This media is not supported in your browser
VIEW IN TELEGRAM
Бывший CEO Google Эрик Шмидт выступил на выпускной церемонии Университета Аризоны с речью про ИИ - и зал встретил это не восторгом, а свистом.
Его освистали после фразы:
Для студентов, которые выходят на рынок труда, где вакансий меньше, конкуренции больше, а компании всё чаще прикрывают сокращения словами про автоматизацию, такая фраза звучит не как вдохновение, а как предупреждение.
Шмидт, по сообщениям, ушёл со сцены со слезами на глазах. Получился редкий момент, когда технооптимизм столкнулся не с критиками из Twitter, а с аудиторией, которой в этом будущем предстоит жить первой.
Его освистали после фразы:
«Вам не обязательно интересоваться ИИ. Какую бы карьеру вы ни выбрали, ИИ всё равно будет иметь к ней отношение».
Для студентов, которые выходят на рынок труда, где вакансий меньше, конкуренции больше, а компании всё чаще прикрывают сокращения словами про автоматизацию, такая фраза звучит не как вдохновение, а как предупреждение.
Шмидт, по сообщениям, ушёл со сцены со слезами на глазах. Получился редкий момент, когда технооптимизм столкнулся не с критиками из Twitter, а с аудиторией, которой в этом будущем предстоит жить первой.
😁25💔4😱2💯2
Forwarded from Machinelearning
Google выкатили сразу два больших релиза: Gemini Omni и Gemini 3.5 Flash
Похоже, Google снова пытается перехватить повестку в ИИ.
Первый релиз - Gemini Omni. Это семейство мультимодальных моделей, которые работают почти со всем сразу: текстом, кодом, изображениями, видео и даже виртуальными мирами.
Модель может принимать разные типы контента и не просто «понимать» их, а редактировать, дополнять и превращать в новые форматы:
- добавить эффекты в видео со смартфона
- сделать картину из грубого наброска
- собрать образовательный подкаст по фото
- работать с кодом, текстом, визуалом и видео в одном контексте
Первая модель семейства - Gemini Omni Flash - должна стать доступна уже сегодня.
Второй релиз - Gemini 3.5 Flash.
Google называет её своей самой сильной моделью для агентов и кодинга. Главное отличие - не просто быстрые ответы, а способность планировать работу по большим кодовым базам, рассуждать на длинной дистанции и запускать subagents параллельно.
По словам Google DeepMind, Gemini 3.5 Flash обходит 3.1 Pro на agentic и coding-бенчмарках вроде Terminal-Bench 2.1, GDPval-AA и MCP Atlas, при этом стоит заметно дешевле фронтирных моделей.
Если коротко:
- Gemini Omni - модель для всего: текст, код, картинки, видео, миры
- Gemini 3.5 Flash - ставка на агентов, кодинг и работу с большими проектами
Ещё выкатили Antigravity 2.0 - инструмент для создания и оркстрации множества ИИ-агентов.
Интересно, насколько хорошо модель будет работать как исполнитель: в IDE, браузере, видео, агентных workflow и реальных продуктах.
Релиз https://x.com/GoogleDeepMind/status/2056786446636212467
Попробовать: https://gemini.google.com/app
Похоже, Google снова пытается перехватить повестку в ИИ.
Первый релиз - Gemini Omni. Это семейство мультимодальных моделей, которые работают почти со всем сразу: текстом, кодом, изображениями, видео и даже виртуальными мирами.
Модель может принимать разные типы контента и не просто «понимать» их, а редактировать, дополнять и превращать в новые форматы:
- добавить эффекты в видео со смартфона
- сделать картину из грубого наброска
- собрать образовательный подкаст по фото
- работать с кодом, текстом, визуалом и видео в одном контексте
Первая модель семейства - Gemini Omni Flash - должна стать доступна уже сегодня.
Второй релиз - Gemini 3.5 Flash.
Google называет её своей самой сильной моделью для агентов и кодинга. Главное отличие - не просто быстрые ответы, а способность планировать работу по большим кодовым базам, рассуждать на длинной дистанции и запускать subagents параллельно.
По словам Google DeepMind, Gemini 3.5 Flash обходит 3.1 Pro на agentic и coding-бенчмарках вроде Terminal-Bench 2.1, GDPval-AA и MCP Atlas, при этом стоит заметно дешевле фронтирных моделей.
Если коротко:
- Gemini Omni - модель для всего: текст, код, картинки, видео, миры
- Gemini 3.5 Flash - ставка на агентов, кодинг и работу с большими проектами
Ещё выкатили Antigravity 2.0 - инструмент для создания и оркстрации множества ИИ-агентов.
Интересно, насколько хорошо модель будет работать как исполнитель: в IDE, браузере, видео, агентных workflow и реальных продуктах.
Релиз https://x.com/GoogleDeepMind/status/2056786446636212467
Попробовать: https://gemini.google.com/app
👍8
Claude Computer Use: Anthropic наконец объяснила, почему агенты промахиваются по кнопкам
Anthropic выложила практический гайд по computer/browser use для Claude. И там не про «магических агентов будущего», а про скучную инженерию, из-за которой агент либо работает, либо кликает мимо кнопки.
Главный инсайт: точность кликов часто ломается не из-за модели, а из-за скриншотов.
Если отправлять в API нативный 4K-скрин, Claude всё равно может увидеть его в уменьшенном виде. Модель возвращает координаты по одной картинке, а ваш harness кликает по другой системе координат. Итог - стабильные промахи.
Что рекомендует Anthropic:
- заранее downscale скриншотов
- для Claude 4.6 держаться около 1280×720
- для Opus 4.7 можно начинать с 1080p
- не отправлять native 4K без подготовки
- всегда масштабировать координаты обратно в реальный экран
- сначала давать текстовую инструкцию, потом изображение
- для мелких UI-элементов включать zoom или использовать клавиатуру
- логировать transcript и накладывать predicted clicks поверх скриншота
Отдельно интересно про модели. Sonnet 4.6 у них точнее для механических кликов, Opus 4.7 уже почти догнал по click accuracy, но даёт больше reasoning и больший pixel budget.
Самый полезный вывод: browser agent - это не «дал промпт и забыл».
Это система из модели, скриншотов, координат, DPI, zoom, DOM, клавиатуры, логов и fallback-методов. Если хотя бы один слой настроен криво, агент будет выглядеть глупым, хотя проблема вообще не в интеллекте модели.
Агенты становятся реальными не тогда, когда модель «умнее».
А тогда, когда вокруг неё собран нормальный runtime.
https://claude.com/blog/best-practices-for-computer-and-browser-use-with-claude
Anthropic выложила практический гайд по computer/browser use для Claude. И там не про «магических агентов будущего», а про скучную инженерию, из-за которой агент либо работает, либо кликает мимо кнопки.
Главный инсайт: точность кликов часто ломается не из-за модели, а из-за скриншотов.
Если отправлять в API нативный 4K-скрин, Claude всё равно может увидеть его в уменьшенном виде. Модель возвращает координаты по одной картинке, а ваш harness кликает по другой системе координат. Итог - стабильные промахи.
Что рекомендует Anthropic:
- заранее downscale скриншотов
- для Claude 4.6 держаться около 1280×720
- для Opus 4.7 можно начинать с 1080p
- не отправлять native 4K без подготовки
- всегда масштабировать координаты обратно в реальный экран
- сначала давать текстовую инструкцию, потом изображение
- для мелких UI-элементов включать zoom или использовать клавиатуру
- логировать transcript и накладывать predicted clicks поверх скриншота
Отдельно интересно про модели. Sonnet 4.6 у них точнее для механических кликов, Opus 4.7 уже почти догнал по click accuracy, но даёт больше reasoning и больший pixel budget.
Самый полезный вывод: browser agent - это не «дал промпт и забыл».
Это система из модели, скриншотов, координат, DPI, zoom, DOM, клавиатуры, логов и fallback-методов. Если хотя бы один слой настроен криво, агент будет выглядеть глупым, хотя проблема вообще не в интеллекте модели.
Агенты становятся реальными не тогда, когда модель «умнее».
А тогда, когда вокруг неё собран нормальный runtime.
https://claude.com/blog/best-practices-for-computer-and-browser-use-with-claude
❤9👍5🤣4🔥3😁1
GitHub взломали через расширение для VS Code. Утекли тысячи внутренних репозиториев
GitHub сообщил о компрометации одного из сотрудников компании. По предварительным данным, атака прошла через заражённое расширение для VS Code.
В результате злоумышленники получили доступ примерно к 4 000 внутренних репозиториев.
И, конечно, история уже вышла за рамки «внутреннего инцидента»: хакеры выставили похищенные данные на продажу за $50 000.
GitHub обещает позже опубликовать подробный отчёт и итоги расследования.
По текущей оценке, активность злоумышленника свелась к эксфильтрации только внутренних репозиториев GitHub. Заявления атакующего о ~3 800 репозиториях, по словам компании, в целом соответствуют результатам их расследования.
Чтобы снизить риски, GitHub оперативно провёл ротацию критических секретов — вчера и в течение ночи, начав с учётных данных с наибольшим потенциальным влиянием. Команда продолжает анализировать логи, проверять ротацию секретов и отслеживать возможную последующую активность; при необходимости будут предприняты дополнительные меры.
https://x.com/github/status/2056949168208552080
@data_analysis_ml
GitHub сообщил о компрометации одного из сотрудников компании. По предварительным данным, атака прошла через заражённое расширение для VS Code.
В результате злоумышленники получили доступ примерно к 4 000 внутренних репозиториев.
И, конечно, история уже вышла за рамки «внутреннего инцидента»: хакеры выставили похищенные данные на продажу за $50 000.
GitHub обещает позже опубликовать подробный отчёт и итоги расследования.
По текущей оценке, активность злоумышленника свелась к эксфильтрации только внутренних репозиториев GitHub. Заявления атакующего о ~3 800 репозиториях, по словам компании, в целом соответствуют результатам их расследования.
Чтобы снизить риски, GitHub оперативно провёл ротацию критических секретов — вчера и в течение ночи, начав с учётных данных с наибольшим потенциальным влиянием. Команда продолжает анализировать логи, проверять ротацию секретов и отслеживать возможную последующую активность; при необходимости будут предприняты дополнительные меры.
https://x.com/github/status/2056949168208552080
@data_analysis_ml
❤13👍5🔥5😁2
Tencent выкатил переводчик, который помещается почти куда угодно
Tencent Hunyuan открыли Hy-MT2 - серию мультиязычных моделей для перевода с Dense и MoE-вариантами.
Главная фишка не в том, что это «ещё одна модель для перевода». Самое интересное - маленькая версия на 1.8B параметров.
Её ужали через AngelSlim до 1.25-bit, и теперь модель занимает всего 440 МБ. При этом на Apple A15 она работает в 1.5 раза быстрее, чем обычный 4-bit inference.
То есть нормальный on-device перевод уже не выглядит как фантазия, где нужно жертвовать либо скоростью, либо размером.
Что заявляют по моделям:
• поддержка 33 языков и 5 китайских диалектов
• версия 1.8B обходит Microsoft Translate и другие коммерческие API на FLORES-200
• версии 7B и 30B-A3B обходят DeepSeek-V4-Pro
• 7B достигает 97.9% от уровня Gemini 3.1 Pro Think
• 30B-A3B достигает 98.6% от уровня Gemini 3.1 Pro Think
• все три модели показывают 96-99% от Gemini 3.1 Pro Think на реальных и доменных бенчмарках
Плюс Tencent вместе с моделями открыли IFMTBench - бенчмарк для проверки того, насколько хорошо переводческие модели следуют инструкциям.
🤖 https://modelscope.ai/collections/Tencent-Hunyuan/Hy-MT2
Tencent Hunyuan открыли Hy-MT2 - серию мультиязычных моделей для перевода с Dense и MoE-вариантами.
Главная фишка не в том, что это «ещё одна модель для перевода». Самое интересное - маленькая версия на 1.8B параметров.
Её ужали через AngelSlim до 1.25-bit, и теперь модель занимает всего 440 МБ. При этом на Apple A15 она работает в 1.5 раза быстрее, чем обычный 4-bit inference.
То есть нормальный on-device перевод уже не выглядит как фантазия, где нужно жертвовать либо скоростью, либо размером.
Что заявляют по моделям:
• поддержка 33 языков и 5 китайских диалектов
• версия 1.8B обходит Microsoft Translate и другие коммерческие API на FLORES-200
• версии 7B и 30B-A3B обходят DeepSeek-V4-Pro
• 7B достигает 97.9% от уровня Gemini 3.1 Pro Think
• 30B-A3B достигает 98.6% от уровня Gemini 3.1 Pro Think
• все три модели показывают 96-99% от Gemini 3.1 Pro Think на реальных и доменных бенчмарках
Плюс Tencent вместе с моделями открыли IFMTBench - бенчмарк для проверки того, насколько хорошо переводческие модели следуют инструкциям.
🤖 https://modelscope.ai/collections/Tencent-Hunyuan/Hy-MT2
❤21👍7🔥5🤣3
Qwen выкатила Qwen3.7-Max: модель под агентов.
Alibaba показала Qwen3.7-Max - новый флагман семейства, который явно целят не в «ответь на вопрос», а в полноценную агентную работу.
Главный акцент - кодинг и long-horizon задачи. Модель обещают как основу для агентов, которые умеют не только писать куски кода, но и вести задачу end-to-end: собирать фронтенд-прототипы, делать многофайловые рефакторы, дебажить реальные проблемы и работать через инструменты.
Самая громкая заявка - 35 часов автономной работы над задачей по оптимизации kernel. Больше 1000 tool calls и без постоянного ручного контроля. Если это стабильно повторяется не только в демо, это уже другой класс агентных сценариев.
Что ещё заявляют:
- coding agent для реальной разработки, а не игрушечных сниппетов
- офисный ассистент через MCP-интеграции
- multi-agent orchestration для сложных рабочих процессов
- совместимость с разными агентными оболочками
- работа через Claude Code, OpenClaw, Qwen Code или свой стек
- доступ через Alibaba Model Studio и Qwen Studio
📖 Blog: https://qwen.ai/blog?id=qwen3.7
✅ Qwen Studio: https://chat.qwen.ai/?models=qwen3.7-max
⚡️ API:https://modelstudio.console.alibabacloud.com/ap-southeast-1?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3.7-max&serviceSite=international
@data_analysis_ml
Alibaba показала Qwen3.7-Max - новый флагман семейства, который явно целят не в «ответь на вопрос», а в полноценную агентную работу.
Главный акцент - кодинг и long-horizon задачи. Модель обещают как основу для агентов, которые умеют не только писать куски кода, но и вести задачу end-to-end: собирать фронтенд-прототипы, делать многофайловые рефакторы, дебажить реальные проблемы и работать через инструменты.
Самая громкая заявка - 35 часов автономной работы над задачей по оптимизации kernel. Больше 1000 tool calls и без постоянного ручного контроля. Если это стабильно повторяется не только в демо, это уже другой класс агентных сценариев.
Что ещё заявляют:
- coding agent для реальной разработки, а не игрушечных сниппетов
- офисный ассистент через MCP-интеграции
- multi-agent orchestration для сложных рабочих процессов
- совместимость с разными агентными оболочками
- работа через Claude Code, OpenClaw, Qwen Code или свой стек
- доступ через Alibaba Model Studio и Qwen Studio
📖 Blog: https://qwen.ai/blog?id=qwen3.7
✅ Qwen Studio: https://chat.qwen.ai/?models=qwen3.7-max
⚡️ API:https://modelstudio.console.alibabacloud.com/ap-southeast-1?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3.7-max&serviceSite=international
@data_analysis_ml
❤19🔥8👍7
МЕГАДОД Центрального университета - день открытых дверей для будущих студентов
Центральный университет проводит МЕГАДОД для школьников 10-11 классов, родителей и абитуриентов магистратуры.
На встрече можно будет узнать всё об обучении в ЦУ напрямую от преподавателей, студентов и академических руководителей программ.
Что будет:
- презентации программ бакалавриата и магистратуры
- разговор о карьерных возможностях после обучения
- истории студентов и выпускников
- знакомство с кампусом и академической средой
- интерактивные сессии
- возможность задать вопросы преподавателям и студентам
Это хороший шанс понять, как устроено обучение в Центральном университете, какие направления можно выбрать и какие возможности открываются после поступления.
Зарегистрироваться
Центральный университет проводит МЕГАДОД для школьников 10-11 классов, родителей и абитуриентов магистратуры.
На встрече можно будет узнать всё об обучении в ЦУ напрямую от преподавателей, студентов и академических руководителей программ.
Что будет:
- презентации программ бакалавриата и магистратуры
- разговор о карьерных возможностях после обучения
- истории студентов и выпускников
- знакомство с кампусом и академической средой
- интерактивные сессии
- возможность задать вопросы преподавателям и студентам
Это хороший шанс понять, как устроено обучение в Центральном университете, какие направления можно выбрать и какие возможности открываются после поступления.
Зарегистрироваться
❤3👍2
По данным The Information, в первом квартале OpenAI получила около $5,7 млрд выручки. Anthropic за тот же период - примерно $4,7 млрд.
На бумаге OpenAI впереди.
Но у Anthropic годовая выручка в пересчёте с последнего месяца уже якобы достигла $45 млрд. У OpenAI - около $25 млрд. То есть в квартальном отчёте OpenAI ещё выглядит лучше, но по текущей скорости рост Anthropic уже вырвалась вперёд.
Главный драйвер роста OpenAI - Codex, продажи бизнесу и тестирование рекламы в ChatGPT. Но у Anthropic, судя по цифрам, месячная выручка после первого квартала выросла больше чем в два раза.
- Anthropic, по оценкам, выходит к первой операционной прибыли примерно на $600 млн
- OpenAI всё ещё теряет около $1,22 на каждый заработанный доллар
- рост ChatGPT не дотянул до цели в 1 млрд пользователей
- OpenAI при этом продолжает поднимать гигантские раунды финансирования
Получается странный разворот. Компания, которая громче всех ассоциируется с ИИ-бумом, сжигает деньги быстрее, чем превращает аудиторию в устойчивую экономику.
А Anthropic, которую долго воспринимали как догоняющего конкурента, может оказаться бизнесом с более здоровой моделью.
На бумаге OpenAI впереди.
Но у Anthropic годовая выручка в пересчёте с последнего месяца уже якобы достигла $45 млрд. У OpenAI - около $25 млрд. То есть в квартальном отчёте OpenAI ещё выглядит лучше, но по текущей скорости рост Anthropic уже вырвалась вперёд.
Главный драйвер роста OpenAI - Codex, продажи бизнесу и тестирование рекламы в ChatGPT. Но у Anthropic, судя по цифрам, месячная выручка после первого квартала выросла больше чем в два раза.
- Anthropic, по оценкам, выходит к первой операционной прибыли примерно на $600 млн
- OpenAI всё ещё теряет около $1,22 на каждый заработанный доллар
- рост ChatGPT не дотянул до цели в 1 млрд пользователей
- OpenAI при этом продолжает поднимать гигантские раунды финансирования
Получается странный разворот. Компания, которая громче всех ассоциируется с ИИ-бумом, сжигает деньги быстрее, чем превращает аудиторию в устойчивую экономику.
А Anthropic, которую долго воспринимали как догоняющего конкурента, может оказаться бизнесом с более здоровой моделью.
🔥7👍6❤4
Японцы показали компонент для чипов, который может стать ответом на энергетический ад ИИ
Университет Токио разработал компонент, который обрабатывает данные до 1000 раз быстрее обычных методов и при этом не разгоняет тепловыделение.
Но главная цифра даже не скорость.
По заявке разработчиков, энергопотребление может упасть до 1/100 от текущего уровня. Если очень грубо перевести это на масштаб дата-центров, объект, который сегодня потребляет энергию как 80 000 домов, теоретически мог бы уложиться в уровень около 800 домов.
Прототип чипа ожидается только к 2030 году, а коммерческое применение - ещё позже.
Университет Токио разработал компонент, который обрабатывает данные до 1000 раз быстрее обычных методов и при этом не разгоняет тепловыделение.
Но главная цифра даже не скорость.
По заявке разработчиков, энергопотребление может упасть до 1/100 от текущего уровня. Если очень грубо перевести это на масштаб дата-центров, объект, который сегодня потребляет энергию как 80 000 домов, теоретически мог бы уложиться в уровень около 800 домов.
Прототип чипа ожидается только к 2030 году, а коммерческое применение - ещё позже.
🔥12👍9❤6
МЕГАДОД Центрального университета - день открытых дверей для будущих студентов
Центральный университет проводит МЕГАДОД для школьников 10-11 классов, родителей и абитуриентов магистратуры.
На встрече можно будет узнать всё об обучении в ЦУ напрямую от преподавателей, студентов и академических руководителей программ.
Что будет:
- презентации программ бакалавриата и магистратуры
- разговор о карьерных возможностях после обучения
- истории студентов и выпускников
- знакомство с кампусом и академической средой
- интерактивные сессии
- возможность задать вопросы преподавателям и студентам
Это хороший шанс понять, как устроено обучение в Центральном университете, какие направления можно выбрать и какие возможности открываются после поступления.
Зарегистрироваться
Центральный университет проводит МЕГАДОД для школьников 10-11 классов, родителей и абитуриентов магистратуры.
На встрече можно будет узнать всё об обучении в ЦУ напрямую от преподавателей, студентов и академических руководителей программ.
Что будет:
- презентации программ бакалавриата и магистратуры
- разговор о карьерных возможностях после обучения
- истории студентов и выпускников
- знакомство с кампусом и академической средой
- интерактивные сессии
- возможность задать вопросы преподавателям и студентам
Это хороший шанс понять, как устроено обучение в Центральном университете, какие направления можно выбрать и какие возможности открываются после поступления.
Зарегистрироваться
❤3🔥2
Yandex ML Challenge — соревнование по ML с задачами по CV, LLM, RL и оптимизации нейросетей.
Если вам интересны foundation models и соревновательный ML — советую посмотреть.
С 21 мая начался длинный онлайн-тур: 3 задачи, рейтинг и 11 дней на решения. Топ-100 участников попадут в очный финал на Young Con в Москве.
1 место — 1 млн рублей.
Топ-15 получат устройства от Яндекса.
Регистрация уже открыта.
Если вам интересны foundation models и соревновательный ML — советую посмотреть.
С 21 мая начался длинный онлайн-тур: 3 задачи, рейтинг и 11 дней на решения. Топ-100 участников попадут в очный финал на Young Con в Москве.
1 место — 1 млн рублей.
Топ-15 получат устройства от Яндекса.
Регистрация уже открыта.
👍7😍5🙏2🥱2🌭2
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
OpenAI готовит заявку на первичное размещение акций на сентябрь. Сэм Альтман торопит процесс, несмотря на позицию финансового директора Сары Фрайар о необходимости дополнительного времени на подготовку.
На этой неделе суд отклонил иск Илона Маска, обвинявшего OpenAI в незаконном переходе от некоммерческой лаборатории к коммерческой структуре. Закрытие дела устранило одно из юридических препятствий для листинга.
Перед размещением OpenAI предстоит обосновать инвесторам бизнес-модель. Основные проблемы - затраты на дата-центры и невыполнение внутренних KPI по выручке и пользователям.
На стратегию также влияет конкуренция: из-за темпов роста Anthropic в корпоративном секторе OpenAI пришлось корректировать план развития.
wsj.com
Администрация США предложила внедрить систему добровольной оценки ИИ-моделей перед выходом на рынок. Инициативу обсуждали на закрытой встрече Управления национальной кибербезопасности США с руководителями ИИ-лабораторий.
Новые правила предполагают передачу правительству доступа к флагманским моделям за 90 дней до релиза. Компании лоббируют сокращение окна тестирования до 14 дней. Критерии отбора систем определят АНБ, УНКБ и Управление по научно-технической политике. Аудит пройдет в конфиденциальном режиме при участии Министерства обороны США.
Поводом для создания механизма стала Mythos от Anthropic. По данным спецслужб, на закрытых тестах система смогла эксплуатировать уязвимости нулевого дня, после чего ведомства ускорили разработку правил превентивного контроля.
theinformation.com
Google добавит инструменты видеоредактора CapCut в интерфейс Gemini. Пользователи смогут монтировать видео и редактировать фото напрямую в диалоговом окне.
Интеграция объединит этапы создания контента: генерацию идей, написание сценария через LLM, склейку и экспорт ролика в одном интерфейсе.
Точная дата релиза совместного продукта пока неизвестна.
Cupcut в сети Х
Google тестирует диалоговые рекламные форматы в поиске на базе Gemini. В ИИ-режиме выдачи модель генерирует текст контекстного объявления с объяснением, как продукт решает задачу из запроса пользователя. Блоки сохранят обязательную пометку о спонсорстве.
Интеграция включает несколько форматов: адаптация креатива под узкие запросы, встраивание коммерческих предложений в сгенерированные рекомендации и персональное обоснование для покупки товаров.
Вместо статичных форм сбора лидов Google добавила встроенного в объявление интерактивного чат-бота, который отвечает на вопросы по базе знаний сайта компании.
В рамках программы Direct Offers, Gemini научилась динамически собирать персональные скидочные наборы. Продавцы, работающие по протоколу UCP смогут закрывать сделки через чекаут напрямую в поисковом интерфейсе.
blog.google
Новая серия построена на базе архитектуры Strix Halo. Чипы поддерживают до 192 ГБ объединенной памяти стандарта LPDDR5X по 256-битной шине и допускают ручное выделение до 160 ГБ в качестве видеопамяти для встроенной графики. Это позволяет локально запускать LLM размером 300 млрд параметров.
Флагманский 16-ядерный чип Ryzen AI Max+ PRO 495 работает на частоте до 5,20 ГГц. Встроенный GPU RDNA 3.5 задействует 40 вычислительных блоков на частоте до 3,00 ГГц. Производительность интегрированного NPU составляет 55 TOPS.
В серию также вошли младшие модели с графикой на 32 блока: 12-ядерный PRO 490 и 8-ядерный PRO 485. Релиз потребительских версий запланирован на конец года.
techpowerup.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍2
Любители науки, фестиваль для вас
Жителей и гостей Санкт-Петербурга приглашают на Т-Двор — масштабный и бесплатный городской фестиваль.
Особенно рекомендуем заглянуть в субботу, 4 июня, на День технологий. Он посвящен точным наукам, ИИ, биотеху, генной инженерии, космосу и физике. На фестивале выступят ученые:
— Астроном Владимир Сурдин расскажет про космос, черные дыры и тайны Вселенной.
— Океанолог Александр Осадчиев выступит с докладом про воду — главный ресурс планеты, изученный лишь на 5%.
— Футуролог Руслан Юсуфов будет рассуждать о цифровом приговоре — когда данные начинают решать за нас.
А еще будет арт-пространство, еда и активности. Встречаемся в Никольских рядах.
Успей зарегистрироваться, чтобы не пропустить событие
Жителей и гостей Санкт-Петербурга приглашают на Т-Двор — масштабный и бесплатный городской фестиваль.
Особенно рекомендуем заглянуть в субботу, 4 июня, на День технологий. Он посвящен точным наукам, ИИ, биотеху, генной инженерии, космосу и физике. На фестивале выступят ученые:
— Астроном Владимир Сурдин расскажет про космос, черные дыры и тайны Вселенной.
— Океанолог Александр Осадчиев выступит с докладом про воду — главный ресурс планеты, изученный лишь на 5%.
— Футуролог Руслан Юсуфов будет рассуждать о цифровом приговоре — когда данные начинают решать за нас.
А еще будет арт-пространство, еда и активности. Встречаемся в Никольских рядах.
Успей зарегистрироваться, чтобы не пропустить событие
❤2🙏2
ModelScope добавили в EvalScope режим Agent Evaluation Mode. И это полезный сдвиг: теперь стандартные бенчмарки можно прогонять не только как «вопрос - ответ», а как полноценные агентные сценарии.
GSM8K, AIME, IFEval и SWE-Bench можно превратить в multi-turn задачи одной настройкой в конфиге. Дальше AgentLoop сам гоняет модель по циклу: сгенерировала шаг, вызвала инструмент, получила наблюдение, повторила.
Для оценки агентов это гораздо ближе к реальности. В проде модель редко просто отвечает текстом. Она вызывает функции, пишет код, запускает shell или Python, ошибается, читает вывод, чинит решение и идёт дальше.
В EvalScope теперь можно переключать стратегии: Function Calling, ReAct или SWE-Bench protocol. Можно сохранять полный trace: каждый шаг, ошибку, tool call и наблюдение. Потом всё это воспроизводится в Web Dashboard, что особенно полезно для дебага, а не только для красивой цифры в таблице.
Отдельно завезли безопасный sandbox через Docker и ms-enclave, чтобы shell и Python-инструменты запускались изолированно. Это важно, потому что агентные бенчмарки без sandbox быстро превращаются в рискованный запуск чужого кода.
Самое удобное - старые бенчмарки не надо переписывать. Включаешь Agent Mode в TaskConfig, и обычная проверка превращается в агентный прогон.
Судя по направлению, оценка AI-систем постепенно уходит от «какая модель умнее на статичном тесте» к более неприятному вопросу: как она ведёт себя в цикле, с инструментами, ошибками, ограничениями и реальным состоянием среды.
Вот это уже ближе к тому, что потом ломается в проде.
https://github.com/modelscope/evalscope
GSM8K, AIME, IFEval и SWE-Bench можно превратить в multi-turn задачи одной настройкой в конфиге. Дальше AgentLoop сам гоняет модель по циклу: сгенерировала шаг, вызвала инструмент, получила наблюдение, повторила.
Для оценки агентов это гораздо ближе к реальности. В проде модель редко просто отвечает текстом. Она вызывает функции, пишет код, запускает shell или Python, ошибается, читает вывод, чинит решение и идёт дальше.
В EvalScope теперь можно переключать стратегии: Function Calling, ReAct или SWE-Bench protocol. Можно сохранять полный trace: каждый шаг, ошибку, tool call и наблюдение. Потом всё это воспроизводится в Web Dashboard, что особенно полезно для дебага, а не только для красивой цифры в таблице.
Отдельно завезли безопасный sandbox через Docker и ms-enclave, чтобы shell и Python-инструменты запускались изолированно. Это важно, потому что агентные бенчмарки без sandbox быстро превращаются в рискованный запуск чужого кода.
Самое удобное - старые бенчмарки не надо переписывать. Включаешь Agent Mode в TaskConfig, и обычная проверка превращается в агентный прогон.
Судя по направлению, оценка AI-систем постепенно уходит от «какая модель умнее на статичном тесте» к более неприятному вопросу: как она ведёт себя в цикле, с инструментами, ошибками, ограничениями и реальным состоянием среды.
Вот это уже ближе к тому, что потом ломается в проде.
https://github.com/modelscope/evalscope
👍7🥰4❤3
Большой русскоязычный roadmap по машинному обучению: от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOps и даже вабкодинга.
Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и что должно получиться на практике после каждого этапа.
Roadmap разбит на 7 треков:
1. Фундамент: Python, математика, статистика, инструменты
2. Классический ML: scikit-learn, табличные данные, метрики, валидация
3. Deep Learning: PyTorch, CNN, RNN, training loop
4. LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты
5. Generative AI: изображения, видео, аудио, мультимодальность
6. MLOps и прод: Docker, Kubernetes, CI/CD, monitoring, serving
7. Специализация: CV, NLP, RecSys, RL, Safety
Roadmap не продаёт иллюзию “обучил модель - стал ML-инженером”.
В реальной работе много времени уходит на данные, метрики, деплой, мониторинг, воспроизводимость и разбор ошибок. Модель - только часть системы.
Хорошая мысль из roadmap: LLM не делает джуна сеньором. Она ускоряет того, кто уже понимает базу. Без базы человек просто становится оператором Copilot, который не может объяснить, почему всё сломалось.
По времени тоже без сказок:
1. 0-3 месяца: математика, классический ML
2. 3-6 месяцев: Deep Learning и PyTorch
3. 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты
4. 12+ месяцев: MLOps, прод, масштабирование, специализация
Тут же собрано 7 болших бесплатных курсов по машинному обучению, математике и вайбкодингу!
Если давно хотели зайти в ML системно, а не прыгать между роликами про ChatGPT, Stable Diffusion и “топ-10 библиотек”, это хороший ориентир.
https://github.com/justxor/MachineLearningRoadmap
Please open Telegram to view this post
VIEW IN TELEGRAM
❤15👍7🔥4❤🔥3
Anthropic выкатили первый апдейт по Project Glasswing и цифры там уже выглядят как начало нового этапа в кибербезе.
Claude Mythos Preview вместе с партнёрами нашёл больше 10 тысяч high и critical уязвимостей в системах, на которых держится интернет. У одного только Cloudflare модель накопала около 2000 багов, из них 400 критических. Mozilla за месяц закрыла 271 уязвимость в Firefox. Некоторые дыры сидели в коде больше 15 лет.
Anthropic прямо пишет, что поиск уязвимостей перестал быть узким местом. Теперь всё упирается в людей, которые должны успевать проверять отчёты, делать disclosure и выпускать патчи. Несколько maintainers open-source проектов уже попросили снизить поток репортов, потому что команды не справляются.
Отдельно впечатляет качество находок. Независимые исследователи подтвердили 90.6% true positive среди проверенных high/critical багов в open-source проектах. Для security tooling это уже не “интересный эксперимент”, а рабочий инструмент уровня топовых ресерчеров.
Anthropic при этом всё ещё не готова выпускать Mythos в паблик. Они прямо говорят, что индустрия пока не умеет контролировать модели такого уровня и не знает, как предотвращать их злоупотребление. Поэтому доступ пока только у ограниченного круга компаний и госструктур.
AI уже научился искать баги быстрее, чем индустрия успевает их чинить.
https://www.anthropic.com/research/glasswing-initial-update
Claude Mythos Preview вместе с партнёрами нашёл больше 10 тысяч high и critical уязвимостей в системах, на которых держится интернет. У одного только Cloudflare модель накопала около 2000 багов, из них 400 критических. Mozilla за месяц закрыла 271 уязвимость в Firefox. Некоторые дыры сидели в коде больше 15 лет.
Anthropic прямо пишет, что поиск уязвимостей перестал быть узким местом. Теперь всё упирается в людей, которые должны успевать проверять отчёты, делать disclosure и выпускать патчи. Несколько maintainers open-source проектов уже попросили снизить поток репортов, потому что команды не справляются.
Отдельно впечатляет качество находок. Независимые исследователи подтвердили 90.6% true positive среди проверенных high/critical багов в open-source проектах. Для security tooling это уже не “интересный эксперимент”, а рабочий инструмент уровня топовых ресерчеров.
Anthropic при этом всё ещё не готова выпускать Mythos в паблик. Они прямо говорят, что индустрия пока не умеет контролировать модели такого уровня и не знает, как предотвращать их злоупотребление. Поэтому доступ пока только у ограниченного круга компаний и госструктур.
AI уже научился искать баги быстрее, чем индустрия успевает их чинить.
https://www.anthropic.com/research/glasswing-initial-update
❤24🔥9👍7🤣3