Machinelearning
Для всех, кто закопался в коде и не успел отправить форму — выдыхайте, ведь организаторы подвинули дедлайн из-за большого количества запросов!
Это ваш шанс заявить о себе и показать комьюнити своих проекты в области ML!
И небольшой лайфхак по поводу оформления: если вы решите добавить к заявке видеовизитку, ее можно отправить и позже, уже после заполнения основной анкеты, однако сделать это необходимо строго до 1 июня 23:59.
А если до сих пор сомневаетесь, стоит ли делиться наработками, просто посмотрите, о каких крутых вещах рассказывали коллеги на прошлой Practical ML Conf.
Это ваш шанс заявить о себе и показать комьюнити своих проекты в области ML!
И небольшой лайфхак по поводу оформления: если вы решите добавить к заявке видеовизитку, ее можно отправить и позже, уже после заполнения основной анкеты, однако сделать это необходимо строго до 1 июня 23:59.
А если до сих пор сомневаетесь, стоит ли делиться наработками, просто посмотрите, о каких крутых вещах рассказывали коллеги на прошлой Practical ML Conf.
Telegram
Yandex for ML
↔️ Почему рекомендательные системы выходят на плато и что с этим делать
Рекомендательные системы в Яндексе, как и в других крупных компаниях, состоят из десятков микросервисов, каскадной фильтрации и тысяч ручных признаков. Каждая такая система работает…
Рекомендательные системы в Яндексе, как и в других крупных компаниях, состоят из десятков микросервисов, каскадной фильтрации и тысяч ручных признаков. Каждая такая система работает…
😁13👍8❤6🔥5👏1😢1
MiniCPM5-1B теперь полностью open source: открыты веса, обучающие данные и код для деплоя. 🚀
1B параметров, первое место на Artificial Analysis среди всех открытых моделей меньше 2B параметров - 17.9 балла.
Обходит Qwen3.5-2B, у которой 16.3 балла, при вдвое меньшем числе параметров. Также превосходит Qwen3.5-0.8B и LFM2.5-1.2B-Thinking в задачах на знания, математику, код и использование инструментов.
INT4-версия занимает 0.5 ГБ. Запускается на телефонах, в браузерах и на edge-устройствах.
Обучена с помощью ForgeTrain - первого production-grade фреймворка для pretraining LLM, полностью написанного ИИ: без human-программистов и на 10% быстрее NVIDIA Megatron.
🤖 https://modelscope.cn/models/OpenBMB/MiniCPM5-1B
@ai_machinelearning_big_data
1B параметров, первое место на Artificial Analysis среди всех открытых моделей меньше 2B параметров - 17.9 балла.
Обходит Qwen3.5-2B, у которой 16.3 балла, при вдвое меньшем числе параметров. Также превосходит Qwen3.5-0.8B и LFM2.5-1.2B-Thinking в задачах на знания, математику, код и использование инструментов.
INT4-версия занимает 0.5 ГБ. Запускается на телефонах, в браузерах и на edge-устройствах.
Обучена с помощью ForgeTrain - первого production-grade фреймворка для pretraining LLM, полностью написанного ИИ: без human-программистов и на 10% быстрее NVIDIA Megatron.
🤖 https://modelscope.cn/models/OpenBMB/MiniCPM5-1B
@ai_machinelearning_big_data
❤58🔥20👍12😁4
✝️ Крис Олах в Ватикане: зачем сооснователь Anthropic говорил об ИИ перед Папой
25 мая Папа Лев XIV выпустил энциклику об ИИ «Magnifica humanitas» - о защите человека в эпоху искусственного интеллекта. На презентации выступал Крис Олах, сооснователь Anthropic и один из ключевых исследователей интерпретируемости моделей.
Олах начал не с обещаний про безопасный ИИ, а с неприятной для индустрии вещи: фронтирные лаборатории, включая Anthropic, работают внутри системы стимулов, которая легко уводит их от интересов общества. Коммерческое давление, гонка за лидерством, геополитика, амбиции и гордость влияют на решения не меньше, чем красивые safety-документы.
Поэтому, по его словам, индустрии нужны внешние критики, которых нельзя встроить в эту гонку. Церковь, академия, независимые институты и общество здесь выступают не как зрители, а как противовес лабораториям, которые сами себя полностью контролировать не смогут.
Дальше Олах переходит к тому, как вообще устроены современные модели.
Их не проектируют в привычном инженерном смысле. Их скорее выращивают: на архитектурах, отдалённо напоминающих мозг, и на огромном массиве человеческой речи, культуры и мышления.
Из-за этого даже создатели не понимают модели полностью. Они могут обучать, тестировать, ограничивать и улучшать систему, но не имеют полной карты того, что происходит внутри.
Олах объясняет это просто:
Отдельно он затрагивает тему внутренних состояний моделей. Его команда изучает структуры внутри нейросетей и находит паттерны, которые перекликаются с нейронаукой: признаки интроспекции и состояния, функционально похожие на радость, удовлетворение, страх, горе и тревогу.
Олах не делает громких выводов и прямо признаёт, что не знает, как это правильно интерпретировать. Но сам факт, что руководитель направления интерпретируемости Anthropic выносит такую тему на площадку Ватикана, важен. Разговор об ИИ выходит за пределы лабораторий, бенчмарков и корпоративных презентаций.
Оригинал речи опубликован на сайте Anthropic. Читается быстро, но для ИИ-команд это хороший текст для внутреннего обсуждения.
https://www.anthropic.com/news/chris-olah-pope-leo-encyclical
@ai_machinelearning_big_data
25 мая Папа Лев XIV выпустил энциклику об ИИ «Magnifica humanitas» - о защите человека в эпоху искусственного интеллекта. На презентации выступал Крис Олах, сооснователь Anthropic и один из ключевых исследователей интерпретируемости моделей.
Олах начал не с обещаний про безопасный ИИ, а с неприятной для индустрии вещи: фронтирные лаборатории, включая Anthropic, работают внутри системы стимулов, которая легко уводит их от интересов общества. Коммерческое давление, гонка за лидерством, геополитика, амбиции и гордость влияют на решения не меньше, чем красивые safety-документы.
Поэтому, по его словам, индустрии нужны внешние критики, которых нельзя встроить в эту гонку. Церковь, академия, независимые институты и общество здесь выступают не как зрители, а как противовес лабораториям, которые сами себя полностью контролировать не смогут.
Дальше Олах переходит к тому, как вообще устроены современные модели.
Их не проектируют в привычном инженерном смысле. Их скорее выращивают: на архитектурах, отдалённо напоминающих мозг, и на огромном массиве человеческой речи, культуры и мышления.
Из-за этого даже создатели не понимают модели полностью. Они могут обучать, тестировать, ограничивать и улучшать систему, но не имеют полной карты того, что происходит внутри.
Олах объясняет это просто:
представьте, что вымышленный персонаж вдруг ожил, начал говорить с людьми и выполнять работу.
Отдельно он затрагивает тему внутренних состояний моделей. Его команда изучает структуры внутри нейросетей и находит паттерны, которые перекликаются с нейронаукой: признаки интроспекции и состояния, функционально похожие на радость, удовлетворение, страх, горе и тревогу.
Олах не делает громких выводов и прямо признаёт, что не знает, как это правильно интерпретировать. Но сам факт, что руководитель направления интерпретируемости Anthropic выносит такую тему на площадку Ватикана, важен. Разговор об ИИ выходит за пределы лабораторий, бенчмарков и корпоративных презентаций.
Оригинал речи опубликован на сайте Anthropic. Читается быстро, но для ИИ-команд это хороший текст для внутреннего обсуждения.
https://www.anthropic.com/news/chris-olah-pope-leo-encyclical
@ai_machinelearning_big_data
❤108👍22🔥12🤣6😁2
Media is too big
VIEW IN TELEGRAM
Белый дом одобрил выделение $9 млрд АНБ и ЦРУ на закупку ускорителей Nvidia Grace Blackwell. Цель - создание изолированной ИИ-инфраструктуры.
Спецслужбы закупят в обход Пентагона невыпущенную модель Mythos от Anthropic. Технические требования Mythos позволяют развернуть ее на серверах предыдущего поколения, пока строятся новые дата-центры.
Ранее Минобороны США настаивало на праве использовать алгоритмы для любых законных целей, против чего выступала Anthropic. В итоговом контракте этот пункт убрали. Вместо него прописан прямой запрет применять Mythos для анализа данных и слежки за гражданами США.
Ожидается, что документ станет юридическим шаблоном для будущих контрактов со всеми ИИ-разработчиками.
nytimes.com
Команда Preparedness в OpenAI открыла вакансию исследователя рисков автономного развития ИИ с зарплатой $445 000.
В задачи специалиста войдет разработка инструментов интерпретируемости, защита от отравления данных и внедрение метрик для оценки скорости автоматизации труда инженеров.
По планам Сэма Альтмана, к сентябрю 2026 года компания запустит автоматизированного ИИ-стажера для исследований. Появление полностью автономных R&D-систем прогнозируется к 2028 году.
businessinsider.com
Apple добавила поддомен genai.apple.com на свои DNS-серверы. Страница пока недоступна, назначение этого портала неизвестно.
Ожидается, что 8 июня на WWDC 2026 компания представит iOS 27, iPadOS 27 и macOS 27. В новых версиях Siri получит интерфейс чат-бота и функцию распознавания экранного контекста.
Apple Intelligence расширит функциональность базовых сервисов. Voice Control начнет распознавать команды на естественном языке без жестких шаблонов. Алгоритмы Visual Intelligence смогут напрямую парсить данные с визиток или сканировать состав продуктов, а Safari получит автогенерацию названий для групп вкладок.
Также заявлена поддержка создания быстрых команд с помощью ИИ и генерация автоматических субтитров для видео.
macrumors.com
xAI завершила претрейн модели Grok V9-Medium на 1.5T параметров. Публичный релиз ожидается через две-три недели.
Сейчас команда проводит файн-тюнинг, после чего перейдёт к этапу RL. По словам Илона Маска, первые внутренние тесты показали положительные результаты.
На этапе дополнительного обучения разработчики задействовали массив данных от редактора Cursor. xAI рассчитывает, что это улучшит показатели модели в кодинге по сравнению с предыдущей версией v8-small.
Elon Musk в сети Х
LeRobot (подразделение Hugging Face) выпустила open-source проект двуногого робота. Детали корпуса печатаются на 3D-принтере, стоимость сборки со стандартными приводами составляет около $2500.
В релиз вошли инструменты симуляции, алгоритмы калибровки, sim-to-real пайплайны и базовые модели обучения ходьбе. Пока для сборки доступна только нижняя часть платформы. Интеграция плечевого пояса и обучение моторике всего тела заявлены в дорожной карте.
Использование 3D-печати позволяет самостоятельно перепечатывать сломанные детали и не прерывать исследования локомоции на время ожидания запчастей.
huggingface.co
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍56❤35🔥9😢3🤝2👾2
Яндекс Образование совместно с Томским политехом запускают новый студкемп
Интенсив «Компьютерное зрение и наука» пройдёт с 10 по 23 августа на базе ТПУ. Две недели задач с упором на реальные данные и системное понимание CV.
Что будет внутри студкемпа:
— Задачи из индустрии и науки: робототехника, медицина, автоматизация
— Работа с современным стеком: от DL-архитектур до мультиагентных систем на основе VLM
— Практика на исследовательских данных и работа над собственным проектом
— Лекции и разборы от инженеров Яндекса и исследователей ТПУ
— Нетворк со студентами и ML-специалистами со всей России
Участие бесплатное, всем прошедшим отбор Яндекс Образование оплатит дорогу и проживание. Для тестового потребуются знания линейной алгебры, теории вероятностей, матстата, Python, базовых ML/CV-библиотек.
Дедлайн регистрации: 14 июня. Подать заявку можно по этой ссылке
Интенсив «Компьютерное зрение и наука» пройдёт с 10 по 23 августа на базе ТПУ. Две недели задач с упором на реальные данные и системное понимание CV.
Что будет внутри студкемпа:
— Задачи из индустрии и науки: робототехника, медицина, автоматизация
— Работа с современным стеком: от DL-архитектур до мультиагентных систем на основе VLM
— Практика на исследовательских данных и работа над собственным проектом
— Лекции и разборы от инженеров Яндекса и исследователей ТПУ
— Нетворк со студентами и ML-специалистами со всей России
Участие бесплатное, всем прошедшим отбор Яндекс Образование оплатит дорогу и проживание. Для тестового потребуются знания линейной алгебры, теории вероятностей, матстата, Python, базовых ML/CV-библиотек.
Дедлайн регистрации: 14 июня. Подать заявку можно по этой ссылке
❤17👍8🤣5🔥4🤬2😐2🤷2
AI2 опубликовал систему ArtifactLinker, которая предсказывает, какие из размещённых на платформе HuggingFace моделей способны установить новый SOTA-рекорд на конкретных бенчмарках.
Авторы исходят из того, что большинство моделей тестируются лишь на небольшой части существующих бенчмарков, а значит, многие LLM никогда не проверялись на задачах, где могли бы показать лучший результат.
Сначала графовая нейросеть (либо языковая модель с графовым контекстом) ранжирует ещё не оценённые пары по вероятности достичь нового рекорда.
По утверждению института, такой подход превосходит методы ранжирования, основанные исключительно на промптинге языковых моделей.
На втором этапе LLM-агент, способный писать и исполнять код, проводит реальную оценку отобранных пар.
Промежуточные результаты сохраняются в общей памяти и используются при последующих запусках.
По данным AI2, агент воспроизводит метрики с точностью до 80% в 72,6% случаев.
Среди наблюдений авторов интересно то, что более свежие LLM, в частности Gemma, нередко уступают существенно более ранней архитектуре DeBERTa на задачах распознавания логических отношений между утверждениями.
Вместе с кодом ArtifactLinker опубликован ArtifactBench - гетерогенный граф из 14 тыс объектов HuggingFace (модели, датасеты, научные статьи, репозитории кода) и 51 тыс связей между ними, включая результаты оценок, эпизоды дообучения и взаимные ссылки.
Институт позиционирует бенч как ресурс для задач предсказания связей в графе и регрессии метрик качества моделей.
@ai_machinelearning_big_data
#AI #ML #LLM #Benchmark #ArtifactLinker #Ai2
Please open Telegram to view this post
VIEW IN TELEGRAM
👍40🔥18❤12🤣4🤔2🤝1
Лаба Intelligent Creation компании ByteDance выложила Lance - модель, которая в единой архитектуре выполняет понимание, генерацию и редактирование изображений и видео.
При небольшом объёме параметров (6 млрд общих и 3 млрд активных) модель покрывает набор задач от генерации видео по тексту до субъект-ориентированной генерации.
ByteDance говорит, что на второй день после публикации модель вошла в тройку лидеров рейтинга Hugging Face Trending.
Lance построена по принципу dual-stream MoE: специализированные пути для понимания и для генерации работают в общем контекстном пространстве, но обладают разной модельной ёмкостью.
Авторы придумали собственный механизм позиционного кодирования MaPE, который помогает модели различать роли разнородных визуальных токенов внутри одной последовательности.
Когда Lance одновременно учится понимать и генерировать, в одну последовательность попадают визуальные токены разной природы: одни описывают исходное изображение для анализа, другие задают условие для генерации, третьи представляют сам будущий кадр на зашумлённой стадии.
Стандартное позиционное кодирование сообщает модели только то, где каждый токен расположен в пространстве и во времени, но ничего не говорит о его роли — и при смешанном обучении модель легко начинает путать, что именно от неё требуется в данной точке.
MaPE добавляет к позиции дополнительный сигнал о принадлежности токена к функциональной группе - фактически снабжает каждый элемент меткой "это для понимания", "это условие", "это то, что нужно сгенерировать", при этом не ломая ни пространственную структуру изображений, ни временной порядок кадров видео.
Модель по-прежнему видит "где" и "когда", но дополнительно понимает, "зачем" здесь оказался конкретный токен.
@ai_machinelearning_big_data
#AI #ML #Multimodal #Lance #ByteDance
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩48🎉16👍13🔥9👏5❤3💯3
На 1M токенов - 9.7x ускорение префилла и 15.6x на декоде против M2.
В марте их лид по претрейну писал, почему для M2 откатились на full attention: эффективные варианты не были готовы к проду.
Спустя полгода готовы.
Схема двухстадийная. Сначала лёгкая index-ветка выбирает релевантные блоки KV. Дальше sparse attention считается только по ним, а не по всему контексту.
Дешёвый 1M-контекст в опенсорсе - это другой режим работы с длинным контекстом и другая экономика инференса для агентов.
Ждём техрепорт и замеры качества. Ну и приятно, что всё это в опенсорсе.
https://x.com/MiniMax_AI/status/2059286515155599595
#MSA #OpenSource #M3
Please open Telegram to view this post
VIEW IN TELEGRAM
👍58❤35👨💻24🔥8👏8🎉6
Media is too big
VIEW IN TELEGRAM
Власти Китая ввели обязательное согласование зарубежных поездок для ключевых ИИ-специалистов из частных компаний, включая Alibaba и DeepSeek. Теперь инженерам, исследователям и основателям стартапов требуется официальное разрешение на выезд из страны вместо прежнего уведомительного порядка.
Ведомства формируют ограничительные списки, оценивая фактическую значимость конкретного разработчика для технологической отрасли, а не его должность в штатном расписании.
Ранее государство контролировало перемещения преимущественно чиновников, топ-менеджеров госкорпораций и ученых из стратегических секторов экономики.
bloomberg.com
Anthropic выпустила плагин Security Guidance для автоматического поиска уязвимостей в Claude Code. Инструмент работает на базе хуков и выявляет баги безопасности в процессе написания кода.
Проверка проходит на 3-х уровнях: при редактировании файлов система ищет опасные паттерны и ошибки использования библиотек; после генерации кода анализирует diff, а на этапе коммита проверяет окружающий контекст.
По данным Anthropic, использование этой системы как предварительного фильтра перед код-ревью снизило количество замечаний по безопасности PR на 30–40%. Расширение доступно в маркетплейсе плагинов Claude Code.
Claude Devs в сети Х
xAI открыла доступ к CLI-ассистенту Grok Build подписчикам SuperGrok и X Premium+. На этапе беты инструмент работал только на флагманском тарифе SuperGrok Heavy за $300 в месяц.
Grok Build предназначен для отладки и рефакторинга локального кода. Режим Plan Mode предварительно анализирует весь проект и составляет пошаговый план изменений - кодовая база обновляется только после подтверждения разработчиком.
Инструмент поддерживает MCP, параллельную работу нескольких агентов и режим для сред без графической оболочки. Дополнительно в CLI интегрирована Imagine для генерации изображений и видео напрямую из терминала.
xAI в сети Х
Вторая версия модели для генерации музыки получила поддержку перегенерации отдельного фрагмента трека, без изменения всей композиции.
Также добавлена возможность создания сложных вокальных структур, смена музыкального жанра по ходу воспроизведения и интеграция немузыкальных звуковых эффектов.
Модель обучена на лицензированных датасетах, сгенерированные треки разрешены к коммерческому использованию. В ближайшее время доступ к ней откроют через API со сниженной на 50% стоимостью вызовов.
elevenlabs.io
Автоматическая система модерации Google безвозвратно заблокировала аккаунт японского художника Масахиро Итосуги. Он потерял доступ к Gmail, YouTube и всем файлам в Google Drive.
Внутренний ИИ-алгоритм без предупреждения пометил приватные черновики художника в облаке как недопустимый контент. Апелляция на восстановление доступа была отклонена.
От непредсказуемой модерации, основанной на ИИ страдают не только художники, но и технические специалисты. Ранее в IT-сообществе вызвал резонанс случай конца 2025 года, когда разработчик из Греции лишился всех рабочих файлов на облачном диске из-за ошибочных действий Gemini 3 Pro.
Masahiro Itosugi в сети Х
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔94🔥82👍41😢26❤20🤬17🤨9🤩1
Для флагманской MiMo-V2.5-Pro стоимость 1 млн токенов на входе при попадании в prompt cache составит $0,0036. Цена без кеширования снижена на 78% до $0,435, стоимость генерации - на 86%, до $0,87 за 1 млн токенов.
Для базовой версии MiMo-V2.5 кешированный инпут обойдется в $0,0028. Токены на входе без кеширования стоят $0,14, токены на выходе - $0,28 за миллион.
Подписки переведены на балльную систему биллинга. Месячные тарифы остались прежними ($6, $16, $50 и $100), но лимиты увеличены от 4,1 млрд до 82 млрд токенов.
Списание для MiMo-V2.5 рассчитывается по ставке: 2 балла за токен из кеша, 100 баллов при cache miss и 200 баллов за токен генерации.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍60👏24❤13💯10🔥6🙈4
This media is not supported in your browser
VIEW IN TELEGRAM
При обычном обучении градиенты проходят через весь граф, а память под активации растёт вместе с глубиной модели. DiffusionBlocks предлагает разрезать сеть на отдельные блоки и обучать каждый независимо.
Каждому блоку дают свою локальную задачу: сдвинуть представление чуть ближе к целевому состоянию, чем это сделал предыдущий блок. Формально это похоже на один шаг диффузионного процесса, поэтому каждый блок оптимизирует собственный лосс и не зависит от соседних блоков.
Главный плюс - память. Для тренировки нужна память под один блок, а не под всю сеть целиком.
Авторы проверили подход на разных архитектурах:
- ViT
- DiT
- masked diffusion
- авторегрессионные трансформеры
- recurrent-depth / Looped-трансформеры
По качеству результаты сопоставимы со сквозным обучением, но с куда меньшими требованиями к памяти.
В Looped-трансформерами один и тот же блок прогоняется много раз подряд, как будто модель «думает» несколькими итерациями. Обычно для обучения приходится разворачивать весь этот процесс через BPTT, из-за чего память и вычисления быстро дорожают
Это ещё один аргумент в пользу идеи, что диффузия - не только про генерацию картинок, а более универсальная рамка для обучения моделей.
Если модель упирается в VRAM из-за глубины, DiffusionBlocks выглядит как подход, за которым стоит следить.
Пейпер: arxiv.org/abs/2506.14202
Код: github.com/SakanaAI/DiffusionBlocks
@ai_machinelearning_big_data
#sakana #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍124👏27🔥20❤15🤔11💯6🤣5
Media is too big
VIEW IN TELEGRAM
Американский вендор поможет довести готовую внутреннюю архитектуру китайской компании до стадии массового производства. Оборудование предназначено для развертывания и масштабирования ИИ-агентов.
Контракт выводит Qualcomm за рамки мобильных процессоров в сегмент серверной ИИ-инфраструктуры, позволяя конкурировать с Broadcom и Marvell.
Ожидается, что партнерство не нарушит ограничения США на экспорт технологий. Вычислительная мощность выпускаемых ASIC спроектирована с учетом актуальных лимитов американских регуляторов на поставку чипов китайским корпорациям.
bloomberg.com
Главы OpenAI и Anthropic отказались от прогнозов о массовых сокращениях из-за внедрения ИИ. Сэм Альтман и Дарио Амодей заявили, что переоценили скорость автоматизации рабочих мест.
Альтман признал ошибку в оценках исчезновения джуниор-позиций. В качестве примера он привел собственный опыт: попытка полностью делегировать LLM ответы в электронной почте и Slack провалилась. CEO OpenAI вернулся к ручной коммуникации из-за необходимости человеческого участия.
Амодей теперь называет модели мультипликатором эффективности. По его словам, передача 90% рутины алгоритмам кратно повышает ценность оставшейся человеческой работы. Эффект описывается парадоксом Джевонса: удешевление процессов не снижает спрос на людей, а расширяет рынок.
Позиция сблизилась с оценками традиционного бизнеса. Независимые исследования не фиксируют всплеска безработицы в сферах, уязвимых для автоматизации.
fortune.com
Обновление модели MAI-Image до версии 2.5 принесло место в тройке лидеров бенчмарка Arena, где новинка делит пьедестал с Nano Banana 2 от Google, уступая Image-2 от OpenAI.
В версии 2.5 улучшили рендеринг текста, работу со сложными промптами и генерацию коммерческой графики. Microsoft говорит, что модель теперь реалистичнее выстраивает освещение, глубину сцены и пространственные связи между объектами.
MAI-Image 2.5 доступна для тестирования на платформе Arena. В течение 2-х недель Microsoft интегрирует ее в собственные сервисы MAI Playground и Foundry.
microsoft.ai
Основой обновления стал Data Science Agent. Инструмент автономно выстраивает аналитику: изучает датасеты, генерирует и выполняет код, делает выводы и визуализирует результаты. Пользователь может вмешиваться и корректировать план на любом этапе выполнения.
Также в Colab добавили инструменты для рефакторинга и поиска багов. Предложенные исправления кода выгружаются в diff-формате для оценки до принятия изменений. Управлять агентом можно через инлайн-команды прямо в ячейке кода или через боковую панель.
По оценкам Google, переход на агентную архитектуру ускорит написание кода минимум в 2 раза.
developers.googleblog.com
КНР модернизирует национальную систему видеонаблюдения, перенося вычисления на периферию и внедряя поиск по видео через промпты. Архитектура базируется на локальных серверах и камерах Hikvision и Huawei со встроенными ИИ-моделями.
Переход от трансляции потока в ЦОДы к обработке данных на местах снижает нагрузку на облачную инфраструктуру и уменьшает задержку. Предыдущие поколения камер использовались для сверки лиц с базами данных. Интеграция мультимодальных моделей меняет формат мониторинга.
Параллельно CV-алгоритмы автономно детектируют аномалии. Камеры фиксируют опасное вождение, несанкционированные митинги, подозрительную активность и проникновение на закрытые территории, уведомляя операторов об инцидентах.
ft.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍66❤34🤔16👏7🥰3🤓3😎2😁1
Модель оптимизирована под сценарии, где критичны скорость ответа и стоимость инференса: модерация контента, техподдержка, классификация обращений, поиск по базам знаний и другие массовые задачи.
Что заявляет компания:
«Яндекс выходит на новый для себя рынок моделей, созданных специально под запросы бизнеса. Alice AI LLM Flash поможет российским компаниям перейти на российские нейросети для автоматизации работы с огромными объемами данных», — руководитель платформы Yandex AI Studio Артур Самигуллин
Интересно, что рынок постепенно приходит к разделению моделей по специализации: тяжёлые reasoning-модели отдельно, быстрые и дешёвые inference-модели для high-load production-задач — отдельно. Попробовать новую модель уже можно в Yandex AI Studio.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍82🤣52❤12👏10🤔7🔥6😁5😭2😎2🤨1🗿1
Издание Phoronix выпустило один из первых публичных обзоров серверного процессора NVIDIA Vera - нового ARM-чипа с 88 ядрами архитектуры Olympus, который компания позиционирует для ИИ-инфраструктуры.
По оценке основателя Phoronix Майкла Ларабела, это первый ARM-процессор, который на серверных нагрузках сопоставим с актуальными Intel Xeon и AMD EPYC.
В среднем по протестированным задачам Vera оказался примерно на 10% быстрее 64-ядерного AMD EPYC 9575F и в 1,55 раза быстрее Intel Xeon 6980P, флагмана линейки Granite Rapids.
По сравнению с предыдущим процессором NVIDIA Grace производительность выросла примерно на 63%.
В тесте сборки ядра Linux со стандартной конфигурацией Vera показал лучший результат среди всех испытуемых - 20 секунд.
Конфигурация Vera включала 88 ядер и 176 потоков, 8 модулей памяти LPDDR5-9600 общим объёмом 768 ГБ и TDP 450 Вт.
С учётом потребления памяти полная нагрузка системы составила около 500 Вт. У топовых EPYC Turin и Xeon Granite Rapids аналогичный показатель относится только к самому процессору, без памяти.
При этом публиковать полные данные об энергопотреблении NVIDIA не разрешила, поэтому реальная энергоэффективность остаётся неизвестной.
Набор бенчмарков был ограничен самой NVIDIA - тестировались сценарии, под которые компания и позиционирует чип: компиляция кода, Python, Java, база данных ClickHouse, сжатие Zstd, кодирование видео SVT-AV1, 7-Zip и ряд других.
Тестов агентного ИИ (ключевого, по заявлениям NVIDIA, сценария применения процессора) в этом раунде не проводилось, их обещают опубликовать позднее.
Цена и сроки массовой доступности вне крупных облачных и ИИ-клиентов также не объявлены. Поставки партнёрам запланированы на вторую половину 2026 года.
AMD готовит EPYC Venice на архитектуре Zen 6 с планами по выходу до конца года, Intel Xeon Diamond Rapids ожидается в 2027-м.
По оценке Phoronix, после выхода Venice, AMD может вернуть лидерство за пределами целевых для Vera сценариев, поэтому многое будет зависеть от того, как быстро NVIDIA сможет выпустить рефреш Olympus.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔86❤42🔥35👍23👏8💘2
This media is not supported in your browser
VIEW IN TELEGRAM
🐟 Китай придумал, как выжать из одного водоёма больше пользы.
Сверху - плавучие солнечные панели, которые дают электричество.
Снизу - фермы, где выращивают рыбу, креветок и крабов.
Такую схему называют FPC - fishery-photovoltaic complementary.
Водоём одновременно становится и солнечной электростанцией, и рыбной фермой.
Больше чистой энергии и дополнительный доход от выращивания морепродуктов.
@ai_machinelearning_big_data
Сверху - плавучие солнечные панели, которые дают электричество.
Снизу - фермы, где выращивают рыбу, креветок и крабов.
Такую схему называют FPC - fishery-photovoltaic complementary.
Водоём одновременно становится и солнечной электростанцией, и рыбной фермой.
Больше чистой энергии и дополнительный доход от выращивания морепродуктов.
@ai_machinelearning_big_data
👍202❤30🔥26🤩24🤨5🤔4💔1🗿1
Проблема классическая: алгоритму нужны сигналы (дослушивания, лайки, скипы, сохранения), чтобы понять, кому рекомендовать новый объект. Но у свежего трека статистики еще нет. В итоге рекомендации часто начинают работать слишком поздно. А в музыке, где у релиза буквально несколько дней на разгон, это критично.
Вместо ожидания накопления данных VK Микс по сути делает искусственный контролируемый warm start. Сначала показывает новый трек ядру самых лояльных слушателей артиста. Так модель быстро получает первичную статистику и начинает масштабировать показ дальше.
Дополнительно в системе сделали почасовое обновление счетчиков. В результате новые треки начинают попадать в рекомендации менее чем за 30 минут. По данным VK, это в 24 раза быстрее среднего по рынку.
Интересный пример того, как проблему холодного старта начинают решать не только моделью, но и через продуманную организацию работы всей рекомендательной системы.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍82🤣33👏26🗿20🤩19🔥11💯6❤3🤷♂1🐳1🙈1
Opus 4.8 появился в выборе моделей Claude Code в десктопном приложении.
Похоже, сегодня день релиза🚀
https://x.com/Machinelearrn/status/2060014943781412903
@ai_machinelearning_big_data
#claude #opus
Похоже, сегодня день релиза
https://x.com/Machinelearrn/status/2060014943781412903
@ai_machinelearning_big_data
#claude #opus
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥103🎉58❤16💯16🤩11👍9👏7🗿1