Media is too big
VIEW IN TELEGRAM
Американский вендор поможет довести готовую внутреннюю архитектуру китайской компании до стадии массового производства. Оборудование предназначено для развертывания и масштабирования ИИ-агентов.
Контракт выводит Qualcomm за рамки мобильных процессоров в сегмент серверной ИИ-инфраструктуры, позволяя конкурировать с Broadcom и Marvell.
Ожидается, что партнерство не нарушит ограничения США на экспорт технологий. Вычислительная мощность выпускаемых ASIC спроектирована с учетом актуальных лимитов американских регуляторов на поставку чипов китайским корпорациям.
bloomberg.com
Главы OpenAI и Anthropic отказались от прогнозов о массовых сокращениях из-за внедрения ИИ. Сэм Альтман и Дарио Амодей заявили, что переоценили скорость автоматизации рабочих мест.
Альтман признал ошибку в оценках исчезновения джуниор-позиций. В качестве примера он привел собственный опыт: попытка полностью делегировать LLM ответы в электронной почте и Slack провалилась. CEO OpenAI вернулся к ручной коммуникации из-за необходимости человеческого участия.
Амодей теперь называет модели мультипликатором эффективности. По его словам, передача 90% рутины алгоритмам кратно повышает ценность оставшейся человеческой работы. Эффект описывается парадоксом Джевонса: удешевление процессов не снижает спрос на людей, а расширяет рынок.
Позиция сблизилась с оценками традиционного бизнеса. Независимые исследования не фиксируют всплеска безработицы в сферах, уязвимых для автоматизации.
fortune.com
Обновление модели MAI-Image до версии 2.5 принесло место в тройке лидеров бенчмарка Arena, где новинка делит пьедестал с Nano Banana 2 от Google, уступая Image-2 от OpenAI.
В версии 2.5 улучшили рендеринг текста, работу со сложными промптами и генерацию коммерческой графики. Microsoft говорит, что модель теперь реалистичнее выстраивает освещение, глубину сцены и пространственные связи между объектами.
MAI-Image 2.5 доступна для тестирования на платформе Arena. В течение 2-х недель Microsoft интегрирует ее в собственные сервисы MAI Playground и Foundry.
microsoft.ai
Основой обновления стал Data Science Agent. Инструмент автономно выстраивает аналитику: изучает датасеты, генерирует и выполняет код, делает выводы и визуализирует результаты. Пользователь может вмешиваться и корректировать план на любом этапе выполнения.
Также в Colab добавили инструменты для рефакторинга и поиска багов. Предложенные исправления кода выгружаются в diff-формате для оценки до принятия изменений. Управлять агентом можно через инлайн-команды прямо в ячейке кода или через боковую панель.
По оценкам Google, переход на агентную архитектуру ускорит написание кода минимум в 2 раза.
developers.googleblog.com
КНР модернизирует национальную систему видеонаблюдения, перенося вычисления на периферию и внедряя поиск по видео через промпты. Архитектура базируется на локальных серверах и камерах Hikvision и Huawei со встроенными ИИ-моделями.
Переход от трансляции потока в ЦОДы к обработке данных на местах снижает нагрузку на облачную инфраструктуру и уменьшает задержку. Предыдущие поколения камер использовались для сверки лиц с базами данных. Интеграция мультимодальных моделей меняет формат мониторинга.
Параллельно CV-алгоритмы автономно детектируют аномалии. Камеры фиксируют опасное вождение, несанкционированные митинги, подозрительную активность и проникновение на закрытые территории, уведомляя операторов об инцидентах.
ft.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍66❤34🤔16👏7🥰3🤓3😎2😁1
Модель оптимизирована под сценарии, где критичны скорость ответа и стоимость инференса: модерация контента, техподдержка, классификация обращений, поиск по базам знаний и другие массовые задачи.
Что заявляет компания:
«Яндекс выходит на новый для себя рынок моделей, созданных специально под запросы бизнеса. Alice AI LLM Flash поможет российским компаниям перейти на российские нейросети для автоматизации работы с огромными объемами данных», — руководитель платформы Yandex AI Studio Артур Самигуллин
Интересно, что рынок постепенно приходит к разделению моделей по специализации: тяжёлые reasoning-модели отдельно, быстрые и дешёвые inference-модели для high-load production-задач — отдельно. Попробовать новую модель уже можно в Yandex AI Studio.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍82🤣54❤12👏10🤔7🔥6😁5😭2😎2🤨1🗿1
Издание Phoronix выпустило один из первых публичных обзоров серверного процессора NVIDIA Vera - нового ARM-чипа с 88 ядрами архитектуры Olympus, который компания позиционирует для ИИ-инфраструктуры.
По оценке основателя Phoronix Майкла Ларабела, это первый ARM-процессор, который на серверных нагрузках сопоставим с актуальными Intel Xeon и AMD EPYC.
В среднем по протестированным задачам Vera оказался примерно на 10% быстрее 64-ядерного AMD EPYC 9575F и в 1,55 раза быстрее Intel Xeon 6980P, флагмана линейки Granite Rapids.
По сравнению с предыдущим процессором NVIDIA Grace производительность выросла примерно на 63%.
В тесте сборки ядра Linux со стандартной конфигурацией Vera показал лучший результат среди всех испытуемых - 20 секунд.
Конфигурация Vera включала 88 ядер и 176 потоков, 8 модулей памяти LPDDR5-9600 общим объёмом 768 ГБ и TDP 450 Вт.
С учётом потребления памяти полная нагрузка системы составила около 500 Вт. У топовых EPYC Turin и Xeon Granite Rapids аналогичный показатель относится только к самому процессору, без памяти.
При этом публиковать полные данные об энергопотреблении NVIDIA не разрешила, поэтому реальная энергоэффективность остаётся неизвестной.
Набор бенчмарков был ограничен самой NVIDIA - тестировались сценарии, под которые компания и позиционирует чип: компиляция кода, Python, Java, база данных ClickHouse, сжатие Zstd, кодирование видео SVT-AV1, 7-Zip и ряд других.
Тестов агентного ИИ (ключевого, по заявлениям NVIDIA, сценария применения процессора) в этом раунде не проводилось, их обещают опубликовать позднее.
Цена и сроки массовой доступности вне крупных облачных и ИИ-клиентов также не объявлены. Поставки партнёрам запланированы на вторую половину 2026 года.
AMD готовит EPYC Venice на архитектуре Zen 6 с планами по выходу до конца года, Intel Xeon Diamond Rapids ожидается в 2027-м.
По оценке Phoronix, после выхода Venice, AMD может вернуть лидерство за пределами целевых для Vera сценариев, поэтому многое будет зависеть от того, как быстро NVIDIA сможет выпустить рефреш Olympus.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔97❤42🔥35👍23👏8💘2
This media is not supported in your browser
VIEW IN TELEGRAM
🐟 Китай придумал, как выжать из одного водоёма больше пользы.
Сверху - плавучие солнечные панели, которые дают электричество.
Снизу - фермы, где выращивают рыбу, креветок и крабов.
Такую схему называют FPC - fishery-photovoltaic complementary.
Водоём одновременно становится и солнечной электростанцией, и рыбной фермой.
Больше чистой энергии и дополнительный доход от выращивания морепродуктов.
@ai_machinelearning_big_data
Сверху - плавучие солнечные панели, которые дают электричество.
Снизу - фермы, где выращивают рыбу, креветок и крабов.
Такую схему называют FPC - fishery-photovoltaic complementary.
Водоём одновременно становится и солнечной электростанцией, и рыбной фермой.
Больше чистой энергии и дополнительный доход от выращивания морепродуктов.
@ai_machinelearning_big_data
👍212❤30🔥26🤩24🤨5🤔4💔1🗿1
Проблема классическая: алгоритму нужны сигналы (дослушивания, лайки, скипы, сохранения), чтобы понять, кому рекомендовать новый объект. Но у свежего трека статистики еще нет. В итоге рекомендации часто начинают работать слишком поздно. А в музыке, где у релиза буквально несколько дней на разгон, это критично.
Вместо ожидания накопления данных VK Микс по сути делает искусственный контролируемый warm start. Сначала показывает новый трек ядру самых лояльных слушателей артиста. Так модель быстро получает первичную статистику и начинает масштабировать показ дальше.
Дополнительно в системе сделали почасовое обновление счетчиков. В результате новые треки начинают попадать в рекомендации менее чем за 30 минут. По данным VK, это в 24 раза быстрее среднего по рынку.
Интересный пример того, как проблему холодного старта начинают решать не только моделью, но и через продуманную организацию работы всей рекомендательной системы.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍94🤣34👏26🗿20🤩19🔥11💯6❤3🤷♂1🐳1🙈1
Opus 4.8 появился в выборе моделей Claude Code в десктопном приложении.
Похоже, сегодня день релиза🚀
https://x.com/Machinelearrn/status/2060014943781412903
@ai_machinelearning_big_data
#claude #opus
Похоже, сегодня день релиза
https://x.com/Machinelearrn/status/2060014943781412903
@ai_machinelearning_big_data
#claude #opus
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥103🎉59❤16💯16🤩11👍9👏7🗿1
Together AI выложила метод квантования KV-кэша до 2-х бит - OSCAR (Offline Spectral Covariance-Aware Rotation).
KV-кэш - структура, в которой модель хранит промежуточные представления токенов при генерации.
На длинных контекстах он занимает значительную часть памяти GPU, и его сжатие позволяет либо обслуживать больше запросов одновременно, либо ускорять чтение из памяти.
Прежние попытки сжать кэш до 2-х бит ухудшали качество ответов.
OSCAR обходит это ограничение за счёт того, что поворот активаций перед квантованием рассчитывается исходя из статистики внимания.
Метод предлагает сначала собрать на калибровочном наборе ковариационные матрицы запросов и значений, взвешенных оценками внимания, и из них вывести персональный поворот для ключей и значений каждого слоя.
После этого применяется преобразование Адамара, выравнивающее значимость каналов, и перестановка с побитовым реверсом, чтобы соседние каналы попадали в один диапазон при поквантовом сжатии.
Первые 64 и последние 256 токенов контекста при этом хранятся в полной точности BF16 как опорные, всё остальное - в 2-х битах.
Калибровка выполняется один раз, поворот и пороги отсечения фиксируются, а онлайн-наценка по вычислениям скрывается внутри ядер декодирования.
На задачах AIME25, GPQA-Diamond, HumanEval, LiveCodeBench v6, MATH500 метод удерживается близко к точности базового режима BF16.
Разрыв составляет 3,78 пункта на Qwen3-4B-Thinking-2507, 1,42 пункта на Qwen3-8B и около нуля на Qwen3-32B и GLM-4.7-FP8.
По бенчмарку RULER-NIAH OSCAR работает стабильнее остальных двухбитных методов, но для меньших моделей разрыв с BF16 растёт по мере увеличения контекста: на Qwen3-4B-Thinking-2507 при 128 тыс. токенов точность падает с 81,0 до 39,5 пункта.
Для GLM-4.7-FP8 кривая практически совпадает с BF16.
В замерах на NVIDIA H100 скорость декодирования при контексте в 100 тыс. токенов выросла в 2,8–3,1 раза относительно BF16.
OSCAR совместим с paged attention и встраивается в SGLang без изменений на стороне клиента. Для экспериментов Together AI выложила предвычисленные матрицы для Qwen3-4B-Thinking, Qwen3-8B, Qwen3-32B и GLM-4.7-FP8.
@ai_machinelearning_big_data
#AI #ML #LLM #Quantization #OSCAR #TogetherAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍106👨💻40💯25🤔18🔥14👌11❤10👏4😐4🕊2🎃1
Anthropic только что выпустила Claude Opus 4.8.
Anthropic только что выпустила Claude Opus 4.8.
Три конкретных изменения по сравнению с 4.7: точнее судит о ситуации, честнее говорит о собственных ограничениях и дольше держит контекст при самостоятельной работе без подсказок.
По бенчмаркам: agentic coding (SWE-Bench Pro) 69.2% против 64.3% у 4.7 и 58.6% у GPT-5.5. Computer use (OSWorld) 83.4%. Knowledge work (GDPval-AA) 1890 против 1753 у предыдущей версии. В терминальном кодинге GPT-5.5 пока впереди с 78.2% против 74.6%, но разрыв небольшой.
Цена не изменилась.
В релизе упоминается апдейт про "более честную оценку собственного прогресса" — это прямо отвечает на одну из главных болей при работе с агентами: модель уверенно сообщает, что задача выполнена, хотя на самом деле застряла. Посмотрим, насколько это реально изменилось на практике.
claude.com/blog/introducing-dynamic-workflows-in-claude-code
Anthropic только что выпустила Claude Opus 4.8.
Три конкретных изменения по сравнению с 4.7: точнее судит о ситуации, честнее говорит о собственных ограничениях и дольше держит контекст при самостоятельной работе без подсказок.
По бенчмаркам: agentic coding (SWE-Bench Pro) 69.2% против 64.3% у 4.7 и 58.6% у GPT-5.5. Computer use (OSWorld) 83.4%. Knowledge work (GDPval-AA) 1890 против 1753 у предыдущей версии. В терминальном кодинге GPT-5.5 пока впереди с 78.2% против 74.6%, но разрыв небольшой.
Цена не изменилась.
В релизе упоминается апдейт про "более честную оценку собственного прогресса" — это прямо отвечает на одну из главных болей при работе с агентами: модель уверенно сообщает, что задача выполнена, хотя на самом деле застряла. Посмотрим, насколько это реально изменилось на практике.
claude.com/blog/introducing-dynamic-workflows-in-claude-code
1❤101👍43🤔32🔥20👏14🤓4😁2💘1
This media is not supported in your browser
VIEW IN TELEGRAM
Обновление позволяет писать JavaScript-скрипты для оркестрации субагентов в рамках одной сессии. Скрипты берут на себя логические ветвления и хранение промежуточных результатов.
Для сложных задач добавлен профиль конфигурации ultracode. В нем модель самостоятельно решает, когда запустить мультиагентный пайплайн для перекрестного код-ревью и автоматического исправления ошибок.
Воркфлоу доступны через CLI и расширения для IDE на тарифах Max и Team. Инструмент кратно увеличивает расход токенов.
claude.com
Французский ИИ-стартап обновил чат-бота Le Chat, переформатировав его в автономного агента Vibe, который интегрируется с Google Workspace, Outlook, Slack, GitHub, SharePoint и Notion.
Агент сканирует почту, парсит таблицы и верстает отчеты, предварительно согласовывая пошаговый план действий. Сценарии можно автоматизировать по расписанию или сохранять как шаблоны.
Появился Code Mode, где агенты работают в изолированных песочницах: пишут код, исправляют баги, создают тесты и доводят задачу до открытия PR. Фоновые сессии выполняются параллельно и не зависят от локального устройства.
Доступна бесплатная версия и тарифы: Pro (15 евро), Team (25 евро) и Enterprise. Точные лимиты не раскрываются - квоты подписок указаны как кратные множители.
mistral.ai
Google показала одноплатный компьютер Coral Board для локального запуска модели Gemma 3 270M.
В основе платы - открытый нейромодуль Coral NPU на архитектуре RISC-V от Google Research. Вычислительным ядром выступает SoC Synaptics Astra SL2619: двухъядерный процессор с частотой 2 ГГц, 2 ГБ оперативной памяти и производительностью 1 TOPS. Этого объема ресурсов хватает для инференса компактной LLM.
Плата спроектирована для интеграции в AR-очки, умные часы и наушники. На презентации показали работу синхронного переводчика, голосовое управление периферией и генерацию звука в реальном времени - модель YOLOv8 отслеживала движения медуз и конвертировала их в музыку.
Исходный код демо-проектов выложен на GitHub. Поставки стартуют летом, цена пока неизвестна.
Google Gemma в сети Х
Алгоритмы видеохостинга будут принудительно добавлять предупреждающую плашку при выявлении генерации, если создатель не указал это сам.
Маркировка станет жестко привязанной и неудаляемой для медиафайлов с метаданными стандарта C2PA, а также для роликов, созданных в Veo и Dream Screen. При ложном срабатывании решение можно оспорить через YouTube Studio.
Визуально метки разместятся под плеером в длинных видео и поверх контента в Shorts. Наличие плашки не влияет на монетизацию и алгоритмы рекомендаций.
Дополнительно YouTube делает общедоступным инструмент Likeness Detection для поиска дипфейков, систему откроют для авторов старше 18 лет.
blog.youtube
Amazon MGM Studios и AWS запустили фонд GenAI Creators и платформу Project Nara для ИИ-видеопроизводства. Участники грантовой программы получат финансирование и доступ к новой облачной инфраструктуре.
Project Nara автоматически маршрутизирует задачи и подбирает модель для каждого этапа генерации. Платформа комбинирует сторонние видеомодели и проприетарные решения Amazon, обученные на контенте студии.
Инфраструктура интегрирует ИИ-агентов напрямую с Maya, Blender, Nuke, Unreal Engine и пакетом Adobe. Встроенная система трекинга документирует происхождение всех сгенерированных ассетов для контроля авторских прав.
amazonmgmstudios.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍39❤16🔥7🤔5🎉2🤣1
Оксфорд, Стэнфорд, Институт Аллена и Sakana AI выложили работу, в которой ставится вопрос: способен ли ИИ предвидеть ход научного прогресса.
Исследование примыкает к дискуссии об "автономном учёном" на базе ИИ - направлении, которое сейчас волнует индустрию, его развивает в том числе и Sakana AI.
Чтобы отделить реальный прогноз от существующих знаний, авторы построили бенч CUSP.
Языковые модели обычно знают уже состоявшиеся открытия из обучающих данных, поэтому при прямом вопросе об известном результате легко дают верный ответ.
CUSP это блокирует: для события, скажем, 2025 года модели разрешают опираться только на сведения, доступные до этой даты.
Говоря проще, систему возвращают в прошлое и заставляют предсказывать будущее вслепую.
В основу теста легли 4760 научных событий за январь 2024 - март 2026 годов из журналов Nature, Science, Cell и подборок заметных работ по ИИ. На этой базе было сформировано 17 429 заданий.
В прогонах принимали участие GPT-5.4, Claude Sonnet 4.5, DeepSeek R1 и GPT-OSS 20B.
Выбрать правдоподобное техническое направление смогли - на вопросах с выбором ответа GPT-5.4 показала точность 81,9%.
Но определить, будет ли конкретное достижение вообще реализовано, модели почти не способны: точность держалась в пределах 45–52%, что близко к подбрасыванию монеты.
Сроки все модели называли с запаздыванием: медианная ошибка GPT-5.4 составила 14 месяцев, Claude Sonnet 4.5 - 17, а вот LLaMA 3.3 оказалась самой точной - 4 месяца.
В задачах на проектирование решения даже лучший результат (5,04 из 10 у GPT-5.4) не попадал в реально применённый позже технический путь.
Рисёрч отмечает деталь: качество прогноза почти не зависело от того, относится событие к периоду до или после среза знаний модели.
Это означает, что дело не только в нехватке данных. Доступ к дополнительной информации повышает результаты, но не закрывает разрыв, причём для самых цитируемых работ он был заметнее.
LLM пока выступают скорее ретроспективными толкователями уже известных результатов, чем надёжными предсказателями будущих.
@ai_machinelearning_big_data
#AI #ML #LLM #Research #Science #Benchmark
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔45👍30😐14❤13🤨10🔥5🫡4
Liquid AI выкатили LFM2.5-8B-A1B - MoE на 8B параметров с 1.5B активных, заточенную под запуск на телефонах, ноутбуках и роботах.
Что внутри:
- гибридная MoE-архитектура линейки LFM2.5
- контекст 128K
- 38T токенов претрейна плюс крупномасштабный RL поверх
- LFM2 open-weight лицензия
- дообучение под узкую задачу влезает на одну GPU
По заявлениям команды, модель уверенно работает с tool calling и тягается с моделями в 3-4 раза тяжелее.
Веса уже на HF. Ждём первых замеров на MMLU-Pro, IFEval и BFCL - особенно интересно, как 1.5B активных параметров поведут себя на длинных tool-use цепочках.
• Блог: http://liquid.ai/blog/lfm2-5-8b-a1b
• Веса: https://huggingface.co/LiquidAI/LFM2.5-8B-A1B
• Документация: http://docs.liquid.ai
• Потестить: http://playground.liquid.ai
@ai_machinelearning_big_data
Что внутри:
- гибридная MoE-архитектура линейки LFM2.5
- контекст 128K
- 38T токенов претрейна плюс крупномасштабный RL поверх
- LFM2 open-weight лицензия
- дообучение под узкую задачу влезает на одну GPU
По заявлениям команды, модель уверенно работает с tool calling и тягается с моделями в 3-4 раза тяжелее.
Веса уже на HF. Ждём первых замеров на MMLU-Pro, IFEval и BFCL - особенно интересно, как 1.5B активных параметров поведут себя на длинных tool-use цепочках.
• Блог: http://liquid.ai/blog/lfm2-5-8b-a1b
• Веса: https://huggingface.co/LiquidAI/LFM2.5-8B-A1B
• Документация: http://docs.liquid.ai
• Потестить: http://playground.liquid.ai
@ai_machinelearning_big_data
1👍48🔥47👏18❤7🤓7🎉2🤩1🌚1