Machinelearning

🌟

Embedded Language Flows: диффузия для текста оживает

Команда из MIT показала, что непрерывная диффузия для текста может быть не просто теоретической выкладкой на бумаге - модель на 105M параметров по их замерам бьёт более крупные (~170M) дискретные и непрерывные DLMs, тратя на порядок меньше данных на обучение и меньше шагов на генерацию.

В отличие от картинок и видео, где диффузионки рулят, с текстом всегда была беда из-за дискретности токенов. В ресёрче популярны Diffusion Language Models, а непрерывные подходы буксовали.

ELF предлагает пересобрать архитектуру так, чтобы непрерывная диффузия наконец поехала.

Идея методики в том, чтобы модель перестала мучить дискретные токены на каждом шаге денойзинга:

🟠Берём замороженный энкодер (T5) и переводим дискретные токены в непрерывное пространство эмбеддингов. В инференсе его не будет, он нужен только на обучении.

🟠Запускаем Flow Matching. На протяжении всего процесса инфернса модель сидит в непрерывном пространстве, решая ODE/SDE.

🟠Дискретизация обратно в текст происходит строго на финальном шаге, при этом отдельный декодер не нужен, веса шарятся с основным денойзером. А ещё в процесс замечательно встаёт классический CFG.

В дискретных моделях CFG был малоизучен и работал заметно хуже, а здесь нормально рулит балансом качества и разнообразия генерации.

🟡

Результаты тестов

🟢Метод обходит топовые дискретные (MDLM, Duo) и непрерывные (FLM, LangFlow) DLMs по генеративной перплексии и делает это, будучи меньше по размеру.

🟢На обучение понадобилось всего 45B токенов. Конкурентам нужно примерно в 10 раз больше.

🟢ELF бьёт даже дистиллированные версии конкурентов (few-step версия FLM, Duo с дистилляцией DCD) на малом числе шагов - хватает 32 шагов с SDE.

🟢Хорошие метрики на задачах с условием (то есть когда генерация опирается на вход): BLEU 26.4 в машинном переводе (WMT14 De-En) и лучшие ROUGE-цифры в XSum среди сравниваемых вариантов.

🟡

Дисклеймер

Это пруф-оф-концепт. Самая большая протестированная модель ELF-L содержит всего 652M параметров.

Внутри тестового диапазона (105M → 652M) скейлинг работает и улучшает метрики, но как поведёт себя метод на 7B–70B - неизвестно.

Так что, если под рукой есть пара свободных кластеров H100 и интерес попробовать что-то новое - код открыт, метод описан, можно смело заниматься. Доступны и тестовые чекпоинты из пейпера.

📌Лицензирование: MIT License

🟡

Arxiv

🟡

Набор моделей

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #Diffusion #ELF #MIT

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🤓33❤29👍16🔥9👏7🗿2🍓1

17.1K views17:19

✔️

Сэм Альтман форсирует выход OpenAI на IPO в сентябре

OpenAI готовит заявку на первичное размещение акций на сентябрь. Сэм Альтман торопит процесс, несмотря на позицию финансового директора Сары Фрайар о необходимости дополнительного времени на подготовку.

На этой неделе суд отклонил иск Илона Маска, обвинявшего OpenAI в незаконном переходе от некоммерческой лаборатории к коммерческой структуре. Закрытие дела устранило одно из юридических препятствий для листинга.

Перед размещением OpenAI предстоит обосновать инвесторам бизнес-модель. Основные проблемы - затраты на дата-центры и невыполнение внутренних KPI по выручке и пользователям.

На стратегию также влияет конкуренция: из-за темпов роста Anthropic в корпоративном секторе OpenAI пришлось корректировать план развития.
wsj.com

✔️

Белый дом предлагает тестировать ИИ-модели за 90 дней до релиза

Администрация США предложила внедрить систему добровольной оценки ИИ-моделей перед выходом на рынок. Инициативу обсуждали на закрытой встрече Управления национальной кибербезопасности США с руководителями ИИ-лабораторий.

Новые правила предполагают передачу правительству доступа к флагманским моделям за 90 дней до релиза. Компании лоббируют сокращение окна тестирования до 14 дней. Критерии отбора систем определят АНБ, УНКБ и Управление по научно-технической политике. Аудит пройдет в конфиденциальном режиме при участии Министерства обороны США.

Поводом для создания механизма стала Mythos от Anthropic. По данным спецслужб, на закрытых тестах система смогла эксплуатировать уязвимости нулевого дня, после чего ведомства ускорили разработку правил превентивного контроля.
theinformation.com

✔️

Инструменты CapCut будут встроены в интерфейс Google Gemini

Google добавит инструменты видеоредактора CapCut в интерфейс Gemini. Пользователи смогут монтировать видео и редактировать фото напрямую в диалоговом окне.

Интеграция объединит этапы создания контента: генерацию идей, написание сценария через LLM, склейку и экспорт ролика в одном интерфейсе.

Точная дата релиза совместного продукта пока неизвестна.
Cupcut в сети Х

✔️

Gemini начнет генерировать контекстную рекламу в поиске Google

Google тестирует диалоговые рекламные форматы в поиске на базе Gemini. В ИИ-режиме выдачи модель генерирует текст контекстного объявления с объяснением, как продукт решает задачу из запроса пользователя. Блоки сохранят обязательную пометку о спонсорстве.

Интеграция включает несколько форматов: адаптация креатива под узкие запросы, встраивание коммерческих предложений в сгенерированные рекомендации и персональное обоснование для покупки товаров.

Вместо статичных форм сбора лидов Google добавила встроенного в объявление интерактивного чат-бота, который отвечает на вопросы по базе знаний сайта компании.

В рамках программы Direct Offers, Gemini научилась динамически собирать персональные скидочные наборы. Продавцы, работающие по протоколу UCP смогут закрывать сделки через чекаут напрямую в поисковом интерфейсе.
blog.google

✔️

AMD представила процессоры Ryzen AI Max 400

Новая серия построена на базе архитектуры Strix Halo. Чипы поддерживают до 192 ГБ объединенной памяти стандарта LPDDR5X по 256-битной шине и допускают ручное выделение до 160 ГБ в качестве видеопамяти для встроенной графики. Это позволяет локально запускать LLM размером 300 млрд параметров.

Флагманский 16-ядерный чип Ryzen AI Max+ PRO 495 работает на частоте до 5,20 ГГц. Встроенный GPU RDNA 3.5 задействует 40 вычислительных блоков на частоте до 3,00 ГГц. Производительность интегрированного NPU составляет 55 TOPS.

В серию также вошли младшие модели с графикой на 32 блока: 12-ядерный PRO 490 и 8-ядерный PRO 485. Релиз потребительских версий запланирован на конец года.
techpowerup.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍40🤔37❤21🔥11😐9👏6🎉4

17.7K views06:20

Machinelearning

✔️

Antigravity втрое повысил лимиты

Варун Мохан, участник команды разработки Google Antigravity и бывший основатель Windsurf, объявил в сети X о пересмотре правил использования моделей Gemini на платформе.

По его словам, лимиты запросов для всех платных тарифов Gemini увеличиваются втрое на постоянной основе, а недельные квоты пользователей Antigravity будут сброшены и начислены заново. Изменения уже вступили в силу.

Сообщение стало реакцией на критику со стороны разработчиков, недовольных функциональными ограничениями платформы и высоким расходом ресурсов при работе с ней.

Мохан признал, что команда допустила ошибки при принятии ряда решений, и пообещал внимательнее учитывать обратную связь сообщества при дальнейшей доработке продукта.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍72❤44🔥15👏14🎉9🤩4😁3🥱1🍓1

17.7K views09:43

Machinelearning

✔️

Сбер запустил Маркуса - мультиагентную систему для команды маркетинга и коммуникаций.

Это рабочий агент с ролью, памятью, KPI и доступом к контексту департамента.

Его представили на презентации Сбера и СберМаркетинга.

Маркус мониторит СМИ и соцсети, ищет репутационные риски, анализирует рынок, расшифровывает аудио и видео, готовит черновики пресс-релизов, постов, презентаций и отчётов. Ещё он оценивает кампании по внутренним бренд-критериям: человечность, креативность, эстетика, простота, инновационность.

Агент уже встроен в рутину команды. Он каждое утро рассылает сводки в 30+ группах, а по запросу может раздать задачи, KPI и дедлайны по девяти подразделениям.

Интересен формат внедрения: агенту дают конкретное место в процессе, источники данных, правила бренда, зоны ответственности и сценарии взаимодействия с людьми.

Гглавный риск смещается в качество контроля. Если агент работает с репутацией, задачами, дедлайнами и коммуникациями, нужны аудит, права доступа, проверка фактов и понятная ответственность за результат.

Сбер показывает близкий к реальности сценарий корпоративных агентов: не магический «цифровой сотрудник», а операционный слой, который каждый день собирает данные, готовит материалы и разгружает команду от рутины.

@ai_machinelearning_big_data

#news #ai

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🤣66🤔26❤19👍10👏10🔥7💯7🗿3🤬2🥱1🌭1

15.3K views16:46

Machinelearning

✔️

Китай ввел в эксплуатацию первый в мире подводный дата-центр

Близ Шанхая запущен подводный центр обработки данных, питающийся от ветроэнергетики, - об этом сообщили китайские СМИ со ссылкой на разработчиков проекта.

Объект вышел на полноценную коммерческую эксплуатацию на прошлой неделе, после серии пробных запусков ранее в этом году.

ЦОД мощностью 24 МВт размещён под водой рядом с турбинами ветроэлектростанции и вмещает около 2 тысяч серверов, включая GPU-кластеры China Telecom и оператора LinkWise.

Оборудование поводного дата-центра используется для задач искусственного интеллекта, разметки больших данных, развития 5G и обучения китайских языковых моделей.

Стоимость проекта оценивается примерно в 226 млн долларов, его строительство завершилось в октябре 2025 года.

В проекте полностью отказались от промышленных систем охлаждения: тепло от серверов отводит морская вода, а электричество поступает напрямую от близлежащих ветряков.

Данные о технических параметрах в публикациях расходятся. Часть источников указывает глубину размещения модулей около 10 метров, другие - 35 метров.

Специалисты, причастные к проекту, признают, что технология находится на ранней стадии.

К числу нерешённых вопросов относят коррозию от солёной воды, долговременную герметизацию под давлением, надёжность подводных кабелей, доступность оборудования для обслуживания и возможное воздействие на морскую среду.

Ранее схожий эксперимент, Project Natick, проводила Microsoft, однако в коммерческую эксплуатацию его не вывели.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍99👏24🤔23❤12🤷‍♂10🌚10🔥8🤬5⚡1

17.4K views17:53

Machinelearning

🌟

Tencent выпустила набор моделей машинного перевода Hy-MT2

Линейка включает 3 версии: Hy-MT2-1.8B, Hy-MT2-7B и Hy-MT2-30B-A3B.

Все модели поддерживают перевод между 33 языками (включая русский), а также 5 диалектами и языками национальных меньшинств КНР.

Tencent делает акцент на возможности локального запуска модели на устройствах с ограниченными ресурсами.

Версия с экстремальным квантованием в 1,25 бит, собранная с помощью собственного фреймворка Sherry, занимает около 440 МБ и способна работать на мобильных чипах Apple, Qualcomm и MediaTek без подключения к интернету.

Скорость инференса на Apple A15 заявлена в 1,5 раза выше, чем у 4-битной версии предыдущей модели Hy-MT1.5.

По результатам собственного тестирования Tencent, на бенчмарке FLORES-200 версии Hy-MT2 показали средние результаты 88,1%, 96,9% и 98,1% - компания называет это сопоставимым с показателями Gemini 3.1 Pro.

Tencent утверждает, что старшая модель 30B-A3B превосходит DeepSeek-V4-Pro и Kimi K2.6 на ряде тестов, а младшая 1,8B-версия опережает по среднему качеству перевода коммерческие API, включая решение Microsoft.

Вместе с моделью Tencent открыла исходники IFMTBench - собственного тестового набора для оценки того, насколько точно перевод следует пользовательским инструкциям о стиле, терминологии и формате вывода.

Помимо этого, компания выступает партнёром соревнований WMT26 - General Machine Translation и Video Subtitle Translation.

Одновременно, в экосистеме WeChat запущено мини-приложение Tencent Hy Translate. Полноценные приложения для iOS и Android, по словам компании, появятся позднее.

📌Лицензирование: Tencent HY Ccommunity License

🟡

🟡

🟡

🟡

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #MT #HYMT2 #Tencent

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤40🤓35👍21🎉11👏9🔥6💘2🌚1

14.6K views20:04

Machinelearning

📌

Anthropic опубликовала апдейт по проекту Glasswing

Glasswing - инициатива по поиску уязвимостей в системно значимом программном обеспечении с помощью ИИ.

Согласно обновленному отчету, около 50 её партнёров за первый месяц работы с моделью Mythos Preview обнаружили более 10 000 уязвимостей высокого и критического уровня.

🟡

Среди приведённых примеров:

🟢Cloudflare, в чьих ключевых системах было найдено 2 000 ошибок, из них 400 серьёзных;

🟢Mozilla обнаружила в Firefox 150 271 уязвимость (примерно в 10 раз больше, чем при аналогичной проверке Firefox 148 моделью Claude Opus 4.6);

🟢Британский AI Security Institute подтвердил, что Mythos Preview стал первой моделью, прошедшей оба его сценария многошаговых кибератак от начала до конца.

🟡

Параллельно Anthropic сама сканировала более тысячи опенсорс-проектов

Mythos отметила как потенциально опасные 6 202 уязвимости высокого и критического уровня. Из 1 752 случаев, проверенных независимыми фирмами, 90,6% оказались реальными, а 62,4% подтвердили заявленную тяжесть.

В числе подтверждённых: уязвимость в криптографической библиотеке wolfSSL (CVE-2026-5194), которая позволяла подделывать сертификаты сайтов (уже исправлена).

Anthropic отмечает, что узким местом теперь стала не идентификация ошибок, а их проверка и устранение. Из 530 переданных мейнтейнерам критичных уязвимостей закрыты пока только 75.

Несколько разработчиков попросили Anthropic замедлить темп раскрытия, так как нагрузка превышает их возможности. Среднее время подготовки патча для серьёзной уязвимости составляет около 2-х недель.

В отчёте также упомянут эпизод в одном из банков-партнёров: по словам Anthropic, модель помогла предотвратить мошеннический перевод на 1,5 миллиона долларов после взлома почты клиента.

Название банка и подробности инцидента не раскрываются.

Anthropic обещает расширять Glasswing с участием правительств США и союзных государств.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍95❤20👏15🤩9🔥5🐳2👌1🤣1🙈1💘1

13.8K views07:19

✔️

Codex научился извлекать скрытый текст приложений через Appshots

OpenAI добавила в macOS-клиент Codex функцию Appshots для быстрой передачи контекста активного окна ИИ-ассистенту.

По нажатию обеих клавиш Command система делает снимок экрана и извлекает исходный текст приложения через Accessibility API, включая данные за пределами области прокрутки. Это позволяет передавать логи, API-документацию и код без ручного копирования.

Для работы требуются разрешения macOS на запись экрана и универсальный доступ. Нововведение дополняет режим автономного управления интерфейсом Computer Use и доступно на всех тарифах Codex.
openai.com

✔️

Black Forest Labs выпустила инпэйнт-модель FLUX Erase

FLUX Erase предназначена для удаления объектов с изображений. Модель работает по маске без текстовых промптов, достраивая фон, текстуры и тени.

Скорость генерации - 4,54 секунды на изображении 1024х1024. По оценке BFL, ближайшие аналоги тратят на ту же задачу более 12 секунд. Стоимость API-запроса составляет 3 цента мегапиксельную картинку.

В тестах на качество ретуши FLUX Erase обходит GPT Image-2 и Finegrain Eraser Standard, а по стоимости опережает Nano Banana Pro. Модель доступна только через API, попробовать FLUX Erase можно в бесплатном веб-демо.
bfl.ai

✔️

В Claude Code закрыли уязвимость, позволявшую красть токены разработчиков

Anthropic пропатчила уязвимость в песочнице Claude Code. Баг позволял извлекать токены и исходный код разработчиков через инъекцию нулевого байта в SOCKS5.

Внутренний фильтр считал строку с нулевым символом безопасной, после чего операционная система обрезала текст по байту и подключалась к заблокированному хосту. В связке с промпт-инъекцией через анализируемые моделью файлы механизм давал возможность выполнять код и отправлять данные на сторонние серверы.

Уязвимость присутствовала в релизах до версии 2.1.89. Патч вышел в сборке 2.1.90 без упоминания в чейнджлоге и регистрации CVE. По заявлению Anthropic, разработчики обнаружили и закрыли баг внутренними силами до публикации отчета исследователей.
theregister.com

✔️

Perplexity открыла исходный код сканера локальных уязвимостей

Bumblebee - утилита для поиска уязвимостей на локальных машинах под macOS и Linux. Сканер выявляет скомпрометированные зависимости, вредоносные плагины и опасные конфигурации ИИ-инструментов.

Инструмент работает исключительно в режиме чтения: анализирует метаданные и lock-файлы без запуска пакетных менеджеров. Это исключает случайное выполнение вредоносных скриптов при проверке зараженных библиотек.

Bumblebee анализирует 4 вектора: пакетные менеджеры, расширения для редакторов кода (семейство VS Code, включая Cursor и Windsurf), браузерные плагины и конфигурации ИИ-агентов на базе протокола MCP.

ИБ-команды могут интегрировать сканер в MDM-решения, загружать кастомные индикаторы компрометации и запускать проверки в трех режимах - от фонового мониторинга до глубокого расследования инцидентов.
perplexity.ai

✔️

Губернатор Калифорнии подписал указ о защите рынка труда от ИИ

Штат планирует выделять субсидии бизнесу, который отказывается от замены сотрудников нейросетями, и финансировать программы переобучения офисных работников.

Дополнительно правительство совместно с ИИ-индустрией рассмотрит концепцию универсального базового капитала в виде распределения среди граждан долей в фондах или акций компаний.

В администрации признают нехватку стандартных пособий по безработице и планируют пересмотреть налоговую систему. По оценке властей, сейчас она экономически поощряет внедрение алгоритмов и дестимулирует наем людей.
gov.ca.gov

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍64👏14❤11🤔8💯4🔥1😁1

7.11K views12:03

About

Blog

Apps

Platform