WSJ пишет, что OpenAI сделала первый официальный шаг к IPO.
Компания конфиденциально подала черновые документы для выхода на биржу.
Конфиденциальная форма S-1 позволяет OpenAI начать проверку в SEC, не раскрывая сразу выручку, убытки, структуру клиентов, расходы на вычисления и зарплаты руководителей. Так компания может готовиться к листингу, сохраняя чувствительные цифры закрытыми.
На прошлой неделе Anthropic уже подала свои конфиденциальные документы для IPO. Поэтому это больше не только гонка моделей, а ещё и гонка капитала между лабораториями, которым нужно финансировать следующее поколение ИИ-инфраструктуры.
wsj.com/tech/ai/openai-kicks-off-ipo-process-in-test-of-investor-appetite-for-top-ai-labs-eb7bebe1
Компания конфиденциально подала черновые документы для выхода на биржу.
Конфиденциальная форма S-1 позволяет OpenAI начать проверку в SEC, не раскрывая сразу выручку, убытки, структуру клиентов, расходы на вычисления и зарплаты руководителей. Так компания может готовиться к листингу, сохраняя чувствительные цифры закрытыми.
На прошлой неделе Anthropic уже подала свои конфиденциальные документы для IPO. Поэтому это больше не только гонка моделей, а ещё и гонка капитала между лабораториями, которым нужно финансировать следующее поколение ИИ-инфраструктуры.
wsj.com/tech/ai/openai-kicks-off-ipo-process-in-test-of-investor-appetite-for-top-ai-labs-eb7bebe1
❤1👍1
20 июня – Летняя школа ШЕН Центрального университета
Хочешь узнать, как применять математику, код и машинное обучение в биологии и медицине, но не понимаешь, с чего начать?
Приглашаем на Летнюю школу программы «ИИ в биотехе» Школы естественных наук Центрального университета!
Программа реализуется совместно с инженерной школой и факультетом биоинженерии и биоинформатики МГУ, а также индустриальными партнёрами: Genotek и BIOCAD.
Что будет на Летней школе:
— Узнаешь, как ИИ меняет биотех: от анализа геномов до дизайна лекарств с помощью нейросетей;
— Послушаешь лекции от ведущих экспертов: Дмитрия Пензара, Александра Ракитько, Александра Надолинского и победителя конкурса «Биомолекула» Андрея Кузнецова;
— Познакомишься с магистерской программой «ИИ в биотехе»: направления подготовки, курсы, преподаватели, карьерные перспективы;
— Примешь участие в квестах и получишь шанс выиграть фаст-трек на грант до 75% от стоимости обучения.
Фаст-трек – это возможность поступить в магистратуру, минуя онлайн-контест: достаточно пройти собеседование и ревью анкеты.
Как попасть на Летнюю школу?
Регистрация по ссылке.
Отбор участников – до 15 июня. Результаты пришлём на почту.
Место проведения: кампус Центрального университета, м. Маяковская, ул. Гашека, 7
Ждём тебя на Летней школе «ИИ в биотехе»!
Хочешь узнать, как применять математику, код и машинное обучение в биологии и медицине, но не понимаешь, с чего начать?
Приглашаем на Летнюю школу программы «ИИ в биотехе» Школы естественных наук Центрального университета!
Программа реализуется совместно с инженерной школой и факультетом биоинженерии и биоинформатики МГУ, а также индустриальными партнёрами: Genotek и BIOCAD.
Что будет на Летней школе:
— Узнаешь, как ИИ меняет биотех: от анализа геномов до дизайна лекарств с помощью нейросетей;
— Послушаешь лекции от ведущих экспертов: Дмитрия Пензара, Александра Ракитько, Александра Надолинского и победителя конкурса «Биомолекула» Андрея Кузнецова;
— Познакомишься с магистерской программой «ИИ в биотехе»: направления подготовки, курсы, преподаватели, карьерные перспективы;
— Примешь участие в квестах и получишь шанс выиграть фаст-трек на грант до 75% от стоимости обучения.
Фаст-трек – это возможность поступить в магистратуру, минуя онлайн-контест: достаточно пройти собеседование и ревью анкеты.
Как попасть на Летнюю школу?
Регистрация по ссылке.
Отбор участников – до 15 июня. Результаты пришлём на почту.
Место проведения: кампус Центрального университета, м. Маяковская, ул. Гашека, 7
Ждём тебя на Летней школе «ИИ в биотехе»!
Forwarded from Анализ данных (Data analysis)
Claude 5 Fable - кратко:
- почти на всех проверенных бенчмарках модель показывает уровень SOTA
- особенно сильна в разработке, работе со знаниями, vision-задачах и научных исследованиях
- чем длиннее и сложнее задача, тем сильнее Fable 5 отрывается от других моделей Claude
- модель эффективнее расходует токены, чем прошлые версии Claude
- Fable 5 удерживает фокус на задачах длиной в миллионы токенов и улучшает результат, используя собственные заметки
Fable 5 - это не просто «лучше бенчмарки». Она эффективнее, дольше работает без потери контекста, лучше управляет длинными задачами и даёт больше возможностей для сложных агентных сценариев.
GPT-5.6 уже близко.
Интересно, выпустит ли OpenAI свой аналог Mythos.
Во время раннего тестирования Stripe заявила, что Fable 5 сжала месяцы инженерной работы до нескольких дней. В Ruby-кодовой базе на 50 млн строк модель за один день провела миграцию по всему репозиторию - работу, которая вручную заняла бы у целой команды больше двух месяцев.
https://www.anthropic.com/news/claude-fable-5-mythos-5
- почти на всех проверенных бенчмарках модель показывает уровень SOTA
- особенно сильна в разработке, работе со знаниями, vision-задачах и научных исследованиях
- чем длиннее и сложнее задача, тем сильнее Fable 5 отрывается от других моделей Claude
- модель эффективнее расходует токены, чем прошлые версии Claude
- Fable 5 удерживает фокус на задачах длиной в миллионы токенов и улучшает результат, используя собственные заметки
Fable 5 - это не просто «лучше бенчмарки». Она эффективнее, дольше работает без потери контекста, лучше управляет длинными задачами и даёт больше возможностей для сложных агентных сценариев.
GPT-5.6 уже близко.
Интересно, выпустит ли OpenAI свой аналог Mythos.
Во время раннего тестирования Stripe заявила, что Fable 5 сжала месяцы инженерной работы до нескольких дней. В Ruby-кодовой базе на 50 млн строк модель за один день провела миграцию по всему репозиторию - работу, которая вручную заняла бы у целой команды больше двух месяцев.
https://www.anthropic.com/news/claude-fable-5-mythos-5
❤5🔥4🥰1🤔1
В машинном обучении всё чаще важен не один конкретный пример, а то, как устроены данные целиком.
Например, модель обучали на одном распределении картинок, текстов или действий, а в реальности она получает немного другие данные. Обычная метрика может сказать: “распределения отличаются”. Wasserstein-подход показывает глубже: насколько далеко одно распределение нужно “перенести”, чтобы оно стало похоже на другое.
Идея пришла из оптимального транспорта. Представьте две кучи песка: одна форма - это первое распределение, другая второе. Расстояние Вассерштейна считает минимальную работу, которую нужно сделать, чтобы переложить песок из первой формы во вторую.
Почему это важно для ML:
* помогает анализировать сдвиг данных
* полезно для domain adaptation
* даёт инструменты для устойчивого обучения
* применяется в генеративных моделях
* помогает изучать обобщение нейросетей
* используется в reinforcement learning
В отличие от KL-дивергенции, Wasserstein distance учитывает геометрию пространства. Поэтому два распределения могут отличаться не просто “сильно” или “слабо”, а с учётом того, где именно находятся эти различия.
На практике это важно там, где модель должна быть устойчивой: новые домены, шумные данные, генерация, перенос знаний, обучение агентов.
Wasserstein Learning Theory даёт более точный язык для современной ML-задачи: не просто подогнать модель под датасет, а понять, как она ведёт себя при изменении распределения данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤4🔥2
Title: SIA: Self Improving AI with Harness & Weight Updates
В этой работе показали, что ИИ лучше улучшает сам себя, когда меняет не только обвязку вокруг агента, но и обновляет модель.
Проблема в том, что прогресс ИИ до сих пор сильно зависит от людей: они вручную правят промпты, инструменты, код, данные для обучения и веса модели.
Авторы предлагают SIA - цикл, где один ИИ наблюдает за работой task-agent, а затем улучшает либо его внешнюю настройку, либо саму модель.
Внешняя настройка -это промпты, инструменты, правила повторных попыток, парсинг ответа и прочая обвязка. Обновление весов - это изменение поведения модели на основе обратной связи по задаче.
Работает это так: агент пробует много ответов или программ, верификатор оценивает результат, а эти оценки превращаются в обучающий сигнал.
После этого система обновляет небольшой набор дополнительных весов LoRA. Это меняет поведение модели без полного переобучения.
Базовая модель почти не трогается, но LoRA-адаптер постепенно учится: такие ответы давали высокий reward, а такие проваливались.
Авторы проверили подход на трёх разных задачах: классификация обвинений в китайском праве, ускорение GPU kernel-кода и denoising single-cell RNA.
Комбинированная версия обошла вариант, где улучшали только обвязку: 70.1% на LawBench, более быстрый GPU-код, чем у предыдущего лучшего решения, и 0.289 на задаче denoising.
Интересный вывод: хорошая обвязка помогает агенту действовать лучше, но обновление весов помогает ему выучить паттерны задачи, которые одними промптами и инструментами не находятся.
arxiv. org/abs/2605.27276
В этой работе показали, что ИИ лучше улучшает сам себя, когда меняет не только обвязку вокруг агента, но и обновляет модель.
Проблема в том, что прогресс ИИ до сих пор сильно зависит от людей: они вручную правят промпты, инструменты, код, данные для обучения и веса модели.
Авторы предлагают SIA - цикл, где один ИИ наблюдает за работой task-agent, а затем улучшает либо его внешнюю настройку, либо саму модель.
Внешняя настройка -это промпты, инструменты, правила повторных попыток, парсинг ответа и прочая обвязка. Обновление весов - это изменение поведения модели на основе обратной связи по задаче.
Работает это так: агент пробует много ответов или программ, верификатор оценивает результат, а эти оценки превращаются в обучающий сигнал.
После этого система обновляет небольшой набор дополнительных весов LoRA. Это меняет поведение модели без полного переобучения.
Базовая модель почти не трогается, но LoRA-адаптер постепенно учится: такие ответы давали высокий reward, а такие проваливались.
Авторы проверили подход на трёх разных задачах: классификация обвинений в китайском праве, ускорение GPU kernel-кода и denoising single-cell RNA.
Комбинированная версия обошла вариант, где улучшали только обвязку: 70.1% на LawBench, более быстрый GPU-код, чем у предыдущего лучшего решения, и 0.289 на задаче denoising.
Интересный вывод: хорошая обвязка помогает агенту действовать лучше, но обновление весов помогает ему выучить паттерны задачи, которые одними промптами и инструментами не находятся.
arxiv. org/abs/2605.27276
👍4🔥2❤1
Проблема новичков в том, что они учат Python кусками: синтаксис, пару задач, немного теории - и потом не понимают, как собрать из этого реальный проект.
Этот курс закрывает именно этот разрыв. Здесь вы не просто смотрите уроки, а учитесь писать код, разбирать ошибки и собирать рабочие решения на практике.
Внутри:
- Python с нуля
- много практики без сухой теории
- реальные задачи и проекты
- автоматизация рутины
- работа с файлами, данными и API
- понятная логика программирования
- современная разработка с ИИ
- отдельный блок по вайбкодингу
Вайбкодинг это нормальный навык 2026 года и вас научат- правильно ставить задачу, проверять код, понимать результат и быстрее доводить проект до рабочего состояния.
48 часов скидка 60%: https://stepik.org/course/288218/
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5😁2👍1🔥1
OpenRouter запустил Fusion - систему, где на один запрос отвечает не одна модель, а сразу несколько
Суть в том, что Fusion отправляет ваш промпт параллельно в разные модели. Каждая модель пытается решить задачу по-своему, при необходимости использует web search и bash-инструменты, а затем отдельный judge сравнивает ответы. После этого synthesizer собирает финальный вариант.
Получается не просто «выбор лучшей модели», а полноценная серверная схема коллективного мышления:
* несколько моделей работают одновременно;
* инструменты помогают проверять факты и считать;
* judge отбрасывает слабые ответы;
* synthesizer собирает итоговый результат в один связный ответ.
OpenRouter утверждает, что Fusion уже обходит frontier-модели на DRACO, deep research benchmark от Perplexity.
https://openrouter.ai/fusion
@machinelearning_ru
Суть в том, что Fusion отправляет ваш промпт параллельно в разные модели. Каждая модель пытается решить задачу по-своему, при необходимости использует web search и bash-инструменты, а затем отдельный judge сравнивает ответы. После этого synthesizer собирает финальный вариант.
Получается не просто «выбор лучшей модели», а полноценная серверная схема коллективного мышления:
* несколько моделей работают одновременно;
* инструменты помогают проверять факты и считать;
* judge отбрасывает слабые ответы;
* synthesizer собирает итоговый результат в один связный ответ.
OpenRouter утверждает, что Fusion уже обходит frontier-модели на DRACO, deep research benchmark от Perplexity.
https://openrouter.ai/fusion
@machinelearning_ru
🔥7❤3👍2
Исследователи Amazon с помощью серии промптов добились от модели Anthropic Fable информации о небольшом числе уязвимостей безопасности.
Amazon передала результаты американским чиновникам. Это помогло запустить экспортные ограничения, из-за которых Anthropic пришлось отключить Fable 5 и Mythos 5 для всех клиентов.
Главный спор сейчас в том, что именно показало исследование: серьёзный jailbreak, который раскрыл кибервозможности уровня Mythos, или обычную помощь по кибербезопасности, уже доступную в других продвинутых моделях.
Anthropic не согласна с трактовкой правительства. Эксперты по кибербезопасности, изучившие отчёт, тоже сомневаются, стоит ли вообще считать этот случай jailbreak’ом.
Amazon передала результаты американским чиновникам. Это помогло запустить экспортные ограничения, из-за которых Anthropic пришлось отключить Fable 5 и Mythos 5 для всех клиентов.
Главный спор сейчас в том, что именно показало исследование: серьёзный jailbreak, который раскрыл кибервозможности уровня Mythos, или обычную помощь по кибербезопасности, уже доступную в других продвинутых моделях.
Anthropic не согласна с трактовкой правительства. Эксперты по кибербезопасности, изучившие отчёт, тоже сомневаются, стоит ли вообще считать этот случай jailbreak’ом.
👍9❤5🔥3😁1
Рост продуктивности от ИИ не линейный. Он ускоряется по мере глубины использования.
Сотрудники, которые активно используют продвинутые возможности ChatGPT вроде GPT-5 Thinking, Deep Research и Image Generation, а также работают с разными моделями и инструментами, сообщают о гораздо большей экономии времени.
В новом исследовании OpenAI показано: группа, которая экономит больше 10 часов в неделю, использует примерно в 8 раз больше AI-кредитов, чем сотрудники, которые сообщают о нулевой экономии времени.
То есть история не в том, что «дали всем чат-бота и получили небольшой равномерный прирост».
Чем глубже люди встраивают мощные AI-функции в свой рабочий процесс, тем сильнее накапливается экономия времени. Активные пользователи превращают ИИ не в случайного помощника, а в полноценного рабочего ассистента.
Из отчёта OpenAI “The state of enterprise AI”.
openai.com/index/the-state-of-enterprise-ai-2025-report/
Сотрудники, которые активно используют продвинутые возможности ChatGPT вроде GPT-5 Thinking, Deep Research и Image Generation, а также работают с разными моделями и инструментами, сообщают о гораздо большей экономии времени.
В новом исследовании OpenAI показано: группа, которая экономит больше 10 часов в неделю, использует примерно в 8 раз больше AI-кредитов, чем сотрудники, которые сообщают о нулевой экономии времени.
То есть история не в том, что «дали всем чат-бота и получили небольшой равномерный прирост».
Чем глубже люди встраивают мощные AI-функции в свой рабочий процесс, тем сильнее накапливается экономия времени. Активные пользователи превращают ИИ не в случайного помощника, а в полноценного рабочего ассистента.
Из отчёта OpenAI “The state of enterprise AI”.
openai.com/index/the-state-of-enterprise-ai-2025-report/
❤8🔥5👍4
Бесплатный вебинар «Обзор инфраструктуры Ollama» 23 июня в 20:00 МСК .
Все больше команд разворачивают ИИ-модели внутри своей инфраструктуры, чтобы защитить данные, снизить зависимость от внешних сервисов и сократить расходы на API.
На занятии разберем:
• как устроена платформа Ollama для локального запуска LLM;
• установку и настройку на Linux, macOS и Windows;
• работу с моделями: загрузку, запуск, управление версиями;
• квантизацию и оптимизацию моделей для ограниченных ресурсов.
После урока вы:
• поймете архитектуру Ollama и принципы ее работы;
• сможете развернуть локальную LLM без облачных зависимостей;
• узнаете, как эффективно использовать вычислительные ресурсы и выбирать подходящие модели.
Урок пройдет в рамках «курса ИИ для разработчиков» и будет полезен разработчикам, DevOps-инженерам и всем, кто изучает практическое применение ИИ.
Регистрация: https://tglink.io/0d54bd21761c54?erid=2W5zFGyzKCu
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
Все больше команд разворачивают ИИ-модели внутри своей инфраструктуры, чтобы защитить данные, снизить зависимость от внешних сервисов и сократить расходы на API.
На занятии разберем:
• как устроена платформа Ollama для локального запуска LLM;
• установку и настройку на Linux, macOS и Windows;
• работу с моделями: загрузку, запуск, управление версиями;
• квантизацию и оптимизацию моделей для ограниченных ресурсов.
После урока вы:
• поймете архитектуру Ollama и принципы ее работы;
• сможете развернуть локальную LLM без облачных зависимостей;
• узнаете, как эффективно использовать вычислительные ресурсы и выбирать подходящие модели.
Урок пройдет в рамках «курса ИИ для разработчиков» и будет полезен разработчикам, DevOps-инженерам и всем, кто изучает практическое применение ИИ.
Регистрация: https://tglink.io/0d54bd21761c54?erid=2W5zFGyzKCu
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
❤3🔥3
Исследователи из Stanford, University of California и Nanjing University представили SEFD - переработанную версию EDGAR filings для обучения LLM на финансовых документах.
Главная проблема старого подхода в том, что SEC-отчёты часто превращались в плоский текст. Модель видела слова и цифры, но теряла структуру: вложенные таблицы, объединённые заголовки, отступы, знаки, иерархию строк и связь между показателями.
SEFD решает это через layout-faithful MultiMarkdown. Он сохраняет логику документа и финансовых таблиц, но убирает лишний HTML-шум, который раздувает токены и мешает обучению.
Публичный снапшот содержит 152 млрд токенов. Полный архив, по оценке авторов, может дать около 550 млрд токенов длинных финансовых документов. При этом пересечение с Common Crawl-корпусами меньше 0,1%, то есть это почти незаезженный источник данных для финансовых LLM.
Модели получают структуру отчётности. Для финансового анализа это критично, потому что в таких документах значение часто лежит не в отдельной цифре, а в том, где она стоит, к какому заголовку относится и как связана с соседними строками.
arxiv.org/abs/2606.18192v1
Главная проблема старого подхода в том, что SEC-отчёты часто превращались в плоский текст. Модель видела слова и цифры, но теряла структуру: вложенные таблицы, объединённые заголовки, отступы, знаки, иерархию строк и связь между показателями.
SEFD решает это через layout-faithful MultiMarkdown. Он сохраняет логику документа и финансовых таблиц, но убирает лишний HTML-шум, который раздувает токены и мешает обучению.
Публичный снапшот содержит 152 млрд токенов. Полный архив, по оценке авторов, может дать около 550 млрд токенов длинных финансовых документов. При этом пересечение с Common Crawl-корпусами меньше 0,1%, то есть это почти незаезженный источник данных для финансовых LLM.
Модели получают структуру отчётности. Для финансового анализа это критично, потому что в таких документах значение часто лежит не в отдельной цифре, а в том, где она стоит, к какому заголовку относится и как связана с соседними строками.
arxiv.org/abs/2606.18192v1
❤2👍2
Forwarded from AI VK Hub
This media is not supported in your browser
VIEW IN TELEGRAM
1 июля в Москве инженеры и исследователи AI VK расскажут о трансформерных моделях и LLM-агентах в рекомендациях, представят исследовательское направление и поделятся опытом внедрения технологий Discovery в продукты VK с многомиллионной аудиторией.
Спикеры:
В программе:
#aivkhub #recsys
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2
Команда Tongyi Lab из Alibaba представила LOGOS, большую модель для всей естественной науки сразу.
Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции.
Разные научные объекты записываются одним общим языком токенов.
Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками.
По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.
🤗 HuggingFace: https://huggingface.co/LOGOS-Hub
💻 GitHub: https://github.com/LOGOS-Hub/LOGOS
📄 Paper: https://arxiv.org/abs/2606.16905
Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции.
Разные научные объекты записываются одним общим языком токенов.
Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками.
По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.
🤗 HuggingFace: https://huggingface.co/LOGOS-Hub
💻 GitHub: https://github.com/LOGOS-Hub/LOGOS
📄 Paper: https://arxiv.org/abs/2606.16905
❤1