Data Secrets
90.8K subscribers
7.03K photos
791 videos
20 files
3.17K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
OpenAI поделились статистикой по Codex. Есть интересное.

openai.com/index/how-agents-are-transforming-work/

Смотрим:

– Внутри OpenAI Codex теперь составляет 99,8% их выходных токенов, а ChatGPT – только 0,2%.

– Индивидуальные юзеры все еще концентрируются в ChatGPT, а вот у бизнеса токены в Codex составляют ~64% от общего потребления.

Топ-1% самых активных юзеров Codex в среднем запускают агентов на 71 час в сутки (это сумма по всем агентам).

– Со временем люди все больше и больше делегируют агентам действительно долгие задачи. Например, промпты на задачи, которые занимают ~8-часов работы человека, теперь составляют более четверти запросов. Для сравнения, в декабре их было чуть больше 2%.

Исходя из перечисленного, вопрос: это все еще люди вайбкодят с агентами, или уже агенты с людьми?
23109😁5632🔥8👍5🏆2🤝2🫡2👌1
😳
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁36445🤯1411💯98🍾21😎1
Они добрались до OpenAI: правительство США будет одобрять доступ к GPT-5.6 «клиент за клиентом»

Администрация Трампа связалась с Альтманом и «попросила» его не выпускать модель без одобрения. Конечно же, «по соображениям безопасности».

Так что модель сначала выйдет в ограниченном preview, и только когда-нибудь потом (возмооожно) станет доступна простым смертным: во время периода превью чиновники будут «одобрять доступ клиент за клиентом» (цитата Сэма).

Лицензирование де-факто
1🫡1648428🗿18😁10🤯7🤗7🤔3😍2😎2🕊1
Оранжевый – доля токенов американских моделей в OpenRouter
Серый – доля китайских

Сверху разбиение в июне 2025, снизу – в июне 2026

И кто тут теперь техно-лидер? ⌨️

* из статьи Bloomberg
Please open Telegram to view this post
VIEW IN TELEGRAM
11166😁84🤯32👍168😍6🏆5🗿5💯2🎄2
Итак, встречайте: GPT-5.6

https://openai.com/index/previewing-gpt-5-6-sol/

Анонсировали три модели, в честь солнечной системы (с самооценкой у создателей все ок):

1. Sol – самая крупная и крутая. На многих бенчмарках обходит Mythos, и при этом дешевле в два раза. При этом авторы пишут, что модель использует в три раза меньше токенов. В целом экономия в 5-6 раз (ну типа).

2. Terra – промежуточный вариант. Уже в три раза дешевле Mythos, уверенно обходит Opus 4.8.

3. Luna – самый дешевая и быстрая, но по результатам все еще хороша.

Бенчмарков показали маловато, так что на другие замеры еще посмотрим. Общий доступ обещают в ближайшие недели, пока что модели вышли только для ограниченной группы тестеров.

Хоть бы не повторилась история с Fable 🙏
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1168🔥69👍26🤯13😁4🍾4❤‍🔥3🤔2🍓11
Обновление по Fable и Mythos:

С 12 июня мы тесно сотрудничаем с правительством США, чтобы восстановить доступ к Claude Mythos 5 и Fable 5. Сегодня правительство уведомило нас, что мы можем повторно развернуть Mythos 5 для некоторых организаций США, которые управляют и защищают критическую инфраструктуру.

Мы быстро восстанавливаем доступ для этих организаций, и мы продолжаем работать с правительством, чтобы расширить доступ к Mythos 5 и снова сделать Fable 5 доступным для общего использования.


Честно говоря, пока не слишком обнадеживающе
161🕊33😁20🤔148👍4🎉3🫡3😎2👏1🆒1
Новый дроп от DeepSeek: выложили полностью открытый стек для ускорения генерации LLM

Внутри готовые алгоритмы, обучение, эвал и даже пайплайн для данных. Бери и пользуйся, супер практично. github.com/deepseek-ai/DeepSpec

Основная соль – в алгоритме DSpark. Его DeepSeek уже использует для DeepSeek-V4 Flash и Pro в проде, и, по их данным, относительно старого бейзлайна скорость генерации для пользователя выросла примерно на 60–85%.

Как устроен алгоритм:

– Фундаментально, это небольшая модель, которая пишет черновики для основной LLM. Это называется драфт-модель.

– Такой подход сейчас в моде (Google, например, делают такое для Gemma: t.me/data_secrets/9179), но DeepSeek выводят его на новый уровень. Их драфт-модель работает необычно, в два этапа. Сначала параллельно набрасывается блок токенов, а потом легкий марковский модуль уточняет зависимости между соседними токенами. Благодаря такому подходу драфтер и работает быстро, и не очень сыпится в хвостах.

– После того, как драфтер накидал черновик, основная LLM его проверяет и принимает только правильный префикс, корректируя остальное. При этом DSpark сам решает, сколько токенов отправить на проверку, основываясь на оценках уверенности по токенам и текущей нагрузке на железо.

В результате получаем ускорение минимум в 1.5 раза абсолютно без потери качества. Снимаем шляпу перед DeepSeek за такой опенсорс.
1236🔥79👍39👏4😁3🕊3🍾2🤗2
Правительство США дропнуло новый бенчмарк для LLM ⚡️
Please open Telegram to view this post
VIEW IN TELEGRAM
😁649👍40🔥2911🗿94🫡4😍3🕊2🐳2🍓2
GitVerse × GigaCode: ваш персональный ИИ-напарник

Запустили ранний доступ к ИИ-чату внутри GitVerse. Чат — часть GigaCode, агентного ИИ-ассистента, который умеет самостоятельно работать с файлами, анализировать кодовую базу и генерировать тесты.

Как чат упрощает жизнь:
· Разбор ошибок. Кидаете запрос — он изучает логи и объясняет, что пошло не так.
· Навигация по платформе. Мгновенно находит нужные инструкции и подсказывает, как всё работает.
· Помощь с кодом. Объяснит незнакомый фрагмент и предложит решение.

Запросить ранний доступ и протестировать
1😁7125🗿16🔥764🎉2💯2🤨2🫡2🎄1
Media is too big
VIEW IN TELEGRAM
Дарио Амодеи заявил, что опенсорс в ИИ – это «отвлекающий маневр»

Он сказал, что на самом деле это не тот опенсорс, к которому мы привыкли:

«Вы все равно не можете видеть внутренности модели, и основные плюсы опенсорса вроде коллективной доработки работают с сфере ИИ иначе»


Основной аргумент:

«В итоге вам все равно придется хостить ее в облаке»


В довершении CEO Anthropic заявил, что для конкуренции важнее способности модели и ее эффективность на инференсе, а не «ярлык» опенсорса и лицензия.

Мнения? 😐
Please open Telegram to view this post
VIEW IN TELEGRAM
2🗿200😁84401612👍7🔥42🕊1😎1