OpenAI поделились статистикой по Codex. Есть интересное.
openai.com/index/how-agents-are-transforming-work/
Смотрим:
– Внутри OpenAI Codex теперь составляет 99,8% их выходных токенов, а ChatGPT – только 0,2%.
– Индивидуальные юзеры все еще концентрируются в ChatGPT, а вот у бизнеса токены в Codex составляют ~64% от общего потребления.
– Топ-1% самых активных юзеров Codex в среднем запускают агентов на 71 час в сутки (это сумма по всем агентам).
– Со временем люди все больше и больше делегируют агентам действительно долгие задачи. Например, промпты на задачи, которые занимают ~8-часов работы человека, теперь составляют более четверти запросов. Для сравнения, в декабре их было чуть больше 2%.
Исходя из перечисленного, вопрос: это все еще люди вайбкодят с агентами, или уже агенты с людьми?
openai.com/index/how-agents-are-transforming-work/
Смотрим:
– Внутри OpenAI Codex теперь составляет 99,8% их выходных токенов, а ChatGPT – только 0,2%.
– Индивидуальные юзеры все еще концентрируются в ChatGPT, а вот у бизнеса токены в Codex составляют ~64% от общего потребления.
– Топ-1% самых активных юзеров Codex в среднем запускают агентов на 71 час в сутки (это сумма по всем агентам).
– Со временем люди все больше и больше делегируют агентам действительно долгие задачи. Например, промпты на задачи, которые занимают ~8-часов работы человека, теперь составляют более четверти запросов. Для сравнения, в декабре их было чуть больше 2%.
Исходя из перечисленного, вопрос: это все еще люди вайбкодят с агентами, или уже агенты с людьми?
23❤109😁56 32🔥8👍5🏆2🤝2🫡2👌1
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁364 45🤯14 11💯9❤8🍾2⚡1😎1
Они добрались до OpenAI: правительство США будет одобрять доступ к GPT-5.6 «клиент за клиентом»
Администрация Трампа связалась с Альтманом и «попросила» его не выпускать модель без одобрения. Конечно же, «по соображениям безопасности».
Так что модель сначала выйдет в ограниченном preview, и только когда-нибудь потом (возмооожно) станет доступна простым смертным: во время периода превью чиновники будут «одобрять доступ клиент за клиентом» (цитата Сэма).
Лицензирование де-факто
Администрация Трампа связалась с Альтманом и «попросила» его не выпускать модель без одобрения. Конечно же, «по соображениям безопасности».
Так что модель сначала выйдет в ограниченном preview, и только когда-нибудь потом (возмооожно) станет доступна простым смертным: во время периода превью чиновники будут «одобрять доступ клиент за клиентом» (цитата Сэма).
Лицензирование де-факто
1🫡164 84❤28🗿18😁10🤯7🤗7🤔3😍2😎2🕊1
Оранжевый – доля токенов американских моделей в OpenRouter
Серый – доля китайских
Сверху разбиение в июне 2025, снизу – в июне 2026
И кто тут теперь техно-лидер?⌨️
* из статьи Bloomberg
Серый – доля китайских
Сверху разбиение в июне 2025, снизу – в июне 2026
И кто тут теперь техно-лидер?
* из статьи Bloomberg
Please open Telegram to view this post
VIEW IN TELEGRAM
11⚡166😁84🤯32👍16❤8😍6🏆5🗿5💯2🎄2
Итак, встречайте: GPT-5.6
https://openai.com/index/previewing-gpt-5-6-sol/
Анонсировали три модели, в честь солнечной системы (с самооценкой у создателей все ок):
1. Sol – самая крупная и крутая. На многих бенчмарках обходит Mythos, и при этом дешевле в два раза. При этом авторы пишут, что модель использует в три раза меньше токенов. В целом экономия в 5-6 раз (ну типа).
2. Terra – промежуточный вариант. Уже в три раза дешевле Mythos, уверенно обходит Opus 4.8.
3. Luna – самый дешевая и быстрая, но по результатам все еще хороша.
Бенчмарков показали маловато, так что на другие замеры еще посмотрим. Общий доступ обещают в ближайшие недели, пока что модели вышли только для ограниченной группы тестеров.
Хоть бы не повторилась история с Fable🙏
https://openai.com/index/previewing-gpt-5-6-sol/
Анонсировали три модели, в честь солнечной системы (с самооценкой у создателей все ок):
1. Sol – самая крупная и крутая. На многих бенчмарках обходит Mythos, и при этом дешевле в два раза. При этом авторы пишут, что модель использует в три раза меньше токенов. В целом экономия в 5-6 раз (ну типа).
2. Terra – промежуточный вариант. Уже в три раза дешевле Mythos, уверенно обходит Opus 4.8.
3. Luna – самый дешевая и быстрая, но по результатам все еще хороша.
Бенчмарков показали маловато, так что на другие замеры еще посмотрим. Общий доступ обещают в ближайшие недели, пока что модели вышли только для ограниченной группы тестеров.
Хоть бы не повторилась история с Fable
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤168🔥69👍26🤯13😁4🍾4❤🔥3🤔2🍓1 1
Обновление по Fable и Mythos:
Честно говоря, пока не слишком обнадеживающе
С 12 июня мы тесно сотрудничаем с правительством США, чтобы восстановить доступ к Claude Mythos 5 и Fable 5. Сегодня правительство уведомило нас, что мы можем повторно развернуть Mythos 5 для некоторых организаций США, которые управляют и защищают критическую инфраструктуру.
Мы быстро восстанавливаем доступ для этих организаций, и мы продолжаем работать с правительством, чтобы расширить доступ к Mythos 5 и снова сделать Fable 5 доступным для общего использования.
Честно говоря, пока не слишком обнадеживающе
Новый дроп от DeepSeek: выложили полностью открытый стек для ускорения генерации LLM
Внутри готовые алгоритмы, обучение, эвал и даже пайплайн для данных. Бери и пользуйся, супер практично. github.com/deepseek-ai/DeepSpec
Основная соль – в алгоритме DSpark. Его DeepSeek уже использует для DeepSeek-V4 Flash и Pro в проде, и, по их данным, относительно старого бейзлайна скорость генерации для пользователя выросла примерно на 60–85%.
Как устроен алгоритм:
– Фундаментально, это небольшая модель, которая пишет черновики для основной LLM. Это называется драфт-модель.
– Такой подход сейчас в моде (Google, например, делают такое для Gemma: t.me/data_secrets/9179), но DeepSeek выводят его на новый уровень. Их драфт-модель работает необычно, в два этапа. Сначала параллельно набрасывается блок токенов, а потом легкий марковский модуль уточняет зависимости между соседними токенами. Благодаря такому подходу драфтер и работает быстро, и не очень сыпится в хвостах.
– После того, как драфтер накидал черновик, основная LLM его проверяет и принимает только правильный префикс, корректируя остальное. При этом DSpark сам решает, сколько токенов отправить на проверку, основываясь на оценках уверенности по токенам и текущей нагрузке на железо.
В результате получаем ускорение минимум в 1.5 раза абсолютно без потери качества. Снимаем шляпу перед DeepSeek за такой опенсорс.
Внутри готовые алгоритмы, обучение, эвал и даже пайплайн для данных. Бери и пользуйся, супер практично. github.com/deepseek-ai/DeepSpec
Основная соль – в алгоритме DSpark. Его DeepSeek уже использует для DeepSeek-V4 Flash и Pro в проде, и, по их данным, относительно старого бейзлайна скорость генерации для пользователя выросла примерно на 60–85%.
Как устроен алгоритм:
– Фундаментально, это небольшая модель, которая пишет черновики для основной LLM. Это называется драфт-модель.
– Такой подход сейчас в моде (Google, например, делают такое для Gemma: t.me/data_secrets/9179), но DeepSeek выводят его на новый уровень. Их драфт-модель работает необычно, в два этапа. Сначала параллельно набрасывается блок токенов, а потом легкий марковский модуль уточняет зависимости между соседними токенами. Благодаря такому подходу драфтер и работает быстро, и не очень сыпится в хвостах.
– После того, как драфтер накидал черновик, основная LLM его проверяет и принимает только правильный префикс, корректируя остальное. При этом DSpark сам решает, сколько токенов отправить на проверку, основываясь на оценках уверенности по токенам и текущей нагрузке на железо.
В результате получаем ускорение минимум в 1.5 раза абсолютно без потери качества. Снимаем шляпу перед DeepSeek за такой опенсорс.
1❤236🔥79👍39👏4😁3🕊3🍾2🤗2
Please open Telegram to view this post
VIEW IN TELEGRAM
😁649👍40🔥29❤11🗿9☃4🫡4😍3🕊2🐳2🍓2
GitVerse × GigaCode: ваш персональный ИИ-напарник
Запустили ранний доступ к ИИ-чату внутри GitVerse. Чат — часть GigaCode, агентного ИИ-ассистента, который умеет самостоятельно работать с файлами, анализировать кодовую базу и генерировать тесты.
Как чат упрощает жизнь:
· Разбор ошибок. Кидаете запрос — он изучает логи и объясняет, что пошло не так.
· Навигация по платформе. Мгновенно находит нужные инструкции и подсказывает, как всё работает.
· Помощь с кодом. Объяснит незнакомый фрагмент и предложит решение.
Запросить ранний доступ и протестировать
Запустили ранний доступ к ИИ-чату внутри GitVerse. Чат — часть GigaCode, агентного ИИ-ассистента, который умеет самостоятельно работать с файлами, анализировать кодовую базу и генерировать тесты.
Как чат упрощает жизнь:
· Разбор ошибок. Кидаете запрос — он изучает логи и объясняет, что пошло не так.
· Навигация по платформе. Мгновенно находит нужные инструкции и подсказывает, как всё работает.
· Помощь с кодом. Объяснит незнакомый фрагмент и предложит решение.
Запросить ранний доступ и протестировать
1😁71 25🗿16🔥7❤6 4🎉2💯2🤨2🫡2🎄1
Media is too big
VIEW IN TELEGRAM
Дарио Амодеи заявил, что опенсорс в ИИ – это «отвлекающий маневр»
Он сказал, что на самом деле это не тот опенсорс, к которому мы привыкли:
Основной аргумент:
В довершении CEO Anthropic заявил, что для конкуренции важнее способности модели и ее эффективность на инференсе, а не «ярлык» опенсорса и лицензия.
Мнения?😐
Он сказал, что на самом деле это не тот опенсорс, к которому мы привыкли:
«Вы все равно не можете видеть внутренности модели, и основные плюсы опенсорса вроде коллективной доработки работают с сфере ИИ иначе»
Основной аргумент:
«В итоге вам все равно придется хостить ее в облаке»
В довершении CEO Anthropic заявил, что для конкуренции важнее способности модели и ее эффективность на инференсе, а не «ярлык» опенсорса и лицензия.
Мнения?
Please open Telegram to view this post
VIEW IN TELEGRAM
2🗿200😁84 40 16❤12👍7🔥4☃2🕊1😎1