AI for Devs

⚡️ NVIDIA анонсировали Nemotron 3 Ultra и RTX Spark на Computex 2026 Computex — ежегодная выставка в Тайбэе, одна из крупнейших в мире по железу и комплектующим. Дженсен Хуанг традиционно использует её для больших анонсов. RTX Spark — новый суперчип для…

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ Nemotron 3 Ultra стала полностью доступна

550B параметров, 55B активных, MoE-архитектура. По бенчмаркам держится рядом с Kimi K2.6, скорость инференса выше 300 tok/s. Полностью open-source: веса, данные, процесс тренировки.

Заценить на своих задачах можно бесплатно уже сейчас, модель доступна на OpenRouter и в OpenCode.

@ai_for_devs

1👍39⚡19🔥12❤5🤩2

10.4K views10:47

AI for Devs

⚡️ Anthropic выпустили исследование про самосовершенствование ИИ

Claude уже пишет более 80% кода, который попадает в кодовую базу Anthropic. Во втором квартале 2026 типичный инженер коммитит в 8 раз больше кода в день, чем в 2024-м.

Количество != качество. Это правда. Но и по качеству картина меняется: сотрудники Anthropic оценивают код Claude как примерно равный человеческому уже сейчас, а через год ожидают, что он станет лучше.

Следующий шаг с их точки зрения очевиден: когда качество кода ИИ достигнет паритета с человеческим, люди перестанут его писать и перейдут только к ревью. Но ревью уже становится узким местом. Исполнение задач почти ничего не стоит в человеческом времени — пока единственное настоящее преимущество людей остаётся в выборе задач и оценке результатов.

Anthropic описывают три возможных сценария развития событий:

1. Тренд тормозит, а нынешние модели просто расходятся по экономике
2. Разработка ИИ автоматизируется, но люди остаются теми, кто решает, что делать
3. ИИ замыкает петлю и начинает улучшать себя сам

Первый они, конечно же, считают маловероятным)

@ai_for_devs

1👍28⚡24❤22🔥5🤯4

12.6K views14:34

AI for Devs

0:35

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ Kimi Code: open-source CLI-агент для программирования

Репозиторий kimi-cli на GitHub существовал несколько месяцев, но не получал широкого продвижения. Сейчас Moonshot полностью заребрендили и проапгрейдили инструмент, переписали CLI на TypeScript/Node.js и активно форсят его в соцсетях.

Kimi Code работает в терминале, есть расширение для VS Code, а также интеграция c другими IDE через ACP-протокол (JetBrains, Zed и др.).

Ключевые улучшения крайнего обновления:
– Однострочная установка через curl, очень быстрый запуск
– Под капотом модель kimi-for-coding на базе Kimi K2.6 (нативно мультимодальная)
– Видео как контекст: можно перетащить запись экрана, и агент способен анализировать её и писать код
– API совместим с OpenAI/Anthropic: можно использовать как бэкенд в Claude Code, Roo Code и аналогах

Стоимость подписки Kimi Code составляет от $19 до $199 в месяц (разные тиры с разными квотами). API-токены тарифицируются отдельно.

@ai_for_devs

1🔥27👍21⚡10❤7🤯1🤩1

9.2K views14:28

⚡️ Xiaomi разогнали 1T-модель до 1200 tok/s на стандартных GPU

Китайские команды MiMo и TileRT опубликовали режим UltraSpeed для модели MiMo V2.5 Pro (1,02T параметров).

На одном 8-карточном сервере со стандартными GPU, до ~1200 токенов в секунду. Cerebras выдаёт похожие скорости на кастомном железе. Здесь обошлись без него.

В кратце работает так:
1. MoE-слои сжали с 16 до 4 бит: они занимают большую часть весов и хорошо переносят потерю точности, остальное оставили нетронутым
2. Рядом с основной моделью запускается маленькая, которая угадывает сразу 8 токенов вперёд
3. Основная проверяет их разом и принимает правильные
4. В coding-сценариях угадывается ~6,3 токенов из 8

Похожий механизм Google применяет в Gemma 4.

На видео можно заценить скорость: 12 секунд против 6 минут на стандартных скоростях, к которым мы сейчас привыкли.

@ai_for_devs

1🔥49⚡14🤯14👍8❤7

9.76K views14:49

AI for Devs

⚡️ Anthropic выпустили Claude Fable 5 в публичный доступ

Fable 5 принадлежит к новому классу Mythos, выше Opus по способностям. До сегодняшнего дня модели этого класса были доступны только партнёрам Project Glasswing.

Разница между Fable 5 и Mythos 5 (который остаётся закрытым) в защитных фильтрах: запросы по кибербезопасности, биологии, химии и distillation-трафик перенаправляются к Opus 4.8.

Цена: $10 за миллион входных токенов и $50 за выходных, вдвое дешевле Mythos Preview.

Доступна на тарифах Pro/Max/Team/Enterprise до 22 июня, затем потребует usage credits.

@ai_for_devs

1🔥43🤯25⚡11❤6👏4🤩3

11.4K viewsedited 17:25

AI for Devs

⚡️ Xiaomi выпустили MiMo Code — своего coding-агента

Вслед за Kimi ещё одна китайская компания обзавелась своим агентом.

Основной упор в релизной статье китайцы делают на Max Mode: на каждом шаге агент генерирует 5 параллельных планов действий, а модель-судья выбирает лучший, остальные отбрасываются.

По SWE-Bench Pro прирост у Mimo-V2.5-Pro до 20% за 4-5× больше токенов.

MIT-лицензия, open source, построен на OpenCode.

@ai_for_devs

2🔥50👍23⚡13❤5

9.53K views08:51

AI for Devs

⚡️ Подписки Anthropic и OpenAI убыточнее, чем считалось

В январе исследователи уже считали реальную стоимость подписок Claude Code в пересчёте на API. Тогда $200/мес обошлись бы в ~$2 700 по API-расценкам.

SemiAnalysis повторили опыт на всех тарифах провайдеров с длинными coding-задачами до истощения недельного лимита и текущие цифры заметно выше.

Для Anthropic цифра выросла почти втрое: claude-max-20x за $200/мес эквивалентен $8 000/мес по API. У OpenAI ещё хуже: chatgpt-pro-20x за те же $200 тянет на $14 000/мес.

SemiAnalysis считают, что все новые модели и фичи будут придерживать только для пользователей API.

А Fable (Mythos), как уже известно, с 22 июня исчезнет из подписок и будет доступен только за extra usage.

@ai_for_devs

1😱43🤯22👍14⚡13❤3🤩3

10.6K views15:30

AI for Devs

0:28

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ Пользователи Codex теперь могут сбросить лимит самостоятельно

Всем платящим пользователям (Go, Plus, Pro и Business) выдали по одному бесплатному сбросу (часового и недельного лимита). Активировать можно в любой момент из меню профиля.

Вместе с этим OpenAI запустили реферальную акцию: подписчики Plus и Pro могут пригласить до трёх человек. Каждый приглашённый, отправивший первое сообщение в Codex, даёт +1 сброс обоим.

Чуваки буквально продвигают rate limit как фичу 😁

@ai_for_devs

Please open Telegram to view this post

VIEW IN TELEGRAM

152🔥27👍17😁8❤5

10.7K views09:28

AI for Devs

⚡️ Anthropic отключили Fable 5 и Mythos 5 для всех пользователей

Правительство США сослалось на полномочия в сфере нацбезопасности и выпустило директиву об экспортном контроле: Fable 5 и Mythos запрещено использовать иностранным гражданам, в том числе находящимся в США и сотрудникам самой Anthropic с иностранным гражданством.

Выполнить это избирательно нельзя, поэтому Anthropic просто отключили обе модели для всех. Существующие сессии с Fable 5 закрываются с ошибкой, новые запросы в API тоже. По умолчанию все запросы переходят на Opus 4.8.

Anthropic назвала произошедшее недоразумением и говорит, что работает над восстановлением доступа.

@ai_for_devs

1🤯89⚡22😱15🤬12❤8👏2👍1

11.7K viewsedited 06:23

AI for Devs

⚡️ Moonshot AI выпустили Kimi-K2.7-Code

Не так давно китайцы начали активно маркетить Kimi Code, теперь вышла отдельная модель, заточенная именно под работу с кодом.

Внятных независимых бенчмарков для этой модели пока что нет. Ни SWE-Bench Verified, ни DeepSWE, только собственные бенчмарки Moonshot и пара агентных.

По тому, что есть: прирост относительно K2.6 от 9 до 31% в зависимости от задачи.

Модель на HuggingFace.

@ai_for_devs

1👍46❤9⚡4🔥3

10.2K views13:32

AI for Devs

😱

Чем лучше Claude Code, тем хуже разработчик

Boeing фиксирует: около 80% авиакатастроф с 1950-х связаны с человеческим фактором. За тот же период автопилоты из вспомогательного инструмента превратились в штатный режим полёта. Два этих факта связаны между собой.

Этот эффект в авиации назвали automation-induced complacency. Чем надёжнее система, тем меньше оператор готов к её сбою.

Claude Code, Cursor, Codex спроектированы так, чтобы разработчик меньше вмешивался. Судя по статистике, многие так и делают. При 1% ошибок и 200 фрагментах кода в день это приводит к ежедневным багам. Способность их замечать тем временем постепенно атрофируется.

Джун, который с первого дня пишет код с агентом, пропускает путь от синтаксиса к архитектуре.

Три навыка, которые деградируют быстрее всего:
1. Читать незнакомый код самостоятельно
2. Отлаживать без подсказок
3. Разбирать ошибки компилятора до конца, не скармливая их агенту

Когда агент ошибётся в чём-то нетривиальном, именно этих навыков не окажется и наш самолёт совершит крушение.

В авиации эту проблему решают просто: пилоты обязаны регулярно летать вручную. Не потому что автопилот ненадёжен, а потому что надёжность автопилота != надёжности пилота.

Разработчику тоже нужна практика без "автопилота". Периодически отлаживать возникшую проблему самостоятельно. Делать code review прежде чем просить агента объяснить чужой код. Иногда писать небольшую задачу с нуля.

Может, мы драматизируем. Может, нет. Решаем в бурной дискуссии на Хабре: https://habr.com/ru/articles/1045628/comments/

Please open Telegram to view this post

VIEW IN TELEGRAM

1👍104💯43🔥15❤7🤩1

9.66K views06:55

AI for Devs

⚡️ Связка дешёвых моделей обошла GPT-5.5 и Opus 4.8

OpenRouter запустили Fusion: запускаешь любые модели параллельно, синтезатор собирает лучшее из всех.

Промпт уходит сразу на несколько моделей. Модель-судья анализирует ответы: ищет консенсус, противоречия, пробелы. Синтезатор пишет финальный ответ.

На DRACO-бенчмарке Perplexity (100 задач по праву, медицине, финансам) связка из Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro отстала от Fable 5 меньше чем на 1% и обошла GPT-5.5 и Opus 4.8 в одиночку.

Стоимость при этом оказалась вдвое ниже Fable. Но в целом Fusion обычно стоит примерно в 4–5 раз дороже, чем один вызов модели (что довольно логично).

@ai_for_devs

3👍63🔥27⚡8❤6😱1

9.39K viewsedited 12:45

AI for Devs

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

⚡ Kimi K2.7 Code HighSpeed: ускорение в 6 раз

Moonshot AI запустили быстрый режим своей свежей модели Kimi K2.7 Code. На задачах со средним контекстом она выдаёт около 180 tok/s, на коротких до 260 tok/s — в 6 раз быстрее базовой версии K2.7 Code.

Пока доступ ограничен: участники Beta Program, по API и пользователям на тарифе Business. Вступить в бету можно без очереди.

Подсобрали самые быстрые модели за последнее время:

1. Xiaomi MiMo V2.5 Pro Ultra Speed: 1T-модель до 1200 tok/s на стандартных GPU
2. GPT-5.3-Codex-Spark: более 1000 tok/s на чипах Cerebras
3. Kimi K2.6: примерно 1000 tok/s на чипах Cerebras
4. GLM-5.1 High Speed: до 400 tok/s на стандартных GPU
5. Nemotron 3 Ultra: больше 300 tok/s на стандартных GPU

Anthropic в этом плане "не торопятся")

@ai_for_devs

1⚡32👍18🔥12❤4

10K views07:17

AI for Devs

⚡️ SpaceX покупает Cursor за $60 млрд

С апреля было известно, что SpaceX получил опцион на покупку: либо взять Cursor за $60 млрд, либо ограничиться партнёрством за $10 млрд. Сегодня подтвердилось – берут!

Cursor рос рекордно как по пользовательской базе, так и по объёмам выручки. Microsoft рассматривали возможности покупки, но в итоге отказались. OpenAI дважды пытались договориться и оба раза получили отказ.

Теперь у Маска электромобили, ракеты, спутники, соцсеть, Grok и один из самых популярных инструментов для разработчиков.

@ai_for_devs

1🤯82👍34🔥20❤7😱5🤩3⚡1

11K views13:51

AI for Devs

⚡️ Состоялся полноценный релиз GLM-5.2

Z.ai (Zhipu AI) опубликовали веса GLM-5.2 на HuggingFace под MIT-лицензией. Модель анонсировали ещё 13 июня, но без весов и с урезанным доступом.

Технически: 744B параметров (MoE, 40B активных), контекст вырос с 200K до 1M токенов, максимальный вывод 131K токенов. Два уровня рассуждений: GLM-5.2 (max) и GLM-5.2 (high). Цены на API те же, что у GLM-5.1.

Попробовать модель можно через их ADE ZCode, а также через Claude Code, OpenCode и т.д. Ребята из Китая сами написали инструкцию, как подключить GLM-5.2 в сторонних агентах.

В отличие от релиза Kimi, здесь бенчмарки всем известные и результаты впечатляют. По первым отзывам пользователей модель также крайне хорошо себя показывает.

@ai_for_devs

1🔥57👍23❤9🤩8🤯2

9.97K views18:06

AI for Devs

⚡️ Cursor готовят замену GitHub для AI-агентов

Систему спроектировали так: основным автором и ревьюером кода становится AI-агент, человек подключается только на этапе финального одобрения. Анонс продукта сделал Томас Реймерс, основатель Graphite (сервис ревью кода, который Cursor купили в 2025 году).

Платформа рассчитана на сотни агентов, которые параллельно клонируют, создают ветки и коммитят в один репозиторий. На демо показали 22,6 коммита в секунду в одном репо и сотни тысяч клонов и пушей в час.

GitHub строили под людей, которые читают диффы и пишут комментарии к строкам кода. Cursor делает ставку на то, что код всё чаще пишут и проверяют агенты.

Релиз запланирован на осень, лист ожидания уже открыт на cursor.com/origin. Цены и список функций пока неизвестны.

@ai_for_devs

1👍55🔥33🤯23😱10❤7⚡5

10.6K views10:20

AI for Devs

⚡️ Subquadratic подали признаки жизни: вышла SubQ 1.1 Small с независимой проверкой бенчмарков

Та самая SSA-модель с контекстом до 12M токенов, про которую мы писали раньше. Бенчмарки теперь проверила сторонняя организация Appen.

Small в названии, по всей видимости, отражает размер модели в линейке. Сколько именно у неё параметров, компания не говорит. Дальше обещают модели покрупнее, также с контекстом до 12M токенов.

На тесте, где нужно связывать факты из разных частей текста, точность выросла с 95% до 99%.

Обычные модели сверяют каждое слово с каждым, поэтому вычислений с ростом текста становится непропорционально больше. SubQ выбирает только значимые связи и реально использует 0.13% всех пар слов, отсюда экономия на длинных задачах.

На контексте 1M токенов: вычислений в 64 раза меньше, чем у обычных моделей, ответ получают в 56 раз быстрее.

Общие способности не упали: GPQA Diamond — 85.4%, LiveCodeBench — 89.7%, почти на уровне лучших моделей.

Пока модель доступна избранным партнёрам, широкий публичный релиз обещают к концу года. Ждём!

@ai_for_devs

1🔥40👍21🤯15❤5⚡2

11.8K views09:50

About

Blog

Apps

Platform