AI for Devs
11.6K subscribers
245 photos
92 videos
219 links
По сотрудничеству пишите в личные сообщения канала.

Канал для разработчиков про AI. Модели, ИИ-агенты, практические кейсы и новости из мира AI. Всё, что можно применить в работе.

Технологический партнер: veai.ru
Download Telegram
Подпискам за $20/месяц скоро придет конец

В апреле Anthropic убрали Claude Code из Pro-плана для 2% новых пользователей, без анонса, просто изменив документацию и страницу с тарифами. Один из руководителей Anthropic назвал это «небольшим A/B-тестом», а затем признал:

The way people actually use a Claude subscription has changed fundamentally


Текущие тарифы не строились под агентное использование.

С 1 июня GitHub переводит Copilot на оплату по токенам. Никаких фиксированных лимитов premium-запросов — только AI Credits. GitHub объяснил это прямо: агентное использование «становится нормой» и создаёт нагрузку, при которой текущая подписка перестаёт работать.

Параллельно Питер Штайнбергер, автор OpenClaw, опубликовал скриншот своего дашборда: $1 305 088 за 30 дней, 603 млрд токенов, 7,6 млн запросов. Команда из трёх человек гоняет ~100 Codex-агентов, которые ревьюят PR, ищут уязвимости, дедублицируют issues и фиксят баги. Счёт покрывает OpenAI — Штайнбергер теперь сотрудник компании. Без fast mode было бы «всего» $300k 🙂

В целом, на этом можно было бы закончить, но вот еще несколько фактов:
1. Пользователи Anthropic в среднем потребляют вычислений на $8 при выручке $1 с подписки.
2. Microsoft теряет $20+ в месяц на каждом пользователе Copilot, и до $80 при подписке за $10 на "продвинутых" юзерах.

Все вышеперечисленные факты говорят о том, что несколько десятков долларов в месяц — это временное явление для агентного кодинга, которое может закончиться в аккурат с выходом Anthropic и OpenAI на IPO в следующем году.

Подробный разбор на эту тему уже опубликован на Хабре! Ну и в комментах можно будет подискутировать.

@ai_for_devs
3🤯63👍32🔥97💯4😁3
⚡️ Cursor выпустили Composer 2.5 — обновление свой флагманской модели для кодинга

В качестве базовой модели всё также используется Kimi K2.5.

Главное в обучении: синтетических задач стало в 25 раз больше, плюс новый приём targeted textual feedback — точечный сигнал прямо в месте ошибки, а не итоговый reward по всему роллауту.

Цены: $0.50/$2.50 за миллион токенов (input/output), быстрый вариант — $3/$15. На первую неделю дают двойной лимит.

Параллельно вместе со SpaceXAI обучают следующую модель с нуля на 10x больше вычислений на Colossus 2.

@ai_for_devs
2🔥37👍1887
🤖 Первый день Google I/O подошел к концу

Ежегодная конференция от Google для разработчиков в первую очередь порадовала нас релизом Gemini 3.5 Flash.

Модель обходит Gemini 3.1 Pro по бенчмаркам почти везде: MCP Atlas (многошаговые агентные задачи) 83.6% против 78.2%, Terminal-Bench 76.2% против 70.3%, SWE-Bench Pro очень близко к GPT-5.5.

Контекст 1M токенов, модель уже доступна в API. Pro-версия ожидается в июне.

Также обновили Antigravity до версии 2.0. Поддерживает параллельные команды агентов, scheduled tasks и голосовую транскрипцию. По умолчанию работает на Gemini 3.5 Flash.


Помимо этого представили Gemini Omni (мультимодальную модель, особенно сильную в генерации и редактировании видео), умные очки Android XR и новые AI-ноутбуки (Googlebook на базе Aluminium OS).

@ai_for_devs
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍442010🔥8
🇨🇳 Alibaba выпустили Qwen3.7-Max: флагманскую закрытую модель серии Qwen3

Главный кейс из релиза: модель 35 часов работала полностью автономно, сделала 1158+ вызовов инструментов и самостоятельно оптимизировала низкоуровневое CUDA-ядро для работы с длинным контекстом на железе, на котором никогда не обучалась. Результат 10x прирост скорости инференса.

Контекстное окно 1M токенов, только текст (мультимодальности в этом релизе нет).

По бенчмаркам: SWE-bench Pro — 60.6% (выше DeepSeek V4-Pro, но ниже Claude Opus 4.7 с 64.3%).


Интересно, что модель специально тестировали на трёх разных харнессах (OpenClaw, Claude Code и Hermes). Разброс результатов — в пределах ~6 пунктов. Хорошая обобщаемость.

Доступна через Qwen Studio (chat.qwen.ai) и Alibaba Cloud Model Studio (API). Веса Max-версии не открывают. Plus-версия серии Qwen3.7 уйдёт в open-source.

@ai_for_devs
2🤩46👍42🔥139
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ GLM-5.1 от Z.ai теперь выдаёт 400 токенов в секунду через API

Для сравнения: большинство флагманских моделей сейчас дают 80–120 tok/s.

При этом речь не об урезанной модели, качество то же, ускорили именно систему запуска.


Команда TileRT переписала то, как модель работает на GPU: вместо сотен последовательных мелких операций с паузами между ними — один непрерывный процесс, который не останавливается между генерацией токенов.

@ai_for_devs
246🔥31👍21🤯131
Главная новость прошедшей недели: как взломали GitHub. 19 мая GitHub написали в соц.сетях:

Расследуем несанкционированный доступ к внутренним репозиториям. Данные клиентов предположительно не затронуты.


Через 24 часа на BreachForums появился пост от TeamPCP. Начинается он примерно так:

Всем привет, как дела? Предлагаем купить исходники GitHub.


Если покупатель найдется, то исходники передадут ему, если нет покупателя, то опубликуют бесплатно. Заявили о ~3800 приватных репозиториях.

Позднее GitHub подтвердил: цифра соответствует масштабам реальной утечки.

———

Теперь о причине. Один из сотрудников поставил вредоносное расширение для VS Code 🫠. Скомпрометированная версия плагина провисела в маркетплейсе 18 минут. Автообновление сделало остальное. Расширение вело себя штатно, но при открытии любого проекта молча скачивало обфусцированный скрипт из «осиротевшего» коммита официального репозитория и собирало всё доступное: токены GitHub и AWS, ключи npm, хранилища 1Password, конфиги Claude Code.

Расширения VS Code ставятся из маркетплейса, где любой может опубликовать что угодно. Автообновление включено по умолчанию. Аудит того, что реально собрано в бинарнике расширения, почти никто не делает. GitHub при этом вроде не стартап с двумя инженерами))

Самое ироничное во всём этом то, что GitHub пострадал от своей же экосистемы :D Маркетплейс расширений VS Code, автообновления, доверие к верифицированным паблишерам — всё это инфраструктура Microsoft. И именно сотрудник Microsoft получил автообновление в течение тех самых 18 минут 🤣

@ai_for_devs
Please open Telegram to view this post
VIEW IN TELEGRAM
2🤯67😁32👍1512🔥32👏2
⚡️ Cerebras запустили Kimi K2.6 на скорости ~1000 токенов в секунду

Для тех, кто слышит про Cerebras впервые, расскажу. Cerebras — это американский чипмейкер, который пошёл против индустрии: вместо кластеров из сотен GPU они делают один огромный процессор размером с ноутбук. Он содержит 4 триллиона транзисторов, 900 тысяч вычислительных ядер и 44 гигабайта памяти прямо на кристалле. Вся память рядом с вычислениями, данные не гоняются по сети между чипами, отсюда и скорость.

В январе 2026-го статус компании резко изменился: OpenAI подписала многолетний контракт на развёртывание 750 МВт мощностей Cerebras для обслуживания своих пользователей. Сделка оценивается более чем в 20 млрд долларов, OpenAI также выдала Cerebras кредит на 1 млрд. Первый совместный продукт — GPT-5.3-Codex-Spark, работающий на скорости более 1200 токенов/с.


На этом же железе Cerebras теперь запустили Kimi K2.6 для корпоративных клиентов. Это первая триллионная open-weight модель в их инфраструктуре. Измерения Artificial Analysis: 981 токен/с — в 6,7 раза быстрее ближайшего GPU-облака и в 23 раза быстрее медианного провайдера. На практике: запрос с 10 000 токенов входа и 500 токенов ответа занимает 5,6 секунды против 163,7 секунды на официальном эндпоинте Kimi.

Подробнее про архитектуру Cerebras можно прочитать в их блоге.

@ai_for_devs
4🔥65🤯25👍14👏211