AI for Devs

2😁145👍35💯25🔥10🤯7👏4❤3

8.15K views15:07

Подпискам за $20/месяц скоро придет конец

В апреле Anthropic убрали Claude Code из Pro-плана для 2% новых пользователей, без анонса, просто изменив документацию и страницу с тарифами. Один из руководителей Anthropic назвал это «небольшим A/B-тестом», а затем признал:

The way people actually use a Claude subscription has changed fundamentally

Текущие тарифы не строились под агентное использование.

С 1 июня GitHub переводит Copilot на оплату по токенам. Никаких фиксированных лимитов premium-запросов — только AI Credits. GitHub объяснил это прямо: агентное использование «становится нормой» и создаёт нагрузку, при которой текущая подписка перестаёт работать.

Параллельно Питер Штайнбергер, автор OpenClaw, опубликовал скриншот своего дашборда: $1 305 088 за 30 дней, 603 млрд токенов, 7,6 млн запросов. Команда из трёх человек гоняет ~100 Codex-агентов, которые ревьюят PR, ищут уязвимости, дедублицируют issues и фиксят баги. Счёт покрывает OpenAI — Штайнбергер теперь сотрудник компании. Без fast mode было бы «всего» $300k 🙂

В целом, на этом можно было бы закончить, но вот еще несколько фактов:
1. Пользователи Anthropic в среднем потребляют вычислений на $8 при выручке $1 с подписки.
2. Microsoft теряет $20+ в месяц на каждом пользователе Copilot, и до $80 при подписке за $10 на "продвинутых" юзерах.

Все вышеперечисленные факты говорят о том, что несколько десятков долларов в месяц — это временное явление для агентного кодинга, которое может закончиться в аккурат с выходом Anthropic и OpenAI на IPO в следующем году.

Подробный разбор на эту тему уже опубликован на Хабре! Ну и в комментах можно будет подискутировать.

@ai_for_devs

3🤯63👍32🔥9❤7💯4😁3

7.36K views16:06

AI for Devs

⚡️ Cursor выпустили Composer 2.5 — обновление свой флагманской модели для кодинга

В качестве базовой модели всё также используется Kimi K2.5.

Главное в обучении: синтетических задач стало в 25 раз больше, плюс новый приём targeted textual feedback — точечный сигнал прямо в месте ошибки, а не итоговый reward по всему роллауту.

Цены: $0.50/$2.50 за миллион токенов (input/output), быстрый вариант — $3/$15. На первую неделю дают двойной лимит.

Параллельно вместе со SpaceXAI обучают следующую модель с нуля на 10x больше вычислений на Colossus 2.

@ai_for_devs

2🔥37👍18⚡8❤7

6.41K views05:27

AI for Devs

🤖 Первый день Google I/O подошел к концу

Ежегодная конференция от Google для разработчиков в первую очередь порадовала нас релизом Gemini 3.5 Flash.

Модель обходит Gemini 3.1 Pro по бенчмаркам почти везде: MCP Atlas (многошаговые агентные задачи) 83.6% против 78.2%, Terminal-Bench 76.2% против 70.3%, SWE-Bench Pro очень близко к GPT-5.5.

Контекст 1M токенов, модель уже доступна в API. Pro-версия ожидается в июне.

Также обновили Antigravity до версии 2.0. Поддерживает параллельные команды агентов, scheduled tasks и голосовую транскрипцию. По умолчанию работает на Gemini 3.5 Flash.

Помимо этого представили Gemini Omni (мультимодальную модель, особенно сильную в генерации и редактировании видео), умные очки Android XR и новые AI-ноутбуки (Googlebook на базе Aluminium OS).

@ai_for_devs

Please open Telegram to view this post

VIEW IN TELEGRAM

1👍44⚡20❤10🔥8

6.96K views19:47

AI for Devs

🇨🇳 Alibaba выпустили Qwen3.7-Max: флагманскую закрытую модель серии Qwen3

Главный кейс из релиза: модель 35 часов работала полностью автономно, сделала 1158+ вызовов инструментов и самостоятельно оптимизировала низкоуровневое CUDA-ядро для работы с длинным контекстом на железе, на котором никогда не обучалась. Результат 10x прирост скорости инференса.

Контекстное окно 1M токенов, только текст (мультимодальности в этом релизе нет).

По бенчмаркам: SWE-bench Pro — 60.6% (выше DeepSeek V4-Pro, но ниже Claude Opus 4.7 с 64.3%).

Интересно, что модель специально тестировали на трёх разных харнессах (OpenClaw, Claude Code и Hermes). Разброс результатов — в пределах ~6 пунктов. Хорошая обобщаемость.

Доступна через Qwen Studio (chat.qwen.ai) и Alibaba Cloud Model Studio (API). Веса Max-версии не открывают. Plus-версия серии Qwen3.7 уйдёт в open-source.

@ai_for_devs

2🤩46👍42🔥13❤9

6.57K views16:20

AI for Devs

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ GLM-5.1 от Z.ai теперь выдаёт 400 токенов в секунду через API

Для сравнения: большинство флагманских моделей сейчас дают 80–120 tok/s.

При этом речь не об урезанной модели, качество то же, ускорили именно систему запуска.

Команда TileRT переписала то, как модель работает на GPU: вместо сотен последовательных мелких операций с паузами между ними — один непрерывный процесс, который не останавливается между генерацией токенов.

@ai_for_devs

2⚡46🔥31👍21🤯13❤1

5.83K views12:36

AI for Devs

Главная новость прошедшей недели: как взломали GitHub. 19 мая GitHub написали в соц.сетях:

Расследуем несанкционированный доступ к внутренним репозиториям. Данные клиентов предположительно не затронуты.

Через 24 часа на BreachForums появился пост от TeamPCP. Начинается он примерно так:

Всем привет, как дела? Предлагаем купить исходники GitHub.

Если покупатель найдется, то исходники передадут ему, если нет покупателя, то опубликуют бесплатно. Заявили о ~3800 приватных репозиториях.

Позднее GitHub подтвердил: цифра соответствует масштабам реальной утечки.

———

Теперь о причине. Один из сотрудников поставил вредоносное расширение для VS Code 🫠. Скомпрометированная версия плагина провисела в маркетплейсе 18 минут. Автообновление сделало остальное. Расширение вело себя штатно, но при открытии любого проекта молча скачивало обфусцированный скрипт из «осиротевшего» коммита официального репозитория и собирало всё доступное: токены GitHub и AWS, ключи npm, хранилища 1Password, конфиги Claude Code.

Расширения VS Code ставятся из маркетплейса, где любой может опубликовать что угодно. Автообновление включено по умолчанию. Аудит того, что реально собрано в бинарнике расширения, почти никто не делает. GitHub при этом вроде не стартап с двумя инженерами))

Самое ироничное во всём этом то, что GitHub пострадал от своей же экосистемы :D Маркетплейс расширений VS Code, автообновления, доверие к верифицированным паблишерам — всё это инфраструктура Microsoft. И именно сотрудник Microsoft получил автообновление в течение тех самых 18 минут 🤣

@ai_for_devs

Please open Telegram to view this post

VIEW IN TELEGRAM

2🤯67😁32👍15❤12🔥3⚡2👏2

6.2K views10:19

AI for Devs

⚡️ Cerebras запустили Kimi K2.6 на скорости ~1000 токенов в секунду

Для тех, кто слышит про Cerebras впервые, расскажу. Cerebras — это американский чипмейкер, который пошёл против индустрии: вместо кластеров из сотен GPU они делают один огромный процессор размером с ноутбук. Он содержит 4 триллиона транзисторов, 900 тысяч вычислительных ядер и 44 гигабайта памяти прямо на кристалле. Вся память рядом с вычислениями, данные не гоняются по сети между чипами, отсюда и скорость.

В январе 2026-го статус компании резко изменился: OpenAI подписала многолетний контракт на развёртывание 750 МВт мощностей Cerebras для обслуживания своих пользователей. Сделка оценивается более чем в 20 млрд долларов, OpenAI также выдала Cerebras кредит на 1 млрд. Первый совместный продукт — GPT-5.3-Codex-Spark, работающий на скорости более 1200 токенов/с.

На этом же железе Cerebras теперь запустили Kimi K2.6 для корпоративных клиентов. Это первая триллионная open-weight модель в их инфраструктуре. Измерения Artificial Analysis: 981 токен/с — в 6,7 раза быстрее ближайшего GPU-облака и в 23 раза быстрее медианного провайдера. На практике: запрос с 10 000 токенов входа и 500 токенов ответа занимает 5,6 секунды против 163,7 секунды на официальном эндпоинте Kimi.

Подробнее про архитектуру Cerebras можно прочитать в их блоге.

@ai_for_devs

www.cerebras.ai

Cerebras Brings Kimi K2.6 Inference to Enterprises

Cerebras brings Kimi K2.6 to enterprises, delivering near-1,000 TPS inference on the first trillion-parameter open-weight model for real-time AI coding.

4🔥65🤯25👍14👏2❤1⚡1

4.39K views10:30

About

Blog

Apps

Platform