AI for Devs
14.4K subscribers
284 photos
102 videos
262 links
По сотрудничеству пишите в личные сообщения канала.

Канал для разработчиков про AI. Модели, ИИ-агенты, практические кейсы и новости из мира AI. Всё, что можно применить в работе.

Технологический партнер: veai.ru
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Пользователи Codex теперь могут сбросить лимит самостоятельно

Всем платящим пользователям (Go, Plus, Pro и Business) выдали по одному бесплатному сбросу (часового и недельного лимита). Активировать можно в любой момент из меню профиля.

Вместе с этим OpenAI запустили реферальную акцию: подписчики Plus и Pro могут пригласить до трёх человек. Каждый приглашённый, отправивший первое сообщение в Codex, даёт +1 сброс обоим.

Чуваки буквально продвигают rate limit как фичу 😁

@ai_for_devs
Please open Telegram to view this post
VIEW IN TELEGRAM
152🔥27👍17😁85
⚡️ Anthropic отключили Fable 5 и Mythos 5 для всех пользователей

Правительство США сослалось на полномочия в сфере нацбезопасности и выпустило директиву об экспортном контроле: Fable 5 и Mythos запрещено использовать иностранным гражданам, в том числе находящимся в США и сотрудникам самой Anthropic с иностранным гражданством.

Выполнить это избирательно нельзя, поэтому Anthropic просто отключили обе модели для всех. Существующие сессии с Fable 5 закрываются с ошибкой, новые запросы в API тоже. По умолчанию все запросы переходят на Opus 4.8.


Anthropic назвала произошедшее недоразумением и говорит, что работает над восстановлением доступа.

@ai_for_devs
1🤯8922😱15🤬128👏2👍1
⚡️ Moonshot AI выпустили Kimi-K2.7-Code

Не так давно китайцы начали активно маркетить Kimi Code, теперь вышла отдельная модель, заточенная именно под работу с кодом.

Внятных независимых бенчмарков для этой модели пока что нет. Ни SWE-Bench Verified, ни DeepSWE, только собственные бенчмарки Moonshot и пара агентных.

По тому, что есть: прирост относительно K2.6 от 9 до 31% в зависимости от задачи.

Модель на HuggingFace.

@ai_for_devs
1👍4694🔥3
😱 Чем лучше Claude Code, тем хуже разработчик

Boeing фиксирует: около 80% авиакатастроф с 1950-х связаны с человеческим фактором. За тот же период автопилоты из вспомогательного инструмента превратились в штатный режим полёта. Два этих факта связаны между собой.

Этот эффект в авиации назвали automation-induced complacency. Чем надёжнее система, тем меньше оператор готов к её сбою.

Claude Code, Cursor, Codex спроектированы так, чтобы разработчик меньше вмешивался. Судя по статистике, многие так и делают. При 1% ошибок и 200 фрагментах кода в день это приводит к ежедневным багам. Способность их замечать тем временем постепенно атрофируется.

Джун, который с первого дня пишет код с агентом, пропускает путь от синтаксиса к архитектуре.

Три навыка, которые деградируют быстрее всего:
1. Читать незнакомый код самостоятельно
2. Отлаживать без подсказок
3. Разбирать ошибки компилятора до конца, не скармливая их агенту


Когда агент ошибётся в чём-то нетривиальном, именно этих навыков не окажется и наш самолёт совершит крушение.

В авиации эту проблему решают просто: пилоты обязаны регулярно летать вручную. Не потому что автопилот ненадёжен, а потому что надёжность автопилота != надёжности пилота.

Разработчику тоже нужна практика без "автопилота". Периодически отлаживать возникшую проблему самостоятельно. Делать code review прежде чем просить агента объяснить чужой код. Иногда писать небольшую задачу с нуля.

Может, мы драматизируем. Может, нет. Решаем в бурной дискуссии на Хабре: https://habr.com/ru/articles/1045628/comments/
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍104💯43🔥157🤩1
⚡️ Связка дешёвых моделей обошла GPT-5.5 и Opus 4.8

OpenRouter запустили Fusion: запускаешь любые модели параллельно, синтезатор собирает лучшее из всех.

Промпт уходит сразу на несколько моделей. Модель-судья анализирует ответы: ищет консенсус, противоречия, пробелы. Синтезатор пишет финальный ответ.

На DRACO-бенчмарке Perplexity (100 задач по праву, медицине, финансам) связка из Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro отстала от Fable 5 меньше чем на 1% и обошла GPT-5.5 и Opus 4.8 в одиночку.

Стоимость при этом оказалась вдвое ниже Fable. Но в целом Fusion обычно стоит примерно в 4–5 раз дороже, чем один вызов модели (что довольно логично).

@ai_for_devs
3👍63🔥2786😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Kimi K2.7 Code HighSpeed: ускорение в 6 раз

Moonshot AI запустили быстрый режим своей свежей модели Kimi K2.7 Code. На задачах со средним контекстом она выдаёт около 180 tok/s, на коротких до 260 tok/s — в 6 раз быстрее базовой версии K2.7 Code.

Пока доступ ограничен: участники Beta Program, по API и пользователям на тарифе Business. Вступить в бету можно без очереди.


Подсобрали самые быстрые модели за последнее время:

1. Xiaomi MiMo V2.5 Pro Ultra Speed: 1T-модель до 1200 tok/s на стандартных GPU
2. GPT-5.3-Codex-Spark: более 1000 tok/s на чипах Cerebras
3. Kimi K2.6: примерно 1000 tok/s на чипах Cerebras
4. GLM-5.1 High Speed: до 400 tok/s на стандартных GPU
5. Nemotron 3 Ultra: больше 300 tok/s на стандартных GPU

Anthropic в этом плане "не торопятся")

@ai_for_devs
132👍18🔥124
⚡️ SpaceX покупает Cursor за $60 млрд

С апреля было известно, что SpaceX получил опцион на покупку: либо взять Cursor за $60 млрд, либо ограничиться партнёрством за $10 млрд. Сегодня подтвердилось – берут!

Cursor рос рекордно как по пользовательской базе, так и по объёмам выручки. Microsoft рассматривали возможности покупки, но в итоге отказались. OpenAI дважды пытались договориться и оба раза получили отказ.


Теперь у Маска электромобили, ракеты, спутники, соцсеть, Grok и один из самых популярных инструментов для разработчиков.

@ai_for_devs
1🤯82👍34🔥207😱5🤩31
⚡️ Состоялся полноценный релиз GLM-5.2

Z.ai (Zhipu AI) опубликовали веса GLM-5.2 на HuggingFace под MIT-лицензией. Модель анонсировали ещё 13 июня, но без весов и с урезанным доступом.

Технически: 744B параметров (MoE, 40B активных), контекст вырос с 200K до 1M токенов, максимальный вывод 131K токенов. Два уровня рассуждений: GLM-5.2 (max) и GLM-5.2 (high). Цены на API те же, что у GLM-5.1.


Попробовать модель можно через их ADE ZCode, а также через Claude Code, OpenCode и т.д. Ребята из Китая сами написали инструкцию, как подключить GLM-5.2 в сторонних агентах.

В отличие от релиза Kimi, здесь бенчмарки всем известные и результаты впечатляют. По первым отзывам пользователей модель также крайне хорошо себя показывает.

@ai_for_devs
1🔥57👍239🤩8🤯2
⚡️ Cursor готовят замену GitHub для AI-агентов

Систему спроектировали так: основным автором и ревьюером кода становится AI-агент, человек подключается только на этапе финального одобрения. Анонс продукта сделал Томас Реймерс, основатель Graphite (сервис ревью кода, который Cursor купили в 2025 году).

Платформа рассчитана на сотни агентов, которые параллельно клонируют, создают ветки и коммитят в один репозиторий. На демо показали 22,6 коммита в секунду в одном репо и сотни тысяч клонов и пушей в час.


GitHub строили под людей, которые читают диффы и пишут комментарии к строкам кода. Cursor делает ставку на то, что код всё чаще пишут и проверяют агенты.

Релиз запланирован на осень, лист ожидания уже открыт на cursor.com/origin. Цены и список функций пока неизвестны.

@ai_for_devs
1👍55🔥33🤯23😱1075
⚡️ Subquadratic подали признаки жизни: вышла SubQ 1.1 Small с независимой проверкой бенчмарков

Та самая SSA-модель с контекстом до 12M токенов, про которую мы писали раньше. Бенчмарки теперь проверила сторонняя организация Appen.

Small в названии, по всей видимости, отражает размер модели в линейке. Сколько именно у неё параметров, компания не говорит. Дальше обещают модели покрупнее, также с контекстом до 12M токенов.

На тесте, где нужно связывать факты из разных частей текста, точность выросла с 95% до 99%.

Обычные модели сверяют каждое слово с каждым, поэтому вычислений с ростом текста становится непропорционально больше. SubQ выбирает только значимые связи и реально использует 0.13% всех пар слов, отсюда экономия на длинных задачах.

На контексте 1M токенов: вычислений в 64 раза меньше, чем у обычных моделей, ответ получают в 56 раз быстрее.


Общие способности не упали: GPQA Diamond — 85.4%, LiveCodeBench — 89.7%, почти на уровне лучших моделей.

Пока модель доступна избранным партнёрам, широкий публичный релиз обещают к концу года. Ждём!

@ai_for_devs
1🔥40👍21🤯1552
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Anthropic добавили Artifacts в Claude Code: живые HTML-страницы из контекста сессии

Теперь прогресс сессии можно опубликовать как интерактивную HTML-страницу. Claude Code собирает её из кодовой базы, коннекторов и переписки с моделью. Страница обновляется по тому же URL по ходу работы, версии сохраняются в истории.

И мы уверены, что у этой фичи есть предыстория. Ещё в мае Тарик Шихипар, инженер из команды Claude Code, рассказывал, что перешёл с Markdown на HTML.

Главная причина: у HTML куда больше возможностей визуализации, а красивые таблицы, SVG-диаграммы и интерактивные слайдеры люди воспринимают лучше обычного текста.

Видимо, каждый раз просить Claude сделать HTML ребятам поднадоело, и они решили избавить себя от лишних действий. Теперь подобный способ делиться результатами своей работы в Claude Code стал отдельной фичей продукта.


По умолчанию артефакт виден только автору. Делиться можно с участниками организации на тарифах Team и Enterprise, остальным пока что недоступно.

Подробнее о том, почему HTML лучше Markdown с точки зрения инженера Anthropic, читайте на Habr.

@ai_for_devs
1🔥57👍229🤩9🤯1
Был в моей карьере небольшой период, когда я писал на Go. В то время периодически натыкался на видео Николая Тузова. Думаю, любой, кто в своё время сидел на Go, так или иначе видел его топовый глубокий инженерный контент: за больше чем 4 года такого накопилось довольно много.

Недавно узнал, что Николай читает наш канал. Приятно, честно говоря!


А сейчас его (как и всю индустрию) затянуло в AI, и он в это плотно погрузился.

Теперь Николай активно экспериментирует, разбирается с LLM и делится практическими заметками в канале Tuzov AI Lab. Личные кейсы, что работает, что нет, объяснения базы и авторские мысли.

Кому интересны личные кейсы опытного разработчика, объяснение базы про LLM и авторские заметки – welcome!

P.S. Один из постов, который лично мне пришелся по душе – "Создатель OpenClaw — вайбкодер или инженер?".

@ai_for_devs
1👍5532🔥10👏1
⚡️ Sakana AI выпустили Fugu Ultra: японская LLM обходит часть западных флагманов

Sakana AI основали экс-инженеры Google Дэвид Ха и Лайон Джонс (один из восьми авторов оригинальной статьи про трансформеры). В апреле компания уже показывала Marlin: агента, который самостоятельно копает тему до 8 часов и выдаёт отчёт с презентацией.

Fugu их следующий продукт с реализацией идеи «несколько моделей вместо одной»: компактная LLM, обученная решать, кого вызвать, в какой роли и с какими подзадачами под конкретный запрос. Нечто похожее недавно показали OpenRouter с продуктом Fusion.

Fugu Ultra работает немного иначе: сама генерирует workflow на естественном языке, делит задачу на подзадачи, распределяет их по моделям и может рекурсивно вызвать себя как одного из воркеров.

На бенчмарках Fugu Ultra идёт почти вровень с топовыми западными моделями.

@ai_for_devs
1🔥6123👍222😱1
⚡️ OpenAI и Broadcom представили чип для инференса LLM: Jalapeño

Чип спроектирован с нуля под инференс больших языковых моделей. Производит его TSMC. Разработка от дизайна до отправки финального проекта на фабрику заняла 9 месяцев — рекордный срок для сложных современных чипов, по словам компаний.

В отличие от Cerebras, которые делают один гигантский кристалл с памятью прямо на чипе (на котором GPT-5.3-Codex-Spark выдаёт больше 1000 ток/с), Jalapeño — чип обычного размера.

Нужную мощность получают не размером кристалла, а количеством чипов: тысячи Jalapeño соединяют в кластер через сетевые чипы.


Первый коммерческий запуск обещают до конца 2026 года.

Google, Amazon, Microsoft, Meta и OpenAI уходят от Nvidia к своим чипам, а Маск наоборот: у xAI уже 555 тысяч GPU, цель — миллион. Может, зря?)

@ai_for_devs
1👍39🔥1985🤯5
⚡️ Opus, Sonnet, GPT, Gemini, GLM, DeepSeek — c оплатой рублями, без зарубежной карты и VPN

Veai — российский AI-агент для JetBrains IDE с доступом к топовым моделям. Поддерживает MCP, SKILLs, дебаг, сборку и запуск проекта, умеет фиксить тесты и поддерживает сабагентов.

Первые 30 дней бесплатно, затем оплата подписки в рублях. Есть 3 тарифа:

1. Сообщество — бесплатный. Подключаешь свой API-ключ и пробуешь все функции плагина без ограничений.

2. Персональный — 2 800 ₽/мес. 200 минут работы с топовыми моделями по единой цене.

3. Профессиональный — 10 000 ₽/мес. 1000 минут, приоритетный доступ, минута работы модели дешевле — 10 ₽ против 14 ₽ у «Персонального».


Минуты не сгорают, переносятся на следующий месяц.

Начни использовать Veai: https://veai.ru/products
1👍29👌1511🔥8🤯8🤡2
😐 Loop Engineering: The Next Big Thing

Индустрия меняет фокус каждые несколько месяцев. Сначала был prompt engineering: главным было то, что и как написать агенту. Потом MCP дал агентам доступ к внешним инструментам. Потом появились SKILLs: знание о проекте, записанное один раз и читаемое на каждом запуске. Теперь все чаще слышно про Loop'ы и Goal'ы.

Идея: один раз спроектировать систему, которая сама находит задачу, прогоняет её через агента, проверяет результат и решает, что делать дальше. Дальше она промптит себя сама, человек выходит из цикла.

TL;DR: Loop Engineering реален, но большинству разработчиков он пока не нужен.


Loop оправдывает себя, если выполняются все четыре условия:

1. Задача повторяется хотя бы раз в неделю
2. Проверка автоматизирована (тесты, линтер, сборка)
3. Лимит токенов (практически или полностью) неограничен
4. У агента есть инструменты уровня senior-инженера

Если не выполняется хоть одно из условий, затраты превысят выгоду.

Можете похвастаться подпиской за $200, а то и не одной? Периодически ловите себя на мысли, что вы это уже делали с агентом? Новая статья на Хабре: «Loop Engineering: 14 шагов от промптера до архитектора систем».

@ai_for_devs
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥27👍1711👏2🤩2🤯1
⚡️ Китайцы получают доступ к Claude в 10 раз дешевле

ChinaTalk опубликовали расследование о китайских API-прокси для доступа к Claude.

Это зарубежные серверы, которые принимают запросы пользователей и передают их в Anthropic от своего имени, обходя геоблокировку и требование иностранной банковской карты.

Через такие прокси токены Claude продают по 1 юаню за $1 — это на 70–90% дешевле официальной стоимости.

Низкую цену объясняют тремя источниками:

1. Массовая регистрация аккаунтов: бесплатные $5-кредиты Anthropic, чужие неиспользованные квоты, скидки для студентов, деление одной подписки Max за $200 между несколькими пользователями.

2. Подмена моделей: аудит немецкого центра CISPA проверил 17 прокси и обнаружил, что запрос к «Gemini-2.5» через прокси показывал 37% на медицинском бенчмарке вместо 83,82% у официального API. То есть по сути продают не Claude, а свои дешевые локальные модели.

3. Третий источник, по словам самих китайских разработчиков, главный: логи запросов и ответов, которые можно продать для обучения других моделей. Данные дороже кода, это нам давно известно.


Блокировки не останавливают, а создают рынок для тех, кто умеет их обходить. Нам это в целом знакомо 🥲

@ai_for_devs
Please open Telegram to view this post
VIEW IN TELEGRAM
133🤯21👍186💯3🔥2