AI for Devs

🙈 Claude Code делает 4% коммитов на GitHub

По данным SemiAnalysis на начало февраля, на Claude Code приходится 4% всех публичных коммитов — рост с почти нулевого уровня; при сохранении текущих тенденций прогнозируется до 20% к концу года.

Возникает вопрос качества этих коммитов. Компилятор из предыдущего поста, кстати, не может скомпилировать Hello World из своего же README файла :)

Ну когда уже нас заменят окончательно!? Хочу на море...

@ai_for_devs

😁38👍11🎉8🤯5❤4

6.19K views11:15

AI for Devs

😎 Обзор AI‑ассистентов для кодинга в 2026

12 февраля в 14:30 (мск) эксперты из Veai будут разбирать, почему большинство текущих решений ломаются на больших кодовых базах: теряют зависимости, плохо держат контекст и не видят проект целиком.

Фокус на инженерной стороне вопроса. Как эволюционировали AI-инструменты для кодинга, какие подходы работают в CLI, что реально дают planning mode, memory bank и субагенты, и где проходят границы промптинга в продакшене.

Спикер: Михаил Костицын (Lead Developer).

Вебинар бесплатный, главное зарегистрироваться: https://my.mts-link.ru/j/Veal/12547604067

1❤12👍12🔥6😁5👏1

5.32K views08:15

AI for Devs

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

Развлекался на выходных со Skills от Remotion. В итоге получился этот промо-ролик.

В Remotion видео описывается как React-приложение. Компоненты, параметры, детерминированный покадровый рендер. Плюс у них есть набор шаблонов под разные типы роликов. Я уже пробовал собирать видео с Remotion и ИИ-агентами пару месяцев назад. Выходило откровенно слабо. Сейчас тоже не «вау», но разница заметная.

Переломным моментом стал релиз скилов от ремоушен. С ними агент понимает, как создавать композиции, работать с таймингом, анимациями и экспортом.

Процесс создания такого видоса довольно простой. Создаёшь шаблонный проект. Отдаёшь агенту структуру ролика: сцены, текст, акценты. Дальше несколько итераций на вкусовщину. Где-то ускорить, где-то смягчить переход, где-то сдвинуть текст.

Финальный штрих — звук. Он влияет сильнее, чем кажется, даже если его почти не замечаешь. Тут пришлось тряхнуть стариной и залезть в DaVinci Resolve, чтобы накинуть пару whoosh’ей.

В целом прикольно. Для коротких промо, README и презентаций это рабочий вариант. Если есть знакомый дизайнер или монтажёр, которому интересно поиграться с кодом и агентами, можно смело шарить.

И напоследок примеры людей, которые закопались глубже и сделали заметно веселее: раз, два, три. Полный процесс описал в статье на Хабре.

@ai_for_devs

5👍14🔥7❤5👏3

5.37K views16:36

AI for Devs

⚡️ Китайцы тихо дропнули свежую версию своей флагманской модели GLM-5!

Пока что нет никакой информации, но модель уже доступна на https://chat.z.ai

Воодушевляет, GLM-4.7 была действительно неплохой. Ждём бенчмарки!

@ai_for_devs

2🔥43👍14⚡6❤3🤯2

5.2K viewsedited 13:06

AI for Devs

🔥 Подъехали бенчмарки по GLM-5

Z.ai раскрыли детали по новой версии. Коротко по сравнению с GLM-4.7: модель выросла с 355B (32B active) до 744B параметров (40B active), объём предобучения — 28.5T токенов. Добавили DeepSeek Sparse Attention для длинного контекста и собственную RL-инфраструктуру slime для ускорения посттрейна.

По результатам open-source сегмента GLM-5 держится в верхней группе.

Основные бенчмарки:

— SWE-bench Verified: 77.8 (у GLM-4.7 — 73.8)
— Terminal-Bench 2.0 (Terminus 2): 56.2 / 60.7
— BrowseComp с управлением контекстом: 75.9
— Vending Bench 2: $4,432 за год симуляции бизнеса

На Vending Bench 2 это первое место среди open-source моделей. В reasoning-задачах результаты близки к Claude Opus 4.5, местами выше других открытых моделей.

Модель уже выложена с весами под MIT на HuggingFace и доступна через API. Судя по метрикам, ставка сделана на длинные агентные сценарии и инженерные задачи.

@ai_for_devs

1🔥37👍14❤9🤩3🤯2

6.08K views17:48

AI for Devs

😎 Вебинар про AI‑ассистентов для кодинга в 2026 уже сегодня!

Если ты всё еще не зарегистрировался, то сейчас самое время. Трансляция начнется через час, в 14:30 мск.

Напомню, что эксперты из Veai будут разбирать, почему большинство текущих решений ломаются на больших кодовых базах: теряют зависимости, плохо держат контекст и не видят проект целиком.

Спикер: Михаил Костицын (Lead Developer).

Вебинар бесплатный, главное зарегистрироваться: https://my.mts-link.ru/j/Veal/12547604067

P.S. В конце вебинара ребята обещали раздать подарки :)

2👍16🔥11❤7😁3

5.5K viewsedited 10:33

AI for Devs

🇨🇳 Неделя релизов из Китая продолжается

MiniMax представили M2.5 — флагманскую модель для кодинга и агентных задач.

— Результаты уровня SOTA в программировании (SWE-Bench Verified — 80,2%), поиске (BrowseComp — 76,3%), агентном вызове инструментов (BFCL — 76,8%) и офисных задачах
— Оптимизирована для эффективного выполнения: на 37% быстрее в сложных задачах
— При $1 в час на скорости 100 токенов в секунду становится экономически возможным масштабирование долгоживущих агентов

Кстати, модель уже доступна бесплатно на 7 дней в OpenCode.

MiniMax Agent | API | Блогпост

@ai_for_devs

Please open Telegram to view this post

VIEW IN TELEGRAM

2👍29❤13🔥9⚡1

4.69K viewsedited 17:41

AI for Devs

0:51

This media is not supported in your browser

VIEW IN TELEGRAM

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

0:46

This media is not supported in your browser

VIEW IN TELEGRAM

Больше 1 000 токенов в секунду. Именно столько выдаёт новая версия модели GPT-5.3-Codex от OpenAI под кодовым названием Spark. Это примерно в 10 раз быстрее GPT-5.3-Codex и других моделей, с которыми мы сейчас взаимодействуем.

Скорость обеспечена за счёт запуска на железе Cerebras и оптимизации всего пайплайна. OpenAI объявили о партнерстве с Cerebras ровно месяц назад.

Доступ уже открыт в режиме research preview для ChatGPT Pro в Codex app, CLI и VS Code.

Видео не ускорены — разница в ощущении от взаимодействия действительно колоссальная.

@ai_for_devs

3⚡23👍18🤯11🔥5❤3

6.28K views06:50

AI for Devs

Делать было нечего, дело было вечером. Всё возвращаюсь к истории про Opus 4.6, который написал C-компилятор на Rust. Снова перечитал исходную статью "Building a C compiler with a team of parallel Claudes" — обратил внимание именно на динамику версий Opus.

Opus 4 с задачей компилятора справлялся с трудом. Мог собрать что-то работоспособное, но это был эксперимент, который по сути потерпел неудачу.

Opus 4.5 стал первой версией, которая набрала "критическую массу": компилятор начал проходить большие тест-сьюты. При этом реальные крупные проекты всё ещё не собирались.

Opus 4.6 — финальная точка этой истории. Компилятор уже способен собирать значимую часть проектов, используется GCC как эталон для дифференциальной проверки, вокруг модели построен цикл автономной доработки. Но автор прямо пишет: это ещё не замена настоящему компилятору, а добавление новых фич регулярно ломает старое. Похоже на достижение предела конкретной архитектуры.

На этом фоне особенно любопытны бенчмарки. В агентном программировании скачка фактически нет: Agentic Coding у Opus 4.6 снизился на 0,1% по сравнению с Opus 4.5! Зато Agentic Search вырос на 17%!

Получается, в случае с Opus 4.6 прорыв случился не в "чистом кодинге", а в умении долго искать, сравнивать, уточнять, проверять гипотезы.

И это, возможно, важнее, чем очередные несколько "очков" в coding-бенчмарке.

@ai_for_devs

1👍26❤22🔥7

4.93K views15:26

AI for Devs

😎 На прошлой неделе состоялся вебинар от команды Veai

Ажиотаж оказался таким, что МТС Линк даже на максимальном тарифе не смог принять всех желающих — часть участников просто не пустило в эфир. Сожалеем, что так получилось и к следующему вебинару что нибудь придумаем!

Хорошо, что велась запись. Все, кто не смог подключиться, могут посмотреть материал на RUTUBE: «Обзор AI-ассистентов для кодинга в 2026».

P.S. Обещали подарки тем, кто был онлайн. Поскольку многие не попали не по своей вине, решили дать возможность всем воспользоваться бонусом.

5000 Flex-кредитов на Veai по промокоду: veai_for_devs

Активировать можно до 28 февраля, 23:59 (МСК) в личном кабинете: https://app.veai.ru

@ai_for_devs

51❤22🔥9👍8😁1🤯1🤩1

5.17K views11:57

AI for Devs

Перекличка. Проверяете ли вы каждую строку кода, сгенерированного AI для ПРОДАКШЕНА?

Anonymous Poll

Посмотреть результаты

🤯11👍7❤2🙏2

1.48K voters4.47K views15:17

AI for Devs

1:29

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ Anthropic представили Claude Sonnet 4.6

Обновление «средней» модели, которая теперь по ряду задач конкурирует с Opus-классом.

— Контекстное окно 1 млн токенов (бета): в один запрос помещается целый репозиторий или десятки документов
— В Claude Code пользователи выбирали 4.6 вместо 4.5 в ~70% случаев
— В сравнении с Opus 4.5 — предпочтение в 59% сессий
— Повышена устойчивость к prompt injection
— Цена без изменений: $3 / $15 за млн входных / выходных токенов

Модель стала дефолтной для тарифов Free и Pro в claude.ai и Cowork.

@ai_for_devs

2🔥40❤6🤯5⚡4🤩3

4.84K views17:57

AI for Devs

⚡️ Два разных подхода к «fast mode» у Anthropic и OpenAI

Обе компании запустили ускоренный режим для своих лучших кодовых моделей. Цифры сильно отличаются.

У Anthropic до 170 токенов/с против ~65 у Opus 4.6 (примерно 2,5×).
У OpenAI более 1 000 токенов/с против ~65 у GPT-5.3-Codex (около 15×).

Ключевая разница в том, что Anthropic в fast mode отдают ту же модель, Opus 4.6. OpenAI в fast mode используют отдельную версию GPT-5.3-Codex-Spark. Она быстрее, но менее стабильна: чаще путается в tool calls и сложной логике по сравнению с основной Codex.

Почему так.

У Anthropic наиболее вероятное объяснение — уменьшение batch size при инференсе. Узкое место здесь память: перед запуском нужно загрузить prompt на GPU. Чем больше батч, тем выше общая пропускная способность, но выше и задержка. Меньший батч даёт более быстрый первый токен и меньшую задержку, но снижает эффективность. Отсюда и экономика: примерно в 6 раз дороже за около 2,5 кратный прирост скорости.

У OpenAI другой подход. В анонсе указан партнёр Cerebras. Их чипы значительно больше обычных GPU и содержат больше встроенной SRAM. Модель или её часть можно держать ближе к вычислениям, уменьшая обращения к внешней памяти. Это и даёт кратный рост скорости.

Но ограничение в объёме памяти остаётся. Один чип Cerebras вмещает десятки гигабайт SRAM. Этого достаточно для модели порядка 20–40B параметров в зависимости от формата весов, но недостаточно для GPT-5.3-Codex. Поэтому в fast mode используется отдельная версия, Spark, меньшая по размеру. По обсуждениям, модель может распределяться по нескольким чипам.

Инженерно решение OpenAI сложнее: перенос модели на нестандартную архитектуру и адаптация под её ограничения.

Открытым остается вопрос практической ценности. Если скорость растёт вместе с числом ошибок, то зачем менять шило на мыло? В агентных сценариях больше времени уходит на исправление ошибок, а не на ожидание токенов.

Фактически это две стратегии: ускорение существующей модели за счёт настроек инференса и адаптация модели под специализированное железо.

А если вы и так всё это знали, то вот вам занимательный факт: в 1977 году радиотелескоп проекта Big Ear зафиксировал краткий сигнал «Wow!», источник которого до сих пор не установлен.

@ai_for_devs

2👍22🔥8❤6

3.88K views14:45

AI for Devs

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ Вышел Cursor 2.5. Два главных изменения: маркетплейс плагинов и нормальная многоагентность

Теперь навыки, субагенты, MCP-серверы, хуки и правила можно упаковать в один плагин и поставить через маркетплейс. Поддержка уже есть у Amplitude, AWS, Figma, Linear, Stripe. Установить можно прямо из редактора через /add-plugin.

Второй крупный апдейт — sandbox. Теперь можно явно задать, к каким доменам агент имеет доступ. Три режима: только свой allowlist, allowlist плюс дефолтные домены Cursor или полный доступ. Появились ограничения на директории и файлы.

И самое интересное — асинхронные субагенты. Раньше дочерний агент блокировал родительский. Теперь он работает в фоне, а основной продолжает задачу. Субагенты могут запускать своих субагентов, формируя иерархическое дерево.

@ai_for_devs

2👍35🔥16❤7⚡1

4.37K views08:36

AI for Devs

🔥 Большое исследование Anthropic про автономность ИИ-агентов в продакшене

Anthropic разобрали миллионы сессий Claude Code и вызовов через API, чтобы понять, сколько автономности люди реально дают ИИ-агентам в проде.

Основные результаты:

– Самые длинные непрерывные «заходы» Claude Code за три месяца выросли почти вдвое: с ~25 до ~45 минут без вмешательства человека

– Новые пользователи включают полный auto-approve примерно в 20% сессий. У опытных — уже больше 40%

– При этом опытные чаще останавливают агента по ходу работы: около 9% остановок от общего числа запусков против ~5% у новичков

– На сложных задачах сам Claude останавливается с уточняющими вопросами чаще, чем его прерывает человек

@ai_for_devs

2👍23🔥7❤5🤯1

3.95K views09:16

About

Blog

Apps

Platform