Ноябрь, итоги
Кодекс: 15B токенов, $3k по апи ценам
Глм c китами: 1.7b, $62
Средненький месяц
А сами смотрите свою статистику?
#post
@deksden_notes
Кодекс: 15B токенов, $3k по апи ценам
Глм c китами: 1.7b, $62
Средненький месяц
А сами смотрите свою статистику?
#post
@deksden_notes
🔥5😭4
Словарик, часть 2 (продолжение)
Начало тут: https://t.me/deksden_notes/174
🆕 - Киты : китайские фронтирные опенсорсные модели (DeepSeek, GLM, Kimi K2, MiniMAx M2); скорее уважительное;
Начало тут: https://t.me/deksden_notes/174
🆕 - Киты : китайские фронтирные опенсорсные модели (DeepSeek, GLM, Kimi K2, MiniMAx M2); скорее уважительное;
Telegram
DEKSDEN notes
О терминах
Пару раз за последнее время заходила речь об используемых терминах / жаргонных наименованиях. Вопрос не самый первостепенный, но словарик постепенно сформируем. Это не исчерпывающий словарик AI терминов, но это про те термины, в которых были…
Пару раз за последнее время заходила речь об используемых терминах / жаргонных наименованиях. Вопрос не самый первостепенный, но словарик постепенно сформируем. Это не исчерпывающий словарик AI терминов, но это про те термины, в которых были…
🔥3👍1
Opus - народу!
Свежий релиз СС (2.0.58), и:
... Add Opus 4.5 access for Pro users
OMFG, this is big! 💣 🔥 💥
Здравствуй подписка за 20 баксов )))
Что конкуренция животворящая исполняет!
#post
@deksden_notes
Свежий релиз СС (2.0.58), и:
... Add Opus 4.5 access for Pro users
OMFG, this is big! 💣 🔥 💥
Здравствуй подписка за 20 баксов )))
Что конкуренция животворящая исполняет!
#post
@deksden_notes
🔥10👍3
Kiro powers
Тут Киро разродилось штукой - называется POWERS
Читать вот тут:
🔗 https://kiro.dev/blog/introducing-powers/
Концептуально - это тот же скилл.
😀 Из забавного: они прямо используют индексный файл, потому что POWER.md соджержит "a map of steering files for specific workflows. ". Ура! Мажоры учатся в контекстный инжиниринг.
До аннотированных ссылок они пока не дошли, зато индексный файл уже изобрели!
В бандл с POWER могут входить: инструкции, конфигурации MCP серверов, steering файлы / хуки.
Бандлить скрипты они пока не додумались. Бандлить пакеты скриптов - тоже (типа, как package.json зависимости указывает). Ну - еще не вечер.
Upd: замечу, что скорее всего тема скиллов уйдет в принятие отраслью, раз кодекс и киро уже проявили явный интерес к таким механизмам! Так что у нас второй механизм общепринятый появляется
- сначала была память на файлах с folder-scope (CLAUDE.md и .cursorrules стиля, AGENTS.md как часть движа)
- щас скиллы
(ц) такое нас радует
#post
@deksden_notes
Тут Киро разродилось штукой - называется POWERS
Читать вот тут:
🔗 https://kiro.dev/blog/introducing-powers/
Концептуально - это тот же скилл.
😀 Из забавного: они прямо используют индексный файл, потому что POWER.md соджержит "a map of steering files for specific workflows. ". Ура! Мажоры учатся в контекстный инжиниринг.
До аннотированных ссылок они пока не дошли, зато индексный файл уже изобрели!
В бандл с POWER могут входить: инструкции, конфигурации MCP серверов, steering файлы / хуки.
Бандлить скрипты они пока не додумались. Бандлить пакеты скриптов - тоже (типа, как package.json зависимости указывает). Ну - еще не вечер.
Upd: замечу, что скорее всего тема скиллов уйдет в принятие отраслью, раз кодекс и киро уже проявили явный интерес к таким механизмам! Так что у нас второй механизм общепринятый появляется
- сначала была память на файлах с folder-scope (CLAUDE.md и .cursorrules стиля, AGENTS.md как часть движа)
- щас скиллы
(ц) такое нас радует
#post
@deksden_notes
kiro.dev
Introducing Kiro powers
Dynamic loading of context and MCP servers
👍2🔥1
CodexBar доработан - теперь и СС
Маленькая macOS утилитка доработалась. Показывает использование лимитов, версию - как кодекс, так и СС.
https://t.me/deksden_notes/220
Скачиваем тут: https://github.com/steipete/CodexBar
(ц) такое мы пользуем
#post
@deksden_notes
Маленькая macOS утилитка доработалась. Показывает использование лимитов, версию - как кодекс, так и СС.
https://t.me/deksden_notes/220
Скачиваем тут: https://github.com/steipete/CodexBar
(ц) такое мы пользуем
#post
@deksden_notes
Telegram
DEKSDEN notes
CodexUsage
Отдельная маленькая macOS утилита для трекинга использования лимитов кодекса.
https://github.com/steipete/CodexBar
Полезно, имхо
#post
@deksden_notes
Отдельная маленькая macOS утилита для трекинга использования лимитов кодекса.
https://github.com/steipete/CodexBar
Полезно, имхо
#post
@deksden_notes
👍1
Playwrighter MCP
Интересная штука!
🔗 https://github.com/remorses/playwriter/
Работает через расширение (нет запуска отдельного браузера)
Работает через 1 тул, но предоставляет полный api playwright. Как вы догадались - запуск кода конечно
В общем, это WIP, но интересно
(ц) За таким мы следим
#post
@deksden_notes
Интересная штука!
🔗 https://github.com/remorses/playwriter/
Работает через расширение (нет запуска отдельного браузера)
Работает через 1 тул, но предоставляет полный api playwright. Как вы догадались - запуск кода конечно
В общем, это WIP, но интересно
(ц) За таким мы следим
#post
@deksden_notes
GitHub
GitHub - remorses/playwriter: Chrome extension to let agents control your browser. Runs Playwright snippets in a stateful sandbox.…
Chrome extension to let agents control your browser. Runs Playwright snippets in a stateful sandbox. Available as CLI or MCP - remorses/playwriter
🔥4👍1
Codex Skills
Замержили в 0.65 экспериментальную фичу:
https://github.com/openai/codex/pull/7412
для внутреннего тестирования, релиза пока не было
Но сам факт!
Замержили в 0.65 экспериментальную фичу:
https://github.com/openai/codex/pull/7412
для внутреннего тестирования, релиза пока не было
Но сам факт!
GitHub
feat: experimental support for skills.md by tibo-openai · Pull Request #7412 · openai/codex
This change prototypes support for Skills with the CLI. This is an experimental feature for internal testing.
👍3
⚪️ ReactGrab
Оказывается, не все слышали про такой довольно удобный фронтэнерский агентный инстурмент: штука, облегчающая указание нужных элементов для агентов. Такой data-testid на максималках))
Почитать тут:
🔗 https://www.react-grab.com/blog/intro
ну и сам сайт тоже
Репо: https://github.com/aidenybai/react-grab
Видос в ридми посмотприте для понмиания.
Мне показалось полезной! Думаю при случае вместе с Playwriter (чуть выше про него заметка) юзать, чтобы агентный сетап был полноценный.
#post
@deksden_notes
Оказывается, не все слышали про такой довольно удобный фронтэнерский агентный инстурмент: штука, облегчающая указание нужных элементов для агентов. Такой data-testid на максималках))
Почитать тут:
🔗 https://www.react-grab.com/blog/intro
ну и сам сайт тоже
Репо: https://github.com/aidenybai/react-grab
Видос в ридми посмотприте для понмиания.
Мне показалось полезной! Думаю при случае вместе с Playwriter (чуть выше про него заметка) юзать, чтобы агентный сетап был полноценный.
#post
@deksden_notes
React Grab
I made your coding agent 3× faster at frontend
I got tired of watching Claude grep around my codebase every time I wanted to edit a button. So I built a tool that lets me click any element and copy its exact source location. Turns out it makes coding agents 3× faster.
👍8🔥1
⚪️ TUI ренессанс - discordo
В последнее время cli инструменты переживают прям ренессанс. Но, мне кажется - с перегибами. вот такое, оказывается, бывает:
🔗 https://github.com/ayn2op/discordo
это TUI клиент для дискорда
Мне одному кажется что это - перебор?
#post
@deksden_notes
В последнее время cli инструменты переживают прям ренессанс. Но, мне кажется - с перегибами. вот такое, оказывается, бывает:
🔗 https://github.com/ayn2op/discordo
это TUI клиент для дискорда
Мне одному кажется что это - перебор?
#post
@deksden_notes
GitHub
GitHub - ayn2op/discordo: A lightweight, secure, and feature-rich Discord terminal (TUI) client.
A lightweight, secure, and feature-rich Discord terminal (TUI) client. - ayn2op/discordo
🔥4🤡1
▶️ Агенты как раннеры
Пришла в голову идея затестить как работают агенты как раннеры. Запускал идентичные тесты (набор юнит-тестов одного из проектов) в разных средах
Сравнивал:
- jetbrains тестовый раннер из их ИДЕ
- запуск в jetbrains команды pnpm test:unit (terminal)
- запуск этой же команды в codex 0.65 из под агента
- запуск этой же команды в СС 2.0.59 из под агента (glm)
Итоги:
- jb: 41s
- jb terminal: 39s
- codex: 109s
- cc: 43s
🤷♂️
скрины в комментах
Пришла в голову идея затестить как работают агенты как раннеры. Запускал идентичные тесты (набор юнит-тестов одного из проектов) в разных средах
Сравнивал:
- jetbrains тестовый раннер из их ИДЕ
- запуск в jetbrains команды pnpm test:unit (terminal)
- запуск этой же команды в codex 0.65 из под агента
- запуск этой же команды в СС 2.0.59 из под агента (glm)
Итоги:
- jb: 41s
- jb terminal: 39s
- codex: 109s
- cc: 43s
🤷♂️
скрины в комментах
👀1
Оправа / Упряжка
Словарик тут: https://t.me/deksden_notes/174
Вот авторы бенча решили прогнать его в родной оправе моделей и зарядили клода внутри СС. Результат на графике - цифры показательные. почему то опус 4.1 только припал, во всех других случаях рост, почти до исчарпания бенчмарка.
👉 Резюме: оправа капец как важна и дает эффект. Поэтому тестировать модели надо не в курсоре, а в родных упряжках (kimi cli, например). Ну или не делать вывода о модели в чужой упряже.
#post
@deksden_notes
Словарик тут: https://t.me/deksden_notes/174
Вот авторы бенча решили прогнать его в родной оправе моделей и зарядили клода внутри СС. Результат на графике - цифры показательные. почему то опус 4.1 только припал, во всех других случаях рост, почти до исчарпания бенчмарка.
👉 Резюме: оправа капец как важна и дает эффект. Поэтому тестировать модели надо не в курсоре, а в родных упряжках (kimi cli, например). Ну или не делать вывода о модели в чужой упряже.
#post
@deksden_notes
👏7❤2
Codex 5.2 WEN? (следующий вторник?)
"Утечки" бенчмарков довольно впечатляющие. Публику прогревают капитально - клиенты должны знать что у клозедов еще есть тузы в рукавах и не стоит отменять подписки в пользу гемини 3!
Обратите внимание с кем сравниваем))
Кстати, с опусом не сравнили! посмотрим на цифры как выйдет.
В любом случае - круто как работает конкуренция! Как пользователь я рад
(ц) "Такое мы ждем"
#post
@deksden_notes
"Утечки" бенчмарков довольно впечатляющие. Публику прогревают капитально - клиенты должны знать что у клозедов еще есть тузы в рукавах и не стоит отменять подписки в пользу гемини 3!
Обратите внимание с кем сравниваем))
Кстати, с опусом не сравнили! посмотрим на цифры как выйдет.
В любом случае - круто как работает конкуренция! Как пользователь я рад
(ц) "Такое мы ждем"
#post
@deksden_notes
❤3
Forwarded from Oleksandr Oliinyk
Сделал менеджера Саб Агентов для Антигравити - можно использовать в качестве саб агентов и Codex и Claude Code -
https://github.com/OleynikAleksandr/antigravity-subagents
https://github.com/OleynikAleksandr/antigravity-subagents
GitHub
GitHub - OleynikAleksandr/antigravity-subagents: **Antigravity SubAgents** provides the infrastructure for **Antigravity IDE**…
**Antigravity SubAgents** provides the infrastructure for **Antigravity IDE** to utilize specialized Sub-Agents. - OleynikAleksandr/antigravity-subagents
❤7👾1
Codex : todo список задач
... у меня пропал совсем. Модель туда не пишет, и я его уже порядком времени не видел! У всех так?
Если да - что бы это значило? Ждем нормлаьный spec / plan mode? с проработкой плана и потом подруливанием модели чтобы она его откатала по полной? Было б прикольно
#post
@deksden_notes
... у меня пропал совсем. Модель туда не пишет, и я его уже порядком времени не видел! У всех так?
Если да - что бы это значило? Ждем нормлаьный spec / plan mode? с проработкой плана и потом подруливанием модели чтобы она его откатала по полной? Было б прикольно
#post
@deksden_notes
🤷4
Claude code :: background agents (2.0.60+)
Теперь можно запустить агента в фоне, и продолжать чатится, пока он будет работать - почти как bash команды отправляются в фон, и управляются через менеджер фоновых заданий.
Агента можно опрашивать - чего там у него делается. на скрине - пример (взят с реддита)
Выглядит удобным. Как применять для работы - надо придумать.
👉 upd: там еще и resumable агенты сюда же! то есть после получения ответа от агента можно будет продолжить с ним же! Интересно.
https://code.claude.com/docs/en/sub-agents#resumable-subagents
#post
@deksden_notes
Теперь можно запустить агента в фоне, и продолжать чатится, пока он будет работать - почти как bash команды отправляются в фон, и управляются через менеджер фоновых заданий.
Агента можно опрашивать - чего там у него делается. на скрине - пример (взят с реддита)
Выглядит удобным. Как применять для работы - надо придумать.
👉 upd: там еще и resumable агенты сюда же! то есть после получения ответа от агента можно будет продолжить с ним же! Интересно.
https://code.claude.com/docs/en/sub-agents#resumable-subagents
#post
@deksden_notes
👍6❤4🔥4
Google Stitch 🎁 Shipmas
У гугловского Стича неделя релизов!
Первый - теперь оно генеририт код и экспортирует его! Можно получить работающий прототип.
Внутри - нанобанана про.
https://x.com/stitchbygoogle/status/1998151360446181626?s=46
Такими темпами и попробовать его руки дойдут!))
(Ц) за таким мы посматриваем!
У гугловского Стича неделя релизов!
Первый - теперь оно генеририт код и экспортирует его! Можно получить работающий прототип.
Внутри - нанобанана про.
https://x.com/stitchbygoogle/status/1998151360446181626?s=46
Такими темпами и попробовать его руки дойдут!))
(Ц) за таким мы посматриваем!
X (formerly Twitter)
Stitch by Google (@stitchbygoogle) on X
Welcome to Shipmas Day 1. 🚢🎁 We have a new ship every day this week and a big launch Wednesday!
First up: We’re unlocking the Redesign Agent by taking the image output and letting you generate code.
Powered by Nano Banana Pro, our agent has been taking…
First up: We’re unlocking the Redesign Agent by taking the image output and letting you generate code.
Powered by Nano Banana Pro, our agent has been taking…
👍2
Тестирование, бизнес-процессы
Я уже затрагивал эту тему ранее, в канале, в лонгриде про тестирование : https://t.me/deksden_notes/249
▶️ Сейчас хотел сказать про немного другой аспект той же проблемы.
Когда я делаю какие то системы, я прежде всего на любую фичу планирую какой то интеграционный тест. По мне елать агентами какую то фичу без такого теста - штука бесмысленная! Даже если сделать все юнит тесты, проработать их стратегию тестирования отдельно, даже если сделать полуинтеграционные тесты, и интеграционыне, все равно могут получаться неработающие системы
ℹ️ Напомню применяемую мною иерархию тестирования:
- юнит тесты: тестируют базовую логику модулей в изоляции; все зависимости обязательно мокнуты, то есть демонстрируют строго детерминированное поведение;
- полу-интеграционные тесты: когда части системы тестируются во взаимодействии с другими, но другие части могут быть частично моками или стабами;
- компонентные тесты: когда в UI есть что то сложное, и его надо отдельно протестировать на правильность поведения;
- тесты - сценарии: по сути большие интеграционные тесты, бизнес-процессы; когда система работает в приближенном к боевому состоянию и тестируется именно полнофункциональная работа по какому то пользовательскому сценарию с реальными компонентами.
👉 Основной поинт этого поста: главным для меня является интеграционный тест / бизнес-процесс. Без него совсем нельзя в AI SWE. Можно без юнит тестов, без компонентных и полу-интеграционных. Они просто подтягивают качество элементов системы. Но основным способом проверять функционирование системы я вижу только бизнес-процесс, без него из элементов может система то и не сложится. "Угадал все буквы но не смог назвать слово!"
❓ Зачем тогда другие тесты? Потому что без них бывает довести интеграционный тест до зеленого состояния совсем затруднительно - слишком много проблем в элементах, из которых состоит система. Если в каждом из них есть "люфт", то система может стать практически неработоспособной - будет все время "виляться" во многих местах, и стабилизировать будет сложно.
Поэтому качество системы подтягиваем на всех возможных уровнях: начиная с lint, продолжаем юнит тестами и полу-интеграционными/компонентными.
❓Что за сценарии? Это практически те же юзкейсы из фич/эпиков аджайла. То есть "хотелка" про то, как пользователь работает в системе, только переведенная в "автоматический" режим.
👉 А вот второй поинт поста: для запуска таких тяжелых сценариев я всегда делаю агентное воркфлоу. Подход такой: я делаю некую инструкцию для ИИ агента:
- как пересобрать систему (потому что часто тест гоняется после проведенной доработки, и нужно собрать систему чтобы подтянуть изменения),
- как поднимать систему в тестовом состоянии (если у вас 3-5 компонентов, то это тоже уже процесс),
- как запустить тестовый сценарий (каким раннером)
- какие ключевые метрики мы ожидаем (если сценарий оформлен как тест в некоем раннере, то тут просто - тест зеленый);
- иногда бывает что этот сценарий - это не тест, а полностью агентный воркфлоу, когда агент чего то запускает, чего то делает, и контролирует результат; по сути - тот же тест, но в виде агентного воркфлоу;
- как интерпретирвоать результаты - чтобы агент понимал критерии успеха и неуспеха,
- как фиксировать отклонения: какую информацию и где собирать если есть отклонение (в каких логах покопаться, откуда их вытаскивать, может быть в БД сходить или в хранилище и исследовать артефакты);
- где лежат фикстуры процесса: тестовые наборы данных (файлы примеров, сиды БД, ...).
Идеальный вариант - писать интеграционный тест с агентом, чтобы он сам прокликал ui и сделал этот сценарий в playwright. Антигравити с браузером как раз для таких штук и будут оптимальна!
▶️ Вы верно увидели сходство: по сути, я оформляю СКИЛЛ для запуска этого бизнес-процесса.
👉 Когда кодекс запустит скиллы, придет пора оформить это в виде реального скилла, раз этот формат прижился!
👌 И - да, тесты вполне может гонять зайка, что дешево, шустро и в качественной упряжке.
А вы гоняете тесты под агентами?
Я уже затрагивал эту тему ранее, в канале, в лонгриде про тестирование : https://t.me/deksden_notes/249
▶️ Сейчас хотел сказать про немного другой аспект той же проблемы.
Когда я делаю какие то системы, я прежде всего на любую фичу планирую какой то интеграционный тест. По мне елать агентами какую то фичу без такого теста - штука бесмысленная! Даже если сделать все юнит тесты, проработать их стратегию тестирования отдельно, даже если сделать полуинтеграционные тесты, и интеграционыне, все равно могут получаться неработающие системы
ℹ️ Напомню применяемую мною иерархию тестирования:
- юнит тесты: тестируют базовую логику модулей в изоляции; все зависимости обязательно мокнуты, то есть демонстрируют строго детерминированное поведение;
- полу-интеграционные тесты: когда части системы тестируются во взаимодействии с другими, но другие части могут быть частично моками или стабами;
- компонентные тесты: когда в UI есть что то сложное, и его надо отдельно протестировать на правильность поведения;
- тесты - сценарии: по сути большие интеграционные тесты, бизнес-процессы; когда система работает в приближенном к боевому состоянию и тестируется именно полнофункциональная работа по какому то пользовательскому сценарию с реальными компонентами.
👉 Основной поинт этого поста: главным для меня является интеграционный тест / бизнес-процесс. Без него совсем нельзя в AI SWE. Можно без юнит тестов, без компонентных и полу-интеграционных. Они просто подтягивают качество элементов системы. Но основным способом проверять функционирование системы я вижу только бизнес-процесс, без него из элементов может система то и не сложится. "Угадал все буквы но не смог назвать слово!"
❓ Зачем тогда другие тесты? Потому что без них бывает довести интеграционный тест до зеленого состояния совсем затруднительно - слишком много проблем в элементах, из которых состоит система. Если в каждом из них есть "люфт", то система может стать практически неработоспособной - будет все время "виляться" во многих местах, и стабилизировать будет сложно.
Поэтому качество системы подтягиваем на всех возможных уровнях: начиная с lint, продолжаем юнит тестами и полу-интеграционными/компонентными.
❓Что за сценарии? Это практически те же юзкейсы из фич/эпиков аджайла. То есть "хотелка" про то, как пользователь работает в системе, только переведенная в "автоматический" режим.
👉 А вот второй поинт поста: для запуска таких тяжелых сценариев я всегда делаю агентное воркфлоу. Подход такой: я делаю некую инструкцию для ИИ агента:
- как пересобрать систему (потому что часто тест гоняется после проведенной доработки, и нужно собрать систему чтобы подтянуть изменения),
- как поднимать систему в тестовом состоянии (если у вас 3-5 компонентов, то это тоже уже процесс),
- как запустить тестовый сценарий (каким раннером)
- какие ключевые метрики мы ожидаем (если сценарий оформлен как тест в некоем раннере, то тут просто - тест зеленый);
- иногда бывает что этот сценарий - это не тест, а полностью агентный воркфлоу, когда агент чего то запускает, чего то делает, и контролирует результат; по сути - тот же тест, но в виде агентного воркфлоу;
- как интерпретирвоать результаты - чтобы агент понимал критерии успеха и неуспеха,
- как фиксировать отклонения: какую информацию и где собирать если есть отклонение (в каких логах покопаться, откуда их вытаскивать, может быть в БД сходить или в хранилище и исследовать артефакты);
- где лежат фикстуры процесса: тестовые наборы данных (файлы примеров, сиды БД, ...).
Идеальный вариант - писать интеграционный тест с агентом, чтобы он сам прокликал ui и сделал этот сценарий в playwright. Антигравити с браузером как раз для таких штук и будут оптимальна!
▶️ Вы верно увидели сходство: по сути, я оформляю СКИЛЛ для запуска этого бизнес-процесса.
👉 Когда кодекс запустит скиллы, придет пора оформить это в виде реального скилла, раз этот формат прижился!
👌 И - да, тесты вполне может гонять зайка, что дешево, шустро и в качественной упряжке.
А вы гоняете тесты под агентами?
Telegram
DEKSDEN notes
Тестирование в эпоху AI агентов ч1/3
Попробую изложить имеющиеся соображения по тестированию и подходов к нему в некотором преломлении к агентам. Может быть покапитанствую местами - но куда ж без этого)
Сначала о термине "тестирование". Это огромная тема…
Попробую изложить имеющиеся соображения по тестированию и подходов к нему в некотором преломлении к агентам. Может быть покапитанствую местами - но куда ж без этого)
Сначала о термине "тестирование". Это огромная тема…
👍5❤🔥3🔥3
Еще один: Mistral Vibe CLI
Давайте уже CLI от каждого вендора, раз пошла такая ... мода!
🔗 https://mistral.ai/news/devstral-2-vibe-cli
Ничего не могу сказать про сабж кроме того, что он есть. Не уверен что в ближайшее сам буду тестировать.
Но для "попробовать" - самое время, пока Devstral 2 модель мистраль дает пробовать бесплатно. Потом - оплачиваем токены.
▶️ Хаб агента тут: https://github.com/mistralai/mistral-vibe
Питон, как ни странно. Не ts, не rust. Это они с кими теперь в одном лагере питонистов.
вебпоиска в тулах нету.
кастомные слеш команды есть, без параметров
агенты есть, с настройкой модели, но в toml файлах ("нестандартный", не md как у CC).
Если пускается в ZED, видимо поддерживает ACP.
#post
@deksden_notes
Давайте уже CLI от каждого вендора, раз пошла такая ... мода!
🔗 https://mistral.ai/news/devstral-2-vibe-cli
Ничего не могу сказать про сабж кроме того, что он есть. Не уверен что в ближайшее сам буду тестировать.
Но для "попробовать" - самое время, пока Devstral 2 модель мистраль дает пробовать бесплатно. Потом - оплачиваем токены.
▶️ Хаб агента тут: https://github.com/mistralai/mistral-vibe
Питон, как ни странно. Не ts, не rust. Это они с кими теперь в одном лагере питонистов.
вебпоиска в тулах нету.
кастомные слеш команды есть, без параметров
агенты есть, с настройкой модели, но в toml файлах ("нестандартный", не md как у CC).
Если пускается в ZED, видимо поддерживает ACP.
#post
@deksden_notes
mistral.ai
Introducing: Devstral 2 and Mistral Vibe CLI. | Mistral AI
State-of-the-art, open-source agentic coding models and CLI agent.
❤1