DEKSDEN notes
960 subscribers
155 photos
2 videos
1 file
269 links
Канал с моими заметками на разные темы
Vibe Coding -> AI SWE, AI Coding Tools, Agents: Claude Code, Codex, news, links
Чат (!!!): https://t.me/+B1fB3sZbaVthMDhi
Download Telegram
⚪️ Codex new features


Там на днях sama объявил, что кодекс ждут много дополнительных фич.

Давайте погадаем - чего ожидать?

• план-мод практически дождались. Неплохо, не без глюков - но сделано вполне удобно. Рисёчем доработают и будет ок
• сварм вроде как делается, но это тонкая штука плюс лимиты кушает на раз! запускать такое без роста лимитов - ну хз. Акки на 20 баксов будут не за 1.5 часа отлетать, а за 15 минут.

А что еще нас ждет? Есть мысли / идеи?

Какие то персональные хотелки?


@deksden_notes
❤‍🔥2👍1
⚪️ Статистика и модели


Я тут смотрел свою статистику по пользованию кодексом и нашел интересные моменты

Смотрим ноябрь / январь. На вход почти одинаковое количество токенов: 500m

на выход - довольно больщое отличие - 15B / 21B. Это +30%

И ризонинг: было 16m / стало 50m - это x3!

Вот вам и разница поколений 5/5.1 vs 5.2

Январь у меня почти исключительно gpt-5.2 high
5🔥5
⚪️ Git flow для агентов / оркестраторов


А кто какой git flow пользует?

я вот в dd-flow оркестраторе по-умолчанию пока запилил так:
• ветки main / develop (как trunk)
• локальным merge train в develop который dd-flow гоняет.
• Ветка Develop управляется только оркестратором, он один туда коммитит.
• релизы путем PR в main, c автомержем

Итог: имею стабильно работающий merge train инттеграции фича-бранчей в develop. Релизы делаем когда накопится нужное количество фичей в develop.

Такой флоу понятный/простой? у кого как?
❤‍🔥1👍1
⚪️ REMOTE tools

"По заявкам телезрителей" зашарю свою подборку средств "удаленной" работы с агентами


* Road Runner (Easily sync code to a remote machine and run commands there. That's it) : https://github.com/rileyhilliard/rr

* VibeTunnel (Turn any browser into your terminal & command your agents on the go.) :
https://github.com/amantus-ai/vibetunnel
https://vibetunnel.sh/

* Happy (Mobile and Web client for Codex and Claude Code, with realtime voice, encryption and fully featured) :
https://github.com/slopus/happy
https://happy.engineering/docs/how-it-works/

* WebTMUX (Web-based terminal with tmux-specific features) : https://github.com/chrismccord/webtmux

* Outray (OutRay is an open-source ngrok alternative that makes it easy to expose your local development server to the internet via secure tunnels) : https://outray.dev/

* Remoto (Remoto creates a secure tunnel between your terminal and your phone. When you run the CLI, it spawns a local shell session and connects to our relay server via WebSocket) : https://www.remoto.sh/

* Takopi (Takopi runs coding agents on your computer and bridges them to Telegram. Send tasks from anywhere, watch progress stream live, pick up when back at the terminal. Scale from quick one-offs to multi-project workflows with topics and parallel worktrees): https://takopi.dev/tutorials/

* Ag3ntum: a general-purpose agent wwith security in mind (Secured CC shell with remote access via web) : https://github.com/extractumio/ag3ntum


(ц) Ынжой

@deksden_notes
👍9🔥4❤‍🔥11🥰1
⚪️ Kimi k2.5


Обзоры и отзывы все видели, да?

Скажу только - это НЕ ДУМАЮЩАЯ версия, и у нее такие неплохие бенчмарки. Думаю, к НГ выйдет думающая, и будет рвать как тузик грелку.

Думаете, уже лучше соннета 4.5? Или ждем думающую?

Нужны свои Evals, конечно ...

@deksden_notes
👀3🔥2
⚪️ Google AI Pro / Ultra

Добавили GCP Кредиты. Немного, но - приятно! На тесты хватит даже ai pro.


@deksden_notes
👍2
⚪️ Jules : пачка апдейтов, январь 2026


Жульес разродился пачкой апдейтов:

👉 Апдейты в АПИ: Апи поддерживает задачи без репозитория (🔥!!!) То есть мы получаем машину в облаке, с ИИ агентом, с node/bun/python/rust.

👉 От апи теперь можно получить пачку изменений в файлах, которые сделала задача

👉 по мелочи - запланированные задачки теперь редактируются

👉 Critic for Plan. Жульес добавил критика для плана. Говорят о повышении качества на 9.5% (drop in task failure rates) Верификация рулит, тут я согласен полностью )

👉 В фоне можно анализировать оптимизации производительности проекта
👍5🔥2
⚪️ Agentic Vision


Вот и зрение у моделей уже не простое, а агентное. Модель пишет код, и итеративно им исследует изображение. В блоге примеры!


🔗 https://blog.google/innovation-and-ai/technology/developers-tools/agentic-vision-gemini-3-flash

Следующий шаг, из очевидных - swarm vision, видимо.

Но как проактивные агентные техники развились то? RAG трещит под напором агентного поиска. И тут - буст 5-10% в бенчах зрения. Для табличек и прочей регулярной информации, с которой агенты справлялись плохо - вообще будет мощный плюс! А если рассматривать картинку не просто внутри thinking блока одного запроса, а действительно агентный цикл зафигачить? Еще и свармом для скорости? чтобы сегментировало, рассматривало в отдельности , кропало, трансформировало, улучшало, и прочее?..

Интересная штука, конечно.

▶️ Upd 1: А вы же обратили внимание, что это Флеш3, а не Про? ) Что характерно


@deksden_notes
1🔥6
⚪️ 11Labs для стартапов - free grant


У илэвенов есть такая программа:

🔗 https://elevenlabs.io/startup-grants

Дают гранты стартапам на 12 месяцев, по заявке. Рассматривают неделю. Кредиты зачисляют на аккаунт с которого давали заявку!

условия:

Monetized product use case: The goal of the ElevenLabs Grants is to help new and nascent products and business models powered by AI voices take off without too much start up cost. As such, only applications with a business or monetization strategy should apply. Only applications with valid business emails will be considered.

No short-term or one-off projects: Grants will only be awarded to companies seeking to build products they intend to take to market for the long term. One-off projects and campaigns will not be considered.

No projects for minors: We are unable to award grants to companies that are building projects for children aged 18 or under.

Startups and small companies only: The ElevenLabs Grants program is open to all startups or companies with less than 25 employees at the time of receiving the application.

One application per company: Each company can only submit one application. If you have multiple companies (rock on!) you can submit one application for each company. Existing enterprise customers are not eligible for grants.

Terms of receipt: If awarded a Grant, the company must agree to display "ElevenLabs Grants" logo at the bottom of their website, and include a link to the ElevenLabs website for at least twelve (12) months from the date of grant approval.


——

🟢 Прикольно, кмк

(ц) Такое мы ценим

@deksden_notes
⚪️ Статистика


Тут глянул гитхаб:
• 2,064 contributions in 2025
• 1,056 contributions in 2026

Сингулярность? ))
💯31🔥1
⚪️ Kimi K2.5 FREE 7day trial


Оказалось что у Кими акция очень тихая,и неприметная. Не знаешь - не найдешь. Но мы поможем!

Короче, раздают мелкий план бесплатно на 7 дней. Можно 2.5 пощупать.

Для кого: новые подписчики. Тем у кого раньше была подписка уже не дают. Как получить - заходите на kimi.com, ЛОГИНИТЕСЬ, и среди планов в варианте "на месяц" у Moderato будет так

@deksden_notes
4👍2
⚪️ СС теперь с нескучными обоями выражениями


Ну - все! Теперь заживм! В следующей версии можно будет кастомизировать чего вам СС во время работы будет писать как текст к спиннеру.

А если кроме шуток - мелкое QoL улучшение, но, в принципе, прикольное. Наверное, такие штуки украшают продукт

@deksden_notes
2🔥1
⚪️ Beautiful Mermaid


Крутой проект - стильный рендер Mermaid диаграмм, дуо-рендер в SVG/ASCII, то есть для TUI тоже! Сложные диаграммы, темы. Оч круто


🔗 https://github.com/lukilabs/beautiful-mermaid
🔗 https://agents.craft.do/mermaid

Просто посмотрите демо сайт! 🔥


Более ранняя работа - кому надо только ASCII рендер:

🔗 https://github.com/AlexanderGrooff/mermaid-ascii

Самое оно для документации. Еще и агенты понимают вполне вменяемо

@deksden_notes
🔥11👍4
⚪️ Progressive Disclosure : пробеги по граблям Skills и меморибанки


(Видимо,) В связи с активностью Vercel в отношении скиллов (запуск большой библиотеки Shills.sh) они тут исследование затеяли.

🔗 https://vercel.com/blog/agents-md-outperforms-skills-in-our-agent-evals

Суть их эксперимента в том, что они смотрели как агенты будут пользоваться скиллом, если туда пакануть документацию. Статья хорошая, прочитать стоит.

Что они обнаружили: что агенты не вызывают скиллы. "срезают углы" и идут простейшим путем. Можем не вызвать? не вызываем. Не новость (да, Опус?)!

Клозеды вот даже подучили как эвалы на свой скилл делать, чтобы смотреть когда он вызываетсяя, а когда - нет:

🔗 https://developers.openai.com/blog/eval-skills

В общем, проблема известная.

👉 Вкратце:
• просто поставить скилл почти совсем не помогает
• явный промптинг "используй скилл" уже заметно помогает
• лучше всего помогает если индекс явно грузить через AGENTS.md (индексный файл, ага) - но тогда теряется progressive disclosure
• думать надо именно в контексте progressive, то есть если сначала грузить документацию, а только потом смотреть на проект, то реультаты хуже чем если сначала смотреть на проект, а потом - в документацию. Это логично: агент будет знать чего смотреть конкретно и зачем.

При чем тут меморибанк? Дело в том, что я давно строю проекты с использованием именно меморибанков на progressive disclosure принципах (еще с тех времен когда они так не назывались - в закрепе канала индекс есть). И я давно свои флоу строю на явных директивных указаниях исследовать проект/меморибанк.

▶️ Vercel тут переоткрыл то, что давно было видно из практики работы с меморибанком: работают детерминированные этапы флоу - сначала готовим контекст явными промптами, потом работаем с ним. Для подготовки контекста принцип progressive disclosure работает хорошо - но только если его готовить.

Оставить все на откуп текущему поколению агентов нельзя, это не работает или работает неважно.

В следующем поколении, возможно (и скорее всего!) будет заметно лучше, раз скиллы настолько пошли в народ. Но пока - директивно праймим контекст.

(ц) А статейку то сами - прочтите, да!)

@deksden_notes
8👍2
⚪️ Оркестраторы и статистика


Поработал сутки своим оркстратором. Даже не весь день стоял. Но одновременно по паре флоу тянул.

Итоги: на вчера явнарь был 22B токенов
Сегодня - 25B

👉 +3B токенов в сутки. 😱

Вот и думайте!
В апи ценах это $750


И это:
• без параллельныз линий флоу, линейный mini
• без сварма (выключен)

А ведь я хочу все это включить.. Интересно - сколько будет жрать тогда?

Но фичи пободрее стали вкорячиваться! Я 5 или 6 довольно приличных протоколов влил. Это прям неплохо! Не до конца как я хотел, но уже близко

(ц) Над таким мы работаем!


@deksden_notes
👍8🤯3
⚪️ Gemini CLI: hooks 🆕


В Гемини КЛИ завезли хуки!

Полезная штука, так то. СС ими силен. Еще бы разные агенты хоть какую то унификацию этих кастомизаций бы придумали, типа стандарта.. Как агентные скиллы / слэш команды, и AGENTS.md до этого!..

Но я, наверное, многого хочу

🔗 Блог тут: https://developers.googleblog.com/tailor-gemini-cli-to-your-workflow-with-hooks/


#deksden_notes
👍4🙏2
⚪️ Прайминг контекста


Я довольно давно использую прайминг, термин отчасти устоявшийся, но не особо широко используемый.

Под праймингом контекста я понимаю процесс подготовки контекста для работы агента.

👉 Сейчас схема отработана довольно длительной практикой, и я делаю ее в пару этапов. После старта новой пустой сессии:

1️⃣ первый промпт: агент инструктируется полностью прочитать главный ИНДЕКС меморибанка;

2️⃣ второй промпт: агент инструктируется ПОДГОТОВИТСЯ к общению по узкой теме (например: "мы обсуждаем дашборд и его работу с сервером; подготовься, ты должен все знать про дашборд и работу сервера с внешними компонентами; глубоко исследуй меморибанк и кодовую базу").

Почему это работает?

Во-первых, у меня есть меморибанк. Это структурированное хранилище информации о проекте, построенное по принципу progressive disclosure, структурировано для облегчения сбора контекста.

Главный индекс меморибанка содержит полную "карту знаний" о проекте - раскрывает структуру меморибанка на глубину 1-2 уровней. Про индексные файлы: https://t.me/deksden_notes/46

Индекс построен не просто из ссылок, а из АННОТИРОВАННЫХ ссылок. То есть к ссылке "прилагается" два компонента - что находится по ссылке, и ЗАЧЕМ/ДЛЯ ЧЕГО может быть полезно прочитать эту ссылку. Вот про аннотированные ссылки: https://t.me/deksden_notes/47

Аннотированные ссылки в некоторой стпени снижают эффект, который мы чуть раньше обсуждали по мотивам статьи Vercel: https://t.me/deksden_notes/407

То есть после первого промпта в контексте агента находится карта знаний с встроенным "маршрутизатором" - когда и в какой раздел "бежать" за нужной информацией. Но наличие ссылок не означает что он по ним будет ходить, как выяснил Vercel.

Поэтому вторым промптом мы обозначаем тему нашей дискуссии - и инструктируем агента СДЕЛАТЬ исследование по меморибанку/кодовой базе. И в этот момент агент уже набирает значительное количество контекста по теме.

У меня в кодексе выходит 15-25% занятого контекста к старту обсуждения какой то узкой темы: это цена подготовки. И времени это занимает от 3 до 10 минут (5.2 на high ризонинге).

▶️ Еще раз:
• идея в том, чтобы сначала дать потенциал для агента (скормить ему карту знаний)
• а потом заставить этот потенциал реализовать по конкретному вопросу

В итоге имею "прогретый" контекст, агент не путается, не создает дополнительных сущностей, в курсе архитектуры, деталей проекта, принципов и подходов.

‼️ Важно: еще это работает потому что в меморибанке такая информация есть - и агент ее достает.

@deksden_notes
👍7❤‍🔥3🔥21
⚪️ Прайминг, если нет меморибанка


Очевидно, он тоже возможен, только нужно задать больше инструкций, и займет он больше времени. Это сложно делать технично и занимает заметно больше времени.

Вам необходимо чтобы в этой сессии агент исследовал ваш проект и разобрался с ним. Вы можете его направить: расскажите ему что ему исследовать.

Я бы предложил первым этапом исследовать проект по С4 структуре, кратко посмотреть L1 (что за проект) и выделять L2 уровни (типа подсистем). Это чтобы агент сориентировался.
ОСТПосле первичного знакомства стоит чтобы агент глубже исследовал нужную вам L2 подсистему (форнтэнд, БД, сервер, ...).

Каждый раз просите агента рассказать в общих словах итоги его исследования - чтобы вы оценили правильно ли и полностью ли агент разобрался в вопросе. Любая неправильная деталь тут приведет при работе к ошибкам (новый кусок форнтэнда не стыкуется с бэком, или обладает своей системой атворизации).

Можно ли заменить прайминг на систему индекстации / контекстный движок? Нет. Это разное: контекстный движок УСКОРЯЕТ исследование - но только если его делать. Агент должен получить сведения об устройстве вашей системы в целом, чтобы ничего сильно не напутать - а для этого он должен ПОЛУЧАТЬ эти сведения. ИМЕТЬ ВОЗМОЖНОСТЬ получить сведения - как подтвержадет Vercel, НЕ ДОСТАТОЧНО.

То есть системы типа курсора/qoder/augie/codealive помогают, но вам нужно их задействовать.

▶️ Меморибанк заменяет трудоемкую сборку контекста на довольно простой двухэтапный прайминг. Всячески рекомендую организовать ту или иную форму меморибанка.

@deksden_notes
👍62❤‍🔥1🔥1
⚪️ Планирование с агентом: работа с контекстом после прайминга


У меня практика такая: я использую контекст после прайминга для разных вещей.

Во-первых, есть некоторый пул "контекстов", у которых завершена первая фаза прайминга - агент прочитал индекс меморибанка и изучил общие сведения о системе. Такие контексты висят у меня неким пулом, я беру очередной для той или иной работы.

Во-вторых, в оркестраторе такие контексты используются для выполнения различных задач: текущий шаг, фикс, и тп. Так я обеспечиваю некоторый рост качества работы.

Как работаю, если мне нужно сделать доработку в проект?

• контекст прогрет под конкретную тему, агент погрузился в нее и готов обсуждать.
• я в свободной форме излагаю свои идеи доработки и прошу проработать вопрос, сообщить мне как это можно сделать - на старте всегда предлагаю подумать несколько вариантов, и обязательно изложить логику для оценки вариантов, какие рекомендации дает агент;
• я прямо говорю агенту: исследуй и изучи, как это лучше сделать в проекте; исследуй код, подготовься;
• после того, как тема прорисовывается, я прошу задать мне вопросы: спросить все что непонятно, устранить gaps для формирования техзадания на эти доработки;
• первая фаза планирования - это всегда обсуждение плана работы с содержательной стороны: что именно мы будем делать; здесь важно зафиксировать "ширину" ваших изменений и их содержание - чего будем делать, и почему будем делать именно так;
• первую фазу логично фиксровать в виде ADR - тогда вы сохраните ЛОГИКУ выбора тех или иных решений из вашего обсуждения;
• не лишним будет сохранить id сессии чтобы если что - вернуться
• после фиксации плана работы, можно начать прорабатывать implementation plan - тут агент должен предметно исследовать КАК в системе правильно приземлить твои изменения
• прорабатывайте side effects, использование существующих механизмов, убирайте оверинжиниринг и усложенния, ищите самый простой способ из возможных с сохранением функциональности
• еще раз просите агента все исследовать и думать как будет оптимально; просите предлагать идеи, давать оценки - это проработка;
• агент не должен выполнять ваши хотелки, агент должен найти качественное решение для поставленной задачи, поэтому местами он должен даже спорить ради эффективного решения - промптите его на это!
• проработанный implementation plan фиксируйте как Tech Specs
• я все документы храню в соответстввущих папках меморибанка, для истории (memory-bank/adrs/, memory-bank/tech-specs/, в последовательно пронумерованных файлах типа ADR-017-some-fieatures.md); использвоание номера сильно ускоряет отсылки к документам ("иди и прочитай ADR 021", и агент это понимает).


▶️ Общий принцип: расспрашивайте агента. Побуждайте его исследовать код, готовится к ответу на ваши вопросы, прорабатывать темы. Агент не должен выдумывать, агент должен бегать по проекту и изучать. Карта знаний по проекту му затем и дана - чтобы он знал куда бежать. И вот как раз настал момент, когда это надо сделать! побуждайте агента чтобы он это делал.

▶️ Проработка из двух фаз:
• выяснили ЧТО БУДЕМ ДЕЛАТЬ- фиксируем в ADR
• проработали КАК ИМЕННО ЭТО НАДО ДЕЛАТЬ - фиксируем в Tech Spec.


Когда рожден Tech Spec / Implementation plan - планирование в целом закончено, дальше - реализация. С оркестратором я просто даю id сессии и стартую флоу, где эта сессия превращается в план работ и реализуюется.

@deksden_notes
👍4🔥3❤‍🔥1
⚪️ Vercel и Agents.md


По следам блога Vercel про усвоение скиллов, уже сделали вот такую штуку, которая превращает скиллы в индекс для добавления в AGENTS.md файл, улучшая воспирятие агентом:

🔗 https://github.com/leviathofnoesia/AgentCompiler


Ну и такая штука встретилась: компилирует любую документацию в скилл:

🔗 https://github.com/hyperbrowserai/hyperbrowser-app-examples/tree/ex/hyperskill/skills-generator

Может, кому то будет полезно

@
👍3🔥3