DEKSDEN notes
955 subscribers
155 photos
2 videos
1 file
269 links
Канал с моими заметками на разные темы
Vibe Coding -> AI SWE, AI Coding Tools, Agents: Claude Code, Codex, news, links
Чат (!!!): https://t.me/+B1fB3sZbaVthMDhi
Download Telegram
Jules теперь - свободный агент!


Omfg. Они отвязали агента от репо, и теперь с жульесом можно просто чатится! А там, напомню, снова Гемини 3 про.

Любопытно! Это получается тут под боком есть свободный агент, с vm впридачу, и без требования подключить репо... Это в очередной раз заставляет меня задуматься - а как бы его в оркестратор включить, как удаленную ноду! Масштабирование тогда дешевое и на чужих мощностях - круто же!

Ух.. Надо думать

https://jules.google/docs/changelog/#start-from-scratchinstantly
5🔥5
Background process manager proposal


▶️ Запускаю щас всякие процессы в разных LLM. Вообще жесть - из методики трекинга выполнения - только спамить запросами.

В лучшем случае - это sleep 60, чтобы подождать.

Не понимаю - почему нету тула правильного для отслеживания запущенных фоновых башей: ты пускаешь кучу процессов, единый менеджер их трекает. Родилась некая идея.


🟢 Менеджер устроен как тул (например, пакован в MCP). Когда модель запускает некий процесс - она обозначает чего ждать: либо ей сразу отдать сгенерированную строку, либо собирать логи в батч, либо логи игнорировать и ждать когда в логах встретится ключевая подстрока, либо дать когда процесс в терминал чего то спросит, либо вообще стримить терминал в модель. В общем - подумать в каких режимах нам запускать надо процессы. Может, при апдейтах отдавать Stdout / stderr - посмотреть чего там надо модели.

Менеджер процессов в итоге трекает все, и по этой логике чего то возвращает в модель. Можно сразу вызвать нужный тул - чтобы он подготовил следующую пачку данных.

Для логов сжелать хранение и обработку - чтобы можно было запрос делать к логам: по подстроке, по времени и тп.

В общем, какие то такие мысли! Надо при случае выгрузить в какого то PMa буржуйского CLI агента. Жаль это реализует скорее какой нибудь дроид/opencode чем gemini/codex


А пока мучамся в кодексе как в пустыне - нифига нету. Хорошо хоть модель изворотливая относительно.

#post
@deksden_notes
👍1
Инструкции агентам


Немного ассоциаций!

Работая с агентами, я замечаю что часто начинаю общаться как в свое время с специфическими сотрудниками, знаете таких? Которые типа хитрые, но косят под простачков и могут сильно буквально исполнять инструкции. Типа "ну вы же сказали - ..." или "а нам никто не говорил, что ...", или, что хуже "а в инструкции сказано - ... ". Ведь даже такой вид забастовки есть - итальянская забастовка, когда работаем строго по инструкции.

В итоге, следишь за словами, за указаниями - чтобы и так, и эдак "не дать ему вывернутся".

▶️ Смешаные ощущения, конечно. Зато все больше убеждаюсь что отрасль движется в сторону большей доли менеджмента

У вас так же? Или это сугубо персональный контекст?


#post
@deksden_notes
🔥53👍3
Подписочки для OpenCode для Codex


Вот такую штуку нарыл:

🔗 https://github.com/numman-ali/opencode-openai-codex-auth

плагин для openCode чтобы работать через подписку Plus/Pro. прикольно!

‼️ Это некоторое нарушение TOS, поэтому на основном акке я бы не тренировался с такими сетапами! Аккуратно


🔥 Upd: openCode Desktop готовится! скрин в комментах


#post
@deksden_notes
Google UX


К версии 0.18.4 в Gemini CLI появился email того аккаунта, через который ты авторизован. Всего было 219 релизов на гитхабе.

Лучше поздно

В принципе, все консистентно - это гугл! Он такой. Что то мега-крутое сочетается с лютой дичью местами в UX...

(ц) такое мы принимаем в дзене, так как изменить не в состоянии

#post
@deksden_notes
👍1
DeepSeek - 3.2


Новость в деталях обсказали уже все каналы и пара утюгов, я лишь добавлю: модель продолжает тренд на interleaved thinking режим как в минимаксе м2 и кими. Ну и свежих соннетах!

так что не даром они все предоставлют антропик-стиль апи!

interleaved thinking к слову, способствует более мощной агентности.


(ц) тренд, однака!

1️⃣Upd : контекст в 128к смотрится архаично! Но мощный ризонинг формально на уровне gemini 3 pro - заставляет задуматься, что получится когда они это все опробуют на R2.

Я так понимаю нам дают результаты экспериментов по отработке разных фишек в пайплайне - но на старой базе.

Ждемс v4 + r2. Уже испытываю повышенные ожидания!)



#post
@deksden_notes
🔥4
Модель не справляется


▶️ Наблюдение, но подтверждается многократно. Отлаживаю оркестратор, гонял его на разных моделях и часто - второго эшелона. Glm, qwen и m2, например. Хорошие модели!

И в 100% случаев когда воркфлоу падал по причине ошибок агента, когда он что=то не то делал - оказывалось проблема в контексте. Противоречивые инструкции, взаимоисключающие инструкции, недостаточно ясные формулировки, отсутствие информации, битые отсылки и тп.

То есть - все дело в промпте и контексте! Модели с понятными заданиями с нормальным контекстом справляются уверенно

👉 Поэтому: если у вас модель лажает в таком месте, где по вашим ощущениям должна справится - то скорее всего есть причина, и ее реально найти.

👌 как искать? Глазами, если вы старовер. Ну и агентами: у меня "старшие" модели проводили расследование и указывали на противоречия или иные проблемные моменты контекста! Модели такое видят. Конечно, контекст им надо предъявить.


#post
@deksden_notes
👍74
Bun -> Anthropic

О-как!

Неожиданно, но code act и code tool теперь будет на js/ts, видимо))

ждем трансформацию mcp на запуск через код
🔥7
Claude Select


Нашел небольшую утилиту:

🔗 https://github.com/aeitroc/claude-select

A unified launcher for Claude Code that lets you interactively choose which LLM backend to use.

Выбираем какая модель будет "под капотом" у СС

Возможно, кому то будет удобно такое!

#link
@deksden_notes
🔥4👍2
Kimi Slides - free до 07.дек


Собственно, сабж! Бесплано, до 07 декабря - продлили


Пока это самые симпатичные слайды выходят из протестированных мною (Google NotebookLM, Z.ai Slides)
14
Ноябрь, итоги


Кодекс: 15B токенов, $3k по апи ценам

Глм c китами: 1.7b, $62


Средненький месяц

А сами смотрите свою статистику?

#post
@deksden_notes
🔥5😭4
Opus - народу!


Свежий релиз СС (2.0.58), и:

... Add Opus 4.5 access for Pro users

OMFG, this is big! 💣 🔥 💥


Здравствуй подписка за 20 баксов )))

Что конкуренция животворящая исполняет!

#post
@deksden_notes
🔥10👍3
Репутация Антропиков

Шутят тут

Надеюсь всем сообществом их заклюют на более лояльные условия. Клод всегда был хорош, хоть и дороговат и с пресловутыми лимитами
😁5
Kiro powers


Тут Киро разродилось штукой - называется POWERS

Читать вот тут:

🔗 https://kiro.dev/blog/introducing-powers/

Концептуально - это тот же скилл.

😀 Из забавного: они прямо используют индексный файл, потому что POWER.md соджержит "a map of steering files for specific workflows. ". Ура! Мажоры учатся в контекстный инжиниринг.

До аннотированных ссылок они пока не дошли, зато индексный файл уже изобрели!

В бандл с POWER могут входить: инструкции, конфигурации MCP серверов, steering файлы / хуки.

Бандлить скрипты они пока не додумались. Бандлить пакеты скриптов - тоже (типа, как package.json зависимости указывает). Ну - еще не вечер.

Upd: замечу, что скорее всего тема скиллов уйдет в принятие отраслью, раз кодекс и киро уже проявили явный интерес к таким механизмам! Так что у нас второй механизм общепринятый появляется
- сначала была память на файлах с folder-scope (CLAUDE.md и .cursorrules стиля, AGENTS.md как часть движа)
- щас скиллы


(ц) такое нас радует

#post
@deksden_notes
👍2🔥1
CodexBar доработан - теперь и СС


Маленькая macOS утилитка доработалась. Показывает использование лимитов, версию - как кодекс, так и СС.

https://t.me/deksden_notes/220

Скачиваем тут: https://github.com/steipete/CodexBar

(ц) такое мы пользуем

#post
@deksden_notes
👍1
Playwrighter MCP


Интересная штука!

🔗 https://github.com/remorses/playwriter/


Работает через расширение (нет запуска отдельного браузера)
Работает через 1 тул, но предоставляет полный api playwright. Как вы догадались - запуск кода конечно

В общем, это WIP, но интересно

(ц) За таким мы следим

#post
@deksden_notes
🔥4👍1
Codex Skills


Замержили в 0.65 экспериментальную фичу:

https://github.com/openai/codex/pull/7412

для внутреннего тестирования, релиза пока не было

Но сам факт!
👍3
Opencode web


А все видели такой режим? В консольке:

opencode web


Забавно ))