DEKSDEN notes
947 subscribers
155 photos
2 videos
1 file
269 links
Канал с моими заметками на разные темы
Vibe Coding -> AI SWE, AI Coding Tools, Agents: Claude Code, Codex, news, links
Чат (!!!): https://t.me/+B1fB3sZbaVthMDhi
Download Telegram
⚪️ TUI


Не все TUI одинаково полезны!

просто посмотрите - один и тот де код как работает с UI на базе ink (на котором CC, к слову работает), и как рабоатет UI на базе pi с нормальным дифференциальным рендеренгом

Код как вы можете догадаться примерно одинаковый, это разные ui прикручены

#post
@deksden_notes
🔥7🤯2
⚪️ Claude code desktop Cowork


Тут случилось презентация переименование представленного с opus 4.5 варианта Claude code desktop (который жил как режим в десктопном приложении) в Cowork - типа, универсальный агент.

Теперь вопросов о том, почему у него меньше функций чем у CLI вроде как нету - продук то другой! Удобненько.

Только яблочникам.


(ц) (мем - такое мы хаваем - у нас нету выбора!)
😁5
⚪️ Skills шагают по планете!


Вот и в антиграве появились

🔗 https://antigravity.google/docs/skills
🔗 https://antigravity.google/changelog

Ну а чего? Хорошая же штука.

И как ей помогло стандартизация и оформление как независимый стандарт! Другим товарищам на заметку, да - гугл? Нет желания выделить стандарты типа a2a? ucp?

В общем, пользуем скиллы! Вы пользуете?

🟢 Я вот начал потихоньку переводить все с MCP на обернутые в скиллы cli утилиты. По-моему отличная технология. И progressive disclosure, и code act можно сделать (пущать утилиты не напрямую, а через скрипты, которые делают постобработку и первичную фильтрацию данных, - бережем контекст, ускоряем работу).

Пользуете такое?

(ц) А вот скиллы мы пользуем, да!


#post
@deksden_notes
🔥7
⚪️ Расширенный План-мод в OpenCode


Его наконец то доработали. Правда за фича-флагом, зато принимается обратная связь, писать сюда:

🔗 https://x.com/thdxr/status/2011204789607284974?s=46

В этом треде есть демо видос небольшой!

Хорошее дело, да. Опенкод заслужил свой хайп. Высказывайте пожелания к планмоду. Мне вот кажется тут с контекстом что то бы сделать, и запуски исследований по теме бы сделать! Чтобы агенту не только уточняющие вопросы задавать, но и дособирать контекст. Я напишу эти соображения


1️⃣ Upd: переформулировал. Простой планмод там давно был, с самого начала, наверное - но он был лишь работой агента в режиме Read-only. Теперь добавили некие действия при план-моде.

#post
@deksden_notes
⚪️ Антропики спасают контекст от MCP в СС

Включили seartTool в СС. Эта штука позволяет делать lazy loading подключенных MCP серверов и экономить контекст.

Подробнее тут:

🔗 https://x.com/trq212/status/2011523109871108570?s=20

🔗 https://platform.claude.com/docs/en/agents-and-tools/tool-use/tool-search-tool


В комментах упоминал экспериментальных флаг - ENABLE_EXPERIMENTAL_MCP_CLI, неужели антропики планируют таки обернуть MCP в CLI ? Типа, как MCPorter делает? Любопытно

@deksden_notes
🔥6
⚪️ Ударники капиталистического вайбкодинга


Небезизвестный австрийский Петя тут статистикой поделился коммитов.

▶️ Для сравнения - у меня всего около 550 коммитов в месяц. Правда, за январь уже 400+.

Я конечно понимаю, что коммит-коммиту рознь. Но все равно - это другой порядок!

А вы говорите - зачем тебе оркестратор. Правда, я пока не представляю с какой скоростью отлетают лимиты с 7k коммитов))

@deksden_notes
5🤯4👍2😨1
⚪️ Богатые тоже плачут У вайбкодеров свои сложности


Еще один чел с оркестратором (Gas Town) рассказывает, что кончилась третья $200 подписка Клода в текущем месяце, упершись в недельный лимит.

🔗 https://x.com/Steve_Yegge/status/2011681192895266909?s=20

Вот такие нынче сложности! Лимиты на максимальных тарифах - маленькие. Кстати - это Клод. Мне кажется у Pro тарифов клозедов все немного гуманнее.

@deksden_notes
⚪️ Наш ответ Чемберлену!


OpenCode в ответ на "отлучение" от подписок Claude Pro/Max решило, что "не очень то и хотелось" и "у нас будут свои подписки! Гораздо лучше ваших" и сделало OpenCode Black, и, что особенно забавно - ровно с клодовскими ценами (20/100/200) и коэффициентами использования (base, x5, x20).

🔗 https://opencode.ai/black


🤷‍♂️ У меня один вопрос: почему у Black 100 нарисовано 4 квадратика, а использование x5? А у Black 200 нарисовано 25 квадратиков, хотя использование - x20? Бардак. (ц) "Вы чем там вообще занимаетесь?!"


▶️ А если серьезно - интересно будет почитать отзывы сравнения лимитов. Правда, в подписке то не только клод, но и Gpt, Gemini, ...


@deksden_notes
👍6
⚪️ Vercel digest про AI SWE


Пора уже обозначить вклад Vercel в AI SWE и агентный кодинг. Не знаю - я вот пользуюсь некоторым. Может и вам сгодится!

Из относительно свежего выделил бы:

▶️ add-skill: утилита, помогающая установить скилл сразу где надо - CC, Codex, openCode, Cursor. В PR есть патчи для Roo, Kilo, Goose, Amp, Antigravity

🔗 https://github.com/vercel-labs/add-skill

Пример:
# GitHub shorthand
npx add-skill vercel-labs/agent-skills


▶️ agent-skills: коллекция навыков от Vercel:
• react-best-practices: оптимизировать React/next.js приложения
• web-design-guidelines : многочисленные правила про фронт
• vercel-deploy-claimable : деплой на vercel

ставим через add-skill

🔗 https://github.com/vercel-labs/agent-skills

Блог: https://vercel.com/blog/introducing-react-best-practices


▶️ agent-browser: интересный подход к браузерной автоматизации. Это быстрый cli на rust к playwright, никакого mcp.

🔗 https://github.com/vercel-labs/agent-browser


(ц) ынжой

1️⃣ Upd: тут верцел изобрел pi

https://vercel.com/blog/we-removed-80-percent-of-our-agents-tools


@deksden_notes
👍65
⚪️ Документация


‼️ Опрос: Кто как нынче ведет документацию?

заморачиваетесь с разделением уровней?

Придерживаетесь методологии Code is Documentstion? Или Spec first? Или Living Documentation c пирамидкой знаний?

Кто то делает разделение смыслов между кодом, докстрингами/jsDoc и документацией?

Вообще - интересна тема документирования? Может, накидат постов по теоретическим подходам и в чем тут цинус вопроса?


——

Почему спрашиваю: я тут ревизию промптов меморибанка решил составить, - вот, думаю надо подрихтовать методологию, поапгрейдить, для включения в оркестратор.

А то вроде как появляется возможность это все соблюдать несложными техническими способами - так надо бы все по красоте пилить. А красота то - она какая нынче?
👍10👎1🔥1
⚪️ Codex Experimental Steering


Я есть не знать какк ээто бююдет по-рюсски!..

В общем, Кодекс тут себе стиринг сообщений пользователя во время работы агента включил.

Была концептуальная битва у фанатов Сс и Кодекса. Кодекс всегда стекал сообщения, и они отправлялись агенту только когда тот завершал работу, выводил отчет и ждал ввода от пользователя - вот в этот момент и прилетало застеканное сообщение, и кодекс приступал к работе!

У СС при отправке сообщения оно улетало "в агента" прямо в процессе работы - в очередной агентный шаг (когда отработают тулы и агент шагает дальше). В итоге можно было подруливать агентом прямо в процессе, без остановки.

Теперь ровно так же можно делать с кодексом! Что удобно. А стекать сообщения (старое поведение) можно Табом!

Включается так: /experimental, дальше ищем Steer conversation и жмакаем Enter. Вуаля! Вы в теме

Да, и раньше можно было через Esc остановить агента и "датьновые вводные" - но это потерять текущую операцию, и время. Экономим секунды!

@deksden_notes
👍62🔥1
Forwarded from Alexandrov pro .Net
DSpyNet
https://github.com/al322se/DSpyNet

Недавно задумался а какие паттерны есть в работе с нейронными сетями. Поискал, они есть, интересно ))

Один из "паттернов" оказался завернут в конретную библиотеку на питоне https://dspy.ai/ - а именно полуавтоматическое создание промтов. Когда ты не сам выбираешь лучший промт, а с помощью разных стратегий (они ниже) автоматом выбираешь/генерируешь лучший.

Я люблю .net... И я сделал порт этой библиотеки с питона на .net https://github.com/al322se/DSpyNet

Паттерны которые там есть

Predict - чуть более удобная работа с вопросом и ответом нейросети через аттрибуты


Chain of Thought
До: Predict: Вопрос -> Ответ (Часто галлюцинации).
После: ChainOfThought: Вопрос -> Рассуждение (Логика) -> Ответ (Высокая точность).


COPRO (Оптимизатор инструкций)
Это автоматический промпт-инжиниринг.
Проблема: Вы написали инструкцию: Переведи текст Она работает плохо. Вы меняете на Переведи текст как профессионал. Чуть лучше. Вы тратите часы, перебирая слова.
Решение (DSpyNet): Вы даете задачу COPRO.
1. Он просит мощную модель (например, GPT-4) предложить 10 вариантов инструкции лучше вашей.
2. Он тестирует каждый вариант на ваших данных.
3. Он выбирает тот текст инструкции, который дал максимальный балл метрики.


MIPRO (Байесовская оптимизация всего)
Проблема: У вас есть 10 хороших примеров и 5 вариантов инструкций. Какая комбинация даст лучший результат? Инструкция А + Примеры 1, 2, 3? Или Инструкция Б + Примеры 8, 9, 10? Перебирать всё вручную нереально.
Решение (DSpyNet): Использует математику (Байесовскую оптимизацию).
1. Он генерирует множество вариантов инструкций.
2. Он генерирует множество наборов примеров.
3. Он запускает умный поиск, пробуя разные комбинации и обучаясь на результатах
6🔥1
⚪️ Codex - Really Fast

А было бы неплохо!

Чтобы 5.2 не ползала, а порхала! ))
💯42
⚪️ О верификации - коротко


Неоднократно говорил что верифицировать агентов надо обязательно. Кажется что кодекс отрабатывает полностью, глубоко и систематично. Все так - но вот вам пример

Недоделано 7 моментов в плане из 8 шагов, мини-протокол, без наворотов

Рекомендую верифицировать всегда! Клод вообще был склонен процентов 20 работы не сделать

Тут кодекс работал не оч долго, часа 1.5! Но остались огрехи.

@deksden_notes
👍7🔥4
⚪️ Оверинжиниринг

В чате напомнили о явной особенности моделей gpt 5 серии - они склонны усложнять.

Я борюсь с этим так: в стиль кодирования, а также в принципы проектирования всегда закладываю:
• не усложнять, без оверинжиниринга, но с сохранением требуемой функциональности
• решай проьлемы самым простым способом
• используй и пере используй имеющиеся сущности и не создавай новых без особой на то необходимости
• доверяй фреймворкам, не делай ненужных слоев оберток
• не вводи слоев абстракции без необходимости



Ну и прочее всякое в этом духе!

Как вы боретесь с заумью моделей? Как там опус проектирует? Как побеждаете?

@deksden_notes
👍83
⚪️ SKILLS.sh - Платформа от Vercel


Видимо Vercel прониклась скиллами! Они не только выпустили свои скиллы (писал об этом), но еще и организовали себе крутое имя пакета в npm (skills) и вот теперь сделали сайт с каталогом скиллов!

крута!

(ц) Ну это прикольно

1️⃣ Upd: Скиллов уже 4500

——

2️⃣ Upd: Понравилась шутка из интернета:

"Заставить разработчиков наконец то писать документацию, назвав ее SKILL было умным ходом!"


@deksden_notes
👍71❤‍🔥1😁1
⚪️ Agent Skills и стандартизация


Как вы уже знаете у нас сложилась немного комичная ситуация со скиллами - каждый агент ставит их себе в свой собственный путь. Стандарт не потрудился этот аспект стандартизировать.

Зато попыталась Vercel со своим skills.sh и npx skills

Теперь - как на картинке, SSoT будет в ~/.agent/skills/. В остальных папках - симлинк. Я так кастомные слеш команды раньше ставил из своего меморибанка, к слову - в кодекс и СС чтобы работало. И CLAUDE.md был симлинком к AGENTS.md.

Забавно))

(ц) (мем про 15й стандарт)

@deksden_notes
👍11💯1
⚪️ Делаем видео программно через скилл


Классное демо работы скиллов от Remotion. Впечатляет!

Видео:

https://x.com/Remotion/status/2013626968386765291?s=20

А вот как его делали в клод коде:

https://x.com/Remotion/status/2013626968386765291?s=20

А вот скрипт сессии из Клод кода:

https://gist.github.com/JonnyBurger/5b801182176f1b76447901fbeb5a84ac

(ц) Такое меня впечатляет

@deksden_notes
🔥7👍2
⚪️ Agentation


Вот полезная штука для фронтэнда - утиль, которая помогает объяснить агенту чего менять в страничке и где именно. Мы добавляем заметки прямо к элементам страницы!

https://x.com/benjitaylor/status/2014109590972145908?s=20

Да, похоже на https://www.react-grab.com/

🔗 Вот оффсайт сабжа: https://agentation.dev/

На оффсайте сразу и демо.

🔗 Open source: https://github.com/benjitaylor/agentation

Понравилось? Не забываем ставить ⭐️ в их гитхабе.

Кмк, 🔥


1️⃣ Upd: конечно появился скилл!

$ npx add-skill benjitaylor/agentation

потом появляется команда /agentation в Claude Code.

Делает: Automatically detects your framework, installs the package, creates a provider, and wires it into your layout. Super simple.

@deksden_notes
2🔥6👍5
⚪️ Agent Readiness для проекта


Тут Дроиды (factory.ai) придумали весьма интересную штуку - отчет о готовности репозитория к агентной разработке. Называется readiness report. Измеряет по 8 направлениям, по каждому выставляет скоринг, хранит статистику. Можно смотреть динамику, можно разные репо сраOpenHandsУ критериев есть пять грейдов (уровней готовности) от L1 до L5.

Новость с презентацией и кое какой информацией тут:

🔗 https://factory.ai/news/agent-readiness

👉 НО! Самое прикольное. OpenHands сделали open source скилл, который делает такой же рапорт ДЛЯ ЛЮБОГО агента! Плюс в самом скилле методика очевидно расписана.

🔗 https://github.com/OpenHands/skills/blob/main/skills/readiness-report/SKILL.md


🟢 Такое вот начинание, очень прикольное. Стата не особо сложная, я местами не совсем согласен c каким то деталями в уровнях - но абсолютно все направления верные. Как их отработать - тут варианты, кмк допустимы, но это уж как всегда! Стандартизация подходов и разработка - это несовместимые вещи. Езда на своих велосипедах - народная забава, как и NIH синдромы))

Очень важно что может появиться некий измеряемый индикатор, который что то вменяемое показывает.

(ц) вот таким мы интересуемся и ценим!

@deksden_notes
👍7🔥5
⚪️ CC: stash prompt


Я сейчас активно пользую кодекс, модель мне больше нравится - но нельзя не отметить что по фичам СС уделывает кодекс с запасом! В том числе по мелким QoL фишкам

Одна из таких фич - возможность "спрятать промпт в шкафчик" (prompt _S_tash, вызывается кнопкой ctrl+S). Смысл такой: вы пишите длинный промпт пока агент доделывает работу! И вдруг вам захотелось что то сказать ему, буквально пару ласковых.. Вы жмете Ctrl+S - и ваш промпт отложен "в шкафчик", строка ввода пустая! Как только ваши "пара ласковых" улетает в агента, промпт возвращается. Ctrl+S может вернуть его сразу.

В общем - мелочь, но приятная же!

@deksden_notes
8👍5🔥5