DEKSDEN notes
2.1K subscribers
246 photos
4 videos
1 file
384 links
Канал с моими заметками на разные темы
Vibe Coding -> AI SWE, AI Coding Tools, Agents: Claude Code, Codex, news, links
Чат (!!!): https://t.me/+B1fB3sZbaVthMDhi
Download Telegram
⚪️ Browser Use CLI 2.0


Новика в категории наших ai-инструментов #tools, в разделе browser automation.


Browser Use выпустил новый инструмент:
* это просто CLI
* скилл имеется
* подключается к запущенному свежему Chrome (direct CDP)
* быстрее чем раньше работает

🔗 Почитать доку: https://docs.browser-use.com/open-source/browser-use-cli

🔗 Код на Гитхбе: https://github.com/browser-use/browser-use

🔗 Анонс в Х: https://x.com/browser_use/status/2035081807209931153


Посмотрите - там мноо фишек и помимо browser use. Доступ к облачному апи bowser use, туннели через cloudflare к локальным серверам, всякие облачные профили, сессии...


▶️ Интересная штука, достойная внимания

@deksden_notes
👍223🔥3
⚪️ Vercel Emulate


Vercel выпустил полезную штуку для тестирования проектов, которые интегрированы с внешними сервисами - Emulate. Она эмулирует внешние сервисы для вашего приложения и можно тестировать интеграции без лишних сложностей - детерминированно, предсказуемо, стабильно.

Сейчас поддерживают GitHub, Google и, неожиданно, но еще и Vercel )) Stripe есть уже в PR.

🔗 Вот оно: https://github.com/vercel-labs/emulate

скилл:

npx skills add vercel-labs/emulate --skill google

В комменте пример с better_auth и локальной эмуляцией гугла

@deksden_notes
🔥11👍1
⚪️ Anthropic @ War


Вы твм клода то когда понукаете - вы аккуратнее! Он если запомнит - вам может прилететь. Причем в самом прямом смысле этого слова, что то весьма заметное типа томагавка.

Palantir то на клоде

🔗 Сабж: https://x.com/shiri_shh/status/2035762040879644774?s=20

Глюки и "срезание уголов" моделью немного другие последствия получило, да? Невесело - как быстро мы пришли сюда


(ц) Это грустная сторона новых технологий

@deksde_notes
😨92🔥1🤔1🤬1🖕1
⚪️ Grok CLI v1 (unofficial)


Вышел новый CLI агент, - это было бы малопримечательное событие, благо их у меня несколько десятков "в блокнотике" записано, но у этого фичапак примечателен удаленным управлением через Telegram "из коробки" - что примечательно! Почему такого нету в каждом первом CLI не понимаю, это же реально удобно.

А так - фичапак для v1 весьма полный, на самом деле:
• базируется на opencode
• поиск от грока - X + web; да, по твиттеру тоже
• подключение к тележке и - сразу почти openClaw
• кастомные субагенты, фоновые агенты
• скоро обещают добавить автономное тестирование (Autonomous testing - чтобы это ни значило) и Scheduling (видимо, крон, как в codex app);
• подписок конечно нету (ну и как работать то?)

🔗 Сабж тут: https://github.com/superagent-ai/grok-cli


npm i -g grok-dev

👉 Из всего пака нравится интеграция с Телеграммом. Хочу такой плагин для кодекса - ну или для pi / opencode / cc. Написал автору


(ц) такого мы ждем повсеместно!

——

Upd 1️⃣▶️ Grok CLI unofficial v1.1: omfg

вот чел за неделю выпускает то, что хрен дождешься от больших вендоров

• интегрировал imagine и оно умеет делать картинки и видео
• sandbox поддерживает
• cron (у него schedule)
• voice chat в телеге

🔗 Анонс с картинками : https://x.com/pelaseyed/status/2037212221525172560


@deksden_notes
7👍4🔥3
⚪️ Kapso : WhatsApp интеграции


просто оставлю это здесь для тех - кому актуально. В РФ уже не особо актуально, хотя я посмотрю их апи / подходы.

🔗 https://kapso.ai/

Бесплатный план есть. Апи меты официальное.

——

Upd 1️⃣ : Аналог этого же - но для imessage

Sendblue

https://docs.sendblue.com/

https://x.com/nikita_builds/status/2037220813888176563?s=20

и оформили твит идентично ))

@deksden_notes
🔥5👌2
⚪️ MiniMax Token Plan

Интересная и весьма новаторская подписка от минимаксов - они предлагают мультимедийную подписку. Генерируем код, картинки, речь, музыку, видео.

Любопытно!

Таблички в комментах

@deksden_notes
👍7🔥2🤔1
Forwarded from Max Derkachev
Привет, хочу показать свой комбайн для разработки - Memento https://github.com/mderk/memento
В комплекте - всё "как обычно" - процесс plan-implement-test-review (c протоколами - как в лучших домах :), меморибанк (генерируется для проекта автоматически), управлением бэклогом и другие инструменты. Своя фишка - подход к оркестрации процессов.
Начиналось всё с вылизывания промптов для процессов, как обычно бывает в подобных местах. Оно неплохо работает в новых моделях, но от системных проблем никуда не деться. Агент - дрянной исполнитель. Забывает или перепутывает шаги, теряет счётчик в циклах, путает условия. А "фиксы" промптов часто открывают перед агентом новые непредвиденные возможности :) C ростом контекста всё становится хуже. Детерминированные задачи вроде линтера и тестов он пробует выполнять "творчески", каждый раз чуть по-разному, ошибки сжигают токены впустую.
Естественное желание - вынести механику из агента, оставив ему только творческую работу. Сделал оркестратор, который вызывает LLM через Agent SDK или subprocess для творческих шагов. Работает хорошо в неинтерактивной среде, но если нужны интерактивные инструменты, встроенные механизмы безопасности агента (работаю в-основном в Claude Code) - не подходит. Пробовал разные хаки, но процесс получался сложным и хрупким.
В итоге пришёл к идее развернуть контроль: не агент управляет процессом, а MCP-сервер с полноценным stateful workflow engine c привычным control flow. Движок запускает описанный заранее workflow, который кормит агента небольшими четко очерченными задачами, где ему сложно запутаться. Просто получает очередное небольшое задание и его выполняет, а вся логика оркестрации от него скрыта.
В итоге - разделение, которого хотелось. Управляется это всё детерминированно снаружи. Shell-шаги (линтер, тесты, детект стека и т.п.) выполняются внутри сервера - агент их даже не видит, контекст не засоряется, токены не тратятся. Творческая работа - написание кода, анализ, ревью - остаётся за LLM, причём в полноценном окружении со всеми инструментами. Работа чекпоинтится на диск - если процесс упал, продолжаем с того же места. А сам сервер заперт в OS-level песочнице, чтобы не снести чего лишнего.
Гоняю я его как плагин к клоду, но в принципе не вижу ничего сложного запускать это в другом окружении. Подробнее про оркестрацию - https://github.com/mderk/memento/tree/main/memento-workflow
Фидбек приветствуется.
@max_derkachev

#opensource
🔥20👍144❤‍🔥3
⚪️ Sora app всё


Интересный движ

Высвобождаем побольше места на ГПУ?

(мем про "мы же рак лечить хотели, да?!..")

@deksden_notes
👏42🤔1
⚪️ Alibaba Coding Plan Lite: всё


Халява быстро закончилась! Алибаба отменила новые регистрации Coding Plan Lite за $10 (было $3 или $5!!!) - поэтому подключится на него уже нельзя. Отменили с 20.03.2026.


А план то - все топовые китайские модели (на момент выпуска плана). Сейчас уже появился минимакс 2.7 и глм-5-турбо. Интересно - добавят? Или уж не до такого?))


Все у кого он был подключен, могут продолжать использование, просто надо не забывать продляться.

Ну - спасибо и на этом! Продлил.


(ц) халява не вечна, но мы в теме))

@deksden_notes
👍93🖕1
⚪️ LiteParse от LllamaIndex, это бесплатно


У LLamaIndex сейчас основной бизнес - это LlamaParse для преобразования документов разного типа в читаемый агентами формат. Довольно навороченная штука, но платная - хотя и бесплатный тир (и не маленький) тоже имеет.

У нее теперь LiteParse - бесплатный opensource вариант, но без агентов/моделей. Заявлено что круче Markitdown / PyPDF / PyMuPDF. Не использует VLM.

🔗 Почитать блог: https://www.llamaindex.ai/blog/liteparse-local-document-parsing-for-ai-agents
🔗 Репка : https://github.com/run-llama/liteparse
🔗 Анонс : https://x.com/jerryjliu0/status/2034665976428724267


(ц) Ползеная штука, да.

——

▶️ Все же знают аналоги? Помимо упомянутых в посте еще отметил бы: https://github.com/opendataloader-project/opendataloader-pdf

——
▶️ Fast Office document extraction for LLMs and agents. Converts DOCX, XLSX, CSV, PPTX, and PDF into clean markdown, structured JSON IR, and Docling output : https://github.com/ThomAub/officemd

——
▶️ MarkIt. Convert anything to markdown. PDF, DOCX, PPTX, XLSX, HTML, EPUB, Jupyter, RSS, images, audio, URLs, and more. Pluggable converters, built-in LLM providers for image description and audio transcription. Works as a CLI and as a library : https://github.com/Michaelliv/markit

@deksden_notes
7🔥5❤‍🔥2🙏1
⚪️ OfficeDocs - статья от MiniMax про их skills


Неплохая статья встретилась:

🔗 статья: https://x.com/MiniMax_AI/status/2036888404890378258

🔗 репо со скиллами: https://github.com/MiniMax-AI/skills


Open-Sourcing Our Office Skills: Crafting Deliverable Documents

Там минимасы описывают какие подходы использовали чтобы создать скиллы для работы с различными офисными форматами - word, excel, pdf, presentations. Немножко даже про эвалы написали как все смотреть. В общем, полезно и практично.


В комментах пара полезных ссылок тоже проскакивала:

🔗 Обратный конвертр в md: Fast Office document extraction for LLMs and agents. Converts DOCX, XLSX, CSV, PPTX, and PDF into clean markdown, structured JSON IR, and Docling output : https://github.com/ThomAub/officemd

@deksden_notes
👍107
⚪️ Git для Агентов


Собственно - сабж. Такое должен быть гитхаб сделать, конечно, но вот так. До конца не понимаю зачем, но чувствую, что может быть полезная штука: Code.Storage

🔗 https://code.storage/

Кстати, сам сайт по дизайну весьма примечательный


Кто как думает? Как и для чего этим пользоваться? В воркфлоу?


@deksden_notes
🤔7
⚪️ OpenCode: бесплатные MiMo


Говорят, топ за свои деньги - а сейчас так вовсе бесплатно.

И еще неделю будет бесплатно.

Налетаем тестить MiMo-V2-Pro + MiMo-V2-Omni - еще одну недельку!

@deksden_notes
👍11
⚪️ Лимиты Клода


Если вам казалось что у Клода мелкие 5-ти часовые лимиты, - то это вам казалось! Теперь в пиковые часы (американский день) эти лимиты будут еще меньше)) Смотрите на скрине

(мем с кланяющимся пингвином)

Ну хоть неельные лимиты еще не трогают.

Схожая ситуация в стане клозедов будет 2 апреля, видимо (как завершаться х2 лимиты). Оч хочется чтобы они что то придумали после этого дедлайна!


(ц) время охренительных историй

@deksden_notes
🦄9🔥2
⚪️ Codex Plugins


Ну вот теперь в кодексе тоже есть бандлы расширений - плагины.

В СС это тоже плагины, в Gemini - это extensions. Все они пакуют скиллы, mcp, в кодексе еще и apps integrations.


🔗 Дока: https://developers.openai.com/codex/plugins
🔗 Анонс: https://x.com/OpenAIDevs/status/2037296316104282119

▶️ Если честно - не совсем понимаю тягу вендоров городить эти бандлы. Особой ценности пользователю завернуть вместе скилл и mcp я не вижу! Всегда внутрь скилла можно поставить скрипт, который все установит чего надо по зависимостям.

Видимо, мечта о собственном апп сторе не оставляет вендоров.

Но тут - несовместимые форматы этих бандлов, у каждого вендора свой. Зачем пользователю все затачивать под одного агента? Усугублять вендорлок? Скиллы потому и стали популярны, что открытый стандарт, и значит - более универсальная штука.

Ну ок, сделали и сделали - может, кто то найдет их очень нужными.

Что думаете?

@deksden_notes
👍7
⚪️ PGLite pg-micro


Любопытный проект. Представьте SQLite, но postgreSQL.

А если в облаке? Durable pgObjects. Vercel Functions DataFunctions. Ну и все в таком духе

🔗 Почитайте анонс: https://x.com/glcst/status/2037254698898432278?s=20

🔗 Репо тоже любопытен по технике: https://github.com/glommer/pgmicro

Это как Turso, но с диалектом постгре.

(ц) любопытная штука! Будем посматривать

@deksden_notes
🔥6👍3
⚪️ Codex Limits Reset


Не знаю что повлияло, но у кодекса опять амнистия! Лимиты сбросили

Последнюю неделю перед отменой х2 лимитов - гуляем на все. Прикольно. Особенно в сравнении с закручиванием гайки у 5ти часового лимита клода.

(ц) всем - вайбкодить!

@deksden_noews
🔥21👍6❤‍🔥1
⚪️ Турбо зайка

GLM goes brrr!

Зайконавты включают glm-5-turbo на ВСЕХ тарифах Для Про подписчиков это было ожидаемо и анонсировано (ждали до конца месяца что включат, и вот - включают). Но пользователи Лайт тарифов оказались облаготельствованы неожиданно, и приятно.

Кроме того, до конца апреля акция на льготные коэффициенты к использованию - в обычное время Турбо модель идет по х1 коэффичиенту вместо повышенных. Но есть пиковые часы, где квота тратится сильнее.

▶️ Подробнее об условиях акции на картинке в комментах.

🔥

▶️ но меня все не отпускает вопрос - куда делась -Code модель, которая немножко мелькала в анонсах? Это ее в Турбо переименовали? Или мы ждем от зайки нового релиза?

(ц) турбо вайбкодим

@deksden_notes
🔥73👍21
⚪️ Dev Browser


Очередная штука в browser automation, аналог playwright.

🔗 https://github.com/SawyerHood/dev-browser

Это скилл, который запускает управление браузером в JS сендбоксах, statefull. Может подключиться к запущенному хрому или новый сделать.

Ну - для коллекции норм.


@deksden_notes
👍84
⚪️ Augument Code : Spec Driven Development


Пройти мимо таких словосочетаний тем кто в теме - невозможно. SDD это одно, а Augument Code весьма уважаемая контора в AI SWE полянке.

Встретился небольшой видос от них про тематику:

🔗https://x.com/augmentcode/status/2037293314165375320

Мне он показался весьма полезным, поэтому я перелил его на ютуб:

🔗 https://www.youtube.com/watch?v=_ZqRCUfmTRQ

И обработал notebookLM в пресказ (в комментах) и слайды (тоже в комментах). Мне показалось стоящим изучения.

▶️ Респект Аугументам! Полезное


(ц) такое мы случаем внимательно


👉 В комментах много всякого: транскрипт, слайды презентации, - не говоря уже о самих комментах ⬇️


@deksden_notes
👍14❤‍🔥21
⚪️ Projects от Stripe


Кто делал full AI-SDLC, тот знает что написание спецификаций и кода - это часть картины, причем уже довольно сильно проработанная агентами.

А вот развертывание инфраструктуры под проект - это уже штука сложная и хлопотная.

Так вот: тут нам завезли сервис, который помогает разворачивать проекты. Сделал его Stripe, немаленькая контора. Интересно

🔗 https://projects.dev/

🔗 Блог тут: https://stripe.dev/blog/production-ready-dev-stack-from-terminal

🔗 Анонс: https://x.com/stripe/status/2037197998074335292


👉 пока preview, доступ надо просить - но концепция прикольная



@deksden_notes
👍7