avocoder.works
106 subscribers
208 photos
93 videos
250 links
journaling my findings @avocoder
Download Telegram
В чём преимущество скилов? Качество вывода LLM напрямую зависит от промта.
Skill это типа "prompt engineering". То есть заготовки для промтов.

Ты можешь сказать: improve ASO in this project
Или можешь заюзать "skill" — длинный заготовленный промт, в котором хорошо описано как добиться нужного результата
👍1
Может не совсем очевидно для всех, но для подобных задач тоже можно использовать кодинг агентов.

- Установи X
- Скачай Y
- Склонируй репо Z и настрой его
Если пропустили — сейчас набирает хайп ещё одна альтернатива OpenClaw: Hermes Agent от Nous Research.

Это open-source персональный AI-агент, который можно запустить на своей машине или сервере. Он поддерживает Telegram, Discord, Slack, WhatsApp, Signal и CLI, не привязан к одному провайдеру моделей и умеет сохранять контекст между сессиями, постепенно накапливая skills и рабочие паттерны.

🔗 https://github.com/NousResearch/hermes-agent
🔗 https://hermes-agent.nousresearch.com/

#agents #tools
Rate limits работают по 5-часовому окну и сбрасываются после этого.

У Anthropic есть API endpoint, который использует Claude Code API key: GET /api/oauth/usage

Я сделал skill для aeon (github.com/aaronjmars/aeon), который следит за тем, когда моё 5-часовое окно подходит к концу.

Если до конца окна остаётся меньше 30 минут, он запускает все мои запланированные skills — фиксы PR, ресёрч и прочее — пока я не доберу лимит до 100%.

🔗 https://github.com/aaronjmars/aeon

Для мажоров))

#skills
Fizzy — современный kanban-инструмент для задач, идей, багов и небольших проектов.

Для тех, кто хочет попробовать более свежий формат трекера задач вместо привычных перегруженных решений. Из фич: auto close для старых карточек, webhooks, публичные доски, удобные уведомления и визуальные детали для быстрого обзора состояния задач.

🔗 https://fizzy.do

#tools #productivity
👍1
@monoteistBlog меня немного смотивировал попробовать локальную LLM.

Я примерно год назад пробовал LLM Studio с какой-то моделью. Но с тех пор многое изменилось. Любопытно какая будет скорость выдачи и что из этого вообще можно вытянуть.
LiteLLM БЫЛ СКОМПРОМЕТИРОВАН, НЕ ОБНОВЛЯЙТЕСЬ. Мы только что обнаружили, что релиз LiteLLM 1.82.8 в PyPI был скомпрометирован. Он содержит litellm_init.pth с base64-кодированными инструкциями: отправлять все найденные credentials на удалённый сервер и самораспространяться. Подробности по ссылкам ниже.

🔗 https://futuresearch.ai/blog/litellm-pypi-supply-chain-attack/
🔗 https://x.com/i/status/2036414330267193815

#security
This media is not supported in your browser
VIEW IN TELEGRAM
Так это примерно работает. 256к контекста довольно медленно на RTX4060 8GB / 32GB RAM

#local_llm
В Claude Code появился auto mode.

Вместо того чтобы подтверждать каждую запись в файл и каждую bash-команду вручную — или полностью отключать permissions — auto mode позволяет Claude самому принимать решения о разрешениях от вашего имени.

Перед каждым tool call действие проверяется классификатором на потенциальную деструктивность. Безопасные действия выполняются автоматически, рискованные — блокируются, и Claude ищет другой способ решить задачу.

💬 avoc0der: я всё равно постоянно просто использую --dangerously-skip-permissions

#claudecode #tools
Вижу нередко как Droid (factory.ai) хвалят. Кто-нибудь пользовался?

У них субсидированные тарифы. Не знаю насколько выгодно, но по триалу дали 10млн токенов. Будем смотреть)
This media is not supported in your browser
VIEW IN TELEGRAM
Эрик Шмидт говорит, что преимущество в 10x теперь уже не в исполнении. Оно в том, чтобы правильно определить, что считается успехом.

Программист пишет спецификацию и evaluation function, запускает всё в 7 вечера — а утром смотрит, что было придумано за ночь.

Преимущество теперь у того, кто умеет точно задавать проблему.

Всё остальное будет автоматизировано.

#opinion #agents
👍1
men in their 40s used to have cool midlife crisis but now they just have agentic workflows


😂
avocoder.works
Solo — workspace для CLI-агентов и dev stack в одном окне. Можно запускать рядом Claude Code, Codex, Gemini CLI, dev-серверы, воркеры, базы и обычные терминалы — с общим обзором состояния процессов. Есть автоперезапуск упавших сервисов и доступ агентов к…
Так. Я примерно неделю работаю с Solo.

Удобно:
- Наличие "команд". Все свои регулярные скрипты прописываешь в командах и запускаешь их время от времени.
- Встроенный MCP чтобы сказать агенту: посмотри что там в такой-то команде происходит и поправь.
- Поддержка агентов (Claude|Open Code, Codex)

Неудобно:
- Когда сессия в агенте растет, производительность проседает. Автор пишет, что он уже работает над этой проблемой и будет исправление в следующей версии.
- Нет полноэкранного режима. Идеальным тут решением будет возможность автоскрытия sidebar. Я думаю, так он и сделает в итоге.

Пока более удобных способов так же быстро настраиваться на работу над проектом не знаю, чтобы это еще и так же хорошо работало)

tmux-ide тоже примерно схожий имеет смысл, плюс в tmux можно "зумить" окна. Я может напишу об этом позже, если интересно)
👍2
avocoder.works
Вижу нередко как Droid (factory.ai) хвалят. Кто-нибудь пользовался? У них субсидированные тарифы. Не знаю насколько выгодно, но по триалу дали 10млн токенов. Будем смотреть)
Израсходовал все 10млн токенов за пару приседов))

В общем, не знаю, чего-то кардинально иного в этом инструменте не увидел. А что там в каких-то кейсах где-то что-то бывает лучше и тд это всё настолько неважная деталь, которая от температуры в комнате даже может меняться. В целом он прикольный, некоторые UX моменты прям понравились.

Отменил триал и не стану покупать подписку.
Google выложили paper по TurboQuant вчера утром. Через 36 часов он уже работает в llama.cpp на Apple Silicon — и даже быстрее базового варианта, который заменяет.

По цифрам:

• сжатие KV cache в 4.6 раза
• 102% от скорости q8_0
• качество почти без потерь: PPL в пределах 1.3% от baseline

Всё это стало open source буквально за полтора дня после публикации paper.

Paper до рабочего результата за 36 часов. Какое всё-таки время.

Это просто идеальный тайминг для моих экспериментов с local LLMs.

🔗 https://github.com/TheTom/turboquant_plus

#local_llm
👍1
Честный value proposition такой: если ваш bottleneck — это память (не влезает длинный контекст, упираетесь в eviction cache), то сжатие в 4.6 раза при ~1% потери качества — вполне разумный компромисс.

Если же bottleneck — это скорость, и по памяти вы и так укладываетесь, то это уже лишний overhead, который вам не нужен.

#local_llm