avocoder.works

Текущие тактики эффективного использования AI-агентов для программирования в общих чертах таковы:
1. Дать агентам инструменты для самопроверки

• MCP-серверы (agent-browser, playwright)
• тесты
• tsc, линтеры
2. Научить агентов создавать собственные инструменты проверки

Агенты могут писать собственные скрипты, навыки, субагенты, фреймворки для оценки, планы и критерии успеха.

Если вы не знаете, что именно спросить, спросите у агента:
«Какие инструменты тебе понадобятся, чтобы понять, что ты хорошо справился с задачей?»
3. Направлять агента обратно на самого себя

• Превращайте сложные рабочие процессы в переиспользуемые навыки/субагенты — после завершения длинной сессии спросите агента, можно ли что-то вынести в переиспользуемые навыки.
• Просите агента переписать ваши промпты более ясно.
• Используйте несколько моделей для взаимной оценки (особенно полезно для оценки планов и ревью кода перед PR).
• Если навык работает неидеально, завершите задачу вручную, а затем передайте диалог обратно, чтобы он улучшил инструкции для навыка.
• Если агент просит вас сделать что-то вручную, спросите себя: как научить агента отвечать на этот вопрос самостоятельно?
• Вы можете научить агента самосовершенствованию, создавая мета-навыки, которые обновляют другие навыки/правила на основе того, что сработало (или не сработало) при закрытии PR.
4. Давать лучший контекст

• Прикладывайте скриншоты
• Ссылайтесь на документацию и блог-посты
• Говорите агенту читать исходный код OSS-зависимостей
• Ссылайтесь на примеры высококачественных результатов, которым он должен подражать

И если вы не знаете, как сделать что-либо из вышеперечисленного — спросите агента.

👍4

75 viewsاوكودر, 22:18

avocoder.works

0:42

This media is not supported in your browser

VIEW IN TELEGRAM

Компания NVIDIA выпустила PersonaPlex-7B

Полнодуплексная голосовая модель, которая одновременно слушает и говорит.
Никаких пауз. Никакой очередности. Настоящий разговор.

Полностью открытый исходный код. Бесплатно.
Голосовой ИИ вышел на новый уровень.

https://huggingface.co/nvidia/personaplex-7b-v1

91 viewsاوكودر, 18:10

avocoder.works

Недельный лимит в OpenCode Black закончился быстро.

64 viewsاوكودر, edited 19:36

avocoder.works

Ну как у вас дела? Как ваши лимиты?))

64 viewsاوكودر, 11:07

avocoder.works

Радикальные меры борьбы с ИИ))

63 viewsاوكودر, 11:26

avocoder.works

This media is not supported in your browser

VIEW IN TELEGRAM

POV: Разработчик, который до сих пор не использует агентов, потому что они *совершают ошибки*

🤣2

59 viewsاوكودر, 16:15

avocoder.works

Отменил подписку на ElevenLabs. У меня немало кредитов тут. Если кому интересно попробовать, могу сделать вам ключ API. Пишите)

61 viewsاوكودر, 17:06

avocoder.works

У меня макбук всегда на док станции в режиме ожидания (использую amphetamine). Поэтому мой бот всегда работает и я могу за чашкой чая на кухне задавать ему вопросы о проектах и даже запускать кодинг агентов типа opencode/claudecode и тд

👍2

65 viewsاوكودر, edited 10:21

avocoder.works

https://t.me/data_secrets/8660

👀

Data Secrets

Вышла Qwen3-Max-Thinking, и модель заслуживает внимания

Метрики говорят сами за себя:

– HLE 30.2 (примерно уровень Claude-Opus 4.5), с test-time-scaling техниками еще больше
– SWE Verified 75.3 (чуть хуже опуса, примерно Gemini 3 Pro)
– IMO 83.9 (бьет…

68 viewsاوكودر, 16:10

avocoder.works

https://x.com/karpathy/status/2015883857489522876?s=46&t=onZ5ScNF_xp9cjWbEjraHQ

Топ инфлюенсер в "ИИ+разработка" высказался снова. Завтра будут посты везде))

Перевод гпт:

Несколько случайных заметок от Claude после довольно интенсивного кодинга в последние несколько недель.

Рабочий процесс кодинга. С учётом последнего скачка в возможностях LLM для программирования, как и многие другие, я очень быстро перешёл от примерно 80% ручного кодинга с автодополнением и 20% агентов в ноябре к 80% агентного кодинга и 20% правок и доработок в декабре. То есть я действительно в основном программирую на английском, немного стесняясь, говоря LLM, какой код писать… словами. Это немного бьёт по самолюбию, но возможность оперировать программным обеспечением большими «код-действиями» слишком полезна в чистом виде, особенно когда ты к этому адаптируешься, настраиваешь, учишься использовать и понимаешь, что он может и чего не может. Это, безусловно, самое большое изменение моего базового рабочего процесса кодинга примерно за два десятилетия программирования, и оно произошло за несколько недель. Я ожидаю, что нечто подобное сейчас происходит у хорошо бы двузначного процента инженеров, в то время как осведомлённость об этом в общей популяции ощущается где-то в пределах низких единиц процентов.

IDE / агентные «рои» / ошибаемость. И хайп «IDE больше не нужен», и хайп «роев агентов», на мой взгляд, сейчас чрезмерны. Модели всё ещё определённо ошибаются, и если у вас есть код, который вам действительно важен, я бы наблюдал за ними как ястреб, в хорошем большом IDE на стороне. Характер ошибок сильно изменился — это уже не простые синтаксические промахи, а тонкие концептуальные ошибки, какие мог бы сделать слегка небрежный, торопливый джуниор. Самая частая категория — модели делают неверные предположения за вас и просто бегут дальше, не проверяя их. Они также не управляют своей растерянностью: не просят уточнений, не выносят на поверхность несогласованности, не представляют компромиссы, не возражают, когда должны, и всё ещё немного слишком угодливы. В режиме планирования становится лучше, но явно нужен какой-то лёгкий встроенный план-режим. Они также очень любят переусложнять код и API, раздувают абстракции, не чистят за собой мёртвый код и т. п. Они могут реализовать неэффективную, раздутую, хрупкую конструкцию на 1000 строк, и вам приходится говорить: «ммм, а нельзя ли просто сделать вот так?» — и они отвечают: «конечно!» и сразу ужимают всё до 100 строк. Они всё ещё иногда меняют или удаляют комментарии и код, которые им не нравятся или которые они недостаточно понимают, как побочные эффекты, даже если это ортогонально текущей задаче. Всё это происходит несмотря на несколько простых попыток исправить это через инструкции в CLAUDE.md. Несмотря на все эти проблемы, это всё равно огромный чистый выигрыш, и очень трудно представить возвращение к полностью ручному кодингу. TL;DR: у каждого формируется свой рабочий поток; мой текущий — это несколько небольших сессий CC слева в окнах/вкладках Ghostty и IDE справа для просмотра кода и ручных правок.

Упорство. Невероятно интересно наблюдать, как агент неотступно работает над задачей. Он никогда не устаёт, никогда не впадает в уныние, он просто продолжает идти и пробовать там, где человек давно бы сдался и отложил до лучших времён. Это момент «почувствовать AGI», когда смотришь, как он долго мучается с чем-то и всё-таки выходит победителем через 30 минут. Ты понимаешь, что выносливость — это ключевое узкое место в работе, и что с LLM в руках она была радикально увеличена.

Ускорения. Неочевидно, как измерять «ускорение» от помощи LLM. Безусловно, я ощущаю, что в сумме делаю то, что и так собирался, намного быстрее, но главный эффект в том, что я делаю гораздо больше, чем собирался, потому что 1) я могу закодить кучу вещей, которые раньше просто не стоило писать, и 2) я могу браться за код, с которым раньше не мог работать из-за нехватки знаний или навыков. Так что это, конечно, ускорение, но, возможно, в гораздо большей степени это расширение.

Рычаг.

X (formerly Twitter)

Andrej Karpathy (@karpathy) on X

A few random notes from claude coding quite a bit last few weeks.

Coding workflow. Given the latest lift in LLM coding capability, like many others I rapidly went from about 80% manual+autocomplete coding and 20% agents in November to 80% agent coding and…

👍1

341 viewsاوكودر, 21:11

avocoder.works

LLM исключительно хорошо умеют зацикливаться, пока не достигнут конкретных целей, и именно здесь находится большая часть «почувствовать AGI» магии. Не говорите ему, что делать, дайте критерии успеха и смотрите, как оно работает. Заставьте его сначала написать тесты, а потом пройти их. Поместите его в цикл с браузерным MCP. Сначала напишите наивный алгоритм, который почти наверняка корректен, а затем попросите его оптимизировать его, сохранив корректность. Смените подход с императивного на декларативный, чтобы агенты дольше крутились в цикле и вы получили больше рычага.

Удовольствие. Я не ожидал, что с агентами программирование станет более увлекательным, потому что большая часть рутинного «заполнения пробелов» исчезает, а остаётся творческая часть. Я также чувствую себя гораздо реже заблокированным или застрявшим (что совсем не весело) и испытываю намного больше смелости, потому что почти всегда есть способ работать с ним рука об руку и продвинуться вперёд. Я видел и противоположное мнение: LLM-кодинг разделит инженеров на тех, кому прежде всего нравилось писать код, и тех, кому прежде всего нравилось строить продукты.

Атрофия. Я уже заметил, что постепенно начинаю терять способность писать код вручную. Генерация (написание кода) и дискриминация (чтение кода) — это разные способности мозга. Вообще из-за всех этих мелких, в основном синтаксических деталей программирования вы можете вполне нормально ревьюить код, даже если вам уже трудно его писать.

Slopacolypse. Я готовлюсь к тому, что 2026 станет годом слопокалипсиса по всему GitHub, Substack, arXiv, X/Instagram и вообще по всем цифровым медиа. Мы также увидим гораздо больше AI-хайп-продуктивити-театра (возможно ли это вообще?), наряду с реальными, настоящими улучшениями.

Вопросы. Несколько вопросов, которые меня занимают:
— Что произойдёт с «10X-инженером» — с соотношением продуктивности между средним и максимальным инженером? Вполне возможно, что оно вырастет очень сильно.
— С LLM в руках будут ли универсалы всё чаще превосходить специалистов? LLM намного лучше справляются с заполнением пробелов (микро), чем с большой стратегией (макро).
— На что будет похоже LLM-кодинг в будущем? Это как играть в StarCraft? В Factorio? Как играть музыку?
— Насколько большая часть общества ограничена узкими местами цифровой интеллектуальной работы?

TL;DR. К чему мы пришли? Агентные возможности LLM (особенно Claude и Codex) пересекли какой-то порог согласованности примерно в декабре 2025 года и вызвали фазовый сдвиг в программной инженерии и близких областях. Интеллектуальная часть внезапно ощущается заметно опережающей всё остальное — интеграции (инструменты, знания), необходимость новых организационных рабочих процессов, диффузию в целом. 2026 год будет высокоэнергетичным, пока индустрия переваривает новую способность.

61 viewsاوكودر, 21:11

avocoder.works

https://t.me/data_secrets/8664

Помимо этого вчера кто-то выявил, что в сети сотни активных clawdbot с открытым полным доступом к компьютеру.

Это те устройства, на которых был настроен удаленный доступ без необходимости авторизации.

Data Secrets

Мем: Anthropic попросили ClawdBot переименоваться – якобы из-за каких-то проблем с товарным знаком. Теперь ClawdBot – это MoltBot (с англ. molt – линька).

Anthropic, ну не завидуйте вы так 😐

61 viewsاوكودر, 09:09

avocoder.works

Вы до сих пор не установили себе Clawdbot (Moltbot)? Почему?)

61 viewsاوكودر, 17:57

avocoder.works

Вы до сих пор не установили себе Clawdbot (Moltbot)? Почему?)

Видел люди часто спрашивают: а чем он отличается от решения {х} или что в нем такого особенного?

Ничего особенного в нем нет. Его преимущество а том, что его легко настроить и он "просто работает".

62 viewsاوكودر, 17:59

About

Blog

Apps

Platform