avocoder.works
106 subscribers
211 photos
95 videos
255 links
journaling my findings @avocoder
Download Telegram
nlsh позволяет вам общаться с терминалом на естественном языке.

Она учитывает контекст, и вы по-прежнему можете выполнять обычные команды оболочки.


Выглядит интересно. В принципе я так уже делаю, но внутри VSCode

https://github.com/junaid-mahmood/nlsh
This media is not supported in your browser
VIEW IN TELEGRAM
))
Текущие тактики эффективного использования AI-агентов для программирования в общих чертах таковы:
1. Дать агентам инструменты для самопроверки

• MCP-серверы (agent-browser, playwright)
• тесты
• tsc, линтеры
2. Научить агентов создавать собственные инструменты проверки

Агенты могут писать собственные скрипты, навыки, субагенты, фреймворки для оценки, планы и критерии успеха.

Если вы не знаете, что именно спросить, спросите у агента:
«Какие инструменты тебе понадобятся, чтобы понять, что ты хорошо справился с задачей?»
3. Направлять агента обратно на самого себя

• Превращайте сложные рабочие процессы в переиспользуемые навыки/субагенты — после завершения длинной сессии спросите агента, можно ли что-то вынести в переиспользуемые навыки.
• Просите агента переписать ваши промпты более ясно.
• Используйте несколько моделей для взаимной оценки (особенно полезно для оценки планов и ревью кода перед PR).
• Если навык работает неидеально, завершите задачу вручную, а затем передайте диалог обратно, чтобы он улучшил инструкции для навыка.
• Если агент просит вас сделать что-то вручную, спросите себя: как научить агента отвечать на этот вопрос самостоятельно?
• Вы можете научить агента самосовершенствованию, создавая мета-навыки, которые обновляют другие навыки/правила на основе того, что сработало (или не сработало) при закрытии PR.
4. Давать лучший контекст

• Прикладывайте скриншоты
• Ссылайтесь на документацию и блог-посты
• Говорите агенту читать исходный код OSS-зависимостей
• Ссылайтесь на примеры высококачественных результатов, которым он должен подражать

И если вы не знаете, как сделать что-либо из вышеперечисленного — спросите агента.
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Компания NVIDIA выпустила PersonaPlex-7B

Полнодуплексная голосовая модель, которая одновременно слушает и говорит.
Никаких пауз. Никакой очередности. Настоящий разговор.

Полностью открытый исходный код. Бесплатно.
Голосовой ИИ вышел на новый уровень.


https://huggingface.co/nvidia/personaplex-7b-v1
Недельный лимит в OpenCode Black закончился быстро.
Ну как у вас дела? Как ваши лимиты?))
Радикальные меры борьбы с ИИ))
This media is not supported in your browser
VIEW IN TELEGRAM
POV: Разработчик, который до сих пор не использует агентов, потому что они *совершают ошибки*
🤣2
Отменил подписку на ElevenLabs. У меня немало кредитов тут. Если кому интересно попробовать, могу сделать вам ключ API. Пишите)
У меня макбук всегда на док станции в режиме ожидания (использую amphetamine). Поэтому мой бот всегда работает и я могу за чашкой чая на кухне задавать ему вопросы о проектах и даже запускать кодинг агентов типа opencode/claudecode и тд
👍2
https://x.com/karpathy/status/2015883857489522876?s=46&t=onZ5ScNF_xp9cjWbEjraHQ

Топ инфлюенсер в "ИИ+разработка" высказался снова. Завтра будут посты везде))

Перевод гпт:
Несколько случайных заметок от Claude после довольно интенсивного кодинга в последние несколько недель.

Рабочий процесс кодинга. С учётом последнего скачка в возможностях LLM для программирования, как и многие другие, я очень быстро перешёл от примерно 80% ручного кодинга с автодополнением и 20% агентов в ноябре к 80% агентного кодинга и 20% правок и доработок в декабре. То есть я действительно в основном программирую на английском, немного стесняясь, говоря LLM, какой код писать… словами. Это немного бьёт по самолюбию, но возможность оперировать программным обеспечением большими «код-действиями» слишком полезна в чистом виде, особенно когда ты к этому адаптируешься, настраиваешь, учишься использовать и понимаешь, что он может и чего не может. Это, безусловно, самое большое изменение моего базового рабочего процесса кодинга примерно за два десятилетия программирования, и оно произошло за несколько недель. Я ожидаю, что нечто подобное сейчас происходит у хорошо бы двузначного процента инженеров, в то время как осведомлённость об этом в общей популяции ощущается где-то в пределах низких единиц процентов.

IDE / агентные «рои» / ошибаемость. И хайп «IDE больше не нужен», и хайп «роев агентов», на мой взгляд, сейчас чрезмерны. Модели всё ещё определённо ошибаются, и если у вас есть код, который вам действительно важен, я бы наблюдал за ними как ястреб, в хорошем большом IDE на стороне. Характер ошибок сильно изменился — это уже не простые синтаксические промахи, а тонкие концептуальные ошибки, какие мог бы сделать слегка небрежный, торопливый джуниор. Самая частая категория — модели делают неверные предположения за вас и просто бегут дальше, не проверяя их. Они также не управляют своей растерянностью: не просят уточнений, не выносят на поверхность несогласованности, не представляют компромиссы, не возражают, когда должны, и всё ещё немного слишком угодливы. В режиме планирования становится лучше, но явно нужен какой-то лёгкий встроенный план-режим. Они также очень любят переусложнять код и API, раздувают абстракции, не чистят за собой мёртвый код и т. п. Они могут реализовать неэффективную, раздутую, хрупкую конструкцию на 1000 строк, и вам приходится говорить: «ммм, а нельзя ли просто сделать вот так?» — и они отвечают: «конечно!» и сразу ужимают всё до 100 строк. Они всё ещё иногда меняют или удаляют комментарии и код, которые им не нравятся или которые они недостаточно понимают, как побочные эффекты, даже если это ортогонально текущей задаче. Всё это происходит несмотря на несколько простых попыток исправить это через инструкции в CLAUDE.md. Несмотря на все эти проблемы, это всё равно огромный чистый выигрыш, и очень трудно представить возвращение к полностью ручному кодингу. TL;DR: у каждого формируется свой рабочий поток; мой текущий — это несколько небольших сессий CC слева в окнах/вкладках Ghostty и IDE справа для просмотра кода и ручных правок.

Упорство. Невероятно интересно наблюдать, как агент неотступно работает над задачей. Он никогда не устаёт, никогда не впадает в уныние, он просто продолжает идти и пробовать там, где человек давно бы сдался и отложил до лучших времён. Это момент «почувствовать AGI», когда смотришь, как он долго мучается с чем-то и всё-таки выходит победителем через 30 минут. Ты понимаешь, что выносливость — это ключевое узкое место в работе, и что с LLM в руках она была радикально увеличена.

Ускорения. Неочевидно, как измерять «ускорение» от помощи LLM. Безусловно, я ощущаю, что в сумме делаю то, что и так собирался, намного быстрее, но главный эффект в том, что я делаю гораздо больше, чем собирался, потому что 1) я могу закодить кучу вещей, которые раньше просто не стоило писать, и 2) я могу браться за код, с которым раньше не мог работать из-за нехватки знаний или навыков. Так что это, конечно, ускорение, но, возможно, в гораздо большей степени это расширение.

Рычаг.
👍1
LLM исключительно хорошо умеют зацикливаться, пока не достигнут конкретных целей, и именно здесь находится большая часть «почувствовать AGI» магии. Не говорите ему, что делать, дайте критерии успеха и смотрите, как оно работает. Заставьте его сначала написать тесты, а потом пройти их. Поместите его в цикл с браузерным MCP. Сначала напишите наивный алгоритм, который почти наверняка корректен, а затем попросите его оптимизировать его, сохранив корректность. Смените подход с императивного на декларативный, чтобы агенты дольше крутились в цикле и вы получили больше рычага.

Удовольствие. Я не ожидал, что с агентами программирование станет более увлекательным, потому что большая часть рутинного «заполнения пробелов» исчезает, а остаётся творческая часть. Я также чувствую себя гораздо реже заблокированным или застрявшим (что совсем не весело) и испытываю намного больше смелости, потому что почти всегда есть способ работать с ним рука об руку и продвинуться вперёд. Я видел и противоположное мнение: LLM-кодинг разделит инженеров на тех, кому прежде всего нравилось писать код, и тех, кому прежде всего нравилось строить продукты.

Атрофия. Я уже заметил, что постепенно начинаю терять способность писать код вручную. Генерация (написание кода) и дискриминация (чтение кода) — это разные способности мозга. Вообще из-за всех этих мелких, в основном синтаксических деталей программирования вы можете вполне нормально ревьюить код, даже если вам уже трудно его писать.

Slopacolypse. Я готовлюсь к тому, что 2026 станет годом слопокалипсиса по всему GitHub, Substack, arXiv, X/Instagram и вообще по всем цифровым медиа. Мы также увидим гораздо больше AI-хайп-продуктивити-театра (возможно ли это вообще?), наряду с реальными, настоящими улучшениями.

Вопросы. Несколько вопросов, которые меня занимают:
— Что произойдёт с «10X-инженером» — с соотношением продуктивности между средним и максимальным инженером? Вполне возможно, что оно вырастет очень сильно.
— С LLM в руках будут ли универсалы всё чаще превосходить специалистов? LLM намного лучше справляются с заполнением пробелов (микро), чем с большой стратегией (макро).
— На что будет похоже LLM-кодинг в будущем? Это как играть в StarCraft? В Factorio? Как играть музыку?
— Насколько большая часть общества ограничена узкими местами цифровой интеллектуальной работы?

TL;DR. К чему мы пришли? Агентные возможности LLM (особенно Claude и Codex) пересекли какой-то порог согласованности примерно в декабре 2025 года и вызвали фазовый сдвиг в программной инженерии и близких областях. Интеллектуальная часть внезапно ощущается заметно опережающей всё остальное — интеграции (инструменты, знания), необходимость новых организационных рабочих процессов, диффузию в целом. 2026 год будет высокоэнергетичным, пока индустрия переваривает новую способность.
https://t.me/data_secrets/8664

Помимо этого вчера кто-то выявил, что в сети сотни активных clawdbot с открытым полным доступом к компьютеру.

Это те устройства, на которых был настроен удаленный доступ без необходимости авторизации.
Вы до сих пор не установили себе Clawdbot (Moltbot)? Почему?)
avocoder.works
Вы до сих пор не установили себе Clawdbot (Moltbot)? Почему?)
Видел люди часто спрашивают: а чем он отличается от решения {х} или что в нем такого особенного?

Ничего особенного в нем нет. Его преимущество а том, что его легко настроить и он "просто работает".
🦞 Новости: Clawdbot превращается в Moltbot!

«Лобстер» сбрасывает старую кожу! Согласно Forbes и MacStories, Clawdbot официально меняет название на Moltbot, чтобы избежать путаницы с товарным знаком Claude от Anthropic.

Федерико Витиччи (MacStories) назвал это «взглядом в будущее персональных AI-ассистентов». Тем временем проект официально преодолел отметку в 10 000+ звезд на GitHub! 🥑🚀

#AI #Clawdbot #Moltbot #OpenSource #НовостиAI
То, что он может себя же обновить и перезапустить даже немного странно ощущается, но это работает))

- Обновил git origin на новый адрес
- Стянул изменения на main
- Обновил билд
- Перезапустил