Media is too big
VIEW IN TELEGRAM
часть 6
смысл использования простых/менее умных моделей для написания кода
смысл использования простых/менее умных моделей для написания кода
👍1
nlsh позволяет вам общаться с терминалом на естественном языке.
Она учитывает контекст, и вы по-прежнему можете выполнять обычные команды оболочки.
Выглядит интересно. В принципе я так уже делаю, но внутри VSCode
https://github.com/junaid-mahmood/nlsh
This media is not supported in your browser
VIEW IN TELEGRAM
Текущие тактики эффективного использования AI-агентов для программирования в общих чертах таковы:
1. Дать агентам инструменты для самопроверки
• MCP-серверы (agent-browser, playwright)
• тесты
• tsc, линтеры
2. Научить агентов создавать собственные инструменты проверки
Агенты могут писать собственные скрипты, навыки, субагенты, фреймворки для оценки, планы и критерии успеха.
Если вы не знаете, что именно спросить, спросите у агента:
«Какие инструменты тебе понадобятся, чтобы понять, что ты хорошо справился с задачей?»
3. Направлять агента обратно на самого себя
• Превращайте сложные рабочие процессы в переиспользуемые навыки/субагенты — после завершения длинной сессии спросите агента, можно ли что-то вынести в переиспользуемые навыки.
• Просите агента переписать ваши промпты более ясно.
• Используйте несколько моделей для взаимной оценки (особенно полезно для оценки планов и ревью кода перед PR).
• Если навык работает неидеально, завершите задачу вручную, а затем передайте диалог обратно, чтобы он улучшил инструкции для навыка.
• Если агент просит вас сделать что-то вручную, спросите себя: как научить агента отвечать на этот вопрос самостоятельно?
• Вы можете научить агента самосовершенствованию, создавая мета-навыки, которые обновляют другие навыки/правила на основе того, что сработало (или не сработало) при закрытии PR.
4. Давать лучший контекст
• Прикладывайте скриншоты
• Ссылайтесь на документацию и блог-посты
• Говорите агенту читать исходный код OSS-зависимостей
• Ссылайтесь на примеры высококачественных результатов, которым он должен подражать
И если вы не знаете, как сделать что-либо из вышеперечисленного — спросите агента.
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Компания NVIDIA выпустила PersonaPlex-7B
Полнодуплексная голосовая модель, которая одновременно слушает и говорит.
Никаких пауз. Никакой очередности. Настоящий разговор.
Полностью открытый исходный код. Бесплатно.
Голосовой ИИ вышел на новый уровень.
https://huggingface.co/nvidia/personaplex-7b-v1
This media is not supported in your browser
VIEW IN TELEGRAM
POV: Разработчик, который до сих пор не использует агентов, потому что они *совершают ошибки*
🤣2
https://x.com/karpathy/status/2015883857489522876?s=46&t=onZ5ScNF_xp9cjWbEjraHQ
Топ инфлюенсер в "ИИ+разработка" высказался снова. Завтра будут посты везде))
Перевод гпт:
Топ инфлюенсер в "ИИ+разработка" высказался снова. Завтра будут посты везде))
Перевод гпт:
Несколько случайных заметок от Claude после довольно интенсивного кодинга в последние несколько недель.
Рабочий процесс кодинга. С учётом последнего скачка в возможностях LLM для программирования, как и многие другие, я очень быстро перешёл от примерно 80% ручного кодинга с автодополнением и 20% агентов в ноябре к 80% агентного кодинга и 20% правок и доработок в декабре. То есть я действительно в основном программирую на английском, немного стесняясь, говоря LLM, какой код писать… словами. Это немного бьёт по самолюбию, но возможность оперировать программным обеспечением большими «код-действиями» слишком полезна в чистом виде, особенно когда ты к этому адаптируешься, настраиваешь, учишься использовать и понимаешь, что он может и чего не может. Это, безусловно, самое большое изменение моего базового рабочего процесса кодинга примерно за два десятилетия программирования, и оно произошло за несколько недель. Я ожидаю, что нечто подобное сейчас происходит у хорошо бы двузначного процента инженеров, в то время как осведомлённость об этом в общей популяции ощущается где-то в пределах низких единиц процентов.
IDE / агентные «рои» / ошибаемость. И хайп «IDE больше не нужен», и хайп «роев агентов», на мой взгляд, сейчас чрезмерны. Модели всё ещё определённо ошибаются, и если у вас есть код, который вам действительно важен, я бы наблюдал за ними как ястреб, в хорошем большом IDE на стороне. Характер ошибок сильно изменился — это уже не простые синтаксические промахи, а тонкие концептуальные ошибки, какие мог бы сделать слегка небрежный, торопливый джуниор. Самая частая категория — модели делают неверные предположения за вас и просто бегут дальше, не проверяя их. Они также не управляют своей растерянностью: не просят уточнений, не выносят на поверхность несогласованности, не представляют компромиссы, не возражают, когда должны, и всё ещё немного слишком угодливы. В режиме планирования становится лучше, но явно нужен какой-то лёгкий встроенный план-режим. Они также очень любят переусложнять код и API, раздувают абстракции, не чистят за собой мёртвый код и т. п. Они могут реализовать неэффективную, раздутую, хрупкую конструкцию на 1000 строк, и вам приходится говорить: «ммм, а нельзя ли просто сделать вот так?» — и они отвечают: «конечно!» и сразу ужимают всё до 100 строк. Они всё ещё иногда меняют или удаляют комментарии и код, которые им не нравятся или которые они недостаточно понимают, как побочные эффекты, даже если это ортогонально текущей задаче. Всё это происходит несмотря на несколько простых попыток исправить это через инструкции в CLAUDE.md. Несмотря на все эти проблемы, это всё равно огромный чистый выигрыш, и очень трудно представить возвращение к полностью ручному кодингу. TL;DR: у каждого формируется свой рабочий поток; мой текущий — это несколько небольших сессий CC слева в окнах/вкладках Ghostty и IDE справа для просмотра кода и ручных правок.
Упорство. Невероятно интересно наблюдать, как агент неотступно работает над задачей. Он никогда не устаёт, никогда не впадает в уныние, он просто продолжает идти и пробовать там, где человек давно бы сдался и отложил до лучших времён. Это момент «почувствовать AGI», когда смотришь, как он долго мучается с чем-то и всё-таки выходит победителем через 30 минут. Ты понимаешь, что выносливость — это ключевое узкое место в работе, и что с LLM в руках она была радикально увеличена.
Ускорения. Неочевидно, как измерять «ускорение» от помощи LLM. Безусловно, я ощущаю, что в сумме делаю то, что и так собирался, намного быстрее, но главный эффект в том, что я делаю гораздо больше, чем собирался, потому что 1) я могу закодить кучу вещей, которые раньше просто не стоило писать, и 2) я могу браться за код, с которым раньше не мог работать из-за нехватки знаний или навыков. Так что это, конечно, ускорение, но, возможно, в гораздо большей степени это расширение.
Рычаг.
X (formerly Twitter)
Andrej Karpathy (@karpathy) on X
A few random notes from claude coding quite a bit last few weeks.
Coding workflow. Given the latest lift in LLM coding capability, like many others I rapidly went from about 80% manual+autocomplete coding and 20% agents in November to 80% agent coding and…
Coding workflow. Given the latest lift in LLM coding capability, like many others I rapidly went from about 80% manual+autocomplete coding and 20% agents in November to 80% agent coding and…
👍1
LLM исключительно хорошо умеют зацикливаться, пока не достигнут конкретных целей, и именно здесь находится большая часть «почувствовать AGI» магии. Не говорите ему, что делать, дайте критерии успеха и смотрите, как оно работает. Заставьте его сначала написать тесты, а потом пройти их. Поместите его в цикл с браузерным MCP. Сначала напишите наивный алгоритм, который почти наверняка корректен, а затем попросите его оптимизировать его, сохранив корректность. Смените подход с императивного на декларативный, чтобы агенты дольше крутились в цикле и вы получили больше рычага.
Удовольствие. Я не ожидал, что с агентами программирование станет более увлекательным, потому что большая часть рутинного «заполнения пробелов» исчезает, а остаётся творческая часть. Я также чувствую себя гораздо реже заблокированным или застрявшим (что совсем не весело) и испытываю намного больше смелости, потому что почти всегда есть способ работать с ним рука об руку и продвинуться вперёд. Я видел и противоположное мнение: LLM-кодинг разделит инженеров на тех, кому прежде всего нравилось писать код, и тех, кому прежде всего нравилось строить продукты.
Атрофия. Я уже заметил, что постепенно начинаю терять способность писать код вручную. Генерация (написание кода) и дискриминация (чтение кода) — это разные способности мозга. Вообще из-за всех этих мелких, в основном синтаксических деталей программирования вы можете вполне нормально ревьюить код, даже если вам уже трудно его писать.
Slopacolypse. Я готовлюсь к тому, что 2026 станет годом слопокалипсиса по всему GitHub, Substack, arXiv, X/Instagram и вообще по всем цифровым медиа. Мы также увидим гораздо больше AI-хайп-продуктивити-театра (возможно ли это вообще?), наряду с реальными, настоящими улучшениями.
Вопросы. Несколько вопросов, которые меня занимают:
— Что произойдёт с «10X-инженером» — с соотношением продуктивности между средним и максимальным инженером? Вполне возможно, что оно вырастет очень сильно.
— С LLM в руках будут ли универсалы всё чаще превосходить специалистов? LLM намного лучше справляются с заполнением пробелов (микро), чем с большой стратегией (макро).
— На что будет похоже LLM-кодинг в будущем? Это как играть в StarCraft? В Factorio? Как играть музыку?
— Насколько большая часть общества ограничена узкими местами цифровой интеллектуальной работы?
TL;DR. К чему мы пришли? Агентные возможности LLM (особенно Claude и Codex) пересекли какой-то порог согласованности примерно в декабре 2025 года и вызвали фазовый сдвиг в программной инженерии и близких областях. Интеллектуальная часть внезапно ощущается заметно опережающей всё остальное — интеграции (инструменты, знания), необходимость новых организационных рабочих процессов, диффузию в целом. 2026 год будет высокоэнергетичным, пока индустрия переваривает новую способность.
https://t.me/data_secrets/8664
Помимо этого вчера кто-то выявил, что в сети сотни активных clawdbot с открытым полным доступом к компьютеру.
Это те устройства, на которых был настроен удаленный доступ без необходимости авторизации.
Помимо этого вчера кто-то выявил, что в сети сотни активных clawdbot с открытым полным доступом к компьютеру.
Это те устройства, на которых был настроен удаленный доступ без необходимости авторизации.
Telegram
Data Secrets
Мем: Anthropic попросили ClawdBot переименоваться – якобы из-за каких-то проблем с товарным знаком. Теперь ClawdBot – это MoltBot (с англ. molt – линька).
Anthropic, ну не завидуйте вы так 😐
Anthropic, ну не завидуйте вы так 😐
avocoder.works
Вы до сих пор не установили себе Clawdbot (Moltbot)? Почему?)
Видел люди часто спрашивают: а чем он отличается от решения {х} или что в нем такого особенного?
Ничего особенного в нем нет. Его преимущество а том, что его легко настроить и он "просто работает".
Ничего особенного в нем нет. Его преимущество а том, что его легко настроить и он "просто работает".