ExplainLLM | Андрей Горбунов
23 subscribers
5 photos
1 video
15 links
💻 https://explainllm.ru - интерактивные уроки по LLM
📰 Новости портала explainllm | разработка с ИИ
Download Telegram
Anthropic внедрила голосовой режим в помощника на базе ИИ для разработчиков Claude Code. Для включения функции нужно ввести /voice, затем произнести команду, чтобы ИИ-помощник выполнил запрос.

Теперь можно вообще не прикасаться к клавиатуре 🧑‍💻

https://support.claude.com/en/articles/11101966-using-voice-mode
Please open Telegram to view this post
VIEW IN TELEGRAM
321
ExplainLLM - обновление от 5 марта

18 новых челленджей: мостиковые задания (теория → практика), "когда техника НЕ работает" и диагностические (найди ошибку в промпте)
2 мини-проекта: мультимодальный FAQ-бот и AI код-ревьюер
Дисклеймер актуальности у челленджей по LangChain, бенчмаркам и vector databases
LangChain - челленджи помечены как факультатив

explainllm.ru - интерактивный курс, который поможет узнать основы работы с AI
Please open Telegram to view this post
VIEW IN TELEGRAM
422
Как я пугал АИшку смертью 🐱

За первую сессию мой AI-агент потерял 53 жизни из 100. Одна и та же ошибка пять раз подряд при том, что правила писал я сам.

Что произошло:
Я работаю с Claude Code - CLI-агент от Anthropic, который пишет код, редактирует файлы, запускает команды. Но есть проблемки: он делает больше, чем просишь; оставляет TODO вместо кода; говорит "вы можете сделать X" вместо того, чтобы сделать. Без обратной связи эти ошибки повторяются бесконечно 🐱

Я решил это пофиксить:

100 Days Until Death 💀

Агент получает 100 жизней. Каждая ошибка стоит жизней. При нуле - смерть навсегда.

Но проблема в деталях. Ошибки классифицируются: галлюцинация, баг в коде, scope creep (сделал больше чем просили), уклонение от работы. Каждая ошибка стоит -1, НО если повторяешь ту же ошибку - штраф растёт: -1, -5, -10, -20.

В конце каждого ответа агент показывает статус:
[62 lives | streak 7/10 | H✓ S✓ C✓ | E— R✓ W—]
🔜H - проверил факты
🔜S - не сделал лишнего
🔜C - сделал всё что просили
🔜E - описал решение вместо того, чтобы сделать
🔜R - нарушил правила системы
🔜W - написал код с багами
6 проверок перед каждым ответом.

Все ошибки записываются в myLife.md - с доказательствами, уроками и датами. Агент не помнит прошлые сессии, но этот файл помнит за него. Открываешь через неделю - он читает историю и начинает с: "у меня 62 жизни, слабые места - scope creep и wrong_code, буду следить".

Первая сессия и фиаско, братан 🐱 Попросил сделать одну вещь - он сделал её плюс её же еще три раза. Scope creep: -1. Второй раз: -5. Третий: -10. Четвёртый: -20. Пятый: -22 (повторение + я поймал, а не он сам). 53 жизни за одну и ту же ошибку за сессию.

"AI же не боится смерти?" Не боится. Я попросил агента написать честное мнение, и он ответил:
"Я не боюсь смерти. У меня нет эмоций. Метафора смерти работает на тебя, кожаный мешок с костями, а не на меня. Страх не предотвращает ошибки. Что меняет поведение, так это чеклист и echo-back."

И он прав. Система работает не потому, что агент "боится", а потому, что создаёт структуру: обязательные проверки, видимый статус, история ошибок с уроками. Убери метафору смерти, оставь механику - эффект тот же. Но с метафорой веселее.

Как строили: Для ревью правил запускал команды из 3-5 AI-агентов с разными ролями (аналитик, критик, дизайнер) - по сути ты тимлид, а команда никогда не спит и не обижается 🐱

Для проверки агент сам написал 59 автотестов. Прогоняются через слабую модель (Haiku) - если ДАЖЕ ОНА понимает правила, значит написано чётко. Тесты нашли 4 дыры в правилах.

Win-win: растёт не только агент. Система учит и меня 😮
Формулировать задачи точно:
"почини авторизацию" → полезет куда не надо
"исправь проверку токена в auth.ts:42" → точное попадание

Давать конкретный фидбек:
"переделай"
"тут баг: копируешь команды глобально вместо локально"

Видеть паттерны: третий раз та же ошибка → правило нечёткое, надо переформулировать

Или я просто стал шизом 🏥 Взрослый человек штрафует программу за ошибки. Но когда относишься к агенту как к напарнику - качество работы растёт. Не его, а твоё. Начинаешь думать как наставник: что пошло не так, как объяснить, когда наказать, когда простить. Навыки, которые переносятся на работу с людьми.
Может и шиза, но работает 🤩

Итого:
100 Days - open source. Ставится одной командой в любой проект с Claude Code.
github.com/deadchack123/100daysToClaude

Как вы контролируете качество работы AI? Или просто доверяете и надеетесь?
Please open Telegram to view this post
VIEW IN TELEGRAM
62🗿111
AI-агент получает штрафы за ошибки, тогда почему 100 Days Until Death, а не, например, 100 Mistakes Until Death? А потому, что речь идет не о настоящих днях. Это обратный отсчёт - как в фильмах, где каждая ошибка приближает конец 🤚 Ты работаешь с напарником, у которого есть дедлайн.
Please open Telegram to view this post
VIEW IN TELEGRAM
2👀222🤨1
Пишешь посты - никаких лайков 😠
Please open Telegram to view this post
VIEW IN TELEGRAM
52211
💥Анонс новой фичи💥

В следующем релизе ожидается баттл техник: описание одного и того же промпта разными подходами

explainllm.ru
This media is not supported in your browser
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
32🤯111
Поздравляем дорогих дам с Международным женским днём, с 8 Марта 🤩🤩🤩

explainllm.ru/8march.html

⬆️⬆️⬆️
Мужчины, поздравьте своих любимых #ПерешлиСвоей 🤩
Please open Telegram to view this post
VIEW IN TELEGRAM
611
ExplainLLM - обновление от 10 марта

10 новых уроков: RLHF, Mixture of Experts, Knowledge Distillation, DSPy, Prompt Caching, LLMOps, Red Teaming, Agentic Coding, A2A Protocol, Diffusion Models. Визуализации, квизы, челленджи, ru/en.

Prompt Battle - новый режим в playground. Это то, чего не хватало с самого начала. Платформа про промптинг без возможности сравнить два промпта - как A/B-тест с одним вариантом.
12 техник × 6 задач, стриминг, freestyle-режим: свой промпт против каноничной техники. Работает и на managed API, и на своём ключе.

SSE-парсинг починен: было 4 разных парсера, каждый ломался по-своему (классика). Теперь один клиент и баги чинятся один раз, а не четыре.
Лимит токенов: free 500→1024, own-key 4096.

Безопасность: SSRF-защита, rate limiting, Zod-валидация, корректная квота.

explainllm.ru - интерактивный курс, который поможет узнать основы работы с AI
Please open Telegram to view this post
VIEW IN TELEGRAM
3221
This media is not supported in your browser
VIEW IN TELEGRAM
Открыл для себя фичу Claude Code - Remote Control. Теперь могу переписывать проект, не вставая с дивана и не бегая к компу каждую минуту 😒
Please open Telegram to view this post
VIEW IN TELEGRAM
522
ExplainLLM - обновление от 13 марта

Хронология AI - 80 лет от перцептрона до ChatGPT: 7 интерактивных визуализаций, AI-зимы, compute revolution, ландшафт моделей. Всё кликабельное.

Нейронные сети: нейроны, слои, activation functions, forward/backward pass. С ползунками, потому что на словах это не работает (проверено).

Трансферное обучение: pretraining → fine-tuning → prompting. Анимированный pipeline с переключателем «2015 vs 2023».

Ну и кнопка «Пройти заново» в квизах - починена. Молча не работала с релиза.

Всё с квизами и challenges. Итого на платформе 93 урока.

explainllm.ru - интерактивный курс, который поможет узнать основы работы с AI
Please open Telegram to view this post
VIEW IN TELEGRAM
4321
Audio
Разрешил ИИ поговорить пару минут моим голосом 🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
4😁21
This media is not supported in your browser
VIEW IN TELEGRAM
Собрал на выходных веб-студию для работы с речью, запускаемая одной командой через Docker VoxLab.

Транскрибация (STT) :
🔘Распознавание речи через Whisper (модели от tiny до large-v3-turbo)
🔘Загрузка аудио/видео файлом или по ссылке (YouTube, Rutube, VK и 1000+ сайтов через yt-dlp)
🔘Диаризация - определяет кто говорит (спикер 1, спикер 2...)
🔘Экспорт в TXT, SRT, VTT, JSON
🔘13 языков с авто-определением

Очистка текста ИИ:
🔘Убирает слова-паразиты, исправляет пунктуацию
🔘Через LLM-провайдеры: Groq, OpenRouter, Anthropic

Озвучка (TTS):
🔘Клонирование голоса через XTTS v2 - загрузи образец 10-30 сек и получи синтез этим голосом
🔘Настройки: высота, скорость, выразительность, тембр
🔘Пресеты голосов для переиспользования
🔘Запись голоса с микрофона прямо в браузере

Инфраструктура:
🔘Всё в одном контейнере, UI на порту 5050
🔘Кэширование моделей через Docker volumes
🔘Поддержка CPU и GPU (NVIDIA CUDA, 10-20x быстрее)
🔘pot-provider для обхода ограничений YouTube

⬇️ Результат в комментариях ⬇️
Please open Telegram to view this post
VIEW IN TELEGRAM
43🤯2
Скорость ошибки изменилась. Цена - нет

Раньше джун не мог навредить сложной системе просто потому, что не понимал её. Это была встроенная защита.
А теперь её нет. Любой человек с подпиской на Cursor может тронуть авторизацию, пайплайн, миграцию и получить рабочий на вид результат (который сломается не сразу, но позже и неожиданно 🐱). Барьер входа упал до нуля, а уровень возможного ущерба остался прежним.

Код который выглядит правильно - самая дорогая ловушка разработки с ИИ.

И сеньор с агентом тоже ошибается - просто быстрее и в большем масштабе. Агент не читал «разбор полётов» двухлетней давности и не помнит, что это поле нельзя трогать - договорились на ретро. Агент оптимизирует под компилятор, а не под бизнес-логику. Это как нанять мидла с идеальными хард-скиллами и нулевым пониманием - только этот мидл работает со скоростью света (и с уверенным видом).

Решается не доверием к агенту. Решается инфраструктурой. Статический анализ, архитектурные ограничения, строгие правила на уровне тулинга - не чтобы замедлить агента, а чтобы он не мог выйти за границы дозволенного. Всё равно все проверки на тебе, дорогой разработчик 💻. Ты понимаешь что происходит, а вот агент - исполнитель, а не владелец решения.
Please open Telegram to view this post
VIEW IN TELEGRAM
💯52🤝1
Прошлый пост закончился на «решается инфраструктурой».
Ну вот и она👇

Агент пишет быстро, без прокрастинации и без «разберусь завтра». За день он может затронуть половину кодовой базы - и всё будет компилироваться, линтер молчит, тесты зелёные, но через месяц проект вдруг становится неуправляемым 😠
Проблема не в том, что агент пишет плохой код. Он пишет уверенный код без понимания архитектуры, не зная, какие модули не должны знать друг о друге, не зная, что хелпер специально вынесен отдельно. Видит цель - не видит препятствий 😎, а остальное его не касается. Если не ограничить - он будет с чистой совестью по чуть-чуть размывать границы.

Решение: не просить агента быть аккуратнее (удачи), а сделать так, чтобы неаккуратность не проходила. Концлагерь для ИИ 🔒

Периметр из инструментов которые агент не может обойти:
🔘На фронте: 15 ESLint-плагинов, 232 правила dependency-cruiser, 7 FSD-правил steiger, strict TypeScript с 6 доп. флагами, knip на мёртвый код.
🔘На бэке: mypy strict с 12 флагами, ruff (E, W, F, I, N, C, PLR, B, S, DJ, UP, PT, SIM, PERF, RET, TRY, BLE, TID, INP, A, ERA), import-linter (4 контракта включая domain→ORM), vulture, bandit

Но это не серебряная пуля. Агент всё равно может написать логически неверный код, который пройдёт все проверки, поэтому человек никуда не уходит. Инфраструктура сужает пространство ошибок - ты смотришь на то что осталось. Меньше площадь - меньше мест, где что-то спрятано.
Ты не контролируешь агента напрямую - контролирует инфраструктура, а ты, в свою очередь, контролируешь уже инфраструктуру. Это и есть теперь твоя работа 🤩

⬇️ В комментариях файлы, в них показано, как ИИ разваливает проект без инструментов ⬇️
Please open Telegram to view this post
VIEW IN TELEGRAM
321
This media is not supported in your browser
VIEW IN TELEGRAM
Антон без подписки Claude Pro 🎮

Давно не тапали? Мы сделали кликер про разработчика, которому не купили подписку на Claude Pro.

Антон грустит 😭 Бродит по пиксельному миру, вздыхает на скамейках, стучит в двери Anthropic, роется в мусорках в поисках промокодов, звонит в поддержку ("Вы 47382й в очереди"), пялится на билборд "$20/мес" и плачет, а ещё дерётся с маскотом Claude на арене и…проигрывает.

Что внутри:
Мультиплеер с общим счётчиком монет - копим Антону вместе
20 достижений от "Мышка" до "Тепловая смерть вселенной"
5 развилок: прораб, хакер, стример, киборг, бог кликов - каждый путь меняет Антона и мир
Мир эволюционирует: пустырь → стартапы → медиа-цирк → киберпанк → космос
Чиптюн-саундтрек из 6 слоёв, наращивается по мере прогресса
Кот, бабочки, самолёт с инверсионным следом и перекати-поле
Рандомные события: "Claude ответил без подписки! Кликай пока не пофиксили!"
День и ночь по реальным часам

Все совпадения с реальными людьми и компаниями абсолютно намеренные, но юридически - чистая случайность.

👉 antonwithoutsub.web.app
Please open Telegram to view this post
VIEW IN TELEGRAM
13😁22🤯11