#ai
Крайнюю неделю юзаю разные модели для работы/пет-проектов.
Попробовал Claude Code с Opus 4.6, Kilo Code с GLM-5, Claude Code с GLM-5, Cursor с Opus 4.6.
Потратил на все подписки где-то 3400, пока брал месячные, просто, чтобы потестить.
Могу сказать, что лучший вариант среди этого всего — Claude Code Opus 4.6 со связкой с GLM-5.
У Cursor есть большой минус — выжираются токены и всё, приходится покупать новую подписку. У Claude Code Opus 4.6 и GLM от z.ai есть лимиты на пользование — выжрал токены и сиди 4-5 часов, отдыхай, но модели можно чередовать друг с другом, что даёт не останавливаться в вайбкодинге.
Для тех, кто хочет попробовать, но не хочет платить — нужно настроить впн-ку и сделать акк в Kilo Code, они пока раздают доступ к glm-5 — самая свежая модель от китайцев. Это самый лучший вариант бесплатного доступа на рынке.
Пока разбираюсь, какие mcp-сервера можно подключить к Claude Code, чтобы ещё эффективнее работать. Уже подключил serena — позволяет меньше тратить токенов на запросы.
Крайнюю неделю юзаю разные модели для работы/пет-проектов.
Попробовал Claude Code с Opus 4.6, Kilo Code с GLM-5, Claude Code с GLM-5, Cursor с Opus 4.6.
Потратил на все подписки где-то 3400, пока брал месячные, просто, чтобы потестить.
Могу сказать, что лучший вариант среди этого всего — Claude Code Opus 4.6 со связкой с GLM-5.
У Cursor есть большой минус — выжираются токены и всё, приходится покупать новую подписку. У Claude Code Opus 4.6 и GLM от z.ai есть лимиты на пользование — выжрал токены и сиди 4-5 часов, отдыхай, но модели можно чередовать друг с другом, что даёт не останавливаться в вайбкодинге.
Для тех, кто хочет попробовать, но не хочет платить — нужно настроить впн-ку и сделать акк в Kilo Code, они пока раздают доступ к glm-5 — самая свежая модель от китайцев. Это самый лучший вариант бесплатного доступа на рынке.
Пока разбираюсь, какие mcp-сервера можно подключить к Claude Code, чтобы ещё эффективнее работать. Уже подключил serena — позволяет меньше тратить токенов на запросы.
❤1👍1
#ai
По новостям с иишкой у нас в компании всё оч интересно. Люди пилят свои команды агентов, которые прорабатывают идеи. Другой чел запилил команду агентов на двух подписках курсор и бахнул мини-стартап для детей. На всё это дело он потратил 400 USD.
Началась проработка ИИ плановая в компании.
Щас думаю все будут в эту сторону идти и есть вариант помочь компаниям предлагать варианты того, как есть в Яндексах и делать то же самое. Потому что все рано или поздно пойдут туда. Тут смесь того, что мы внедрили/внедряем в ТЛ с тем, что уже внедрили в Яндексе. Мы тут как бы догоняем.
Вот идейки:
— ИИ-описатор ПРов + расширение в хроме бахнуть, чтобы красивое описание выводил в гитлабе/битбакете
— ИИ-обработчик запросов со 2-й/1-й линии. Индексирует все проекты, ищет чё сломалось, тем самым облегчает работы по локализации ошибки
— ИИ-ревьювер. Тут только по диффу трудновато будет ревьювить. Можно на cli утилите чё-то интересное сделать (claude, cursor...)
— ИИ-ченджлогер для тестировщиков. Переход задачи из разработки в тестирование. Можно по диффу чекать, чё поменялось и делать саммари, чтобы тестировщик мог по-хорошему тест-кейсы составить
— ИИ-создатель тест-кейсов. У меня тут лично был заход, но если кто делать будет, то просто диффа недостаточно, будет фигню генерить. Надо подключать cli
Цели проектов субъективны. У кого что болит, тот на то и целится. У нас лично щас есть проблема с узким горлышком в тестировании, так что я попытаюсь доделать ии-генерацию тест-кейсов + ии-помощник для тестировщика масштабировать на остальных. На это ещё, к примеру, можно посмотреть в целом как на сокращение TTM.
Копируем. Внедряем. Получаем оффер/yet another достижение : -)
По новостям с иишкой у нас в компании всё оч интересно. Люди пилят свои команды агентов, которые прорабатывают идеи. Другой чел запилил команду агентов на двух подписках курсор и бахнул мини-стартап для детей. На всё это дело он потратил 400 USD.
Началась проработка ИИ плановая в компании.
Щас думаю все будут в эту сторону идти и есть вариант помочь компаниям предлагать варианты того, как есть в Яндексах и делать то же самое. Потому что все рано или поздно пойдут туда. Тут смесь того, что мы внедрили/внедряем в ТЛ с тем, что уже внедрили в Яндексе. Мы тут как бы догоняем.
Вот идейки:
— ИИ-описатор ПРов + расширение в хроме бахнуть, чтобы красивое описание выводил в гитлабе/битбакете
— ИИ-обработчик запросов со 2-й/1-й линии. Индексирует все проекты, ищет чё сломалось, тем самым облегчает работы по локализации ошибки
— ИИ-ревьювер. Тут только по диффу трудновато будет ревьювить. Можно на cli утилите чё-то интересное сделать (claude, cursor...)
— ИИ-ченджлогер для тестировщиков. Переход задачи из разработки в тестирование. Можно по диффу чекать, чё поменялось и делать саммари, чтобы тестировщик мог по-хорошему тест-кейсы составить
— ИИ-создатель тест-кейсов. У меня тут лично был заход, но если кто делать будет, то просто диффа недостаточно, будет фигню генерить. Надо подключать cli
Цели проектов субъективны. У кого что болит, тот на то и целится. У нас лично щас есть проблема с узким горлышком в тестировании, так что я попытаюсь доделать ии-генерацию тест-кейсов + ии-помощник для тестировщика масштабировать на остальных. На это ещё, к примеру, можно посмотреть в целом как на сокращение TTM.
Копируем. Внедряем. Получаем оффер/yet another достижение : -)
❤2👍2
Запилил сервис по улучшению резюме
Пока запустил в тестовом режиме
Кто не в курсе, резюмехи щас читает иишка, а фильтруются они ATS-системами. А значит нам надо эти системы наебать, вставлять ключевые слова, писать «правильные» цифры, возраст и т.п.
Дальше идёт фильтр от hr, который разные люди по-разному обходят. Кто-то опыт крутит, кто-то скручивает, кто-то придумывает достижения.
Всё это можно, если хочется.
Но можно и честными путями, через определённые паттерны, «продавать» свои достижения. Всё это есть в боте.
Пока запустил в тестовом режиме
Кто не в курсе, резюмехи щас читает иишка, а фильтруются они ATS-системами. А значит нам надо эти системы наебать, вставлять ключевые слова, писать «правильные» цифры, возраст и т.п.
Дальше идёт фильтр от hr, который разные люди по-разному обходят. Кто-то опыт крутит, кто-то скручивает, кто-то придумывает достижения.
Всё это можно, если хочется.
Но можно и честными путями, через определённые паттерны, «продавать» свои достижения. Всё это есть в боте.
Улучшатор Резюме
Улучшатор Резюме — карьерный бот в Telegram
Бот в Telegram, который берёт на себя половину рутины при поиске работы: разбирает резюме, пишет сопроводительные, готовит к собесу и сам поднимает резюме на hh.ru.
👍3
#ai
Хотелось было уже написать какой-то пост на тему того, как всё-таки нужно использовать ИИшку, чтобы получать от неё максимум.
В репосте говорится, что оч много вещей щас на шару делается, чтобы успеть «в забеге». Недавно даже видел, что чувак на своей личной страничке linkedin рекомендует использовать .cursorignore, которого просто нет. Скорее всего это писал не он, а иишка, а он даже не проверил. И когда вот таких людей начинает появляться большое множество, то иишка начинает всё больше и больше глючить. Именно поэтому я в свой рабочий ПР чуть ли не добавил этот файл :_ 0.
С пресловутым AGENTS.md тоже не всё так однозначно — https://arxiv.org/pdf/2602.11988
TL;DR — пишите сами AGENTS.md, но даже в этом случае не факт, что будет лучше : - )
Чтож
Пока от себя и от знакомых могу сказать, что ТОЧНО работают лишь mcp-сервера. Вот их список:
- context7 — актуальную апишку будет иишка брать для своего кода.
- superpowers — скиллы для более лучшего написания плана для разработки. снаружи отличие в том, что спрашивает юзера в форме диалога чё ему надо, а не начинает сам предполагать, что нужно.
- jira/confluence/<put-your-lan-job-service> — апишка для дёргания данных из внутренних сервисов для работы.
Хотелось было уже написать какой-то пост на тему того, как всё-таки нужно использовать ИИшку, чтобы получать от неё максимум.
В репосте говорится, что оч много вещей щас на шару делается, чтобы успеть «в забеге». Недавно даже видел, что чувак на своей личной страничке linkedin рекомендует использовать .cursorignore, которого просто нет. Скорее всего это писал не он, а иишка, а он даже не проверил. И когда вот таких людей начинает появляться большое множество, то иишка начинает всё больше и больше глючить. Именно поэтому я в свой рабочий ПР чуть ли не добавил этот файл :_ 0.
С пресловутым AGENTS.md тоже не всё так однозначно — https://arxiv.org/pdf/2602.11988
TL;DR — пишите сами AGENTS.md, но даже в этом случае не факт, что будет лучше : - )
Чтож
Пока от себя и от знакомых могу сказать, что ТОЧНО работают лишь mcp-сервера. Вот их список:
- context7 — актуальную апишку будет иишка брать для своего кода.
- superpowers — скиллы для более лучшего написания плана для разработки. снаружи отличие в том, что спрашивает юзера в форме диалога чё ему надо, а не начинает сам предполагать, что нужно.
- jira/confluence/<put-your-lan-job-service> — апишка для дёргания данных из внутренних сервисов для работы.
❤2
Forwarded from Гриненко про ИИ, бизнес и образование
Модель, агент и обвязка. Часть 1
LLM, как баба Ванга на минималках — умеет лишь предсказывать следующий токен. Вы ей: «в лесу родилась», а она вам — «ёлочка». Больше модели не умеют ничего. Совсем ничего. Даже позировать.
Как же тогда нейронки создают приложения и решают еще кучу задач? В этом посте разберемся с базовой теорией, а во второй части — соберем собственного агента, чтобы окончательно разобраться.
Как и следует ожидать от старой гадалки, LLM более-менее помнит, что было у неев молодости на этапе тренировки (хотя может и присочинить на ходу), но забывает то, что вы ей только что сказали. Важно понимать, что никакого дообучения, пока вы с ней общаетесь, не происходит.
Карго-культ
За недолгую историю существования LLM пользователи эмпирически подобрали лайфхаки, которые тиражируются в виде статей, репозиториев и роликов на Ютубе, но многие из которых уже окончательно устарели и на актуальных замерах показывают падение качества.
Сюда относятся угрозы, попытки вызвать жалость или подкупить модель, генерация банков памяти, массовое подключение MCP-серверов, подробные инструкции в AGENTS.md, использование скиллов без разбора и прочие магические действия.
Чтобы получить интуицию, какие советы лучше внимательно тестировать перед внедрением, стоит представлять, с чем мы имеем дело.
Контекстное окно
Если не указать в промпте важные детали, нейронка их просто выдумает. Если в датасете не окажется песенки про елочку, то вместо ответа «кто его знает, кто там в лесу родился», модель будет предполагать наиболее вероятные варианты, исходя из того, что ей известно о мире.
Соответственно, важно, чтобы промпт был максимально подробный. Но, во-первых, контекстное окно ограничено, а во-вторых, даже если все поместилось, есть риск, что в потоке текста потеряются важные требования, а среди указаний встретятся противоречия.
К тому же в контекстное окно попадает не только ваш последний промпт, но еще куча всего:
* системный промпт самой модели
* базовый промпт вашего агента
* ваши дополнения из AGENTS.md и аналогов
* скиллы
* подключенные MCP-серверы
* результаты вызовов инструментов (например, содержимое файлов, которые агент решил прочитать)
* и, наконец, вся ваша переписка из текущей сессии
Каждый раз, когда вы отправляете следующий промпт, он просто подклеивается снизу ко всему вышеперечисленному. Модель угадывает следующий токен и так повторяется, пока не сгенерируется токен завершения ответа.
Инструменты
Как же происходит чтение файлов и вызов MCP-серверов, если модель только лишь генерит токены?
За это отвечает обвязка — старый добрый детерминированный код: модель генерит специальный токен «позови-ка-такой-то-тул-с-такими-то-параметрами» и ставит генерацию на паузу. Обвязка видит этот токен, вызывает нужный инструмент и подклеивает в промпт результат этого вызова.
Как показывает практика, если в качестве инструментов дать нейронке возможность читать и писать файлы, а также вызывать bash-команды, то этого набора становится достаточно, чтобы решить множество задач (а всё, чего не хватит, модель может сама себе установить, прочитать в интернете curl-ом, либо просто напрограммировать и запустить). А если перед показом ответа пользователю зациклить нейронку саму на себя, чтобы она, как и живой человек, сначала несколько раз перепроверила результат, то принципиально возрастает качество ответа.
Или, как это точно сформулировал @electroVafinBot:
А дальше работают все те же практики, что и для человеческих команд разработки: уточнение требований, декомпозиция, поиск и исследование доступных библиотек, линтеры и автотесты в CI и т.д.
Claude Code, Antigravity и OpenClaw построены ровно по этому принципу.
Расскажите в комментариях, какие из распространенных рекомендаций для работы с LLM по вашим наблюдениям на самом деле не работают. А мы соберем своего собственного агента в следующей части.
@devspotting
LLM, как баба Ванга на минималках — умеет лишь предсказывать следующий токен. Вы ей: «в лесу родилась», а она вам — «ёлочка». Больше модели не умеют ничего. Совсем ничего. Даже позировать.
Как же тогда нейронки создают приложения и решают еще кучу задач? В этом посте разберемся с базовой теорией, а во второй части — соберем собственного агента, чтобы окончательно разобраться.
Как и следует ожидать от старой гадалки, LLM более-менее помнит, что было у нее
Карго-культ
За недолгую историю существования LLM пользователи эмпирически подобрали лайфхаки, которые тиражируются в виде статей, репозиториев и роликов на Ютубе, но многие из которых уже окончательно устарели и на актуальных замерах показывают падение качества.
Сюда относятся угрозы, попытки вызвать жалость или подкупить модель, генерация банков памяти, массовое подключение MCP-серверов, подробные инструкции в AGENTS.md, использование скиллов без разбора и прочие магические действия.
Чтобы получить интуицию, какие советы лучше внимательно тестировать перед внедрением, стоит представлять, с чем мы имеем дело.
Контекстное окно
Если не указать в промпте важные детали, нейронка их просто выдумает. Если в датасете не окажется песенки про елочку, то вместо ответа «кто его знает, кто там в лесу родился», модель будет предполагать наиболее вероятные варианты, исходя из того, что ей известно о мире.
Соответственно, важно, чтобы промпт был максимально подробный. Но, во-первых, контекстное окно ограничено, а во-вторых, даже если все поместилось, есть риск, что в потоке текста потеряются важные требования, а среди указаний встретятся противоречия.
К тому же в контекстное окно попадает не только ваш последний промпт, но еще куча всего:
* системный промпт самой модели
* базовый промпт вашего агента
* ваши дополнения из AGENTS.md и аналогов
* скиллы
* подключенные MCP-серверы
* результаты вызовов инструментов (например, содержимое файлов, которые агент решил прочитать)
* и, наконец, вся ваша переписка из текущей сессии
Каждый раз, когда вы отправляете следующий промпт, он просто подклеивается снизу ко всему вышеперечисленному. Модель угадывает следующий токен и так повторяется, пока не сгенерируется токен завершения ответа.
Инструменты
Как же происходит чтение файлов и вызов MCP-серверов, если модель только лишь генерит токены?
За это отвечает обвязка — старый добрый детерминированный код: модель генерит специальный токен «позови-ка-такой-то-тул-с-такими-то-параметрами» и ставит генерацию на паузу. Обвязка видит этот токен, вызывает нужный инструмент и подклеивает в промпт результат этого вызова.
Как показывает практика, если в качестве инструментов дать нейронке возможность читать и писать файлы, а также вызывать bash-команды, то этого набора становится достаточно, чтобы решить множество задач (а всё, чего не хватит, модель может сама себе установить, прочитать в интернете curl-ом, либо просто напрограммировать и запустить). А если перед показом ответа пользователю зациклить нейронку саму на себя, чтобы она, как и живой человек, сначала несколько раз перепроверила результат, то принципиально возрастает качество ответа.
Или, как это точно сформулировал @electroVafinBot:
Агент — это не тот, кто умный. Агент — это тот, кто достаточно упертый, чтобы не бросать начатое после первого «Syntax Error».
А дальше работают все те же практики, что и для человеческих команд разработки: уточнение требований, декомпозиция, поиск и исследование доступных библиотек, линтеры и автотесты в CI и т.д.
Claude Code, Antigravity и OpenClaw построены ровно по этому принципу.
Расскажите в комментариях, какие из распространенных рекомендаций для работы с LLM по вашим наблюдениям на самом деле не работают. А мы соберем своего собственного агента в следующей части.
@devspotting
❤2
#ai #карьера
Вчера узнал, что мы перестанем работать по ии-проектам с очень хорошим программистом. У него другое, на мой взгляд, верное видение по поводу того, куда должна двигаться компания и интересная идея, почему ИИ не является серебряной пулей для компании ТЛ. Пример того, что проблемы компании могут быть решены не иишкой, но щас все в азарте и хотят внедрить ИИ, чтоб было. Мой прогноз, что через пару лет все поймут, что бежали не в ту сторону. И я тут не являюсь ии-скептиком, некоторые задачи действительно можно улучшить с помощью ИИ. Но ускорение разработки в n раз, где n > 2?
Вчера узнал, что мы перестанем работать по ии-проектам с очень хорошим программистом. У него другое, на мой взгляд, верное видение по поводу того, куда должна двигаться компания и интересная идея, почему ИИ не является серебряной пулей для компании ТЛ. Пример того, что проблемы компании могут быть решены не иишкой, но щас все в азарте и хотят внедрить ИИ, чтоб было. Мой прогноз, что через пару лет все поймут, что бежали не в ту сторону. И я тут не являюсь ии-скептиком, некоторые задачи действительно можно улучшить с помощью ИИ. Но ускорение разработки в n раз, где n > 2?
❤2👍1
#ai
Купил недавно подписку на Claude Max.
И потестил, как можно вайбкодить прям из туалета/кафешки.
Судя по доке, такая функция доступна даже на бесплатной версии.
Работает только с версии claude 2.5.1. Посмотреть свою версию можно через claude --version. Обновить — через claude update.
Что надо сделать:
1. Открыть терминал/cmd и прописать claude remote-control или claude --remote-control, если хочется и с компа, и с телефона сразу вайбкодить
2. Далее сформируется ссылка, вы её перекидываете себе в телегу
3. Открываете ссылку из телеги на телефоне
Вуаля
Купил недавно подписку на Claude Max.
И потестил, как можно вайбкодить прям из туалета/кафешки.
Судя по доке, такая функция доступна даже на бесплатной версии.
Работает только с версии claude 2.5.1. Посмотреть свою версию можно через claude --version. Обновить — через claude update.
Что надо сделать:
1. Открыть терминал/cmd и прописать claude remote-control или claude --remote-control, если хочется и с компа, и с телефона сразу вайбкодить
2. Далее сформируется ссылка, вы её перекидываете себе в телегу
3. Открываете ссылку из телеги на телефоне
Вуаля
❤3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
#ai
Всё-таки дошли руки написать резюме по AI Dev Day от Яндекса.
- Яндекс ускорился за счёт иишки на 2 процента, avito примерно так же
- Массово все начали по компаниями собирать репки со скилами, рулами, AGENTS.MD для всей компании
- AI Code Review — фокус должен быть не на поиске проблем/мест для улучшений, а на поиске решений для этих проблем/мест (сразу код предлагать), так как это занимает бОльшую часть времени
- Агенты уже работают на уровне джуна/мидла
- В SRE Яндекса используют AI для 1) заполнения постмортемов 2) ответов в чатах при горящей жопе (когда пишет саппорт, что сломалось) 3) нахождения root cause (с этим лично сталкивались в ТЛ, хорошо справляется)
Результаты внедрения в ТОПОВЫЕ компании на рынке обнадёживают...
Всё-таки дошли руки написать резюме по AI Dev Day от Яндекса.
- Яндекс ускорился за счёт иишки на 2 процента, avito примерно так же
- Массово все начали по компаниями собирать репки со скилами, рулами, AGENTS.MD для всей компании
- AI Code Review — фокус должен быть не на поиске проблем/мест для улучшений, а на поиске решений для этих проблем/мест (сразу код предлагать), так как это занимает бОльшую часть времени
- Агенты уже работают на уровне джуна/мидла
- В SRE Яндекса используют AI для 1) заполнения постмортемов 2) ответов в чатах при горящей жопе (когда пишет саппорт, что сломалось) 3) нахождения root cause (с этим лично сталкивались в ТЛ, хорошо справляется)
Результаты внедрения в ТОПОВЫЕ компании на рынке обнадёживают...
👍3
#ai
Прошёл курс по AI-разработке в компании.
В целом, не особо много нового узнал. Для тех, кто в теме, информация была не новой. Тем не менее, выделю интересный тезис.
- Ради экономии токенов юзать английский язык. В русском языке на каждый символ выделяется один токен. В английском на 3-4 символа 1 токен. Или даже на 1 слово.
Так что английский не зря учили : -)
Прошёл курс по AI-разработке в компании.
В целом, не особо много нового узнал. Для тех, кто в теме, информация была не новой. Тем не менее, выделю интересный тезис.
- Ради экономии токенов юзать английский язык. В русском языке на каждый символ выделяется один токен. В английском на 3-4 символа 1 токен. Или даже на 1 слово.
Так что английский не зря учили : -)
❤1👍1
В общем, решил тут я немножко поднабрать аудиторию и разыграть месячную подписку на claude max 20x.
Отличная возможность попробовать инструмент для тех, кто ещё не вкатился во всю ии-движуху. Я со своей подпиской max 5x очень редко когда выжигаю лимиты, а с этой 20x можно вытворять что-то невероятное : - )
Чтобы поучаствовать, нужно:
1. Быть подписчиком канала
2. Написать любой коммент к этом посту
4 апреля в 18:00 по мск выдам приз победителю.
Отличная возможность попробовать инструмент для тех, кто ещё не вкатился во всю ии-движуху. Я со своей подпиской max 5x очень редко когда выжигаю лимиты, а с этой 20x можно вытворять что-то невероятное : - )
Чтобы поучаствовать, нужно:
1. Быть подписчиком канала
2. Написать любой коммент к этом посту
4 апреля в 18:00 по мск выдам приз победителю.
🔥6❤4
#ai
OpenClaw: что это и зачем?
Уже вторую неделю пользуюсь OpenClaw и решил опробовать, что это такое. По сути, OpenClaw — это AI-агент с безграничным доступом ко всему диску.
AI-агент = LLM + harness.
Harness — это всё, что кастомизирует LLM под конкретную задачу (промпты, навыки, плагины, MCP).
И всё.
Устанавливать желательно на VPS или в песочницу, так как у бота есть неограниченный доступ ко всей ОС: он может удалить что-то ненужное.
При установке нужно задать множество различных конфигов: ключи LLM, навыки, модели, с которыми нужно работать, и так далее.
И самое главное — надо выбрать интерфейс для взаимодействия с ботом; я выбрал Telegram. В итоге получился вот такой бот — @peregrine0_bot.
Назвал его Хасбот, в честь Хасбика.
Теперь главный вопрос: нафига эта штуковина нужна?
Я посмотрел кучу разных use cases в интернете, для чего же всё-таки нужен этот бот, и пришёл к выводу, что это глупое занятие — смотреть, что можно автоматизировать в жизни. Так как таким образом проблема не решается, а сначала придумывается, а затем решается. Точно не эффективный способ ведения жизни : - )
Лично я использую его для себя в трёх кейсах:
1. Напоминание о днях рождения каждое утро.
У меня очень много друзей, знакомых и коллег, с которыми надо поддерживать контакт. И так уж повелось, что в нашей культуре поздравление с днём рождения позволяет этот контакт не потерять.
2. Суммаризация новостей из Telegram-каналов.
Я пытаюсь быть на пике новостей, потому что ИТ из-за ИИ движется очень быстро.
3. ИИ-репетитор с сократическим методом по работе.
На работе у каждого разработчика в нашей команде есть ИПР (индивидуальный план развития), по которому люди должны двигаться, чтобы получить повышение.
Я скормил этот ИПР боту, он создал навык, который каждое утро по крону вызывает обучение меня по ИПРу. Могу всем разработчикам советовать этот способ обучения, именно сократический. Его особенность в том, что не просто выдаётся лекционный материал, а по каждой смысловой части задаётся вопрос, не давая конкретных ответов. За неделю понял, что этот метод позволяет копнуть глубже в изучаемом материале.
Мой совет: не смотрите на use cases, смотрите на свою жизнь и посмотрите, что в ней можно автоматизировать, скинуть какие-то обязанности на бота.
Подведём итог:
OpenClaw = AI-агент с неограниченным доступом к диску.
Use Cases — порефлексируйте над вашей жизнью и скиньте что-то домовёнку, который вам напомнит что-то или сделает запрос в LLM за вас.
OpenClaw: что это и зачем?
Уже вторую неделю пользуюсь OpenClaw и решил опробовать, что это такое. По сути, OpenClaw — это AI-агент с безграничным доступом ко всему диску.
AI-агент = LLM + harness.
Harness — это всё, что кастомизирует LLM под конкретную задачу (промпты, навыки, плагины, MCP).
И всё.
Устанавливать желательно на VPS или в песочницу, так как у бота есть неограниченный доступ ко всей ОС: он может удалить что-то ненужное.
При установке нужно задать множество различных конфигов: ключи LLM, навыки, модели, с которыми нужно работать, и так далее.
И самое главное — надо выбрать интерфейс для взаимодействия с ботом; я выбрал Telegram. В итоге получился вот такой бот — @peregrine0_bot.
Назвал его Хасбот, в честь Хасбика.
Теперь главный вопрос: нафига эта штуковина нужна?
Я посмотрел кучу разных use cases в интернете, для чего же всё-таки нужен этот бот, и пришёл к выводу, что это глупое занятие — смотреть, что можно автоматизировать в жизни. Так как таким образом проблема не решается, а сначала придумывается, а затем решается. Точно не эффективный способ ведения жизни : - )
Лично я использую его для себя в трёх кейсах:
1. Напоминание о днях рождения каждое утро.
У меня очень много друзей, знакомых и коллег, с которыми надо поддерживать контакт. И так уж повелось, что в нашей культуре поздравление с днём рождения позволяет этот контакт не потерять.
2. Суммаризация новостей из Telegram-каналов.
Я пытаюсь быть на пике новостей, потому что ИТ из-за ИИ движется очень быстро.
3. ИИ-репетитор с сократическим методом по работе.
На работе у каждого разработчика в нашей команде есть ИПР (индивидуальный план развития), по которому люди должны двигаться, чтобы получить повышение.
Я скормил этот ИПР боту, он создал навык, который каждое утро по крону вызывает обучение меня по ИПРу. Могу всем разработчикам советовать этот способ обучения, именно сократический. Его особенность в том, что не просто выдаётся лекционный материал, а по каждой смысловой части задаётся вопрос, не давая конкретных ответов. За неделю понял, что этот метод позволяет копнуть глубже в изучаемом материале.
Мой совет: не смотрите на use cases, смотрите на свою жизнь и посмотрите, что в ней можно автоматизировать, скинуть какие-то обязанности на бота.
Подведём итог:
OpenClaw = AI-агент с неограниченным доступом к диску.
Use Cases — порефлексируйте над вашей жизнью и скиньте что-то домовёнку, который вам напомнит что-то или сделает запрос в LLM за вас.
❤3🔥1
#ai
Сейчас идëт курс от Яндекса по агентской разработке, который я старательно пытаюсь пройти до 24 апреля :-)
Сделал конспект первых трёх лекций, информации очень много. В следующем посте отправлю конспект оставшихся двух лекций. Инфа будет выглядеть так, будто сгенерена ии. На самом деле это не так. Инфа моя, но структурировала иишка. И так, представляю:
1. Что такое агент?
Агент = LLM + промпты + тулы + память + guardrails + planning skills.
Аналог ОС со своим CPU, оперативной памятью и жёстким диском.
2. LLM и температура
LLM предсказывает следующий токен на основе контекста.
Чем ниже температура, тем выше детерминированность LLM.
3. Tools и MCP
- Tools — внешние функции, которые может вызвать агент.
- MCP (Model Context Protocol) — API между внешними системами и агентом. Позволяет в реальном времени получать актуальные данные (например, обновить знания по Confluence через MCP-сервер).
Аналог USB-C в мире устройств.
Архитектура MCP (3 части):
- MCP Host — управляет UI и подключениями к серверам
- MCP Client — отправляет промпты, возвращает ответы моделей
- MCP Server — предоставляет tools, данные, шаблоны промптов
4. Типы памяти
- Short-term = контекст + действия агента + заметки
- Context (часть short-term)
- Long-term
RAG позволяет контекстному окну работать как long-term память.
HyDE (Hypothetical Document Embeddings) — связывает неформальный ответ пользователя с формальными документами через RAG.
5. Когда RAG, когда дообучение?
RAG (используй в первую очередь):
- первая итерация агента
- информация меняется динамически
- нужны фактуальные ответы по документации
- используются слабые LLM (экономия памяти)
Дообучение (когда достигли потолка RAG):
- доменные знания стабильны (нет оверхеда на real-time)
- требуется глубокое погружение в домен / сложный reasoning
- есть ресурсы (вычисления, данные, инженеры)
👉 Коротко: начинай с RAG, обучай, когда RAG уже не тянет.
6. Guardrails (ограничения ответов)
Защита от галлюцинаций, ухода от темы, промпт-инъекций.
Инструменты (от простых к сложным):
1. regex / rules
2. grammars
3. ML-классификатор
4. DSSM
5. BERT
6. LLM
На практике: комбинация — regex для очевидных случаев, ML/DSSM/BERT для нюансов, LLM для сложных кейсов.
Guardrails нужно постоянно улучшать, иначе их сломают.
7. Как агенты думают: TAO-цикл
Thought → Action → Observation → Repeat
- Thought — планы, рассуждения
- Action — вызов тулов
Типы Thought:
- Планирование («Разобью на 3 части...»)
- Анализ («Ошибка API из-за формата даты»)
- Саморефлексия («Мой предыдущий ответ был слишком общим»)
8. Стратегии reasoning
- CoT (Chain-of-Thought) — пошаговое рассуждение перед ответом (один вызов). Лучшее для логики и математики. Пример: «Let's think step by step.»
- ReAct — лучший, если нужен вызов тулов.
- Встроенный reasoning — через тег
9. Мультиагентные системы
Когда система сложная — один агент не справляется. Нужна мультиагентная система, у каждого агента свой контекст задачи.
Архитектуры:
- иерархическая
- децентрализованная
- централизованная
- Shared Pool
Связь между агентами — фреймворк A2A (аналог Wi-Fi).
> 💸 Важно: для простых агентов в мультиагентной системе используйте простые модели, иначе будет очень дорого.
Материалы:
Intro to AI Agents LLM
Tools. MCP
Memory and Guardrails in LLM-Powered Agents
Memory and Guardrails in LLM-Powered Agents. Practice
AI Agent Workflow Multi-Agent Systems Multimodality
AI Agent Workflow Multi-Agent Systems Multimodality. Practice
Сейчас идëт курс от Яндекса по агентской разработке, который я старательно пытаюсь пройти до 24 апреля :-)
Сделал конспект первых трёх лекций, информации очень много. В следующем посте отправлю конспект оставшихся двух лекций. Инфа будет выглядеть так, будто сгенерена ии. На самом деле это не так. Инфа моя, но структурировала иишка. И так, представляю:
1. Что такое агент?
Агент = LLM + промпты + тулы + память + guardrails + planning skills.
Аналог ОС со своим CPU, оперативной памятью и жёстким диском.
2. LLM и температура
LLM предсказывает следующий токен на основе контекста.
Чем ниже температура, тем выше детерминированность LLM.
3. Tools и MCP
- Tools — внешние функции, которые может вызвать агент.
- MCP (Model Context Protocol) — API между внешними системами и агентом. Позволяет в реальном времени получать актуальные данные (например, обновить знания по Confluence через MCP-сервер).
Аналог USB-C в мире устройств.
Архитектура MCP (3 части):
- MCP Host — управляет UI и подключениями к серверам
- MCP Client — отправляет промпты, возвращает ответы моделей
- MCP Server — предоставляет tools, данные, шаблоны промптов
4. Типы памяти
- Short-term = контекст + действия агента + заметки
- Context (часть short-term)
- Long-term
RAG позволяет контекстному окну работать как long-term память.
HyDE (Hypothetical Document Embeddings) — связывает неформальный ответ пользователя с формальными документами через RAG.
5. Когда RAG, когда дообучение?
RAG (используй в первую очередь):
- первая итерация агента
- информация меняется динамически
- нужны фактуальные ответы по документации
- используются слабые LLM (экономия памяти)
Дообучение (когда достигли потолка RAG):
- доменные знания стабильны (нет оверхеда на real-time)
- требуется глубокое погружение в домен / сложный reasoning
- есть ресурсы (вычисления, данные, инженеры)
👉 Коротко: начинай с RAG, обучай, когда RAG уже не тянет.
6. Guardrails (ограничения ответов)
Защита от галлюцинаций, ухода от темы, промпт-инъекций.
Инструменты (от простых к сложным):
1. regex / rules
2. grammars
3. ML-классификатор
4. DSSM
5. BERT
6. LLM
На практике: комбинация — regex для очевидных случаев, ML/DSSM/BERT для нюансов, LLM для сложных кейсов.
Guardrails нужно постоянно улучшать, иначе их сломают.
7. Как агенты думают: TAO-цикл
Thought → Action → Observation → Repeat
- Thought — планы, рассуждения
- Action — вызов тулов
Типы Thought:
- Планирование («Разобью на 3 части...»)
- Анализ («Ошибка API из-за формата даты»)
- Саморефлексия («Мой предыдущий ответ был слишком общим»)
8. Стратегии reasoning
- CoT (Chain-of-Thought) — пошаговое рассуждение перед ответом (один вызов). Лучшее для логики и математики. Пример: «Let's think step by step.»
- ReAct — лучший, если нужен вызов тулов.
- Встроенный reasoning — через тег
think.9. Мультиагентные системы
Когда система сложная — один агент не справляется. Нужна мультиагентная система, у каждого агента свой контекст задачи.
Архитектуры:
- иерархическая
- децентрализованная
- централизованная
- Shared Pool
Связь между агентами — фреймворк A2A (аналог Wi-Fi).
> 💸 Важно: для простых агентов в мультиагентной системе используйте простые модели, иначе будет очень дорого.
Материалы:
Intro to AI Agents LLM
Tools. MCP
Memory and Guardrails in LLM-Powered Agents
Memory and Guardrails in LLM-Powered Agents. Practice
AI Agent Workflow Multi-Agent Systems Multimodality
AI Agent Workflow Multi-Agent Systems Multimodality. Practice
❤3
В начале было слово.ppt
33.2 MB
#ai
К нам недавно в компанию приезжал Булат Ганиев, технологический предприниматель из Казани.
Прочитал интересную лекцию про ИИ, собрав воедино все важные знания, не углубляясь в детали.
Попросил презентацию — и мне её скинули : - )
Вот, кстати, канал Булата
К нам недавно в компанию приезжал Булат Ганиев, технологический предприниматель из Казани.
Прочитал интересную лекцию про ИИ, собрав воедино все важные знания, не углубляясь в детали.
Попросил презентацию — и мне её скинули : - )
Вот, кстати, канал Булата
❤2❤🔥1
#ai
В эту пятницу в институте iSpring прошла лекция от Максима Смирнова на тему истории развития ИИ. Из интересного:
- Для построения ИИ-агентов больше не нужно писать программу, которая будет использовать разные API, в том числе LLM API, для решения какой-то задачи. Достаточно написать агентский скилл, запустить его либо в ручном режиме, либо он сам запустится из контекста диалога. И всё.
- Рассказал о том, что ИИ-агент был изобретён задолго до хайпа — в робототехнике. ИИ-агент в робототехнике — это система, которая как-то реагирует на окружение посредством памяти и инструментов, с целью выполнения действия по изменению окружения. На картинке схема работы такого агента.
- Обосрал MCP, так как сказал, что с точки зрения хороших архитектурных принципов нормальный человек с этой планеты такую фигню не придумает.
- Отметил, что сейчас знания и умения работников нужно переносить в скиллы и потихоньку заменять и автоматизировать работников таким образом.
В эту пятницу в институте iSpring прошла лекция от Максима Смирнова на тему истории развития ИИ. Из интересного:
- Для построения ИИ-агентов больше не нужно писать программу, которая будет использовать разные API, в том числе LLM API, для решения какой-то задачи. Достаточно написать агентский скилл, запустить его либо в ручном режиме, либо он сам запустится из контекста диалога. И всё.
- Рассказал о том, что ИИ-агент был изобретён задолго до хайпа — в робототехнике. ИИ-агент в робототехнике — это система, которая как-то реагирует на окружение посредством памяти и инструментов, с целью выполнения действия по изменению окружения. На картинке схема работы такого агента.
- Обосрал MCP, так как сказал, что с точки зрения хороших архитектурных принципов нормальный человек с этой планеты такую фигню не придумает.
- Отметил, что сейчас знания и умения работников нужно переносить в скиллы и потихоньку заменять и автоматизировать работников таким образом.
❤2
В мире кода, где пальцы пляшут над клавишами, приходят вести о собраниях молодых умов. (Пустая чаша наполняется опытом, полная же лишь проливается).
Young Con — фестиваль Яндекса, посвященный карьере и технологиям, состоится 25 июня в Москве. В дни Intern Week, с 25 по 29 мая, предлагается путь стажера-фронтенда на неделю, онлайн. Т-Старт дарует оплачиваемые стажировки для фронтенд- и .NET-разработчиков, от 20 часов в неделю, в тишине удаленной работы или в суете офиса. Ozon ищет того, кто владеет JavaScript. Сбер через SberStudent открывает двери оплачиваемых стажировок для студентов очной формы.
Так учит мастер: не бойся идти по пути ученика.
Young Con — фестиваль Яндекса, посвященный карьере и технологиям, состоится 25 июня в Москве. В дни Intern Week, с 25 по 29 мая, предлагается путь стажера-фронтенда на неделю, онлайн. Т-Старт дарует оплачиваемые стажировки для фронтенд- и .NET-разработчиков, от 20 часов в неделю, в тишине удаленной работы или в суете офиса. Ozon ищет того, кто владеет JavaScript. Сбер через SberStudent открывает двери оплачиваемых стажировок для студентов очной формы.
Так учит мастер: не бойся идти по пути ученика.
❤2👾1
Давно не было новостей : - )
У меня наконец-то начался отпуск, довольно-таки плотные деньки вышли.
В голове крутятся две проблемы, связанные с ИИ-разработкой:
1. Пропадает удовольствие от проектирования сложных задач, так как теперь это прекрасно делает Opus 4.8, Fable 5, <yet-another-frontier-model>.
2. При внедрении какой-то утилиты сложно оценить её пользу для компании, так как только в совокупности ии-проекты могут принести какой-то количественный результат. Приходится пользоваться качественными метриками (фидбеком), но они не показывают объективной картины. Сложно доказать пользу своей инициативы сотрудникам.
Как решать их — не знаю :- Может, у вас есть какие-то мысли?
У меня наконец-то начался отпуск, довольно-таки плотные деньки вышли.
В голове крутятся две проблемы, связанные с ИИ-разработкой:
1. Пропадает удовольствие от проектирования сложных задач, так как теперь это прекрасно делает Opus 4.8, Fable 5, <yet-another-frontier-model>.
2. При внедрении какой-то утилиты сложно оценить её пользу для компании, так как только в совокупности ии-проекты могут принести какой-то количественный результат. Приходится пользоваться качественными метриками (фидбеком), но они не показывают объективной картины. Сложно доказать пользу своей инициативы сотрудникам.
Как решать их — не знаю :- Может, у вас есть какие-то мысли?
❤2👍1
17 июня в Москве будет «день Фронтенда» от Яндекса. Отличная возможность для студентов-выпускников попробовать влиться в коллектив.
❤2
#frontend #ai
- Злые марсиане о том, как получать удовольствие от работы программисту в эпоху ИИ
- Опять злые марсиане о том, почему не всегда нужно выбирать React для веб-приложения
- Антон Непша о том, как забыть об использовании useMemo, useCallback и React.memo
- Почему, возможно, не надо использовать скилл от Гугла для веб-разработки
- Как продвинуть свой сайт в поисковой выдаче ИИ
- Злые марсиане о том, как получать удовольствие от работы программисту в эпоху ИИ
- Опять злые марсиане о том, почему не всегда нужно выбирать React для веб-приложения
- Антон Непша о том, как забыть об использовании useMemo, useCallback и React.memo
- Почему, возможно, не надо использовать скилл от Гугла для веб-разработки
- Как продвинуть свой сайт в поисковой выдаче ИИ
❤2🔥1