Нейро Ковальский
14K subscribers
479 photos
82 videos
5 files
403 links
Head of AI Engineer
From IT Admin to Head of AI in 5 years

Applied AI Engineer
B2C RAG (2M+ books)
B2B RAG platform (10+ implementations)
B2C gptdaisy.com (100k MAU)

github.com/vakovalskii | chat @neuraldeepchat

To infinity... and beyond!
Download Telegram
Нейро Ковальский
Как и говорил на стриме самая важная часть что бы у агента были логи, дописал для PicoClaw трейсы ReAct лупа в Langfuse кстати все с телефона навайбил через RustDesk Теперь легко можно будет задавать вопросы по агентному циклу и не гадать что да как, тоже…
PicoClaw + домашние камеры + raspberry

Давно хотел сделать возможность спрашивать и управлять камерами через бота, наконец-то дошли руки реализовать и основа есть хорошая уже.

Я давно закупался для дома внутри и с наружи камерами Tapo мне понравилось что они легко управляются по onvif и можно стащить rtsp поток в два клика настроек (т.е нет вендерлока на их приложение)


Написал тул для picoclaw который забирает фотки через ffmpeg на raspberry(она как мини сервер лежит всегда в домашней сети) все на борту малины она подключается к камерам может ими крутить(через onvif) и анализировать фотки

Анализ фото делает мой локальный qwen3.5

За агентный цикл посадил gpt 5.4

Допиливаю решение через Claude Code

Если ваши камеры поддерживают такие настройки вы легко можете проделать это сами

Далее хочу на камеру на ворота повесить распознание номеров через облако и триггер в малину если я приехал дальше у меня есть контроллер ворот, в общем забуду про ключик от ворот, надеюсь, плюс уехав от дома если я был на звонке я вечно забывал закрыл ли я ворота и если забыл приходилось дергать жену, контроллер не дает обратной связи и лезть в приложение камеры за рулем такое себе удовольствие(масса сценариев еще точно)

В общем я развлекался как мог в этот один выходной =)


Как все настрою сниму видос как забегаю во двор с табличкой своего номера на шее =))) С рулем от камаза)
🔥5620😁14👍11👀3
Media is too big
VIEW IN TELEGRAM
Вышел наш первый комьюнити-стрим!

Полтора часа отвечали на вопросы подписчиков про агентов и другие аспекты из мира AI.

Например в тизере - лишь часть ответа на вопрос про работу OpenClaw на разных моделях.

📹 https://youtu.be/jL6lXttUCPM

Для вас отгружали базу Алексей Остриков и Валера Ковальский, а также огромное спасибо Гене Евстратову и Сергею Шиме за помощь с вопросами. У Сергея кстати классный канал @aimastersme, все подпишитесь.

Смотреть обязательно целиком и не торопясь, получилось просто потрясно.

00:00 — Приветствие!

02:52 — Корпоративный RAG: избыточен или нет? Как понять по объёму данных, стоит ли поднимать RAG или можно обойтись более простыми решениями?

06:56 — OpenClaw — можно ли запустить на локальных моделях и стоит ли покупать для него Mac Studio за 300к? (Мам, это для учёбы!)

14:42 — Будем ли мы продолжать использовать разные фреймворки для агентов или возьмём Claude Code за основу и будем расширять его скиллами и своим контекстом?

21:21 — Как подбирать агентские фреймворки под разные задачи? Корпоративный deep research, разработка кода — и как выбирать инструменты в целом.

25:08 — Попробовал OpenClaw — не зашло из-за сложности, решил написать своего ассистента на Codex CLI. Чему уделить внимание в первую очередь, чтобы он был стабильным?

31:49 — Как выстроить пайплайн для агентов, чтобы они имели полный контекст и могли разобраться в задаче? Есть ли какая-то статья, которую можно дать агенту как основу?

38:33 — OSS-модели на 120B, которые влезут в DGX Spark, или другие локальные модели — есть ли у них перспективы? И отдельно: проблема потребления токенов в OpenClaw — какие есть варианты подписки?

47:06 — Фитнес-домен, классификация видео. Нужно классифицировать около 1000 видео. Как решить вопрос кеширования, чтобы снизить стоимость классификации?

54:47 — Какие задачи из мира LLM можно решать локально на MacBook'ах, помимо транскрибации и шумоподавления? Особенно в преддверии выхода следующих поколений чипов.

01:00:38 — Память: RAG даёт слишком много шума. Что сейчас считается SOTA в части памяти для агентов? И бонус-вопрос: если оставить только одну подписку — какую выбрать?

01:06:57 — Насколько мы готовы передавать разработку кодовым агентам? Должны ли люди контролировать каждую строку кода — особенно с учётом кейса, когда вайбкодинг привёл к убыткам в сотни миллионов рублей?

01:13:46 — GUI-инструменты для агентов: как дать агенту доступ к браузеру и какие решения сейчас работают лучше всего?

01:16:08 — Межагентское взаимодействие: как агенты могут «видеть» друг друга и обмениваться данными? Стоит ли писать собственный протокол или достаточно готовых решений?

01:18:33 — Вопрос про ERC3 и агента с эволюцией — это был готовый фреймворк или самописное решение? Не пробовали использовать https://dspy.ai/?

01:20:38 — С чего начать путь в AI: с собственного железа или облака? Какие практические кейсы подойдут для дома или небольшого офиса?

01:22:56 — Всё выходит сначала для маков — доколе?! Linux всегда был «землёй обетованной» для разработчиков — что изменилось?

01:25:05 — Computer-use на практике: агент работает с сайтом по заданным сценариям, но каждый раз начинает с нуля. Как сохранять контекст и улучшать качество сценариев?

01:28:23 — Как не переизобретать колесо при создании скиллов? Миллион разработчиков уже написали базовые инструменты — как этим пользоваться?

Ребят, огромное спасибо всем, кто пришел и увидимся в новых сериях

P.S: максимальный репост приветствуется 🚀
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥76👍1081
На стриме вчера походу придумал новую профессию, твиторские уже придумали что-то такое?

А вам как?
Environment AI Engineer

Update

Ладно было

Harness Engineer
🔥45🤣24💯61🤮1
Forwarded from _rnd
↗️ Мы захватили этот канал

Раньше канал назывался red_mad_dev.

Теперь это _rnd — публичный блог практики R&D red_mad_robot.

Это рабочая площадка для инженеров и ресёрчеров. Здесь будут наши мысли, эксперименты, короткие и длинные технические разборы, ссылки на научные статьи и git-репозитории.

Про что будем писать:
• какие гипотезы тестируем и какие результаты получаем
• какие архитектурные решения принимаем и почему
• где ошибаемся и что это меняет
• как исследования превращаются в прикладной AI
• что происходит в индустрии и что об этом думаем

Если вам интересны reasoning-архитектуры, RAG-системы, агентные пайплайны, LLM-инфраструктура и реальный продакшн AI — вы в правильном месте.

Поехали ⚡️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥39🤣8🤡3👍2💊1
Media is too big
VIEW IN TELEGRAM
Shut up and take my money

Знакомьтесь

Это Helix 2 от Figure
🔥38😁141
Нейро Ковальский
Photo
Claw Claw claw 😈😈😈


Продолжаю улучшать свой picoclaw инстанс на raspberry pi4 (это такой мини пк который 5х7 см примерно) и питается от 5 вольт

Пока пушу все улучшения в свой закрытый репо но стягиваю обновления из main репо

1) Подкинул треды (скрин)
2) Сделал тулы для камер (прям полноценные тулы)
3) Разобрался с задачами передалал полностью флоу (теперь не глючит, ндеюсь)
4) Настроил LangFuse что бы видеть трейсы + вывел вызовы тулов себе в чат для отладки
5) Перешел на gpt 5.4 (разобрался как арбузить подписку (вроде разрешили делать это официально)
6) Настроил треды и стриминг (драфт метод для агентов в тг)
7) Настроил кастомных подход для proxy подписок
8) Втянул этот cli (google workspace)
нативно я ядро (https://github.com/googleworkspace/cli) очень хорошо продуман формат отдачи данных и описание cli
9) Снял все ограничения что бы gpt 5.4 могла сама себя переписывать билдить go бинарь и сама себя перезапускать (пока без смертей)


Пока топ кейсы в дроге с мобилы или в пути где-то попросить найти свободные слоты, поставить встречу добавить туда нужных людей (если кому-то я присылал красивые выгрузки по свободным часам знайте это был pico)

Второй кейс это выдача доступов на гит/гитлаб

У меня часто просят кинуть инвайт в приват репо, и тут через gh это оказалось ну очень удобно

Третий кейс это диприсерч уровня openai или claude (без впн и доступов в прилы) скачал skill (кстати он прям понимает что должен сделать минимум 10-20 поисков) и агент убежал сам его делать минут 10

Дальше хочу добавить "НОРМАЛЬНЫЙ компакшен" так как его тут нет отродясь


Что еще заметил пока копался с таким решением а то что промпт полностью динамический а агент может его менять как его душе угодно, как раз от сюда вся эта хрупкость системы и частые (он сломался и не работает как надо)
Он несет чушь и делает не то что я просил(а)

линк на темплейт промпта

Может ли тоже самое прила с клодом на мобиле?
Может

Может ли тоже само вообще другой агент?
Может

В чем тогда прикол всех этих агентных циклов запертынх в linux системах?

Интеграции отвечу я и модель потребления

Нам же уготована роль соискателей новых сценариев с LLM в таком UI формате потребления + я считаю топ что это приобрело такую массовость и снизило порог входа

Так что продолжайте эксперименты и не сдавайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍37🔥2916🤡31
Забудь про MCP и tools — конвертируй 100 000 API методов в один CLI инструмент на лету

Все сейчас пишут MCP-серверы и tools для агентов
На каждый API endpoint — отдельный tool с описанием, параметрами, схемой
10 методов? Ок
100? Уже больно
845 (GitHub API)? Удачи (да да можно делать поиск и тулов и MCP) но какой же это зоопарк и как его поддерживать?

Но так же мы поняли новый тренд это cli обертки
От сюда мы с @evilfreelancer пошли другим путём: берём любой OpenAPI spec (JSON/YAML) и конвертируем его в CLI команды на лету Без кодогенерации.
Без компиляции
Один бинарник — любое API

Что это даёт:

→ ocli search --query "create pull request" --limit 5 — BM25-поиск по 845 эндпоинтам за 7мс
→ ocli search --regex "repos.*pulls" — regex по путям, именам, описаниям
→ Несколько профилей одного API с разными наборами эндпоинтов (include/exclude)
→ Несколько API серверов в одном инструменте

Почему CLI, а не MCP tools для агентов?

100 MCP tools → ~50 000 токенов на описания в контексте
100 CLI команд → 1 tool "execute_command" + поиск нужной команды

Объективно я счита что агентов больше таскают команды вызвать, нежели разбираться с тонне контекста tools

Агент вызывает ocli search, находит нужную команду, выполняет её
Один tool_exec вместо тысяч
Контекстное окно свободно для работы, а не для описаний инструментов.

Сделал быстрый тест на реальных API:
- GitHub API — 845 endpoints, 11MB spec, JSON
- Box API — 258 endpoints, YAML

BM25 поиск — порт из Go (picoclaw) на TypeScript с Robertson IDF smoothing.

npm install -g git+https://github.com/EvilFreelancer/openapi-to-cli.git#feat/command-search

ocli profile add github

ocli search --query "upload file" --limit 5

GitHub: https://github.com/EvilFreelancer/openapi-to-cli
5🔥116👍2510🤬33🤔1
South HUB
Каждая новость на TechCrunch о GenAI обещает революцию. Но между демо на питче и production-системой, которая приносит деньги, пропасть из факапов, галлюцинаций и вопросов от CFO. Хуже, когда вопросы звучат от борда, а ответить на них некому. Как внедрять…
Собрал свой мини чемоданчик и еду на Snow BASE от South HUB буду слушать общаться и катать! 😅 (взял с собой picoclaw) буду мучать на склоне =)

Не уверен что попаду на все события из списка, но ожидаю мощнейший нетворкинг!

Так что увидимся, все кто там будет!
2🔥2775💯1
Q&A по AI тематике!

Вы задали ~5 000 вопросов! в бота @neuraldeepbot (под капотом gpt oss 120b)

А через апи вызвали функционал ~20 000 раз в🤯 vamplabai.com
И самое интересное насколько ответы вам действительно помогли

Отпишите в коменты ваш кейс использования 👇
Please open Telegram to view this post
VIEW IN TELEGRAM
112🤡5🔥1
Media is too big
VIEW IN TELEGRAM
2026 LLM moments, это когда пилишь за 3 дня по вечерам приложения за которые раньше платил, и делаешь их удобными для себя

Переписал функционал Paste (это такой расширенный буфер обмена для macos)


При нажатии cmd + shift + v открывается удобное меню с историей clipboard

SvelteKit + Vite на фронте и Tauri 2 + Rust на десктопной части (codex cli + gpt-5.4)
1😁44👍4119🔥11🤡10
Нейро Ковальский pinned «Q&A по AI тематике! Вы задали ~5 000 вопросов! в бота @neuraldeepbot (под капотом gpt oss 120b) А через апи вызвали функционал ~20 000 раз в🤯 vamplabai.com И самое интересное насколько ответы вам действительно помогли Отпишите в коменты ваш кейс использования…»
Forwarded from from:adam
Бен Томпсон сегодня выкатил статью, в которой заявляет: мы не в пузыре.

Выделяются три парадигмы LLM. ChatGPT в 2022 — демонстрация возможностей, но с галлюцинациями и требованием agency от пользователя: ты сам должен понимать, зачем тебе модель, и верифицировать каждый выход. o1 в 2024 — ризонинг-модели начали итерировать над ответом самостоятельно, надёжность выросла, нагрузка на пользователя снизилась. А дальше — агенты в конце 2025: Claude Code с Opus 4.5, GPT-5.2-Codex.

И вот тут самое интересное. Прорыв оказался не в модели. Opus 4.5 вышел в ноябре 2025, и никто не заметил. А потом изменился harness в виде обвязки Claude Code и всё заработало совсем иначе. Агент управляет моделью, дёргает детерминистические инструменты, верифицирует результат без человека. По сути, все слабости первой парадигмы закрыты. Особенно, для верифицируемых юз кейсов типа кода.

Отсюда Томпсон вытаскивает два тезиса. Первый: агенты меняют экономику agency. Раньше для роста потребления компьюта нужен был массовый адопшн — каждый пользователь должен был проявить инициативу, но теперь один человек управляет десятком агентов. Для взрывного спроса на вычисления достаточно сравнительно небольшого числа людей, которые умеют формулировать задачи.

Второй — разбор value chain. Дедью из Asymco недавно написал, что Apple гениально поставила на коммодитизацию моделей: лицензировала Gemini за $1B/год вместо того чтобы тратить $100B на свою. Появится модель лучше — просто сменит поставщика. Побеждает тот, кто владеет клиентом.

Томпсон разбивает это по парадигмам. В эпоху чатботов Дедью был прав — базовые модели быстро стали достаточно хорошими и их можно было гонять локально. Ризонинг-модели уже создали проблему: им нужен быстрый компьют и огромные контекстные окна, Apple Silicon не конкурирует с облаком, но агенты ломают коммодити-тезис окончательно. Дифференциация теперь не в модели, а в интеграции модели и harness. Это не модульные компоненты, которые можно менять по отдельности.

А прибыль в value chain всегда течёт от модульных звеньев к интегрированным. Если агенты = интеграция модель+harness, то Anthropic и OpenAI — точки интеграции, а не взаимозаменяемые API-поставщики. Microsoft тому пример: заявляли model-agnostic стратегию с Core AI, но для Copilot Cowork были вынуждены интегрироваться с конкретной моделью и продавать это в бандле E7 за $99/seat.

https://stratechery.com/2026/agents-over-bubbles/
🔥30🙉119👍4😁1🤔1
Нейро Ковальский pinned «Забудь про MCP и tools — конвертируй 100 000 API методов в один CLI инструмент на лету Все сейчас пишут MCP-серверы и tools для агентов На каждый API endpoint — отдельный tool с описанием, параметрами, схемой 10 методов? Ок 100? Уже больно 845 (GitHub API)?…»
Openapi-to-cli

Самый быстро растущий наш с Пашей проект за меньше чем 5 дней 100+ звезд

400 + Clones
2000 посещений репо


«openapi-to-cli» (ocli) — CLI-утилита на TypeScript, которая превращает любое OpenAPI/Swagger API в набор CLI-команд в рантайме, без кодогенерации. По сравнению с MCP+Search подходом, ocli даёт в 2.2 раз более компактные результаты поиска

Что интересно в части рабочих чатиков видел обсуждение и тесты тулзы (и пока только положительные впечетления)

РЕПО: https://github.com/EvilFreelancer/openapi-to-cli

СКИЛЛ для OpenClaw: https://clawhub.ai/vakovalskii/ocli-api
2🔥81👍3010🤡5💯2🦄22
Дружочки!

Не успела отгреметь наша прошлая встреча, а мы уже врываемся в эфир с новым анонсом. Очевидно, что в начале 2026 года, среди прочего, произошло кое-что значимое в разработке. Если в конце 2025 мы всё ещё морщились от слов «вайбкодинг» и «агенты», то ко второму кварталу 2026 риторика в стиле «всё херня, пишет на уровне тупого джуна» испарилась. Ну а ещё наша реплика вызвала бурный ажиотаж.

Короче, ни слова больше: 27-я офлайн-встреча сообщества #безвотэтоговотвсего будет посвящена теме «Разработка 2026: вайбкодинг, ассистенты, агенты».

Что же нас ждёт:

• Поговорим о том, что из этого уже реально работает, что там с AI SDLC/PDLC и какие кейсы видны уже сейчас.
• Разберём, как меняется роль разработчика, когда рядом появляются ассистенты и агентские сценарии. А ещё обсудим, «схлопнутся» ли все роли в одного инженера или нет.
• Посмотрим, где ассистируемая и агентская разработка ускоряют delivery и discovery, а где добавляют рисков.
• Обсудим истерию вокруг вайбкодинга, конечно же, и вот это всё: «я снова, как 20 лет назад, пишу код, пу-пу-пу».
• И многое другое.

В теме с нами будут разбираться прекрасные эксперты:

• Валерий Ковальский, Head of AI в r_m_r
• Андрей Жуков, консультант в Faust Consulting, ex-CTO RWB
• Максим Скоморохов, Platform Lead, Tutu.ru
• Евгений Финогеев, Head of AI Platform, ecom.tech

Ждём всех 28 апреля по адресу 1-й Нагатинский пр., 10, стр. 1, бизнес-центр «Ньютон Плаза», офис Tutu.ru.

Регистрируемся по ссылке, мест не много, а тема горяча и готовим вопросы)

До встречи, дружочки!
🔥186🤡1