Нейро Ковальский
13.8K subscribers
475 photos
81 videos
5 files
393 links
Head of AI Engineer
From IT Admin to Head of AI in 5 years

Applied AI Engineer
B2C RAG (2M+ books)
B2B RAG platform (10+ implementations)
B2C gptdaisy.com (100k MAU)

github.com/vakovalskii | chat @neuraldeepchat

To infinity... and beyond!
Download Telegram
Нейро Ковальский
PicoClaw и 3 часа настройки? На малине =) Понятно почему в целом все ломаются на кастомную настройки в РФ и в целом не хотят юзать ничего кроме ориг openclaw решений Что бы подрубить любую(заблоканную по IP) подписку нужен впн прям на устройство но вы с…
Как и говорил на стриме самая важная часть что бы у агента были логи, дописал для PicoClaw трейсы ReAct лупа в Langfuse кстати все с телефона навайбил через RustDesk


Теперь легко можно будет задавать вопросы по агентному циклу и не гадать что да как, тоже не видел что бы хоть один блогер настроил логи и трейсинг для своего openclaw
3🔥3712
Нейро Ковальский
Как и говорил на стриме самая важная часть что бы у агента были логи, дописал для PicoClaw трейсы ReAct лупа в Langfuse кстати все с телефона навайбил через RustDesk Теперь легко можно будет задавать вопросы по агентному циклу и не гадать что да как, тоже…
PicoClaw + домашние камеры + raspberry

Давно хотел сделать возможность спрашивать и управлять камерами через бота, наконец-то дошли руки реализовать и основа есть хорошая уже.

Я давно закупался для дома внутри и с наружи камерами Tapo мне понравилось что они легко управляются по onvif и можно стащить rtsp поток в два клика настроек (т.е нет вендерлока на их приложение)


Написал тул для picoclaw который забирает фотки через ffmpeg на raspberry(она как мини сервер лежит всегда в домашней сети) все на борту малины она подключается к камерам может ими крутить(через onvif) и анализировать фотки

Анализ фото делает мой локальный qwen3.5

За агентный цикл посадил gpt 5.4

Допиливаю решение через Claude Code

Если ваши камеры поддерживают такие настройки вы легко можете проделать это сами

Далее хочу на камеру на ворота повесить распознание номеров через облако и триггер в малину если я приехал дальше у меня есть контроллер ворот, в общем забуду про ключик от ворот, надеюсь, плюс уехав от дома если я был на звонке я вечно забывал закрыл ли я ворота и если забыл приходилось дергать жену, контроллер не дает обратной связи и лезть в приложение камеры за рулем такое себе удовольствие(масса сценариев еще точно)

В общем я развлекался как мог в этот один выходной =)


Как все настрою сниму видос как забегаю во двор с табличкой своего номера на шее =))) С рулем от камаза)
🔥4917😁13👍8👀3
Media is too big
VIEW IN TELEGRAM
Вышел наш первый комьюнити-стрим!

Полтора часа отвечали на вопросы подписчиков про агентов и другие аспекты из мира AI.

Например в тизере - лишь часть ответа на вопрос про работу OpenClaw на разных моделях.

📹 https://youtu.be/jL6lXttUCPM

Для вас отгружали базу Алексей Остриков и Валера Ковальский, а также огромное спасибо Гене Евстратову и Сергею Шиме за помощь с вопросами. У Сергея кстати классный канал @aimastersme, все подпишитесь.

Смотреть обязательно целиком и не торопясь, получилось просто потрясно.

00:00 — Приветствие!

02:52 — Корпоративный RAG: избыточен или нет? Как понять по объёму данных, стоит ли поднимать RAG или можно обойтись более простыми решениями?

06:56 — OpenClaw — можно ли запустить на локальных моделях и стоит ли покупать для него Mac Studio за 300к? (Мам, это для учёбы!)

14:42 — Будем ли мы продолжать использовать разные фреймворки для агентов или возьмём Claude Code за основу и будем расширять его скиллами и своим контекстом?

21:21 — Как подбирать агентские фреймворки под разные задачи? Корпоративный deep research, разработка кода — и как выбирать инструменты в целом.

25:08 — Попробовал OpenClaw — не зашло из-за сложности, решил написать своего ассистента на Codex CLI. Чему уделить внимание в первую очередь, чтобы он был стабильным?

31:49 — Как выстроить пайплайн для агентов, чтобы они имели полный контекст и могли разобраться в задаче? Есть ли какая-то статья, которую можно дать агенту как основу?

38:33 — OSS-модели на 120B, которые влезут в DGX Spark, или другие локальные модели — есть ли у них перспективы? И отдельно: проблема потребления токенов в OpenClaw — какие есть варианты подписки?

47:06 — Фитнес-домен, классификация видео. Нужно классифицировать около 1000 видео. Как решить вопрос кеширования, чтобы снизить стоимость классификации?

54:47 — Какие задачи из мира LLM можно решать локально на MacBook'ах, помимо транскрибации и шумоподавления? Особенно в преддверии выхода следующих поколений чипов.

01:00:38 — Память: RAG даёт слишком много шума. Что сейчас считается SOTA в части памяти для агентов? И бонус-вопрос: если оставить только одну подписку — какую выбрать?

01:06:57 — Насколько мы готовы передавать разработку кодовым агентам? Должны ли люди контролировать каждую строку кода — особенно с учётом кейса, когда вайбкодинг привёл к убыткам в сотни миллионов рублей?

01:13:46 — GUI-инструменты для агентов: как дать агенту доступ к браузеру и какие решения сейчас работают лучше всего?

01:16:08 — Межагентское взаимодействие: как агенты могут «видеть» друг друга и обмениваться данными? Стоит ли писать собственный протокол или достаточно готовых решений?

01:18:33 — Вопрос про ERC3 и агента с эволюцией — это был готовый фреймворк или самописное решение? Не пробовали использовать https://dspy.ai/?

01:20:38 — С чего начать путь в AI: с собственного железа или облака? Какие практические кейсы подойдут для дома или небольшого офиса?

01:22:56 — Всё выходит сначала для маков — доколе?! Linux всегда был «землёй обетованной» для разработчиков — что изменилось?

01:25:05 — Computer-use на практике: агент работает с сайтом по заданным сценариям, но каждый раз начинает с нуля. Как сохранять контекст и улучшать качество сценариев?

01:28:23 — Как не переизобретать колесо при создании скиллов? Миллион разработчиков уже написали базовые инструменты — как этим пользоваться?

Ребят, огромное спасибо всем, кто пришел и увидимся в новых сериях

P.S: максимальный репост приветствуется 🚀
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥66👍73
На стриме вчера походу придумал новую профессию, твиторские уже придумали что-то такое?

А вам как?
Environment AI Engineer

Update

Ладно было

Harness Engineer
🔥39🤣22💯41🤮1
Forwarded from _rnd
↗️ Мы захватили этот канал

Раньше канал назывался red_mad_dev.

Теперь это _rnd — публичный блог практики R&D red_mad_robot.

Это рабочая площадка для инженеров и ресёрчеров. Здесь будут наши мысли, эксперименты, короткие и длинные технические разборы, ссылки на научные статьи и git-репозитории.

Про что будем писать:
• какие гипотезы тестируем и какие результаты получаем
• какие архитектурные решения принимаем и почему
• где ошибаемся и что это меняет
• как исследования превращаются в прикладной AI
• что происходит в индустрии и что об этом думаем

Если вам интересны reasoning-архитектуры, RAG-системы, агентные пайплайны, LLM-инфраструктура и реальный продакшн AI — вы в правильном месте.

Поехали ⚡️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥34🤣8🤡3👍1💊1
Media is too big
VIEW IN TELEGRAM
Shut up and take my money

Знакомьтесь

Это Helix 2 от Figure
🔥33😁12
Нейро Ковальский
Photo
Claw Claw claw 😈😈😈


Продолжаю улучшать свой picoclaw инстанс на raspberry pi4 (это такой мини пк который 5х7 см примерно) и питается от 5 вольт

Пока пушу все улучшения в свой закрытый репо но стягиваю обновления из main репо

1) Подкинул треды (скрин)
2) Сделал тулы для камер (прям полноценные тулы)
3) Разобрался с задачами передалал полностью флоу (теперь не глючит, ндеюсь)
4) Настроил LangFuse что бы видеть трейсы + вывел вызовы тулов себе в чат для отладки
5) Перешел на gpt 5.4 (разобрался как арбузить подписку (вроде разрешили делать это официально)
6) Настроил треды и стриминг (драфт метод для агентов в тг)
7) Настроил кастомных подход для proxy подписок
8) Втянул этот cli (google workspace)
нативно я ядро (https://github.com/googleworkspace/cli) очень хорошо продуман формат отдачи данных и описание cli
9) Снял все ограничения что бы gpt 5.4 могла сама себя переписывать билдить go бинарь и сама себя перезапускать (пока без смертей)


Пока топ кейсы в дроге с мобилы или в пути где-то попросить найти свободные слоты, поставить встречу добавить туда нужных людей (если кому-то я присылал красивые выгрузки по свободным часам знайте это был pico)

Второй кейс это выдача доступов на гит/гитлаб

У меня часто просят кинуть инвайт в приват репо, и тут через gh это оказалось ну очень удобно

Третий кейс это диприсерч уровня openai или claude (без впн и доступов в прилы) скачал skill (кстати он прям понимает что должен сделать минимум 10-20 поисков) и агент убежал сам его делать минут 10

Дальше хочу добавить "НОРМАЛЬНЫЙ компакшен" так как его тут нет отродясь


Что еще заметил пока копался с таким решением а то что промпт полностью динамический а агент может его менять как его душе угодно, как раз от сюда вся эта хрупкость системы и частые (он сломался и не работает как надо)
Он несет чушь и делает не то что я просил(а)

линк на темплейт промпта

Может ли тоже самое прила с клодом на мобиле?
Может

Может ли тоже само вообще другой агент?
Может

В чем тогда прикол всех этих агентных циклов запертынх в linux системах?

Интеграции отвечу я и модель потребления

Нам же уготована роль соискателей новых сценариев с LLM в таком UI формате потребления + я считаю топ что это приобрело такую массовость и снизило порог входа

Так что продолжайте эксперименты и не сдавайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍16🔥123🤡21