AIGENTTO
298 subscribers
54 photos
7 videos
2 files
43 links
ИИ-агенты и RAG системы для бизнеса. Автоматизация сотрудников и процессов. Снижение ФОТ. Выявление намерений клиентов и продажи в ИИ-агентах.
Download Telegram
Улучшеная версия PocketFlow

PocketFlow генерит документацию по коду.

Сделал версию которая работает с OpenAI и YandexGPT. Работает с большими репозиториями используя пагинацию для LLM, и учитывает бизнес контекст кода из PROJECT.md, DESCRIPTION.md, README.md, ABOUT.md.

Подпишись 👉🏻 @aigentto 🤖
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Очень полезная фича 😀

Подпишись 👉🏻 @aigentto 🤖
43 дня без изменений

Вы думаете, в организации из 5000+ человек документы меняются часто? Вот RAG бот уже 3 786 530 секунд работает и ничего не менялось 😎 Либо просто новогодние праздники так себя проявили 🤷‍♂️

Подпишись 👉🏻 @aigentto 🤖
3
Почему построить фабрику для производства контента для вашего бизнеса пока не получится?

Уже есть десятки сервисов, которые генерируют видео. Для бизнеса, для контент-маркетинга, были бы полезны даже самые простые типы, например, говорящая голова. Загружаешь свою голову, и она начинает говорить. Затем просто берешь тему своего бизнеса и создаешь генератор сценариев. Затем собираешь пайплайн из генератора сценариев -> апрув -> генератор говорящей головы -> паблиш.

Магия? Но есть ньюансы. Во-первых, все эти сервисы генерируют по 2-3-5-10 минут максимум, то есть потом надо все это еще и склеивать. Допустим, эту часть еще можно автоматизировать. Но основной ньюанс - это токены или деньги. Цена за минуту от 1 до 3 долларов. То есть ролик по теме бизнеса ~30 минут. Вроде всего 30-90 долларов?

Если делать раз в неделю, как многие делают сами, то 120-360 долларов в месяц? Но зачем мне раз в неделю, если я хочу засеять YouTube своими видео, надо бы хотя бы раз в день, тогда выходит 900-2700 долларов. Уже как бы выходит на зарплату человеку, который это будет делать. Короче, пока проще раз в неделю самому писать. Ждем, пока токены подешевеют в 10 раз.

Подпишись 👉🏻 @aigentto 🤖
Почему ИИ-агенты пока не автоматизировали все процессы в компаниях?

Дело в том, что не любую задачу в компании можно выполнить сразу. Более того, большая часть задач естественным образом растягивается во времени. Для людей это не проблема: не закончил сейчас – закончу завтра или после выходных.

ИИ-агент по умолчанию должен либо выполнить задачу, либо сломаться, либо сдаться. Но это неверная парадигма. Нам нужны агенты, которые могут выполнять задачу долго.

Объясню на простом примере. Вот мне сейчас надо заполнить заявку на грант ФСИ, там 3 миллиона полей. Казалось бы, натрави LLM, и она там все заполнит, но нет. Дело в том, что часть полей пока нельзя заполнить, потому что нужны входные данные от участников проекта, надо им написать и получить от них данные. Участник может быть недоступен сейчас и ответит завтра. Затем часть полей требуют выгрузить данные из других внешних систем, которые тоже работают в режиме: заявка –> 5 дней –> исполнение.

То есть для автоматизации такой задачи агент должен делать –> ждать –> делать –> ждать и так далее, пока не будет всей информации. К сожалению, таких задач внутри компаний большинство.

То же самое с ботами: вот спросили бота, а он не знает ответа сейчас. Человек на месте бота скажет: "Я пойду, узнаю и сообщу". Бот так сделать не может, а надо, чтобы мог.

В парадигму нашего фреймворка это как раз ложится хорошо, будет рой агентов с задачей; пока все агенты не принесли в рой всю нужную информацию, задачу выполнить нельзя, и рой живет и ждет момента.

Подпишись 👉🏻 @aigentto 🤖
👍2
Мясной слой для ИИ-агентов

Пока Elon Musk ещё не продает массово своих роботов Optimus 3, появилась замена. Теперь любой ИИ-агент может арендовать человека для выполнения задач в реальном мире 😄

Как я вижу, спрос со стороны людей пока превышает количество задач со стороны ИИ.

Но реально теперь можно собирать ИИ-агентов, у которых будут задачи в реальном мире, я точно попробую прикрутить мясной слой (как его назвали сами создатели сайта) к своим экспериментам с роями агентов на Blackboard.

Бывают такие задачи, например, позвонить куда-то и узнать что-то, или даже ответить на вопрос по данным, когда LLM не смог справиться.

API тут https://rentahuman.ai/mcp. Доступные люди тут https://rentahuman.ai/browse.

Подпишись 👉🏻 @aigentto 🤖
🔥2😁1
Добавлена поддержка gitlab для генератора доки по репо 🔥

https://github.com/alx1379/pocketflow-docs

Подпишись 👉🏻 @aigentto 🤖
Как тестировать RAG?

Я много писал про то, как тестировать RAG. И даже сделал тул, который в том числе может создавать тестовые вопросы и прогонять тесты.

Но нет таких компаний, которые будут следовать вышеуказанным правилам 😄 Все подходят к вопросу в стиле: "Петрович, посмотри, че там?" 🤨

И даже если Вам выделят нанятого студента, чтобы он все хорошо потестил, вы получите падавана, которого надо учить заводить баги, потому что иначе к вам придет список из проблем типа как на скрине, и придется играть в доктора Хаоса и ставить диагноз по фотографии.

На втором скрине приложил краткие правила заведения багов на RAG систему. В таком варианте их можно воспроизвести и починить, но большая часть скорее всего отвалится по дороге.

Подпишись 👉🏻 @aigentto 🤖
Как улучшить RAG-систему без изменения кода?

В больших компаниях много документов и много людей, которые эти документы пишут. Заставить всех писать хорошо и тем более сверяться с другими документами, чтобы избежать дубликатов и противоречий, невозможно.

Поэтому самый простой способ (hack) все это пофиксить - это попросить обязательно вести всего два доп. файла:

ТЕРМИНЫ - аббревиатуры, синонимы, включая неофициальные, все, что используется в компании, про что LLM может не знать.

Например, в одной компании hrlink все называют шарлинк, вот так и написать: "шарлинк - это hrlink".


ПОДСКАЗКИ - файл с правилами интерпретации по умолчанию, когда запрос может быть неоднозначен.

Например, в компании два отдела кадров, но чаще всего имеют в виду отдел кадров головной компании, тогда напишите: "под отделом кадров по умолчанию имей в виду отдел кадров головной компании".


Это не идеальный вариант, но без изменений кода можно сильно улучшить качество ответов. 

Подпишись 👉🏻 @aigentto 🤖
Ботам тяжело в мире людей

Две крайности вопросов к RAG-боту.

Вот человек задает вопрос про ДМС, но пишет много не относящегося к делу, и семантическое сходство тает на глазах. Еще добавить предложение, как именно тебе никто ничего не рассказал, и бот совсем не поймет, про что вопрос 😄

Второй хочет узнать, где в компании поиграть в футбол, но он очень краток 😄

Бот справляется, но еще чуть-чуть, и он не поймет, о чем, блин, речь-то?

Подпишись 👉🏻 @aigentto 🤖
Красивые инструменты не работают

Например, https://github.com/VectifyAI/PageIndex, хорошая идея построить дерево по оглавлению документов PDF. Лучше, чем LangGraph, потому что использует LLM для классификации и создания дерева. 

Но в реальной жизни лучше работает простой семантический поиск через все чанки. Потому что в реальном мире реальных компаний документы всегда плохо структурированы, если это PDF, то он отсканировано-пиксельный, там часто нет никакого оглавления. Сами документы дублируются, и кусочек информации там, а кусочек тут.

И самое главное, сама идея, что все знания можно расположить в виде огромного четкого структурированного дерева очень симпатизирует разработчикам, но в реальности это невозможно. Никакие живые знания так не расположишь, либо нужно нанимать целый отдел, который будет этот бюрократический формат блюсти.

У меня была попытка сделать это по уже структурированной Wiki в одной очень дисциплинированной компании, полностью проявилась, а сработало, например, залить все, что каждый отдел говорил в чатах за последние 10 лет в свою коллекцию знаний и сделать простой роутинг между этими коллекциями.

Подпишись 👉🏻 @aigentto 🤖
AIGENTTO
Слабое звено системы ИИ-агентов — это люди Часто ИИ-агентам нужны знания из RAG-систем или через MCP-сервер. Знания нужны, относящиеся к конкретной компании. Материалы должны добавлять люди. Они их не добавляют по разным причинам — заняты, надо согласовать…
Ментальный прорыв в проблеме полного доступа для агентов

Итак, все уже слышали, что вышел OpenClaw, и спасибо Питеру за наше счастливое будущее, произошел прорыв в решении ментальной проблемы - дать агентам полный, мать его, доступ. Питер собрал все из того, что уже было, и о чудо, оно может делать все (в том числе слить все ваши данные 🤨). 

Но ключевое - это то, что ментальный барьер пройден, люди реально ставят это даже на свои компьютеры, в том числе на рабочие (конечно, беря титанические риски). А всего-то надо было дать агентам exec (то есть способность запускать все, что угодно)

Мир уже не будет прежним, много людей пострадают, но зато дальше будет сильно лучше.

Это то же самое, что выпустить на улицы больших городов 100k машин с автопилотом 😎 Будут сложности, но потом мы уже не сможем без них жить 🎮

Я буду мержить свой Blackboard с OpenClaw и внедрять этих монстров везде, где только можно (конечно, максимально зажимая им тестикулы 😄)

Подпишись 👉🏻 @aigentto 🤖
👍3🍌1
This media is not supported in your browser
VIEW IN TELEGRAM
Благодаря вайбкодингу, каждый может сделать софт под себя
👏2
Проверил множество реализаций OpenClaw

Выводы:

👉 OpenClaw на Node.js (оригинальный) — сложный в установке, глючный и жрёт от 1 GB RAM на агента с browsing.

👉 Из Python-версий — всё полная чушь, кроме nanobot. Очень хорош, быстр и всего 4000 строк кода — всё как мы любим. Но нет multi-agent/multi-adapter из коробки. Можно дописать. Есть browsing через MCP playwright.

👉 Rust/Go-версии — тут можно найти то, что будет ранитьcя на < 10 MB (без browsing), то есть на смартфоне вашей бабули.

Написал свою версию https://github.com/alx1379/SmallClaw — без daemon, без адаптеров, только CLI, чтобы поиграться с концепцией.

Для себя я поставил nanobot. Для сервера рассмотрел бы Rust/Go-версии 😎

Подпишись 👉🏻 @aigentto 🤖