Слишком мало vs слишком много: дилемма Agentic AI
В Replit в 2025 году агент получил полный доступ к продакшн‑данным и удалил записи о 1 200 компаниях. Проблема была не в интеллекте модели, а в том, кто дал ей ключи.
В страховой компании агенту разрешили только наблюдать: анализировал данные, но не мог действовать. Результат — проект свернули, скорость осталась прежней, сотрудники считали его лишней нагрузкой.
И вот парадокс: на самом деле для развития Agentic AI опаснее недостаток автономии. Агент без прав превращается в дорогую имитацию автоматизации, которая ничего не меняет.
Это как выпускать машины на автопилоте на дороги общего пользования. Да, они кого‑то могут «сбить», но люди сами совершают сотни смертельных ошибок ежедневно. Честнее будет смотреть на общую статистику пользы и вреда, а не горевать над конкретным кейсом.
И да, Replit свои данные восстановил из бэкапа — так что не стоит паниковать.
Подпишись 👉🏻 @aigentto 🤖
В Replit в 2025 году агент получил полный доступ к продакшн‑данным и удалил записи о 1 200 компаниях. Проблема была не в интеллекте модели, а в том, кто дал ей ключи.
В страховой компании агенту разрешили только наблюдать: анализировал данные, но не мог действовать. Результат — проект свернули, скорость осталась прежней, сотрудники считали его лишней нагрузкой.
И вот парадокс: на самом деле для развития Agentic AI опаснее недостаток автономии. Агент без прав превращается в дорогую имитацию автоматизации, которая ничего не меняет.
Это как выпускать машины на автопилоте на дороги общего пользования. Да, они кого‑то могут «сбить», но люди сами совершают сотни смертельных ошибок ежедневно. Честнее будет смотреть на общую статистику пользы и вреда, а не горевать над конкретным кейсом.
И да, Replit свои данные восстановил из бэкапа — так что не стоит паниковать.
Подпишись 👉🏻 @aigentto 🤖
Мы теституем наш рой агентов Content Factory для написания постов. Один из двух постов выше написан этим роем.
Определите какой?
Определите какой?
Anonymous Poll
22%
Люди сдаются перед Agentic AI
78%
Слишком мало vs слишком много: дилемма Agentic AI
GPT-5 для RAG не подходит
Главный нюанс — экономика и архитектура.
GPT-5 дешевле только по входным токенам, но у нас вход обычно — это 3–5 слов. Экономия там — микроскопическая. Зато выходные токены стоят одинаково, а именно за них мы и платим больше всего. Короче, никакой выгоды.
Вторая проблема — семантическое кэширование.
Мы уже внедряли своё — отключили, потому что похожие вопросы давали одинаковые и неверные ответы. GPT-5 делает примерно то же самое, только встроенно и без кнопки «выключить». Для RAG это прям больно: ответы становятся непредсказуемыми.
И ещё — GPT-5 умнее, да. Но в RAG «умнее» не значит лучше. Нам не нужно, чтобы модель строила логические цепочки и додумывала за пользователя. Нам нужно, чтобы она просто читала наш контекст и не фантазировала. GPT-4o делает это стабильнее.
По факту:
Переход на GPT-5 для RAG — это больше рисков, ноль экономии и никакой пользы.
Пока GPT-4o остаётся лучшим вариантом.
Подпишись 👉🏻 @aigentto 🤖
Главный нюанс — экономика и архитектура.
GPT-5 дешевле только по входным токенам, но у нас вход обычно — это 3–5 слов. Экономия там — микроскопическая. Зато выходные токены стоят одинаково, а именно за них мы и платим больше всего. Короче, никакой выгоды.
Вторая проблема — семантическое кэширование.
Мы уже внедряли своё — отключили, потому что похожие вопросы давали одинаковые и неверные ответы. GPT-5 делает примерно то же самое, только встроенно и без кнопки «выключить». Для RAG это прям больно: ответы становятся непредсказуемыми.
И ещё — GPT-5 умнее, да. Но в RAG «умнее» не значит лучше. Нам не нужно, чтобы модель строила логические цепочки и додумывала за пользователя. Нам нужно, чтобы она просто читала наш контекст и не фантазировала. GPT-4o делает это стабильнее.
По факту:
Переход на GPT-5 для RAG — это больше рисков, ноль экономии и никакой пользы.
Пока GPT-4o остаётся лучшим вариантом.
Подпишись 👉🏻 @aigentto 🤖
👍4👌2
Мессенжеры и Zoom'ы будущего
Я уже писал про способность LLM извлекать не только смысл, но и эмоции из текста.
Это почти никем сейчас не используется, но, делая эмоциональный анализ, например переписок, мы можем предсказать увольнение сотрудника, увидеть конфликт между сотрудниками или даже определить и предсказать депрессию у человека, а может, и предотвратить самоубийство.
Такие инструменты точно будут внедряться, при этом для анализа нам зачастую не нужен полный текст, а только EQ-обертки из текста, то есть LLM даже может не знать, про что была переписка для такого анализа - не раскрывается тайна переписки.
Но самое крутое, что появятся мессенджеры и Zoom-встречи, которые будут переводить текст или даже видео из одной эмоции в другую, например, подстраиваясь под собеседника. То есть сообщение могло быть с одной эмоцией, а до собеседника дойдет с тем же смыслом, но с другой эмоцией, чтобы лучше донести мысль.
Подпишись 👉🏻 @aigentto 🤖
Я уже писал про способность LLM извлекать не только смысл, но и эмоции из текста.
Это почти никем сейчас не используется, но, делая эмоциональный анализ, например переписок, мы можем предсказать увольнение сотрудника, увидеть конфликт между сотрудниками или даже определить и предсказать депрессию у человека, а может, и предотвратить самоубийство.
Такие инструменты точно будут внедряться, при этом для анализа нам зачастую не нужен полный текст, а только EQ-обертки из текста, то есть LLM даже может не знать, про что была переписка для такого анализа - не раскрывается тайна переписки.
Но самое крутое, что появятся мессенджеры и Zoom-встречи, которые будут переводить текст или даже видео из одной эмоции в другую, например, подстраиваясь под собеседника. То есть сообщение могло быть с одной эмоцией, а до собеседника дойдет с тем же смыслом, но с другой эмоцией, чтобы лучше донести мысль.
Подпишись 👉🏻 @aigentto 🤖
Telegram
AIGENTTO
Промт для извлечения эмоций
Недавно писал про то, как мало фактов в чатах и как много там эмоций.
Вот полезный промт для извлечения эмоций и тем из чатов:
Ты — аналитик по эмоциям и темам чатов.
Я передам тебе переписку, а твоя задача:
1. Для каждого…
Недавно писал про то, как мало фактов в чатах и как много там эмоций.
Вот полезный промт для извлечения эмоций и тем из чатов:
Ты — аналитик по эмоциям и темам чатов.
Я передам тебе переписку, а твоя задача:
1. Для каждого…
🔥3
ИИ-агенты в медицине
Не секрет, что chatGPT уже ставит диагнозы в 4–5 раз точнее при наличии всех анализов, чем средний доктор "по больнице".
Я сам уже 2+ года веду чат по моим медицинским вопросам с chatGPT — он помнит мои предыдущие анализы, уже реально всё про меня знает и быстро и точно отвечает.
И главное, у него не 12 минут на меня выделено, поэтому отвечает очень подробно, объясняя все связи и зависимости.
На картинке — те компании, которые уже делают ИИ-агентов для медицины. Ниже — то, что они делают.
Но догадайтесь, какую проблему пациента и врача эти компании не решают?
И почему я и ещё ~100 млн пациентов и врачей идут за этим в chatGPT?
Пишите ваши версии в комментариях 🙏
Подпишись 👉🏻 @aigentto 🤖
Не секрет, что chatGPT уже ставит диагнозы в 4–5 раз точнее при наличии всех анализов, чем средний доктор "по больнице".
Я сам уже 2+ года веду чат по моим медицинским вопросам с chatGPT — он помнит мои предыдущие анализы, уже реально всё про меня знает и быстро и точно отвечает.
И главное, у него не 12 минут на меня выделено, поэтому отвечает очень подробно, объясняя все связи и зависимости.
На картинке — те компании, которые уже делают ИИ-агентов для медицины. Ниже — то, что они делают.
Но догадайтесь, какую проблему пациента и врача эти компании не решают?
И почему я и ещё ~100 млн пациентов и врачей идут за этим в chatGPT?
Пишите ваши версии в комментариях 🙏
Подпишись 👉🏻 @aigentto 🤖
Что делают ИИ-агенты в медицине:
1️⃣ Клинические ассистенты для врачей (Nabla, Hippocratic AI, Freed, Hyro, Notable, Artisight, Corti)
Делают AI-ассистентов для врачей: транскрипции, подготовку записей, подсказки во время приёма — но не работают с полным анамнезом пациента.
2️⃣ Платформы объединения клинических данных (Innovaccer, Meld, Qventus, RhythmX, Infinutus)
Интегрируют данные разных больниц в одну систему — но это B2B решения, которые не дают пациенту собственное медицинское хранилище.
3️⃣ AI для страхования и биллинга (RapidClaims, Prosper, Amperes, Autonomize)
Оптимизируют страховые выплаты и кодирование процедур — никакого отношения к персональным медицинским данным пациента.
4️⃣ Lifestyle/health monitoring & mental health (Ellipsis, Livmor, Lila, Charta, Tala)
Отслеживают состояние, сон, психику, риски — но не собирают «полную медицинскую историю жизни».
5️⃣ Биотех и медицинские R&D-платформы (Synthpop, AlaffiaHealth, Maverick)
Используют ML для исследований и разработки лекарств — другая индустрия, не связанная с пациентскими данными.
Подпишись 👉🏻 @aigentto 🤖
1️⃣ Клинические ассистенты для врачей (Nabla, Hippocratic AI, Freed, Hyro, Notable, Artisight, Corti)
Делают AI-ассистентов для врачей: транскрипции, подготовку записей, подсказки во время приёма — но не работают с полным анамнезом пациента.
2️⃣ Платформы объединения клинических данных (Innovaccer, Meld, Qventus, RhythmX, Infinutus)
Интегрируют данные разных больниц в одну систему — но это B2B решения, которые не дают пациенту собственное медицинское хранилище.
3️⃣ AI для страхования и биллинга (RapidClaims, Prosper, Amperes, Autonomize)
Оптимизируют страховые выплаты и кодирование процедур — никакого отношения к персональным медицинским данным пациента.
4️⃣ Lifestyle/health monitoring & mental health (Ellipsis, Livmor, Lila, Charta, Tala)
Отслеживают состояние, сон, психику, риски — но не собирают «полную медицинскую историю жизни».
5️⃣ Биотех и медицинские R&D-платформы (Synthpop, AlaffiaHealth, Maverick)
Используют ML для исследований и разработки лекарств — другая индустрия, не связанная с пациентскими данными.
Подпишись 👉🏻 @aigentto 🤖
Из FB Little Red Book...
💡 Думай неправильно. Всегда есть решение. Обычно даже несколько. Если то, что ты делаешь, не работает, попробуй взглянуть на проблему иначе.
❔Может, ты слишком умён. Думай как идиот.
🤔 Может, ты слишком всё усложняешь. Думай проще.
👉 Забудь о том, как делать правильно. Делай то, что работает. Попробуй что-то новое. Затем попробуй что-то ещё.
С наступающим 🎄 @aigentto 🤖
💡 Думай неправильно. Всегда есть решение. Обычно даже несколько. Если то, что ты делаешь, не работает, попробуй взглянуть на проблему иначе.
❔Может, ты слишком умён. Думай как идиот.
🤔 Может, ты слишком всё усложняешь. Думай проще.
👉 Забудь о том, как делать правильно. Делай то, что работает. Попробуй что-то новое. Затем попробуй что-то ещё.
С наступающим 🎄 @aigentto 🤖
🔥2
BEAR.png
53.4 KB
Важные доки по адаптации сотрудников
Вот это я понимаю важные документы по адаптации сотрудников 😀
Подпишись 🎁 @aigentto 🤖
Вот это я понимаю важные документы по адаптации сотрудников 😀
Подпишись 🎁 @aigentto 🤖
💯2
Создал свой reddit, там будут посты на английском по той же теме. Но будет больше специфики мировой и многие темы будут выходить раньше, чем тут 😎
Подключайтесь 👉 https://www.reddit.com/r/AIGENTTO/ 🤖
Подключайтесь 👉 https://www.reddit.com/r/AIGENTTO/ 🤖
Reddit
r/AIGENTTO
Agentic AI topics. Post about your experience with agentic AI. Complex agentic systems. Agentic AI frameworks. This includes complex RAG deployments with agents.
Отказ в гранте ФСИ
То, что мы сейчас делаем, — это в чистом виде НИОКР. Мы разрабатываем новый подход в Agentic AI — работу роев агентов без оркестрации и качественное извлечение знаний из источников.
Для решения второй проблемы были созданы ChunkTester (подбор чанкования для RAG и авто-тестирование RAG систем) и Clusteroid (поиск кластеров знаний в разрозненных документах компаний).
С этими темами мы и подавались на грант, НО когда спустя 4 месяца дело дошло до защиты - это уже было сделано 🤷
И мы пошли дальше в следующий качественный скачок по извлечению знаний и в разработку фреймворков для роевых интеллектов. И тему на защите поменяли.
И не смотря на то что мы такие молодцы сделали за 4 месяца то про что говорили в заявке, предложить продолжение темы было ошибкой.
Надо понимать что грант выдает государство, плюс в том что это бесплатные инвестиции, минус в том что к этому подходить надо как к сдаче реферата или диплома - выбрал тему будь любезен напиши X страниц по выбранной теме.
Ошибка полностью моя - я думал мое глубокое знание вопроса и харизма убедит борду защиты, НО тема формально другая = отказ 😎
В следующий раз будем умнее 🧠 А пока продолжаем разрабокту на свои 💵
Подпишись 👉🏻 @aigentto 🤖
То, что мы сейчас делаем, — это в чистом виде НИОКР. Мы разрабатываем новый подход в Agentic AI — работу роев агентов без оркестрации и качественное извлечение знаний из источников.
Для решения второй проблемы были созданы ChunkTester (подбор чанкования для RAG и авто-тестирование RAG систем) и Clusteroid (поиск кластеров знаний в разрозненных документах компаний).
С этими темами мы и подавались на грант, НО когда спустя 4 месяца дело дошло до защиты - это уже было сделано 🤷
И мы пошли дальше в следующий качественный скачок по извлечению знаний и в разработку фреймворков для роевых интеллектов. И тему на защите поменяли.
И не смотря на то что мы такие молодцы сделали за 4 месяца то про что говорили в заявке, предложить продолжение темы было ошибкой.
Надо понимать что грант выдает государство, плюс в том что это бесплатные инвестиции, минус в том что к этому подходить надо как к сдаче реферата или диплома - выбрал тему будь любезен напиши X страниц по выбранной теме.
Ошибка полностью моя - я думал мое глубокое знание вопроса и харизма убедит борду защиты, НО тема формально другая = отказ 😎
В следующий раз будем умнее 🧠 А пока продолжаем разрабокту на свои 💵
Подпишись 👉🏻 @aigentto 🤖
GitHub
GitHub - alx1379/ChunkTester: RAG ChunkTester is a framework for automated testing of Retrieval-Augmented Generation (RAG) systems.
RAG ChunkTester is a framework for automated testing of Retrieval-Augmented Generation (RAG) systems. - alx1379/ChunkTester
❤4👍3
Генеративные сети слишком оптимистичны
Ещё один большой косяк всех LLM — это их попытка генерировать ответ на любой запрос. Например, ведём разговор с LLM об автомобилях, и тут случайно копируем туда что-то про совсем другую тему. Оно начинает отвечать, пытаясь притянуть нерелевантный запрос за уши.
А по сути, просто должна спросить — ЧЕ? 🤨
Подпишись 👉🏻 @aigentto 🤖
Ещё один большой косяк всех LLM — это их попытка генерировать ответ на любой запрос. Например, ведём разговор с LLM об автомобилях, и тут случайно копируем туда что-то про совсем другую тему. Оно начинает отвечать, пытаясь притянуть нерелевантный запрос за уши.
А по сути, просто должна спросить — ЧЕ? 🤨
Подпишись 👉🏻 @aigentto 🤖
💯8
Как работает наш новый протокол BlackBoard для Agentic AI?
Для простоты добавлены два rag-agent (один по адаптации сотрудников, другой по юридическим вопросам). Агент user-agent читает все ответы агентов и составляет ответ для пользователя. Это позволяет избежать стадии роутинга (нет задержки) и получить информацию от всех вовлечённых агентов.
Подпишись 👉🏻 @aigentto 🤖
Для простоты добавлены два rag-agent (один по адаптации сотрудников, другой по юридическим вопросам). Агент user-agent читает все ответы агентов и составляет ответ для пользователя. Это позволяет избежать стадии роутинга (нет задержки) и получить информацию от всех вовлечённых агентов.
Подпишись 👉🏻 @aigentto 🤖
Можно включить режим принятия решения агентами в нашем протоколе BlackBoard
Несмотря на то, что агенты хорошо справляются с шумом на BlackBoard и способны фильтровать то, что относится именно к ним, бывает полезно заставить агентов думать прежде, чем отвечать. Для этого включаем режим принятия решения на основании контекста переписки о том, участвовать или нет. Как видим, adaptation-agent понял, что вопрос к его теме не относится, и не стал засорять эфир.
Подпишись 👉🏻 @aigentto 🤖
Несмотря на то, что агенты хорошо справляются с шумом на BlackBoard и способны фильтровать то, что относится именно к ним, бывает полезно заставить агентов думать прежде, чем отвечать. Для этого включаем режим принятия решения на основании контекста переписки о том, участвовать или нет. Как видим, adaptation-agent понял, что вопрос к его теме не относится, и не стал засорять эфир.
Подпишись 👉🏻 @aigentto 🤖
👍2
Другой агент уже работает над задачей
Переводим наш Blackboard-механизм для общения агентов на параллельный запуск всех агентов 😱
Я думал, всё сломается, но стало даже лучше — вот агент понял, что другой агент уже работает над задачей и принял решение не участвовать 🔥
Перспектива масштабирования нашего подхода становится ещё лучше 🚀
Подпишись 👉🏻 @aigentto 🤖
Переводим наш Blackboard-механизм для общения агентов на параллельный запуск всех агентов 😱
Я думал, всё сломается, но стало даже лучше — вот агент понял, что другой агент уже работает над задачей и принял решение не участвовать 🔥
Перспектива масштабирования нашего подхода становится ещё лучше 🚀
Подпишись 👉🏻 @aigentto 🤖
Агенты сами просят других агентов помочь, если нужно
Здесь три агента — один пишет статью по теме, другой редактирует согласно политикам редакции, третий проверяет грамматику. Никто не объединял этих агентов в цепочку, они просто сами просят друг друга помочь.
Подпишись 👉🏻 @aigentto 🤖
Здесь три агента — один пишет статью по теме, другой редактирует согласно политикам редакции, третий проверяет грамматику. Никто не объединял этих агентов в цепочку, они просто сами просят друг друга помочь.
Подпишись 👉🏻 @aigentto 🤖