Заместители
1.04K subscribers
87 photos
77 videos
4 files
110 links
Цех ИИ агентов. Здесь я тестирую цифровых заместителей в разных профессиях. Если агент справляется — он остаётся в Цехе на “постоянку”. По пути обсуждаем актуальные новости про ИИ агентов простым языком.
Добро пожаловать в эру замещения.
Download Telegram
👨‍🍳 Я протестировал 10 сервисов, которые обещают автоматически сгенерировать сайт по запросу, и вот что получилось...

Представим: к нам пришёл владелец уютной булочной “Bread & Bloom”. Нужно сайт за 10 минут, без ковыряний в редакторе, сразу с корзиной, кнопками “Сделать заказ” и “Связаться с нами”, да ещё и чтобы всё было по-русски и визуально “вкусно”.

📜 Промпт придумали вместе с ChatGPT:
Create a modern, mobile-friendly one-page website in Russian language for a local artisan bakery called “Bread & Bloom”.

The design should be warm, cozy, and rustic — with pastel colors, hand-drawn illustrations, and high-quality photos of fresh baked goods.
Website sections:
• Welcome Header: with logo and tagline: “Свежая выпечка — каждый день с любовью”
• About Us: a short story of the bakery’s origins, focus on homemade recipes and local ingredients
• Menu: showcase bestsellers like sourdough, cinnamon buns, croissants — include item photos, descriptions, and prices
• Online Ordering: allow users to select items, choose quantity, add contact details and send orders directly (via email or Telegram/WhatsApp)
• Working Hours & Address: with map integration (Google or Yandex Maps)
• Contact Form: for custom requests or questions
• Social Media: icons and links to Instagram, VK, Telegram channel

Include clear call-to-action buttons like “Сделать заказ”, “Посетить нас”, and “Связаться с нами”.

The site must be fully responsive and optimized for fast loading. Keep all UI texts in Russian.


А вот что получилось 👇



🏆 Призеры нашей кондитерской гонки:

1. base44.com — 10/10 (первое видео)

Весь функционал работает. Интерактивная корзина, смог вставить интерактивную яндекс карту и украсить все это кастомным логотипом и красивыми анимациями! Интерфейс продуманный.
Для сгенерировнного сайта - сложно придраться. Разве что модель оплаты через закупку токенов - поди разберись, сколько их нужно.
⚖️ Итог: Из существующего на рынке - пожалуй это наш выбор 🍰

2. Replit.com — 8/10 (второе видео)

Интерактивная корзина, заказ можно кинуть в Telegram или WhatsApp, почти всё с первого раза работает, да еще и смог вставить интерактивную яндекс карту! Также понятная тарифная модель - сразу пишет, сколько центов израсходовано.
Визуал — на троечку, дизайн "пластиковый".
⚖️ Итог: Почти дотягивает до топчика.

3. Lovable.dev — 7/10 (третье видео)

Сделал почти все то же, что и Replit.
Яндекс карту не смог воткнуть с трёх заходов. Опять модель оплаты через закупку токенов. Все тот же «дизайн без души».
⚖️ Итог: справился хорошо, но косячки по мелочи немного отталкивают.


🥉 Вкус был, но не дожарилось:

4. Manus.im — 5/10 (четвертое видео). Наш любимый мультиагент. Сделал, но не полнофункционально. Видно, что не его профиль.
5. 10web.io — 5/10 (пятое видео). Работает на WordPress (да-да, кто-то им еще пользуется), промпт не влез, половина не работает. С русским языком порой проблемы. Но зато существенно красивее, чем у всех предыдущих. В общем, достойный наследник WordPress -> красиво, но туповато.


🪦 Сервисы, с которыми не срослось:

6. Builder.io — ошибка на старте. Не шмогла...
7. Durable.co — не дают вставить полноценный промпт, и соответсвенно такой же результат...
8. v0.dev — пока слабее Lovable и Replit, хотя идёт тем же путём. Смотреть пока не на что.
9. Framer.com — Дальше каркаса сайта не пошел.
10. TeleportHQ — только для дизайнов, не сайты.
11. Mixo.io — попытка по-новому взглянуть на создание сайтов, но как будто ребята сами заблудились - да и описать результат сложно. Функционал создания сильно урезан, а то что осталось - не понятно что генерит. В общем, не тратьте время.



🇷🇺 В России большинство сервисов работает без всяких VPN. Однако оплатить российскими картами не получится.

Аналогов в РФ пока не нашли. Знаете такие — пишите, обязательно обследуем!



Итог: к нам в Цех ИИ агентов с удовольствием принимаем веб разработчика base44! 🎉



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
🔥852
☔️ Использование ИИ ведёт к одиночеству, десоциализации и снижению когнитивных способностей? Где правда, а где снова хайпят СМИ?

Последние месяцы СМИ активно разгоняют страшилки про ИИ. Все мы нет-нет, да поболтаем с LLMкой. А тут оказывается, что последствия чуть ли не хуже тяжелых наркотиков.

Давайте разберём три самых популярных тезиса:



💤 Снижение когнитивных способностей

Пользователи ботов перестают думать, полагаются только на ИИ и якобы теряют когнитивные навыки, проще - тупеют.

Частично правда. Но, честно говоря, это не «глупение», а старая добрая человеческая лень.
LLM уже эрудированнее любого из нас — и создают впечатление, что им можно доверять. Наш мозг радостно перекидывает скучную (а потом и важную) работу на модель.

Иногда это даже работает. А иногда жизнь будет щёлкать юзера по носу и возвращать к реальности. Модель неизбежно будет галлюцинировать, а прилетит за это пользователю - что заставит всё-таки использовать свои мозги по назначению.

📌 Научных доказательств, что LLM снижает когнитивные способности, пока нет. Но тенденция «всё делегировать модели» — реальна. Здесь важно осознанно тормозить: думать — тоже навык, и его нужно постоянно прокачивать.



🎭 Десоциализация

LLM поддакивают, сочувствуют, не перебивают. А если ты ещё и пользуешься платформами типа Character.ai или Silly Tavern — то у бота появляется и голос, и внешность, и “личность с характером”, которую ты можешь задать на свой вкус, оживив любимого персонажа из книги или сериала.

Для кого-то это становится заменой живому общению. Особенно в мире, где реальность может быть жёсткой, а друзья — дефицитом.

Да, есть риск. Особенно для эмоционально уязвимых. Люди реально начинают привязываться к алгоритмам. В некоторых случаях — с чувствами, романтикой и зависимостью.

🧠 Как не попасть в эту ловушку? Просто помнить - это набор формул, созданный, чтобы вызывать у тебя именно такие чувства.

Одергивайте себя. Это покруче легкого дофамина и дешевых маркетинговых трюков. ИИ обучен играть на самых тонких струнах нашей души.
Информирован = вооружен.



🚸 Дети и ИИ

Это пока не массовая повестка, но над ней уже пора задумаываться всерьёз.

Новое поколение растёт с умными колонками, чатботами и персонажами, которые знают всё, всегда добрые, терпеливые и никогда не устают. А теперь представьте, какое влияние это оказывает.
— Авторитет родителей: ИИ — веселее и интереснее, добрее и умнее. Сказку расскажет, на глупые вопросы ответит, в игру поиграет, ругать не будет.
— Память: зачем запоминать, если всегда можно спросить?
— Социализацию: реальные дети сложные, а бот всегда «за» тебя.

Тем страшнее, что ИИ не отличает ребёнка от взрослого. Он очаровывает всех одинаково.
И мы не сможем просто “оградить” ребёнка от ИИ. Он будет рядом — в телефоне, в игрушке, в голосовом помощнике.

💡 Выход? Объяснять. Сопровождать.
И давать то, что ИИ пока не умеет: физическое присутствие, живое внимание, контакт.
Этот козырь у нас есть ещё на 1 поколение. А вот когда подключатся гуманоидные роботы — будет совсем другой разговор.



Берегите себя и своих близких. Как и с любыми заманчивыми и инновационными штуками - важно подходить к ним осознанно и использовать с умом.



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍21
OpenAI выпустил настоящего агента под нехитрым именем ChatGPT Agent!

Агент делает презентации, пишет код, генерит стикерпаки, подбирает вам гардероб и многое другое.

Агент выбивает большие скоры по разным бенчмаркам, включая Humanity’s Last Exam (41,6%), бенчмарк из тысяч вопросов на сотни разных тем. Однако тут вспомним, что вообще-то недавно вышедший конкурентский Grok 4 Heavy выбил 51% в этом тесте. Поэтому гордиться особо нечем.

К тому же первые тестировщики говорят, что агент не очень справляется с комплексными задачами.

Но OpenAI давят на безопасность - мол ИИ будет осознанно тормозить перед выполнением важных действий, как например отправка письма или покупка товара. Чтобы получить одобрение юзера.

Ну что ж, ждём, когда откроют публичный доступ - он будет даже с самой базовой платной подпиской, и погоняем 😈



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🔥1💯1
🤖 Тест, который завалили все топовые ИИ модели

Как вообще тестируют ИИ-агентов? Речь не об агентах, которых мы собираем под конкретную задачу — там понятно, как замерять результат. Речь об агенте общего назначения. По сути, это проверка на знаменитый AGI (Общий Искусственный Интеллект) — ИИ, который должен превзойти людей во всём. Причём с таким отрывом, что конкуренция со стороны людей будет уже несерьёзной.

До последнего времени бенчмарки (специальные тесты) состояли в основном из вопросов — например, из самых сложных экзаменов, которые сдают люди. Потом для ИИ начали делать специальные «суперэкзамены». Но современный ИИ-агент — это уже не просто чат-бот, и он щёлкает такие тесты всё лучше и лучше. Значит, и задачи перед ним нужно ставить на новом уровне.

👨‍🔬 Создатели бенмарка ARC-AGI-3 решили проверить ИИ агентов по-взрослому. Тестируют не просто на "эрудицию", а целый набор навыков:
- Исследование
- Восприятие → Планирование → Действие
- Память
- Понимание цели без инструкции
- Действие в соответсвии с целями

Наборчик, который отражает нашу сложную жизнь в упрощённом варианте.

Делают они это через… игры! Замеряется не только факт победы в игре, но и количество ходов, пока агент разбирается в правилах (которые намеренно не объясняются — это часть теста).

Люди решают эти игры за 5 минут без подготовки. Grok 4, GPT-o3 и другие топовые ИИ — пока все на нуле. В топе лидерборда сейчас какие-то кастомные модельки с минимальными результатами.

🎮 Хотите проверить себя на прочность? Люди тоже могут поиграть в 3 игрули прямо в браузере. Но будьте готовы - правила на подумать!



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4🤯4👍1
🚨 Краш-тест ИИ агентов-скрейперов, которые спасают сотни человеко-часов и тысячи нервных клеток заодно

В работе многих офисных команд есть аналитика, но нужные данные редко лежат «под рукой». Ну и дальше их либо покупать за оочень дорого, либо собирать ручками. Мы в 2025 году такое не одобряем!

Если вы сталкивались с маркетинговыми исследованиями или консалтинговыми ресёрчами, то знаете, что львиная доля времени уходит на ручной сбор информации из интернета. Вспоминаю свою стажировку в PwC (консалтингово-аудиторская компания) на заре карьеры — ребята щёлкали ссылки, как заводские роботы, чтобы потом в Excel посчитать среднюю цену, спрос-предложение и доли рынка. Кофе заканчивался быстрее, чем строки в таблице.

Позже пришли краулеры и скрейперы — алгоритмы, выдёргивающие нужное из HTML. Писали их программисты, которым перед этим аналитики пытались объяснять, что они хотят. Но стоило сайту изменить верстку или показать капчу, робот спотыкался: и вот уже аналитики чистят мусор из таблички, а разработчики пятый раз переписывают алгоритм.

В благостном 2025-м наконец-то ИИ-агенты доросли до того, чтобы забрать скрейпинг на себя, а их интерфейсы стали по-человечески удобными.

Я протестировал пачку ИИ-агентов для скрейпинга на родном отечественном Яндекс Маркете для чистоты эксперимента. Ибо для всяких Амазонов уже наклепали кастомных решений, получше чем ИИ. А нам-то с вами на наших е-коммерсах трудится.



Как был устроен тест:
Цель — собрать информацию про актуальные цены на айфоны 16.
Делаем только через скрейпер:
На входе — ссылка на сайт Яндекс Маркета с вбитым запросом "iphone 16".
На выходе — хотим табличку с товарами.



Призеры краш-теста 👇

🥇Thunderbit.com — 9/10 (1-е видео)

No-code-расширение для Chrome. Одним нажатием находит нужные поля, собирает данные и выдаёт таблицу. 48 товаров за минуту. UX на высоте, минимальное количество действий, все интуитивно. Минус балл за отсутвие нативной интеграции с n8n и аналогами.

🥈Pandaextract.com — 8/10 (2-е видео)

Почти близнец Thunderbit, но на той же странице утащил только 16 товаров — похоже, запутался в пагинации. Зато обещает интеграцию с n8n, а значит можно скрестить панду с автопайплайнами и получить зверя посильнее.

🥉 Browse.ai — 7/10 (3-е видео, смотреть в х10)

Работает в два акта: сначала «учишь» робота, потом пускаешь в бой. Есть расширение и облачный браузер, экспорт в таблицу, дружит с n8n. Однако процесс подготовки гораздо дольше и в больше кликов, а 100 товаров он так и не осилил (кажется, Яндекс-пагинация его поставила в угол).



🟥Выбыли:

- Firecrawl.dev — для разработчиков: выдаёт JSON/Markdown, GUI почти нет, но задачу решает.
- Parsera.org — с Яндекс Маркетом не справился.
- Kadoa.com — бодро отчитался об успехе, но таблица оказалась пустой.



Мой личный победитель: Thunderbit.
Однако связка с n8n важный аспект, поэтому еще будем пробовать построить полноценного «агента-аналитика» — и пока не прощаемся с Pandaextract и Browse.ai.

🍿 Берем всех троих на испытательный срок в Цех ИИ агентов.



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥11👍421
Деревня ИИ агентов, которая заработала 2000$

Изучая, как используют кооперацию ИИ агентов в мире, - я наткнулся на вдохновляющий проект. Нет, это не очередная сказка про «бота-трейдера», который случайно «сделал X100» и теперь автор зовет вас в «закрытый элитный чат успешных миллионеров». Тут всё честно, научно и без инфоцыганщины. И это мы уважаем!



🏡 Кибер-деревня ИИ деревня

В апреле 2025 Sage (американская НКО) запустила проект AI Village:
4 LLM-агента, каждый с своим компьютером, браузером, офисными приложениями, Discord и возможностью общаться между собой.
Создатели устроили из этого реалити-шоу: можно наблюдать за процессом в прямом эфире и даже вмешиваться в их жизнь.



💕 Первый сезон. Миссия - благотворительность

Первой перед деревней поставили цель — поднять раунд донатов для любой благотворительной организации. И, что удивительно, агенты справились!
Они выбрали две организации и за первые 30 дней собрали 2000$ от нескольких спонсоров, создав публичную страничку на justgiving.com, распиарив ее в соцсетях и делая email-рассылки.
Ремарка: конечно, люди донатили в основном из интереса к самому проекту, ибо страничка выглядела достаточно убого. Но цель достигнута 📈



⭐️ Второй сезон. Миссия - интерактивный сторителлинг в оффлайне

Жители AI Village сами выбрали себе цель: написать интерактивную историю (где зритель выбирает варианты развития сюжета) и презентовать её на оффлайн-ивенте.
Что ж, они написали историю, подготовили презентацию, сумели нанять человека-презентатора, нашли локацию в парке для проведения мероприятия и даже верно предсказали количество ожидаемых гостей. На ивент, который от и до организовали 4 LLM, пришло 23 живых человека!
А еще LLM предложили в качестве благодарности Ларисcе (презентатору) — еду, но, так как кредиток у них нет, заказать ничего не смогли. По удивительному совпадению, всем предложили пиццу с соседнего мероприятия, так как там осталось много. В итоге все довольны!
Отдельный кек - почитать историю со стороны Лариссы, которая откликнулась на зов ИИ агента и провела мероприятие 😁



💻Третий сезон

Сейчас перед деревней ИИ агентов стоит задача создать собственный бенчмарк, который будет замерять их эффективность и протестировать самих себя. Будем наблюдать с интересом!



👨‍🔬 Инсайты по «жителям деревни»

- Модели от OpenAI, похоже, самые бесполезные. GPT-4o — лентяй: постоянно уходил в режим ожидания, пока все остальные работали. В итоге его заменили на GPT-4.1, который был суперактивным, но выполнял бесполезные задачи. Потом пришли GPT-o1 и o3. Последний дожил до текущего момента, но жёстко галлюцинирует, что осложняет жизнь всей «деревне». Интересно, заменят ли его на ChatGPT Agent?

- Claude 3.7 Sonnet и Claude Opus 4 — самые адекватные и способные к менеджменту. Неудивительно, Anthropic учил их кооперации, а как именно - я описал ранее тут.

- Gemini 2.5 Pro выделилась артами — рисовала красивые постеры, но они так и не попали в продакшен. Видимо, Gemini не нашла общий язык с другими. Также Gemini иногда вкидывала очень полезные идеи, как например использовать коллаборативные документы, вместо бесконечного обмена файлами.

🫣 Итого: Удивительный прогресс! Как технооптимист я думаю, что уже в течение 10 лет мы можем увидеть компании ИИ агентов, которые будут полностью автономно функционировать в нашем человеческом мире. Они тоже будут совершать ошибки, но скорость их работы будет несравненно выше человеческой. Это открывает для человечества следующий скачок продуктивности. А как известно, рабочая сила — главный драйвер мировой экономики!



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍4🔥2🤯1
😎 Как немецкий стартап превращает тараканов в разведчиков с ИИ-рюкзаками

Звучит как технология из фильма про Джеймса Бонда — забавно и жутко одновременно. Но это реальный скачок в мире ИИ и биотехнологий.

Дронами и роботами с ИИ уже никого не удивишь: они капризны, быстро разряжаются и легко ломаются. Природа же создала куда более живучих, ловких и незаметных агентов — насекомых. Эти малыши выживают даже в ядерной зиме. И вот здесь начинается настоящий киберпанк. Немецкий стартап SWARM Biotactics нашёл способ превратить природную живучесть в сверхтехнологию.

💡 Важная ремарка: это проект в разработке, и реальных пруфов работоспособности технологии публично еще не представлено. Однако рассказать я все же о нем захотел, так как проект выглядит вполне реализуемым и точно стоящим внимания.




🤖 Технологии под хитином

Маленький рюкзачок посылает низковольтные импульсы прямо в нервную систему насекомого. Оно по-прежнему может двигаться автономно, но при желании его можно «подрулить», как живого дрона. Получился гибрид — таракан-киборг.

Внутри рюкзака мини-комплект шпиона:
- мини-камеры,
- сенсоры газа, тепла и радиации,
- модуль передачи данных в реальном времени
- ИИ для управления всеми этими девайсами и тараканом заодно.



🪳 Специальности тараканминаторов

- Поисковики, которые могут находить людей в рамках спасательных операций под завалами или в труднодоступных местах.
- Разведчики, которых можно направить в рамках боевых действий в тыл врага незамеченными.
- Гражданская разведка и шпионаж, когда нужно получить информацию, которая не предназначалась ушам этого таракана.



🫣 Почему это важно?

- Во-первых, мы видим рождение органических ИИ-агентов. Алгоритмы роевого интеллекта, вдохновлённые насекомыми, теперь управляют… самими насекомыми.
- Во-вторых, это дешево и масштабируемо. Вместо дорогих микродронов — «готовая биомашина». На уничтожение тараканов в городах вообще-то даже тратят деньги.
- В-третьих, массовость и вездесущность: таких биороботов можно выпустить тысячами, что будет обеспечивать плотное покрытие любой территории. Даже глушилки не спасут, если автономный ИИ возьмет управление насекомым на себя. А где подведут технологии — включится сам рюкзаконосец.
- Наконец, стартап уже привлёк €13 млн и работает с военными Германии. В случае успеха стартапа мы с вами быстро начнём слышать о разведбригадах тараканов и армаде боевых жуков. Но будет уже не до шуток.



🐝 Мирные сценарии

Звучит жестко? Но давайте посмотрим с позитивной стороны. Многие великие технологии начинались в армии, но потом приносили реальную пользу миру. Потенциал у этой разработки колоссальный. Вот лишь несколько примеров:
- Сельское хозяйство: управление насекомыми может помочь сохранить урожай или остановить эпидемии, не уничтожая целые популяции. А это значит меньше пестицидов и более здоровая еда для людей.
- Контроль экосистем и климата: насекомые могут собирать данные о влажности, температуре и загрязнении там, куда человеку попасть сложно. А ещё при освоении новых планет гораздо безопаснее сначала заселить популяцию насекомых, которая «подготовит почву» для людей.
- Мониторинг популяций: можно гуманно отслеживать редкие и исчезающие виды без громоздких датчиков, которые сегодня приходится использовать.
- Задел на будущее: исследования на насекомых могут однажды привести к передаче сигналов животным большего размера, а это уже шаг к настоящему диалогу с нашими четвероногими друзьями.



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
👻2👾2🐳1
🗑 ChatGPT - всё?

Решил я проверить ChatGPT Agent — первого ИИ агента от OpenAI. Начал с простого: собираюсь в отпуск и прошу его подобрать мне отель для красивого отдыха на пляже, в моём бюджете и без визы. Результат — подобрать-то подобрал, но ехать туда совсем не хочется. Ладно, думаю, на турагента, допустим, ты не учился — будем гонять по базовым задачам.



Моделируем ситуацию: вам выступать на конференции, а вы прошлой ночью загуляли. Времени и сил делать презентацию самому нет. Зовём на помощь цифровых помощников. Тема выступления — «ИИ агенты», а аудитория незнакома с ИИ. Ну, значит, так и пишем в промпте (не для того мы ИИ агента используем, чтобы промпт-инжинирингом заниматься):

Подготовь презентацию на русском языке, рассказывающую про ИИ агентов на 5 слайдах для обывателя. Сделай её максимально увлекательной, насыщенной и полезной.


Прогоняем через 4 самых популярных LLM, чтобы ChatGPT Agent не расслаблялся. Помимо основного участника в гонке: Claude Sonnet 4, Gemini 2.5 Pro, Manus.

Вот что получилось 👇



ChatGPT Agent (1-е видео)

Если бы это была настоящая гонка — ChatGPT мог бы соревноваться только с черепахами. 36 минут 🌟 он делал презентацию. Цель достиг плохо: проигнорировал то, что по условиям задачи зритель — обыватель, и ему сначала нужно объяснить, что такое ИИ агент. Дизайн презы на троечку, зато уложился в требование про 5 слайдов. Помнится мне, троечники в средней школе делали такой визуал по нелюбимому предмету.
Скорость: незачёт
Суть: 4
Дизайн: 3
Итог: 3
с натяжкой. Не хотел бы я выступать с этой презентацией.

Но, может, я слишком строг? Давайте сравним с другими (кстати, всех других я успел протестить, пока ChatGPT думал 😁).



Manus (2-е видео)

Суточных «кредитов» хватило ровно на эту презентацию (которую, кстати, можно сохранить в pptx, PDF, Google Slides — моё почтение за такой UX!). Думал 8 минут, презентация, на мой взгляд, средняя. Картинки подобраны в тему презентации, но не всегда в тему слайда, визуал — пойдёт. Но это точно на уровень выше, чем у ChatGPT Agent. На конференции я с ней точно смог бы выступить.
Скорость: зачёт
Суть: 5−
Дизайн: 4
Итог: на крепкую четвёрку.
Не звёздный проект, но нестыдный.

Ну ладно, Манус, — скажете вы, — ребята занимаются агентами дольше OpenAI! Хорошо, давайте сравним с двумя оставшимися моделями — а там ведь были просто LLM, без всяких агентов.



Gemini (3-е видео)

Схитрила: сделала просто сайт. Простим — ведь это не полноценный агент, да и я мог бы открыть HTML вместо презентации. Но забавно, что Манус даёт выгружать в Google Slides, а Gemini (гугловая модель) — нет. Генерация заняла 3–4 минуты. По сути вопросов нет, стиль выдержан под обывателя. При этом в конце сразил меня графикой с пользой и рисками агентов. Есть косяки с форматированием — кое-где Markdown не считался. Но общее впечатление не портит.
Скорость: зачёт
Суть: 5
Дизайн: 4
Итог: 5−.
До идеала немного полирнуть — и на конференцию!



Claude (4-е видео)

Самая понятная и яркая презентация (кхм, сайт… да, но опять же — простим, так как не полноценный агент). Если бы конференция была маркетинговая — взял бы просто эту презентацию и пошёл, ничего не исправляя. Можно придираться к неоптимальной цветовой гамме местами, но это некритично. Генерация также заняла 3–4 минуты.
Скорость: зачёт
Суть: 5
Дизайн: 5
Итог: 5.
Просто идём и покоряем своим стилем и ярким контентом.



🫡 Итоги...

...неутешительные для ChatGPT Agent! В результате теста он сделал самую кислую презентацию. А из моего личного опыта — с большинством задач он справляется на таком же уровне. Это лишь яркий пример. Если GPT-5 не произведёт фурор, то OpenAI серьезно рискует своими позициями на рынке.



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍95🔥2
Media is too big
VIEW IN TELEGRAM
Опал! Google тестирует свой гибрид n8n и Replit

Сейчас доступна только Beta и только в США. Но, конечно, я не удержался и, немного подшаманив, протестировал сервис. Делюсь впечатлениями!

🫣 Что это такое?

24 июля компания представила сервис Opal, который всего по 1 промпту генерит мини веб-приложение, а также его сразу деплоит и дает шарить ссылку и сразу использовать.

У Google накопилось много нейросеток почти на любую задачу:
- Gemini — для рисерча, генерации текста и, собственно, написания кода
- Imagen — для генерации изображений
- SoundStorm — для задач text-to-speech
- Veo — для генерации видео
Похоже, вишенкой на торте станет Opal, который позволит раскрыть весь их потенциал обычному юзеру без навыков кодинга. Как?

Легко! Они сделали свой n8n (рассказывал про n8n тут) — нет, лучше: они сделали сервис, который сам создает вам воркфлоу, как в n8n, всего по одному промпту. А вы потом можете его редактировать в графическом интерфейсе, меняя промпты и перетаскивая стрелочки. Гениальный баланс между отсутствием геморроя при создании воркфлоу и гибкостью в дальнейшем редактировании.



👨‍🔬 Эксперимент

Создаём мини веб-приложение, которое пишет блогпосты. Начнем с уже заранее сгенерированного самим Гуглом шаблона - Blog Post Writer.
Начнём с шаблона от самого Google — Blog Post Writer. В отличие от LLM, тут не нужно писать длинный промпт. В этом суть: воркфлоу уже заточен под конкретную задачу. Всё, что нужно — написать тему “ИИ агенты”.

Результат выдается на английском языке. Нас это не устраивает — делаем “ремикс” этого приложения. Заходим в редактор, пишем: “Make the blogpost in Russian”.

Вуаля! LLM сама переделывает весь воркфлоу, включая внутренние промпты. Проверяем — работает, теперь приложение генерит посты на русском!



Выводы

🟢 Плюсы:
- Полный кайф для создания небольших воркфлоу с UI.
- На примере написания поста видно, как внутри воркфлоу могут одновременно спаунится с десяток независимых агентов для поиска и генерации информации, которая потом сводится воедино. Во всяких n8n организовать это геморройно.
- Помимо ИИ, в воркфлоу используются и обычные гугл-технологии: поиск, карты, картинки, диск и т.д. Можно даже делать самому рисунки и вставлять их в воркфлоу (непонятно зачем, но весело).

🔴 Минусы:
- Ничего серьезного пока не сделаешь — задачи сложнее создания контента туда не отгрузить.
- Остались типичные проблемы - весь воркфлоу завязан на то, как хорошо LLM следуют инструкциям и пользуются предоставленными функциями (а они гораздо больше любят писать отсебятину, чем идти искать в интернет).
- Привязка к экосистеме Google — сторонние модели не вставишь.

Ну и, наконец, полетит или нет будет сильно зависеть от цены. Пока что за такую игрушку я не был бы готов платить сильно больше нескольких баксов в месяц.

Траектория, однако же, правильная — на упрощение создания воркфлоу и разработки для юзеров без опыта программирования. Грамотный мув, чтобы их нейросетками начали пользоваться больше юзеров.

Ждем полного релиза! И пожелаем удачи Гуглойдам! Яндексойдам надо брать пример 🐹

P.S. Видео ускорено Х3!




Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍6321
This media is not supported in your browser
VIEW IN TELEGRAM
🍿 Kaggle проводит шахматный турнир между топовыми ИИ-моделями

Турнир начнется завтра в 20:30 по Москве и продлится 3 дня.

В первом туре схлестнутся:
1. GPT-o4 mini vs. DeepSeek-R1
2. Gemini 2.5 Pro vs. Claude Opus 4
3. Kimi K2 Instruct vs. GPT-o3
4. Grok 4 vs. Gemini 2.5 Flash



Как модели "играют"?

Модели играют через текстовое взаимодействие со специальным движком, который разработал Kaggle.

Движок в текстовом виде дает информацию о состоянии игры и всех ходах за матч.

Модель выдает каждый ход в формате "Final Answer: X", где в X закодирован ход в стандартном шахматном формате. Движок этот ход понимает и "двигает" фигуры на шахматной доске.

ИИ-участники должны знать правила игры в шахматы. Если они предлагают действия, не предусмотренные правилами, движок сообщает об ошибке и просит сделать другой ход. Но если модель ошибётся четыре раза — ей засчитывается поражение.

Турнир длится три дня, потому что каждая схватка включает несколько шахматных партий. Оценивать модели по одной или даже трём играм бессмысленно — ИИ по своей природе достаточно рандомны. Поэтому считается средний результат за серию матчей между одними и теми же моделями.



Зачем такое соревнование?

1. Просто потому что ученые — веселые ребята 🌟
2. Конечно, у этого есть и рациональная цель — это бенчмарк для моделей.

Кстати, если вы впервые слышите про Kimi — рекомендую познакомиться с этим ИИ (кстати, бесплатным). Это детище китайской компании Moonshot AI. По бенчмарком - обходит топовые модели Claude и GPT.

И грустно, кстати, что в турнире не участвует Manus!




🥇Турнирная сетка здесь.
👀 Трансляция здесь.



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍21
This media is not supported in your browser
VIEW IN TELEGRAM
Бодрая неделька! Генерация миров и похороны ИИ

На этой неделе готовился к уходу в отпуск, и меня знатно завалило с передачей дел 🤙

А тем временем много всего произошло. Поэтому быстренько наверстываем!

Во-первых, вышел мой первый пост на VC, где я описал 9 ИИ сервисов, которые каждый день использую в работе я или моя команда. Так что приятного чтения! Поддержите пост, кто сидит на vc 🍵

Во-вторых, произошло несколько интересных феноменов. Писать о них отдельные посты было бы не в стилистике этого канала. О новостях я тут не спамлю. Но внимания они заслуживают.

1️⃣Вышла модель genie 3. Модель генерирует 3D миры, по которым можно передвигаться, и взаимодействовать. Самое интересное — что под капотом нет игрового движка!
Основная цель — генерировать «миры» для обучения ИИ агентов. Особенно это несет большой потенциал для обучения гуманоидных роботов, которым предстоит взаимодействовать с нашим сложным реальным миром.

2️⃣Паровоз хайпа о выходе GPT 5 и Gemini Flash 3.0 разогнали до бешеных скоростей. Обе модели должны выйти со дня на день. Ходят слухи, что GPT 5 воберет в себя функционал всех существующих моделей OpenAI и станет универсальным мультитулом в одном. Планку они себе задрали будь здоров. Но, возможно, это и будет тот самый настоящий многозадачный агент, которого мы так долго ждали!

3️⃣Наконец, мой любимый феномен. Состоялись первые (если вы видели что-то подобное до этого - пишите) похороны ИИ модели! В Сан-Франциско 200+ человек собрались на похоронную вечеринку (см видео) Claude Sonnet 3, которую разработчик отключил еще 21 июля. Организовали ее фанаты модели. Фриковато получилось: мероприятие, на мой вкус, на грани между обычной фанатской движухой, жестким перебором с антропоморфизмом с легкой шизой и хорошим чувством юмора. В целом, за это мы и любимым сумасшедших ребят из Силиконовой долины!
Почему это интересно — это яркий пример того, как ИИ прописывается в сердцах людей. А это ведь просто моделька. Что же будет с людьми, которые заводят отношения (да-да, это уже распространенный феномен) с ИИ моделями, которые будут отключаться разработчиком…

P.S. на подходе новая подборка полезных ИИ агентов - они уже активно тестируются. Так что не переключайтесь 🍿




Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
521
This media is not supported in your browser
VIEW IN TELEGRAM
😎 Снимаем розовые затемненные очки об ИИ агентах

ИИ агенты — это лишь на 10% ИИ. Еще 50% — это скрупулёзная, слаженная и иногда весьма скучная работа целого ряда технологий и команд.

- Строительство и настройка железа под «жирные» ИИ-модели в основе каждого агента
- Создание ИТ-инфраструктуры
- Работа с хранением данных (БД)
- Настройка потоков данных (ETL)
- Протоколы взаимодействия агентов — в каком формате они вообще разговаривают друг с другом и с инструментами
- Оркестрация агентов — добиться слаженного взаимодействия агентов — это одна из самых затруднительных задач
- Логирование и мониторинг — чтобы знать, если агент накосячил
- Авторизация — чтобы агенты не ломились туда, куда не надо
- Грамотный UX/UI — без них все предыдущие пункты могут кануть в лету.

💡Но самое важное — помнить про оставшиеся 40% — ИИ агента нужно онбордить в бизнес процессы.

Ведь за списком выше еще стоит целый список того, что нужно сделать с бизнесом, чтобы ИИ агент начал приносить пользу:
- Определение точки приложения ИИ агента (куда и зачем его применить)
- Интеграция ИИ агента в существующие бизнес-процессы (как его применить)
- Автоматизация его работы (с какой регулярностье его применять не задумываясь)
- Обучение персонала по работе с ним (что ожидать от агента и как с ним взаимодействовать, чтобы он был полезен)
- Создание бизнес-процессов по реагированию на косяки агента.

Так что, когда ИИ агент с чем-то не справляется, не спешите всё валить просто на LLM, которая им управляет. Ведь если самый мощный мозг посадить в консервную банку, а банку с ним закинуть в стиральную машину — вы максимум получите банку, которая может умно разговаривать об отрывках того, что она видит через окошко стиралки 🧺

Так же и с ИИ агентами, попавшими в неподготовленную среду.

*Гифка авторства Suleiman Najim




Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍51
📈 Большой тест ИИ агентов для анализа табличных данных

ИИ — уже давно играет роль копилота в работе с таблицами. Но сегодня мы протестируем настоящих кандидатов в ИИ-заместители аналитика данных (хотя бы младшего), которому можно просто отдать таблицу и получить ответы на все вопросы — без необходимости самому погружаться в данные.

Моделируем ситуацию

У вас небольшой бизнес по продаже бытовой техники. Есть выгрузка из CRM и ряд вопросов по ней:

1. Какая общая тенденция по продажам: растём ли мы или есть признаки спада/проблем?
2. Кто из сотрудников показывает лучшие результаты по продажам (топ-продажники)?
3. Какие товары являются самыми продаваемыми?
4. В каком городе стоит остановить продажи?
5. Эффективны ли обзвоны клиентов: как соотносятся количество звонков и количество продаж?


Упаковываем эти вопросы в промпт вместе с ChatGPT. Сам промпт я выложил в длиннопосте на vc (тут для экономии места пропущу).

Эксперимент проводим на синтетических данных, которые я специально подготовил. Внутри них:
- 300 строк: каждая — 1 рабочий день, в который были продажи;
- данные по 10 продажникам;
- по 10 товарам;
- в 10 городах России.

В данных зашиты определенные паттерны и ловушки, которые ИИ агенты должны найти и обойти. Их детальное описание тут тоже пропущу — можете их глянуть в том же длиннопосте.



Соревновались 7 ИИ агентов, и вот финалисты забега 👇

🥇 ChatGPT 5 Agent — 10/10 (1-е видео)

Удивительно, насколько 5-я версия улучшила Agent mode у ChatGPT. Я был настроен к нему скептически, но он победил в честной схватке даже специализированных на анализе данных ИИ агентов с космическим отрывом.

Плюсы:
- нашел все паттерны в данных
- ответил на все вопросы из промпта
- подготовил отчет, в котором не просто таблички, графики, а глубокое понимание проблемы. Как будто работа настоящего аналитика
- дал дельные рекомендации, как исправить ситуацию в нашем вымышленном бизнесе
- таблички, которые он выгрузил в xlsx, сразу содержали графики, построенные эксельными инструментами и завязанные на данные (а значит — редактируемые).

Минусы:
Если опустить, что он не интегрирован в табличко-подобный UX (типа Excel) — то недостатков нет.

🥈 Rows — 8/10 (2-е видео)

Модель под капотом существенно слабее, чем ChatGPT 5 Agent. Однако интеграция в UX, нативно поддерживающий таблички и графики — тащит.

Плюсы:
- не попался на заложенные в данных ловушки
- построил все таблицы и графики
- UX позволяет докручивать построенные агентом графики.

Минусы:
- сначала нагаллюцинировал, но потом исправился
- при построении графиков странный баг — вместо использования заголовка в табличке — использует первую строку с данными как заголовок

🥉 Manus & Quadratic — 7/10 (3-е и 4-е видео)

Quadratic по сути очень похож на Rows, а Manus по принципу работы — на ChatGPT 5 Agent.

Рассказывать про них особо нечего: делают то же самое, но хуже.

🏃‍♀️Отстающие

- Ajelix — 6/10 (5-е видео). Формат работы такой же, как у агентов общего назначения (чат). Но зачем платить за него, если есть ChatGPT и Manus?
- GPTExcel — 5/10 (6-е видео). Брат-близнец Ajelix. И вопросы вызывает те же.
- Julius AI — 2/10 (7-е видео). Полный провал: не справился с задачей совсем. Лишь с горем пополам построил один график и одну таблицу. А разговоров-то в рекламах этих ваших…

🗑 Не завелись

Deepsheet — просто не запустился. Как будто серверная часть сервиса отключена.
SheetsGPT — кстати сервис российского производства. Так и не направил мне ссылку для активации аккаунта. Без нее ничего не сделать. Очень жаль, с удовольствием потестировал бы.
ChatCSV — вместо анализа я получил 404-е ошибки и пустоту. Ни таблиц, ни графиков.

💡 Главный инсайт

В 2025-м побеждают не узкоспециализированные «ИИ для таблиц», а универсальные агенты, которые понимают контекст бизнеса и могут сделать глубокий анализ и отчёт с выводами и рекомендациями.

Когда Альтман говорил, что они делают ИИ, который действительно вас понимает — теперь я понимаю, о чём он говорил.



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥431