Заместители
1.04K subscribers
87 photos
77 videos
4 files
110 links
Цех ИИ агентов. Здесь я тестирую цифровых заместителей в разных профессиях. Если агент справляется — он остаётся в Цехе на “постоянку”. По пути обсуждаем актуальные новости про ИИ агентов простым языком.
Добро пожаловать в эру замещения.
Download Telegram
Media is too big
VIEW IN TELEGRAM
🚨 Тест-драйв ИИ-браузеров. Заезд второй

В первом заезде участники — просто трехколесные велосипеды по сравнению с теми, кого мы увидим сегодня. Честно говоря, я сам ждал, когда же доберусь до второго заезда — и вот наконец-то он тут!

Во втором заезде соревнуются три агентных болида:
- Genspark Browser (по этой ссылке рефералка на 1000 кредитов)
- Fellou (реферальный код на бонусные кредиты: G9GS31)
- Comet от Perplexity (рефки нет, есть только ограниченное количество инвайтов — о них в конце поста).

Помимо этого поста — будет ещё отдельный пост про каждый браузер с детальными видео, в лучших традициях этого канала. Уж очень много про каждый из них можно и хочется вам рассказать ☕️

Каждым браузером я попользовался пару дней, а также провёл одинаковые тесты, где браузер по текстовому промпту должен:
1. Подобрать новый iPhone и заказать его
2. Суммаризовать видео на YouTube и VK видео
3. Построить план на выходные с учётом моего расписания в Google Календаре и построить маршрут на карте
4. Провести ребрендинг Автоваза с генерацией новых логотипов (должен же был кто-то взяться за эту задачу 😁)


Также оценивались UX/UI и индивидуальные фишки браузеров.

Томить не буду, подводим результаты заезда:
🥇Победитель заезда — Comet от Perplexity.
Этот браузер — прекрасное комбо агентных функций и удобного браузера на базе Chromium. Космическая тематика, которой он пронизан, сразу заняла у меня в сердечке отдельное место. При этом браузер самый оптимизированный из всех. Всё работает очень шустро: и AI под капотом, и сам браузер. Ну и, конечно, все плюшки от Perplexity на месте — доступ к разным моделям, отдельные пространства и персональные подборки на страничке Discover. Отдельно отмечу Voice mode — будущий Джарвис (правда, пока он сыроват). Наконец, это единственный из трёх браузеров, где всё работает в России без всяких VPN и есть русскоязычная локализация. Лучший выбор для большинства юзеров.

🥈Серебро забирает Fellou
Это настоящий агентный браузер с ооочень самобытным UX/UI. Придётся забыть всё, что вы знали о браузерах, чтобы пересесть на него. Но дизайн сделан с любовью, и UX на самом деле продуман. Этот браузер может брать на себя настоящие агентные задачи и красиво жонглировать несколькими вкладками, где шуршат ИИ агенты. Но иногда это приводит к переусложнению: чтобы решить простые задачи (например, суммаризовать видео), он грозится вызвать целого ИИ агента, где справилась бы обычная LLM. При этом сами агенты думают подольше, чем в Comet.

🥉Финиширует последним в гонке браузеров — Genspark. Но одновременно он получает приз как лучший ИИ мультитул.
Если вы техногик, то количество встроенных сюда ИИ-функций вскружит вам голову. Тем более, что они работают на моделях от топовых вендоров (OpenAI, Google, Qwen…) и работают очень резво. Плюс разработчики впендюрили локальный ИИ прямо в браузер — значит, лёгкие модельки можно скачать на комп без доп знаний (об Ollama), и они будут доступны всегда, даже при нулевом балансе кредитов Genspark или без интернета. Но если вы обычный юзер — браузер разочарует. По ощущениям — это Android OS начала 2010-х: всё «деревянное» и «голое», работает немного топорно. И то и дело при работе агентов наружу торчат всякие куски кода, которые с точки зрения «красоты» должны быть спрятаны под капот.

Кстати, специально для этого обзора я оформил подписку на Genspark. И оказалось, что он отлично подходит для нешго Цеха ИИ агентов, где мы ценим не красоту, а функциональность. Значит берем его стажером и еще погоняем!

Заключительная мысль — после теста стало очевидно, что подписка на отдельную LLM потихоньку теряет смысл. Буду активно юзать Comet и Genspark весь месяц, и в конце месяца решу, стоит ли продлевать подписку на ChatGPT.

Подробные разборы каждого браузера буду публиковать в следующие три дня.

И в конце серии постов сделаем мини-розыгрыш инвайтов 🤔 в браузер Comet (без инвайтов или Pro-подписки Perplexity его нынче не скачать).



Подписывайся, чтобы не пропустить детальные разборы и розыгрыш.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥321
Media is too big
VIEW IN TELEGRAM
Fellou - «первый» агентный ИИ браузер

Доминик Се, CEO компании, позиционирует этот браузер как «первый агентный браузер в мире». Что ж, сложно сказать, кто был первым — смотря с какого момента считать, — но в сентябре 2025 вышла в свет первая полноценная версия Fellou CE (Concept Edition). Она доступна для скачивания и тестирования всем. Причём сходу дают хорошее количество кредитов. Для получения доп кредитов оставлял рефку.

Название на английском сразу располагает к себе. А вот на русском я так и не придумал нормального перевода, который бы не звучал как гэг: «приятель», «тип», «брат»… 😎

Браузер разработан на фреймворке Eko 2.0 (похоже уже даже выпустили Eko 3.0). Это опенсорсный фреймворк для создания ИИ агентов и автоматизаций. Это крутой фундамент. Имея свой фреймворк, «братишка» собирает братву комьюнити, которое будет улучшать и двигать его вперёд. Отличная модель, вместо того чтобы зажимать всё патентами. Причём фреймворк не только позволяет создавать агентов в браузере, но и тех, что управляют компьютером. А значит, браузер рулит не только вкладками, но и всей вашей ОС (на самом деле пока очень ограниченно).

По собственным заявлениям «паренёк» обходит в success rate и Manus, и GPT agent. Сильные заявления. Но, как покажут тесты далее, — вполне может быть правдой.

👨‍🔬 Все фаундеры врут. Тестируй сам...

С таким лозунгом я подхожу ко всем своременным ИИ сервисам и агентам. Поэтому этот браузер я погонял лично. Вот что получилось:

1. Поиск, где заказать новый iPhone.
С этой задачей справился блестяще. Сформировал полноценный каталог: HTML-страницу со ссылками, ценами, сравнением и даже обзором устройства. Оценка — твёрдая 5.

2. Заказ iPhone
А вот тут начались приключения. На Озоне Fellou завис в вечном ожидании. На Яндекс Маркете попал в бесконечный цикл: добавил товар в корзину, но пока читал всплывающее окно, оно исчезло — и агент продолжал тыкать в пустоту. На сайте МТС удалось продвинуться дальше. В итоге заказ остановился на собранной корзине. В целом неплохо, но может быть и лучше — на 4-.

3. Суммаризация видео.
Fellou умеет суммаризовать ролики на YouTube. Работает честно, но суховато — без кликабельных таймкодов, как у большинства браузеров из первого заезда. VK видео ему не поддался (как и всем, кроме Яндекс браузера).

4. Планирование выходных
С задачей справился идеально: прочитал календарь, проверил погоду, предложил список активностей и даже вывел статистику по часам — сколько уйдёт на спорт, а сколько на рестораны. Если бы я жил по этому расписанию, давно был бы в идеальной форме. Оценка — 5.

5. Ребрендинг Автоваза
Fellou провёл исследование и успел сгенерировать несколько логотипов. До полноценного ребрендинга дело не дошло — закончились токены. Тем не менее, с технической стороны — 4.

6. UI/UX
Интерфейс сделан красиво, но очень непривычно. После обычных браузеров приходится перестраивать привычку и формировать новые «нейронные связи». Поэтому — 4.

7. Допы
"Братишка" умеет больше, чем просто искать и тыкать в браузер: он может генерировать музыку и видео, создавать документы, собирать сайты и приложения, а также запускать задачи по расписанию.

💃 Есть и минусы

- После окончания кредитов Fellou просто превращается в тыкву. Даже самые простые действия на «дешёвой модели» недоступны. Чувство такое, будто у тебя на телефоне закончились минуты, а пополнить баланс некому. Неприятненько.
- Иногда теряет связь, после чего процесс крашится и не перезапускается.
- Есть мелкие баги с вводом задач — раздражающие, но терпимые.
- Ну и, конечно, в РФ только с ВПН работает.

🍵 Вердикт

Fellou — это солидный агентный браузер с большим потенциалом. Он справляется с исследовательскими задачами и простыми действиями, но не всегда умеет довести процесс до конца. Капча и сложные формы ставят его в тупик, а иногда он застревает в цикле бессмысленных кликов и сжигает ваши токены. Но это ограничение технологий в целом, а не конкретно Fellou. Если смотреть в будущее — это сильный кандидат в «заместители» для многих офисных трудяг.



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥821
Media is too big
VIEW IN TELEGRAM
Агентный браузер Genspark: мне, пожалуйста, ИИ агентоввзболтать, но не смешивать

Изначально Genspark — это платформа, объединившая в себе много ИИ моделей от разных вендоров и агентов собсвтенной разработки. Ключевая фишка — Super Agent, который может вызывать других агентов по мере необходимости, некий прораб. Такая архитектура позволяет также использовать подход MOA (Mixture-of-Agents). В феврале 2025 платформой пользовались уже 2 млн пользователей ежемесячно. За подписку в 30 баксов (с налогами) в месяц получаешь доступ к куче самых разных моделей и агентов.

Почесали репу создатели, и решили — а чего бы не впихунть все это дело в браузер? И вот уже в сентябре 2025 года выходит Genspark Browser. Его позиционируют как убийцу Google Chrome... Но хватит ли кучи моделек, чтобы стать востребованным браузером? Разбираемся...

👨‍🔬 Первым делом, первым делом тесты...

В рамках экспериментов браузер должен выполнить ряд задач по текстовому промпту. Все результаты и промпты — на видео. А здесь краткие итоги:

1. Поиск, где заказать новый iPhone.
С подбором справился: аккуратная табличка, цены подтянуты верно, ошибок нет. Всё чётко и по делу. Заслуженные 5 баллов.

2. Заказ iPhone
Вот тут Genspark сдулся. Даже когда я прямым текстом попросил положить товар в корзину, он всё равно не справился. Потратил кучу токенов, скроллил, что-то собирал, но в итоге вернулся с объяснением, как мне заказать самому. Для агентного браузера — полный провал.

3. Суммаризация видео
На YouTube суммаризация хорошая: с кликабельными таймкодами, хоть и открывающимися на новой странице. VK Видео не осилил (как и все, кроме Яндекс Браузера). Ставим 5-.

4. Планирование выходных
Справился прекрасно: учёл расписание из моего гугл календаря, предложил маршруты для прогулки, составил детальный план. Построил маршрут в Google Maps. Отличная работа — 5 баллов.

5. Ребрендинг
Это первый браузер (или вернее браузерный агент), который подошёл к задаче глубже логотипа: сделал полноценное подобие брендбука. Правда, лого внутри был неконсистентным, менялся от картинки к картинке. Но по сравнению с остальными участниками гонки — это лучшая работа. Оценка — 5.

6. UI/UX
Самый слабый аспект. Интерфейс будто из начала 2010-х: на базе Chromium, но сыро и некрасиво. В процессе работы агента то и дело вылезает код. На красоту и удобство явно забили. Но путаницы нет: всё на привычных местах, поэтому — 3.

7. Допы и фишки
Разнообразие ИИ агентов и сервисов внутри реально впечатляет:
• генерация видео (Kling, Wan, Veo и др.)
• генерация изображений (Imagen, Nano Banana, Seedream и др.)
• ИИ дизайнер (и снова над ребрендингом поработали — результат был уже солиднее)
• работа с таблицами, документами, презентациями
• разработка приложений и сайтов
• умная нарезка видео
• создание подкастов
• парсинг файлов
• транскрибация и суммаризация встреч
• ИИ факт-чекинг
• и даже ИИ звонки.

Отдельный плюсик в карму за встроенный локальный ИИ (для тех, кто не хочет устанавливать Ollama отдельно). По сути, ничего нового, но удобно: можно работать даже без интернета и когда кредиты закончились.

🐱 Без минусов, конечно, не обойдется

• Оптимизирован плохо, работает откровенно медленно на фоне остальных (и это тоже влияет на и без того кислый UX).
• Без ВПН работают только локальные модели, что странно, могли бы и сами проксировать остальных, как это сделали в Perplexity.

✏️ Вердикт

Чуда не случилось. Genspark — это все еще в первую очередь универсальный мультитул, собравший в себе ИИ от десятков вендоров. В этом он безусловный лидер. Но браузер это посредственный: медленный, сырой, с ощутимым «гиковским» вайбом и без души. Вкладки грузятся тяжело, плавности нет. А без VPN он вообще не работает.

К установке рекомендуется тем, кто постоянно работает с веером разных ИИ моделей и агентов, а также всем гикам, посмотреть до чего прогресс дошел. Всем остальным — не рекомендую.

Если вы таки будете тестить его сами — ловите реф ссылку, которая даст вам доп кредиты для бесплатных тестов.



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥21
Нет, ну что творят… открыли waitlist для раннего доступа Opera Neon. Это еще один агентный браузер с большим потенциалом. Может быть сильным конкурентом для Comet.☄️

Залетаем в лист ожидания.
3🔥11
Media is too big
VIEW IN TELEGRAM
😳 Comet: лучший агентный ИИ браузер, без лишних слов...

Из агентных браузеров, которые можно скачать здесь и сейчас — это лучший. В нем и без того любимый многими Perplexity, обрел дом, обжился и сделал ремонт со всей душой. Он подойдет как любителям инноваций, так и тем, кто просто любит удобство, красоту и эффективность.

👨‍🔬 Без голословных заявлений, все тестируем

Промпты и результаты — как обычно на видео. А тут краткие результаты:

1. Поиск, где заказать новый iPhone
Comet подобрал айфоны по адекватной цене. Искал он на английском, поэтому в выборку не попали маркетплейсы, но на результате это не сказалось. Всё чётко, без лишнего пафоса и красивых HTML-страниц, как у Fellou. А оно здесь и не нужно. Задача выполнена — 5-.

2. Заказ iPhone
Справился быстрее, чем Fellou. Видно, что агент реагирует шустрее — между «увидел» и «сделал» проходит меньше времени. Плюс удобно: можно наблюдать за процессом в маленьком окошке или разворачивать его на весь экран. Правда, Comet уверенно выдумывает адреса и номера телефонов (я уже начал переживать, что заказ уйдёт на Тверскую). В итоге корзина в Restore собрана, ссылка на неё — в чате, адрес доставки тоже заполнен. Да, с формой адреса были заминки, но Comet быстро нашёл обходной путь. Итог — 5-.

3. Суммаризация видео
Суммаризация работает, но топорно. Комет пошёл сложным путём: включил субтитры, вытащил отдельное окошко и уже оттуда собрал некликабельные таймкоды. В общем, не самая сильная сторона. Поэтому честные 4 балла.

4. Планирование выходных
Мое расписание в гугл календаре учёл, корты для падела нашёл, прогулку добавил. Более того — по отдельному запросу построил маршрут в Яндекс.Картах с первой попытки. Впечатлило. Оценка — 5.

5. Ребрендинг
Изучил историю Автоваза, их старые лого и сходу сгенерил несколько новых модных логотипов. До брендбука не дошло, поэтому задачку выполнил скорее частично, хуже чем Genspark. За это 4 балла.

6. UI/UX
Вот здесь Comet блистает. Построен на Chromium, так что ощущение сразу «как дома». Всё привычно, плюс ИИ-функции аккуратно интегрированы в интерфейс. Никакого «чужеродного» UX, как у Fellou или шероховатостей, как у Genspark. А главная страница Perplexity — идеальный старт. А космическая тематика украла сердечко сходу. Это 5.

7. Допы и фишки
- Voice Mode. Красивая идея, сырая реализация. Ассистент очень багучий, и отвечать может только голосом (что не всегда удобно). Поддержка языков есть, включая русский, но пока это больше демо, чем рабочий инструмент.
- Comet умеет генерировать видео и создавать плановые задачи по расписанию. Но не пишет приложения и музыку (в отличие от Fellou).
- ИИ под капотом работает ощутимо быстрее, чем Fellou и Genspark. Чувствуется, что потрудились над оптимизацией.
- Самое главное — работает в России без костылей, и с русской локализацией. 📈

Минусы
Мною не обнаружены. Пробую потихоньку на него полностью переехать.

Вердикт
Comet — это браузер, в котором сделали ставку не на «всё и сразу», а на удобство для обычного пользователя. Здесь нет шоу-презентаций и перегруза агентами, но есть скорость, стабильность и продуманный UX. Он умеет искать, автоматизировать, генерировать картинки и видео, работать с LLM и брать на себя рутину. Все недочёты ему хочется простить и просто ждать, когда он станет ещё лучше. Рекомендуется к установке всем!



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥432
📈 Раздаю инвайты в Comet!

Тот самый ИИ-браузер, который обошел на повороте всех соперников а нашем тест-драйве ИИ-браузеров из двух заездов (раз, два), — теперь и вы сможете потестить его лично. Отдаю 3 инвайта в его закрытое тестирование.

Участвовать просто:
1. Быть подписанным на канал Заместители
2. Поставить лайк к этому посту ❤️
3. Нажать кнопку «Участвовать» 👇

Можно пригласить до 3 друзей в канал (обязательно через ссылку в боте), чтобы повысить шансы.

Победителей выберет бот случайным образом и огласит результаты 7 октября 2025 в 23:00 GMT+3 (по Москве) 🎲

🎉 UPD: Розыгрыш завершен!

🏆 Победители:
1. @leoskyer
2. @passwordqwerty
3. @Kcenobait

🔍 Проверить результаты
Please open Telegram to view this post
VIEW IN TELEGRAM
35👍1🔥1
Comet оказался быстрее кометы и сегодня релизнулся для всех (качайте, не ждите) 👀

Отменять розыгрышь мы конечно же не будем.

Поэтому переобуваемся в полете: 3 победителям оформлю подписочку на perplexity pro на месяц (а для тех, у кого раньше на аккаунте не было Pro подписки — оформлю сразу на 🔥ГОД🔥), чтобы вы раскрыли все прелести нового браузера и целый год вспоминали добрым словом 📈

Кто уже участвует - делать ничего дополнительно не нужно. Если еще не участвуете, то жмакать на кнопку для участия на том же посте.

UPD: Благодаря знатокам в комментах - апгрейдим приз до годовой подписки! 🎩
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥11
👨‍🎨 Примерил на себя шкуру AI художника

Пока есть подписка на Genspark решил потестить сразу пачку моделей для генерации изображений.
Но, тк раньше я занимался фотографией, меня быстро затянуло в творческий процесс. Токенов было сожжено...

В итоге серия изображений сгенерированных разными моделями по извечным вопросам:
1. “Who am I?” - Bytedance Seedream V4
2. “Why are we here?” - Flux 1.1 [Pro] Ultra
3. “What is love?” - Ideogram V3
4. “What happens after death?” - GPT Image
5. “Are we alone in the universe?” - GPT Image

Я отобрал по 1 наиболее удачной генерации для каждой темы. Промпт генерился автоматически: сначала в ChatGPT, а потом в автопромптинге Genspark.

Даже после пары часов творческого тестирования на разных концептах, сложно пока сделать однозначные выводы по всем моделям. Но что чувствуется, так это то, что у каждой модели явно есть свой дефолтный стиль. И сколько ты промпты не крути — она в него сваливается.

- Nano Banana — если не давать референса, то очень сказочные картинки всегда генерит, как-будто из детской художественной книги. Как бы ты не призывал к реализму. Скучно, вот и не попало в финальную подборку.
- Flux — красиво, но явно скомунизженные датасеты для обучения. Понял я это просто — на большинстве изображений модель делает подпись в углу, как обычно делают авторы картин или вебсайт, где выкладывают такие картинки. Присмотритесь к 2 картинке правому нижнему углу. Вроде немецкая компания, а такой ахтунг...🤡
- GPT Image — лучший выбор для драмы, всегда немного художественный стиль, хорошее следование промптам.
- Bytedance Seedream V4 — хорошо работает с людьми, любит детали и текстуры, хорошее следование промптам.
- Ideogram V3 — "вылизанные" картинки, но красиво, со своим неповторимым стилем, который сложно описать и надо прочувствовать.



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍21
Kaggle и Google проводят 5-дневный интенсив по AI агентам

С 10 по 14 ноября Google и Kaggle проведут бесплатный онлайн-интенсив, посвящённый созданию и внедрению AI агентов — от базовых принципов до продакшена. Формат — живые лекции, практические задания и общение в Discord.

Каждый день — отдельный блок:
• День 1. Архитектуры и основы работы AI агентов
• День 2. Инструменты и MCP: как агенты взаимодействуют с внешним миром
• День 3. Контекст и память: кратковременная, долговременная и управляемая память
• День 4. Качество: логирование, трассировка, метрики и оценка эффективности
• День 5. Продакшен и масштабирование. Финальный capstone-проект

Курс подойдёт как начинающим, так и продвинутым разработчикам, ML-инженерам и продакт-менеджерам, работающим с агентными системами.

Регистрация тут



Я проходил у них раньше аналогичный интенсив по genAI. Сюда тоже схожу. Времени займет у вас немного (1-2 часа в день), но быстро погрузит в самые последние технологии простыми словами.

Если вы уже спец по агентам прямо нового вы чего-то не узнаете скорее всего, но получите практический опыт именно с гугловыми системами при создании агентов (и в прошлый раз давали бесплатный доступ к их АПИшке на время интенсива). Да и повторение — мать учения 😈



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥11
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI выпускает своего убийцу n8n

В сеть утекло видео с тестированием нового конструктора агентов от OpenAI.

Будет все: и работа с файлами и поиск и возможность подключить MCP (на видео видны коннекторы с Google и Microsoft сервисами).

По слухам представить должны его уже сегодня на DevDay.

Делать такие визуальные конструкторы вошло в моду — такой есть у Google в разработке, у Яндекс в AI Studio, теперь у ChatGPT.

Сильна тенденция на вертикальную интеграцию: теперь, чтобы собрать своих агентов, достаточно выбрать экосистему, с которой хочешь работать, а дальше — все на мази — аренда мощностей, модели, конструктор, хранение данных. Все необходимое в одном месте, у одного провайдера.

Zapier, n8n, botpress и другие конструкторы общего назначения… press F to pay respect. Им остается козырять своей не привязанностью к одному провайдеру LLM. Хотя… есть же MCP🫶



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2211
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI перевернула правила игры: анонс Apps in ChatGPT

Мы с вами привыкли ко всяким Perplexity, где из нескольких моделек можно выбирать. Но будем честны: обычные юзеры редко этим пользуются, ведь мало кто следит, какая там модель лучше. Берут дефолтную. И дядя Сэм смекнул — надо делать все наоборот.

OpenAI переворачивает игру: теперь не юзеры или аппы выбирают, с какой ИИ работать — теперь внутри одного ChatGPT будет маркетплейс разных традиционных аппов. OpenAI уверенно засасывает аудиторию в свою экосистему.

Теперь прямо внутри ChatGPT можно давать команды в Figma, Canvas, Spotify… на подходе Uber. И результаты команд будут появляться прямо внутри ChatGPT. А ещё позднее обещают дать возможность любому аппу публиковаться внутри их маркетплейса после модерации (через время даже 18+ категорию обещают).

Для сервисов и аппов — это предложение, от которого они не могут отказаться. Все понимают, либо ты идешь туда и, по сути, добровольно сейчас отдаешь часть своего трафика дядюшке Сэму, либо твои конкуренты туда пойдут и заберут ту часть твоей аудитории, которая уже сидит в ChatGPT. Вот и выбирай…



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
👍81🔥1
Подвели результаты розыгрыша.
Поздравляем победителей 😎.

Счастливчикам уже написал в личку. Давайте за них порадуемся и поздравим 🎉
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍21
Агенты Google vs агенты OpenAI: чья стратегия победит?

Google сразу за громкими анонсами от OpenAI — релизнули Gemini Enterprise. И я решил разобраться, кто куда идет в этой гонке. Сейчас на мировом рынке LLM и агентов есть два мастодонта. Разбираемся...

OpenAI исторически последовательно выкатывает готовые к использованию фичи:
1. Сделали одну из лучших LLM, потом топовую text2image модель, потом Sora, добавили функцию Deep Research (под капотом — это агенты).
2. Выпустили Agents SDK — через него можно удобно строить агентов всем желающим разработчикам.
3. Дали функционал GPTs и «проектов» в UI, чтобы непрограммисты могли делать простых агентов.
4. Релизнули GPT-5 — модель с большим акцентом на следование инструкциям и агентную движуху, после чего агентный режим в приложении ChatGPT из тыквы превратился в настоящего терминатора.
5. Добавили функционал для автоматизации покупок онлайн через агентный режим ChatGPT.
6. Сбросили бомбу, релизнув в один день Agent Builder и интеграцию с внешними приложениями (Apps in ChatGPT).

Красивая последовательная стратегия. И важно, что юзеров не перегружают. Всё просто: вот модель, вот понятный UI для использования, вот ваши любимые приложения.

Теперь смотрим путь Google:
1. Они вообще-то были разработчиками самой технологии, лежащей в основе всех современных LLM. Но с этого момента они были в режиме догоняющего: Gemini появляется в нормальном виде сильно позже ChatGPT.
2. Дают свой ADK на платформе Vertex AI. Но кто пользовался, тот знает — Vertex — это изощрённая версия мазохизма (становится лучше, но медленно и больно). ADK вышел неплохим.
3. В Gemini с отставанием, добавляют всякий околоагентный функционал в UI — периодически криво и косо. Но тоже лучшает со временем.
4. И вот в этом году они сравнялись во многом с OpenAI и даже начали двигаться вперёд: выкатывают кучу крутых моделей, создали Agentspace (очень сырой, но концепт хороший), сделали Opal (свой n8n — тоже концепт хороший, но пока бесполезная штука), свой протокол для онлайн-покупок агентами и взаимодействия агентов. Вроде бы все запчасти на столе — можно собирать свой Порше, но тут опять Альтман со своим дурацким Agent Builder — просто выкатывает сразу готовый продукт.
5. Google судорожно пытается что-то быстро нарядно выкатить — сделали релиз Gemini Enterprise. Я уж думал — ща заживём, захожу — а это тот же Agentspace, только логотип поменяли, и все также ооочень сырой 😁
6. Надо отдать должное — только что релизнутые Gemini CLI и Gemini Browser выглядят многообещающе... но, минуточку, вроде у вас был только что релизнут Gemini in Chrome, зачем два браузера?!

Судорожная гонка или две разные стратегии?

Да, ИИ — очень сложная и непредсказуемая сфера, хрен его знает, куда ведёт эта дорога. Но для этого и нужны визионеры во главе компаний. Ясно, что у Альтмана есть чёткая стратегия, и он её придерживается — забрать себе B2C-сегмент ИИ, сделать лучший UX на рынке, замкнуть на себя внешние сервисы и бесконечно увеличивать аудиторию внутри ChatGPT.

Google действует как корпорация: десять разных лидов накатали своё видение, «продали» его акционерам (которые, естественно, ничего не смыслят в ИИ), это всё на коленке как-то пытаются собрать в одну картинку, но всё, блин, не клеится… Хотя на бумаге, уверен, их стратегия звучит красиво — что-то вроде: «быть лидерами во всём ИИ, пользуясь преимуществом своей огромной, наработанной годами аудитории как в B2C, так и в B2B».

Такая широкая постановка задачи их явно разрывает в разные стороны, не позволяя довести большинство продуктов до удобоваримого вида, но в то же время, они сразу пилят большой фундамент и тестируют много гипотез. Доработка этой махины до юзабельного состояния займёт у них месяцы, если не года, пока на фоне OpenAI шустро выкатывает фичу за фичей, рискованно вкладываясь в очень конкретный функционал, не распыляясь на кучу разных гипотез.

🔭 Как думаете, кто выиграет на дальней дистанции?



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥31
Правильные вопросы решают все

Когда появились всякие LLM, самая большая проблема, с которой столкнулось человечество — придумать как их действительно с пользой использовать. Велик соблазн генерить мемы, посты в соцсетях или автоматизировать коллцентры. Но LLM — это всего лишь инструмент, и все зависит от того, как вы его используете.

Так вот делюсь одним из простых и доступных, но крайне полезных способов использовать LLM, который мне лично очень зашел.

Рецепт простой:
1. Вам нужно набрать определенную историю переписки с любимой LLM, у которой есть память (сейчас это большинство LLM - главное с одного аккаунта сидеть и в одной LLM). Говорите с ней обо всем. Что-то скрывать или преукрашивать нет смысла. Чтобы инструмент сработал — вы должны быть с ней честны и о целях и желаниях, и о сомнениях и страхах. Тут и сами диалоги будут интересные, но еще LLM все запомнит про вас.

2. Дальше просите:
Проанализируй все наши чаты, собери основную информацию про меня и сделай вывод, какие у меня основные жизненные цели


Во-первых, поднимает самооценку — нейросеть напишет про вас как про звезду Форбс 😁
Во-вторых, мы подготовили контекст для самого интересного.

3. Наконец, охапка дров и плов готов, в том же чате просите LLM:
С учетом описанных выше целей, какие вопросы я должен задавать себе и тебе, чтобы их достичь?


Честно говоря, самому дойти до правильных вопросов не всегда просто, но когда ими задаешься — это заставляет заглянуть в те уголки сознания, куда вы могли не наведываться годами (или никогда). А как известно, задать правильные вопросы — это 80% успеха.

Примеры вопросов, которые я таким образом получил, и лично меня они подтолкнули к размышлениям:
- Что я на самом деле хочу понять о природе интеллекта — в человеке и в машине?
- В какой точке мои философские взгляды и инженерный подход сходятся в одно целое?
- Какую культуру я хочу транслировать людям, с которыми работаю?
- Что для меня значит “успех”, если исключить сравнение с другими?

Дальше в этом чате развиваете вопросы и обсуждаете с чатом. Вот и получается AI ментор, которого в реальной жизни еще поищи. А для тех, кому это зашло — вот вам и новый агент в копилку.



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥21
This media is not supported in your browser
VIEW IN TELEGRAM
n8n внедрил AI генерацию воркфлоу

Фичу представили тихо, без громких анонсов, а фича то важная. Механизм похожий на Opal от Google. Это будет отраслевой стандарт.

No-code билдеры, как n8n, — все еще слишком сложно для обычного юзера. А vibe coding — слишком не управляемо. Vibe building (патентую название, пока не забрали😁) выглядит как золотая середина.

Идеальный пайплайн с vibe building:
1. Текстовый промпт
2. Автоматически сгенерированный воркфлоу
3. No-code редактирование этого воркфлоу через текстовый промпт или в самом билдере
4. Запуск воркфлоу, либо выгрузка кода воркфлоу и передача разработчикам.

Как устроено сейчас во многих командах: для запуска сколько-нибудь сложной фичи нужно пройти 10 итераций в замкнутом круге "описание бизнес-процесса -> неправильная интерпретация и реализация разработчика -> правки описания -> правки реализации" (и так по кругу).

Как можно сделать теперь: "Бизнес-аналитик сам прототипирует автоматизацию процесса -> разработчик забирает готовый код и просто вшивает его в кодовую базу продукта".

Скорость прототипирования и разработки увеличена за счет снижения "транзакционных издержек" 😊

Ждем, когда аналогичная фича появится в Agent Builder от OpenAI. В реализации она очень простая — нужно лишь генерить JSON со схемой воркфлоу.



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥4211
Apple завезли новый чип M5

Быстрее-выше-сильнее на 30% по сравнению с М4. Рассказывают, что Apple intelligence будет лучше работать — но кого это волнует 😁

Важно, что шустрее будут шуршать локальные модельки, которые вы можете загрузить через Ollama на ноутбук, чтобы в самолете продолжать познавать мир и писать документы через карманную LLM.

Кстати новый чип будет и в айпаде, куда через Reins также можно скачать локальные модельки.

Почему не пользоваться встроенным Apple intelligence спросите вы — да можно, но только на английском 🐱



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥11
Новая Veo3.1 хороша

Все, что мы любим в Veo — прокачали еще немного. Промптов слушается еще лучше. Звучание еще более естественное, хорошо комбинирует фоновые шумы и голоса. Качество по дефолту — 1080p.

По моим тестам Veo3.1 (первое видео) vs Sora 2 (второе видео):
- Sora 2 выдает заметно более кинематографичные сцены, но в более низком качестве (по ощущениям 480-720p).
- Промптам следует лучше Veo3.1 — например, персонаж говорит то, что было написано в промпте, когда Sora 2 немного стилизует текст, хотя делает это и в тему.
- Модель от OpenAI к тому же отказалась дядю Сэма генерить на тракторе, а гугловая модель — с удовольствием 😁



Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥111