Заместители – Telegram

Заместители

1.04K subscribers

86 photos

77 videos

4 files

109 links

Цех ИИ агентов. Здесь я тестирую цифровых заместителей в разных профессиях. Если агент справляется — он остаётся в Цехе на “постоянку”. По пути обсуждаем актуальные новости про ИИ агентов простым языком.
Добро пожаловать в эру замещения.

Download Telegram

About

Blog

Apps

Platform

Заместители

1.04K subscribers

Заместители

This media is not supported in your browser

VIEW IN TELEGRAM

🎮

Сгенерировано бесплатно, или балуемся воскресным утром

Всё хочу сделать обзор сервисов для генерации видео. И хотя есть несомненный лидер — Veo3, на самом деле на рынке очень много крутых ИИ. Многие из них — опенсорсные или с бесплатными лимитами.

Но пока вместо обзора → рум-тур по Цеху ИИ-агентов! 😁

Вот как ИИ животворящий делает такой ролик по шагам

1. Первая часть видео — мой цифровой аватар. Это максимально я, но аватар сам озвучивает текст, который я просто написал. На входе текст — на выходе видео с моим лицом, голосом и липсинком. Спасение для видео-контент-крейторов, чтобы клепать рилсы. Сделано в HeyGen.

2. Дальше — три картинки, сгенерированные в Nano Banana по промпту и моей фотографии (image+text → image).

3. Потом image → video в Wan2.2.

4. В конце всё собираем в любимом видеоредакторе (ну или в CapCut).

Всё сделано полностью бесплатно. Но, конечно, с костылями: где-то водяной знак нужно обрезать, а в Wan2.2 очередь на генерацию ждёшь часами. Если делать это на потоке — лучше брать платные подписки. Но побаловаться можно и так!

Всем солнечного воскресенья! ☀️

⸻

Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍33

494 views12:57

Заместители

🪄

Один пост, чтобы обрести силу... или разбираемся в промптах, чтобы научиться их писать раз и навсегда.

В последнее время расплодилось каналов с псевдоэкспертами по промпт-инжинирингу. Но цель у них одна — зарабатывать на вашем внимании, втюхивая вам сгенерированные в тех же LLM промпты как нечто волшебное и уникальное. Здесь мы такое не одобряем!

Давайте-ка один раз хорошенько разберём, как работают промпты и как их писать. Я намеренно не буду грузить вас заумными терминами, так как именно их используют как завесу из магической пыли вокрут этой темы. Моя же цель — рассказать все максимально просто.

🤔

Сначала база — что такое промпт?

Промпт — это вопрос, инструкция или просто набор слов/символов, который вы отправляете любой LLM и ждёте ответа.

Промпт бывает системный и обычный.
- Системный — выставляется один раз надолго, как настройка.
- Обычный — это ваш диалог с моделью. Каждая новая фраза — тоже промпт.

По сути, оба типа склеиваются и передаются в модель вместе с историей вашего диалога.

Но что такое промпт для модели? Представьте, что модель — это собака 🐕.
Она не понимает ваших слов, слышит только звуки. Но если её надрессировали, у неё есть ассоциации: вы говорите «голос» → собака гавкает → получает вкусняшку.

С моделью всё так же: вы даёте слова, а она ищет у себя в «мозгах», с чем она их ассоциировала во время тренировки и получала за это вкусняшку, и возвращает это вам.

Например: «Разговаривай как мастер Йода». И это отправляет ее к конкретным ассоциациям. Чем точнее и детальнее вы направите её в нужный уголок векторного пространства, тем лучше получите ответ, потому что она будет искать в нужном месте. Если направите плохо — это может приводить к галлюцинациям.

К тому же модели дополнительно обучают следовать инструкциям, чтобы модель не просто возвращала ассоциации с Йодой, а понимала, что именно вы от неё хотите.

🙄

Так как же писать те самые «волшебные промпты»?

Во-первых, легко! Нет никаких «волшебных» и «тех самых» промптов. К тому же, модели специально сейчас обучают в процессе «ризонинга» первым шагом улучшать ваш промпт. То есть модель сама улучшает под себя запрос. И она умеет это лучше тех «гуру», которые это повсюду втюхивают.

Во-вторых, есть общие подходы:

- обозначьте роль/персону модели (как она должна отвечать)
- укажите стиль и формат (коротко, формально, весело, буллетами…)
- сформулируйте задачу (что именно нужно сделать: написать стих, найти инфу, сгенерить код)
- дайте контекст (на что опираться: интернет, загруженный файл, стихи Пушкина и т. д.)

Опционально:

- отрицательный промпт (что не делать)
- формат входных и выходных данных (если их нужно жестко задать)
- пример результата (сильный якорь для модели, поэтому показывайте то, что вам реально нужно).

Все эти элементы можно зашить в системный промпт. А дальше — просто ведите диалог.

В-третьих, используйте рекомендации от создателей конкретных моделей. Google, OpenAI, Anthropic и другие выпускают свои рекомендации, как писать промпт для их моделей. К ним стоит прислушаться, так как они тренируют модели на конкретных шаблонах. Знаете их — понимаете лучше, какие ассоциации зашиты в модель.

В-четвертых, используйте сами LLM для написания промптов. Они это делают лучше людей. Кстати OpenAI даже сделали специальный инструмент для этого (на картинке, кстати, именно он). С помощью него вы можете тренироваться писать крутые промпты.

Ну а если вы матерый датасаентист, который строит агентную систему, то вам нужно пробовать использовать автоматический оптимизатор промптов. Например от OpenAI или от Google.

☕️

Итого: вжух! — и за один пост вы освоили промпт-инжиниринг.

…На уровне выше среднего юзера. А если прочитали инструкции от вендоров — то уже на уровне промпт-инженера. Для большинства этого с головой хватит для получения шикарных результатов от современных моделей.

⸻

Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥7❤3👍3⚡11

504 views13:06

Заместители

Media is too big

VIEW IN TELEGRAM

🫣

AlterEgo обошел Neuralink Илона Маска на повороте?

Наткнулся на уникальный стартап AlterEgo. Это «около-телепатическое» устройство. Оно не читает мысли — оно считывает сигнал, который мозг посылает в речевой аппарат. Таким образом оно имеет доступ только к тому, что вы намеревались сказать, но не к тому, о чём тихо думали.

На демке работает шустро и круто:
- под капотом явно их собственная ИИ моделька, которая интерпретирует импульсы в речь
- устройство имеет маленькую камеру, интегрированную с мультимодальной моделькой (скорее всего какой-то готовой), которая «видит» то же, что и вы
- переводит речь на разные языки в режиме онлайн
- интегрируется с другими устройствами (компьютер, телефон), обеспечивая бесшовную коммуникацию между контентом и вашей безмолвной речью
- само устройство «разговаривает» с вами, передавая вибрации через кости головы (такие наушники уже давно продаются на любом маркетплейсе, но здесь они идеально дополнили устройство).

🤯 Выглядит как чистый сайфай. Настолько круто, что я сперва решил, будто это скам, и немного поресерчил.

Arnav Kapur — CEO и кофаундер компании, парень с серьёзным образованием. Первую версию устройства он начал собирать ещё во время учёбы в MIT.
Max Newlon — COO и кофаундер, тоже не промах, до этого занимался brain-интерфейсами в стартапе-единороге BrainCo.
Раннюю версию устройства они уже показывали на TED в 2019 году. Есть и публикация в официальном медиа MIT.

В общем, на скам не похоже — и это восторг!

И самое интересное — устройство полностью неинвазивное. То есть вам не нужно сверлить череп дорогущим роботом, как в Neuralink Илона Маска. И это гигансткое преимущество для масс маркета. Достаточно надеть прибор на голову и начать безмолвно общаться с компьютером или с другом в другом конце салона самолета.

Конечно, за счет считывания только речевых импульсов функционал ограничен только тем, что можно описать речью. А значит играть в стрелялки, как умеют юзеры Neuralink, не получится. Но будем честны — большинство будут готовы отказаться от этого, если можно будет избежать лишней дырки в черепушке!

⸻

Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤43👍1

421 viewsedited 18:53

Заместители

Готовы ли мы и технологии к ИИ в госуправлении?

Философский пост на тему, которую давно мусолят. Но в последние месяцы она звучит всё громче. Если вы пропустили, то буквально за пару месяцев прокатились такие инфоповоды:

- Ulf Kristersson, премьер-министр Швеции, признался, что использует ChatGPT для получения второго мнения. За что вызвал гнев народа.
- ИИ-помощник Diella (в переводе с албанского — «солнце») почти год помогала по бюрократическим вопросам на «госуслугах» Албании, после чего её «повысили» до члена кабинета министров по вопросам коррупции в госзакупках (на изображении к посту — как раз она).
- Наконец, в Непале зумеры, устроившие госпереворот после блокировки соцсетей, использовали ChatGPT для выбора временного исполняющего обязанности главы правительства.

Один раз — случайность, два раза — совпадение, три — закономерность. И это только громкие случаи. Совершенно очевидно, что многие политики уже используют ИИ для написания текстов, быстрого погружения в незнакомые темы и в целом для тех же задач, что и обычные люди.

🍵

Мнение

Пока ИИ находится в умелых руках, его использование, на мой взгляд, суперполезно даже в критических сферах, где цена ошибки велика. ИИ помогает взвесить «за» и «против», узнать детали, на которые у политиков может просто не хватать времени или ресурсов.

Например, в том же Непале (если что, я не имею мнения по политическим вопросам Непала, и говорю лишь о юзкейсе технологии): толпа смела правительство, а потом поняла, что не знает, что делать дальше. Без ИИ решения возможно принимались бы на догадках неопытной молодёжи или под давлением конкретных политиков. С помощью ChatGPT же они попытались принять более взвешанное решение:
1. Сформировали список кандидатов.
2. Провели дебаты с ChatGPT о плюсах и минусах каждого.
3. В итоге выбрали временного лидера и кандидата на длинной дистанции.

Но есть и обратная сторона. Сейчас ИИ всего лишь инструмент. Его создают люди, а значит, все «взгляды» и «предвзятости» моделей исходят из того, на каких данных и с какими целями они обучались.

Например, в медицине (области с высокими рисками) все заинтересованы в максимально правильных диагнозах, поэтому разработчики честно вкладываются в обучение моделей.

В политике всё иначе. У каждого разработчика свои взгляды и интересы. Кто-то не чувствует ответственности за последствия, кто-то может быть аффилирован с конкретными силами. В общем целая поляна для «лоббизма» (так аккуратно это назовем).

Для иллюстрации (пример исключительно гипотетический): представьте, что Сэм Альтман знает о том, что несколько лидеров стран активно консультируются с ChatGPT по вопросам госуправления. В очередной версии GPT 5.1 в дообучение добавляют слегка изменённую выборку данных, которая незаметно обучает модель конкретным политическим предпочтениям для отдельных стран. Дальше модель мягко транслирует эти идеи политикам-консультантам. На обычных бенчмарках или для массового пользователя это не проявится. Но в узких вопросах по управлению государством — да. По сути, это прямое влияние на чужую политику.

Технологически сейчас от этого защититься на 100% нельзя. Можно лишь кросс-проверять разные модели и чётко осознавать риски.

А можно ли в будущем прийти к моделям, которые будут эффективно и непредвзято управлять целыми государствами? Возможно. Но это точно будет следующее поколение ИИ — AGI (сильный искусственный интеллект), который сможет независимо развиваться и дообучаться без внешнего влияния разработчиков и других людей.

⸻

Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители

Please open Telegram to view this post

VIEW IN TELEGRAM

❤333⚡1

375 views10:00

Заместители

👀

Эй-ай браузеры — смогут ли они сломить привычки юзеров?

Есть две противоположные точки зрения на AI-first браузеры. Одни считают их тупиковой ветвью эволюции, другие — пророчат вытеснение обычных LLM-приложений (вроде ChatGPT).

По сути, ИИ браузеры должны сломить сразу две привычки:
- стандартное использование браузеров, гугление
- уже укоренившееся «спрашивание» информации у LLM.

И если у них получится — они могут стать главным интерфейсом взаимодействия с обеими технологиями.

В последнее время вышла целая гора таких проектов:
1. Dia (от создателей Arc)
2. Genspark
3. Fellou
4. Edge (со встроенным Copilot)
5. Brave Browser (с Leo AI)
6. Comet (от Perplexity)
7. Sigma AI
8. Neon (от Opera)

Половина ещё недоступна (только waitlist). Но вторую половину я уже установил, тестирую и гоняю по полной. Скоро будет обзорчик 😈

Впечатления пока смешанные. В списке есть и наивные, почти бесполезные имплементации ИИ, и реально агентные браузеры с арсеналом встроенных функций.

Уже закрадывается мысль отменить подписку на ChatGPT и вместо этого взять подписку на один из браузеров…

Если знаете ещё крутые AI-first браузеры, которые можно скачать прямо сейчас — кидайте!
А если кто-то уже перешёл на постоянное использование — делитесь впечатлениями 🍵

⸻

Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥10❤11

339 views09:26

Заместители

ИИ шоппингу быть! Сможет ли Google обеспечить безопасные сделки для ИИ агентов?

Google представил Agent Payments Protocol (AP2) — открытый стандарт для безопасных платежей, совершаемых ИИ-агентами.

Недавно я писал о том, как ИИ-агенты потенциально могут сливать бюджеты юзеров. Так вот, именно этот протокол призван избежать такой ситуации.

🤔

Как работает протокол

1. Создание Mandate.
Юзер даёт агенту поручение: «купи авиабилет до $500».
Агент формирует Mandate — цифровой контракт с параметрами: что купить, у кого, за сколько и в какие сроки.
Mandate подписывается криптографически.

2. Передача Mandate продавцу.
Агент отправляет контракт мерчанту или платёжной системе.
Продавец видит ровно те условия, что зашиты в Mandate, и не может запросить «чуть больше денег».

3. Проверка и исполнение.
Платёжные рельсы (банк, кошелёк, процессинг) проверяют:
- валидность подписи
- что продавец зарегистрирован в AP2
- что условия Mandate совпадают с транзакцией
Только после этого списываются деньги.

4. Финализация.
Агент получает подтверждение и закрывает задачу.
Вся цепочка — кто создал Mandate, на какие условия согласился, кто исполнил — записывается и доступна для проверки.

В AP2 есть поддержка:
- банковских переводов
- карт Visa/Mastercard
- стейблкоинов и криптовалют (Coinbase, Ethereum Foundation, MetaMask и др.)

⸻

🕵️‍♂️

Как защищает агентов от скама?

- Никаких ссылок. Агент не «жмёт кнопки», а создаёт Mandate — контракт «купить товар X за Y долларов».
- Верификация. Если продавец не зарегистрирован в AP2, транзакция не пройдёт. Без специального ключа магазин не сможет подписать ответ.
- Лимиты. В контракте сразу зашиты сумма, валюта и срок. Агент ограничен в назначении и сумме платежа.
- Аудит. Каждое действие фиксируется. Любой левый шаг будет виден, и транзакцию, скорее всего, можно будет откатить.

⸻

😐

Гладко было на бумаге…

В теории — все звучит хорошо. На практике «технически надёжные» схемы всегда разбиваются о человеческий фактор и хитрость мошенников.

Сходу в голову приходит несколько рисков.

1. Насколько жёсткой и кем будет верификация при подключении мерчантов к системе? Если вопрос к чьему паспорту привязаться - вспоминаем дропперство так сейчас популярное.

2. Насколько точно и грамотно будут формироваться инструкции в Mandate? И как идентифицировать каждый товар? Запихнул в описание товара промпт инъекцию и продаёшь себе авиабилеты на рейсы игрушечных самолетов по 100 баксов.

3. Потенциальный риск — агенты-прослойки. Они могут маскироваться под агрегаторы, перехватывать заказы от юзерских агентов и накручивать свою комиссию. С точки зрения протокола — схема легальная. Но представьте, что между вами и товаром выстраивается целая цепочка таких «прослоек».

4. Будет ли возможность сделок agent-2-agent? Если да — это сразу фаталити для безопасности юзеров. Взгляните на P2P-рынок в крипте.

5. Наконец, протокол позволяет заранее фиксировать в Mandate намерения пользователя. Сколько же будет судебных тяжб между юзерами, платежками и вендорами о неправильной интерпретации этих намерений… 😁

В общем, направление классное, но дров еще наломаем по пути точно.

Сайт проекта почитать тут.
Репозиторий потыкать тут.

⸻

Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители

Please open Telegram to view this post

VIEW IN TELEGRAM

3🔥2❤11

351 views08:06

Заместители

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

🏛 + 🧠= Gemini in Chrome — апгрейд старичка хрома до уровня агентного браузера

Только я запланировал серию постов про AI браузеры, как в гонку ворвался Google Chrome. А это серьезный игрок, который, судя по анонсу, может претендовать на первое (или, минимум, второе) место.

Google очень выборочен в раскатке релиза — он доступен только юзерам из США, с выбранным языком English (United States). При этом VPNом его далеко не всегда можно обмануть. Гуглойды точно знают где вы сидите, даже когда ВПН включен 😨 Еще поборемся, попробую его таки получить, чтобы потестить в рамках скорого обзора бразуеров. А пока ловите короткий обзор возможностей из анонса самого Гугла.

Обновление называется Gemini в Chrome — появилась специальная кнопочка, вызывающая Gemini на любой странице браузера. Работает сейчас только на английском все (оно и понятно — релиз то только на США). А вот что по функционалу:
- Агентные возможности: обещают, что Gemini сможет выполнять за вас рутинные задачи — например, бронировать стрижку или заказывать продукты, пока вы занимаетесь более важными делами (пока что, конечно, только в сервисах США).
- Работа с несколькими вкладками: Gemini умеет анализировать и сравнивать информацию сразу с нескольких сайтов.
- Поиск ранее посещённых страниц: не нужно листать историю — просто спросите Gemini, и он найдёт нужный сайт по вашему описанию.
- Глубокая интеграция с Google-сервисами: по запросу асистент будет создавать встречи в Календаре, искать моменты в YouTube, узнавайте детали в Maps — не покидая текущей вкладки.
- AI Mode в адресной строке: задавайте сложные вопросы прямо в поисковой строке, тыкайте на кнопочку AI Mode (это кстати, уже доступно всем).
- Контекстные подсказки и AI-обзоры: Gemini предложит релевантные вопросы по содержимому страницы и даёт подробные AI-обзоры прямо в панельке сбоку.
- Борьба с мошенничеством: Safe Browsing с Gemini Nano обещает распознавать новые виды скамов, анализируя контент страницы, включая фейковые вирусы и лотереи.
- Блокировка спама и управление разрешениями: Chrome автоматически фильтрует подозрительные уведомления и предлагает менее навязчивые запросы разрешений.
- Управление паролями: Gemini поможет не только выявить скомпрометированные пароли, но и поменять их в один клик на поддерживаемых сайтах.

Апдейт ожидаемый, и является вишенкой на торте в AI экосистеме Гугла, о которой я говорил тут, когда рассказывал про Google Agentspace.

⸻

Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4❤11

487 views10:07

Заместители

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

🚨

Тест-драйв ИИ браузеров. Первый заезд

Будет два заезда. В первом соревнуются базовые ИИ браузеры, которые просто добавили LLM в свои интерфейсы с разной степенью интеграции.

Во втором заезде будет красивая борьба настоящих агентных браузеров.

⸻

Правила заезда

Тестить будем через запросы к браузерному ИИ:
1. Ищем, где купить новый iPhone
2. Суммаризуем видео на YouTube и русскоязычных видеохостингах
3. Планируем выходные для двоих
Дополнительно смотрим на UX, UI и фишки каждого браузера

🥇 Dia (первое видео) — 4/5 баллов
- Айфоны подобрал, цены корректные, ссылки рабочие.
- На YouTube суммаризует видео без проблем, с таймкодами. Но на других площадках — не может.
- Выходные спланировал приемлемо. Нужно немного «помучать», но в итоге выдаст и ссылки, и расписанный план.
- Реализована концепция “Skills”: ряд преднастроенных пропмтов, что позволяет выполнять действия в два клика: выбрал вкладку, добавил скилл и все, ничего больше писать не надо — удобненько.
- Продуманный и удобный AI-first UI/UX.

Итого: комбинация ChatGPT + удобный браузер. Если бы OpenAI сделали свой браузер (ходят слухи, что делают), то легко бы обошли Dia. А пока это очень гармоничная и удобная обёртка для ChatGPT. В России все ИИ-функции работают только с VPN.

🥈 Edge (второе видео) — 4-/5 баллов
- Айфоны нашёл цены и ссылки на источники корректные.
- Видео на YouTube суммаризует отлично. Сделали pop-up-плашку, которая сразу предлагает саммари. Но на других площадках не работает.
- Выходные запланировал приемлемо.
- Из интересного: в Copilot есть персональная подборка — новости, погода, 4-минутный подкастик (похоже на «утреннее шоу» от Яндекс Алисы). Есть встроенная студия для генерации картинок, но у меня отказалась работать.
- UI/UX обычный. Просто Edge, на мой вкус — безвкусный.

Итого: Главное отличие от Dia — слабее UI/UX. К тому же союз OpenAI и Microsoft шаткий. ChatGPT может исчезнуть из Edge в любой момент. С учётом этого «пускать корни» в браузере не хочется. ИИ в России — только через VPN.

🥉 Yandex Browser (третье видео) — 3/5 баллов
- Подбор айфонов — работает как обычный поиск без ИИ. В Яндекс.Нейро работает лучше, но Яндекс считает, что это отдельный сервис 🌟
- Видео суммаризует шикарно: работает не только на YouTube, но и на vkvideo и Rutube. Для российского юзера это важно. Плюс единственный из всех предлагает бесплатный дубляж на русский язык и автосубтитры. Это главная ИИ-фишка браузера пока.
- Выходные спланировал плохо.
- Строка поиска остаётся строкой поиска, без встроенных ИИ возможностей, как у Dia и Edge. UI/UX будто прячет ИИ от юзера.

Итого: Это всё ещё обычный браузер, куда там-сям напихали ИИ, но без единой концепции. Сам Yandex GPT на фоне конкурентов работает кисленько. В закрытой альфе они уже тестируют агентный функционал. Но если не будет сквозной стратегии внедрения ИИ — это путь в никуда. Из плюсов — работает без VPN и ориентирован на русскоязычные сервисы.

🌐

Brave (четвёртое видео) — 2/5 баллов. Полный фейл.
- Айфоны кое-как нашёл, но цены неверные, ссылки нерабочие.
- Видео на YouTube толком не суммаризовал
- Выходные спланировал плохо.
- Индивидуальная фишка Brave — это повышенная секьюрность. UI/UX лучше чем у Edge, но до Dia не дотягивает.

Итого: Без премиум подписки пользоваться мучительно. Результаты от маленьких LLM выглядят стыдно и неконкурентоспособно. Также, ИИ в РФ работает только через VPN.

⸻

Подведем итоги по базовым ИИ браузерам.

Стоит ли все бросать и переезжать на базовые ИИ браузеры? Нет. Они еще сыроваты — причем каждый по-своему. Заменить ChatGPT на Dia полностью тоже не получится, тк не весь функционал переехал в браузер.

До уровня базовой интеграции ИИ дойдут все браузеры. Поэтому подождем еще немного, прежде чем принимать решение о выборе «того самого».

🤟 Зрелищная гонка нас ждет во втором заезде. Агентные браузеры — настоящие ИИ мультитулы, и уже волей-неволей задумываешься о том чтобы пересесть со своей скромной ~~тойоты~~ LLM на эти ИИ болиды.

⸻

Подписывайся, чтобы не пропустить второй заезд.

Заместители

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥7❤2⚡22

495 views13:10

Заместители

👀

Пост боли и горения…

В Сколково 30 сентября будет очередная конфа по теме ИИ, коих в год проходит десятки. И вроде ничего примечательного. Я лет 5 ходил и выступал на многих российских топовых ИИ конференциях. Поэтому с пониманием отношусь к болтологии, которую там разводят. Но здесь у меня подгорело с главного тезиса конференции.

Основной тезис звучит так: «Ждать или внедрять. ИИ как главный выбор десятилетия».

Дорогой дневник, мне не подобрать слов, чтобы описать всю боль и испанский стыд, которые я испытал… 🧠
Целую панельную дискуссию этому посвятили!

Недавно Цукерберг сказал, что лучше потратит несколько сотен миллиардов долларов, чем пропустит появление суперинтеллекта (Superintelligence - это ИИ, который превзойдет человека в большинстве интеллектуальных функций и тем).

По разным оценкам в России к 2030 году за счёт ИИ вырастет ВВП всей страны на 4-6% (это гигантские цифры).

Всемирная Торговая Организация (то самое ВТО) прогнозирует, что мировая торговля вырастет на 40% за счёт ИИ к 2040.

Что уж, в России давно существует целый веер федеральных проектов и подпроектов и грантов, посвященных ИИ.

А на конференции обсуждают, стоит ли внедрять или ещё подождать… Подождать пока все придумают зарубежом? Подождать, пока будет упущен этап интеллектуализации (да, слово страшное, что поделать) экономики? Подождать, пока во всем мире производительность труда вырастет кратно, а у вас тем временем в офисе тетя Галя вручную печатает отчет? Эх…

Почему так подгорело? Потому что это отражение мыслей российского бизнеса. Это я испытал на своей шкуре, пока последние несколько лет внедрял ИИ в разные бизнесы.

И я понимаю, что страшно и денег нет. Но выбора подождать уже давно нет. Соберитесь там, елки-палки! 😐

Заместители

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9🔥22

363 views21:25

Заместители

Опа 🍒

🍒

🍒

Как раз вовремя! Включаем комету во второй заезд тест-драйва ИИ браузеров.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥63❤21

367 views12:34

Заместители

Media is too big

VIEW IN TELEGRAM

🚨

Тест-драйв ИИ-браузеров. Заезд второй

В первом заезде участники — просто трехколесные велосипеды по сравнению с теми, кого мы увидим сегодня. Честно говоря, я сам ждал, когда же доберусь до второго заезда — и вот наконец-то он тут!

Во втором заезде соревнуются три агентных болида:
- Genspark Browser (по этой ссылке рефералка на 1000 кредитов)
- Fellou (реферальный код на бонусные кредиты: G9GS31)
- Comet от Perplexity (рефки нет, есть только ограниченное количество инвайтов — о них в конце поста).

Помимо этого поста — будет ещё отдельный пост про каждый браузер с детальными видео, в лучших традициях этого канала. Уж очень много про каждый из них можно и хочется вам рассказать ☕️

Каждым браузером я попользовался пару дней, а также провёл одинаковые тесты, где браузер по текстовому промпту должен:

1. Подобрать новый iPhone и заказать его
2. Суммаризовать видео на YouTube и VK видео
3. Построить план на выходные с учётом моего расписания в Google Календаре и построить маршрут на карте
4. Провести ребрендинг Автоваза с генерацией новых логотипов (должен же был кто-то взяться за эту задачу 😁)

Также оценивались UX/UI и индивидуальные фишки браузеров.

Томить не буду, подводим результаты заезда:
🥇Победитель заезда — Comet от Perplexity.
Этот браузер — прекрасное комбо агентных функций и удобного браузера на базе Chromium. Космическая тематика, которой он пронизан, сразу заняла у меня в сердечке отдельное место. При этом браузер самый оптимизированный из всех. Всё работает очень шустро: и AI под капотом, и сам браузер. Ну и, конечно, все плюшки от Perplexity на месте — доступ к разным моделям, отдельные пространства и персональные подборки на страничке Discover. Отдельно отмечу Voice mode — будущий Джарвис (правда, пока он сыроват). Наконец, это единственный из трёх браузеров, где всё работает в России без всяких VPN и есть русскоязычная локализация. Лучший выбор для большинства юзеров.

🥈Серебро забирает Fellou
Это настоящий агентный браузер с ооочень самобытным UX/UI. Придётся забыть всё, что вы знали о браузерах, чтобы пересесть на него. Но дизайн сделан с любовью, и UX на самом деле продуман. Этот браузер может брать на себя настоящие агентные задачи и красиво жонглировать несколькими вкладками, где шуршат ИИ агенты. Но иногда это приводит к переусложнению: чтобы решить простые задачи (например, суммаризовать видео), он грозится вызвать целого ИИ агента, где справилась бы обычная LLM. При этом сами агенты думают подольше, чем в Comet.

🥉Финиширует последним в гонке браузеров — Genspark. Но одновременно он получает приз как лучший ИИ мультитул.
Если вы техногик, то количество встроенных сюда ИИ-функций вскружит вам голову. Тем более, что они работают на моделях от топовых вендоров (OpenAI, Google, Qwen…) и работают очень резво. Плюс разработчики впендюрили локальный ИИ прямо в браузер — значит, лёгкие модельки можно скачать на комп без доп знаний (об Ollama), и они будут доступны всегда, даже при нулевом балансе кредитов Genspark или без интернета. Но если вы обычный юзер — браузер разочарует. По ощущениям — это Android OS начала 2010-х: всё «деревянное» и «голое», работает немного топорно. И то и дело при работе агентов наружу торчат всякие куски кода, которые с точки зрения «красоты» должны быть спрятаны под капот.

Кстати, специально для этого обзора я оформил подписку на Genspark. И оказалось, что он отлично подходит для нешго Цеха ИИ агентов, где мы ценим не красоту, а функциональность. Значит берем его стажером и еще погоняем!

Заключительная мысль — после теста стало очевидно, что подписка на отдельную LLM потихоньку теряет смысл. Буду активно юзать Comet и Genspark весь месяц, и в конце месяца решу, стоит ли продлевать подписку на ChatGPT.

Подробные разборы каждого браузера буду публиковать в следующие три дня.

И в конце серии постов сделаем мини-розыгрыш инвайтов 🤔 в браузер Comet (без инвайтов или Pro-подписки Perplexity его нынче не скачать).

⸻

Подписывайся, чтобы не пропустить детальные разборы и розыгрыш.

Заместители

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5🔥321

2.93K viewsedited 14:42

Заместители

Media is too big

VIEW IN TELEGRAM

Fellou - «первый» агентный ИИ браузер

Доминик Се, CEO компании, позиционирует этот браузер как «первый агентный браузер в мире». Что ж, сложно сказать, кто был первым — смотря с какого момента считать, — но в сентябре 2025 вышла в свет первая полноценная версия Fellou CE (Concept Edition). Она доступна для скачивания и тестирования всем. Причём сходу дают хорошее количество кредитов. Для получения доп кредитов оставлял рефку.

Название на английском сразу располагает к себе. А вот на русском я так и не придумал нормального перевода, который бы не звучал как гэг: «приятель», «тип», «брат»… 😎

Браузер разработан на фреймворке Eko 2.0 (похоже уже даже выпустили Eko 3.0). Это опенсорсный фреймворк для создания ИИ агентов и автоматизаций. Это крутой фундамент. Имея свой фреймворк, «братишка» собирает ~~братву~~ комьюнити, которое будет улучшать и двигать его вперёд. Отличная модель, вместо того чтобы зажимать всё патентами. Причём фреймворк не только позволяет создавать агентов в браузере, но и тех, что управляют компьютером. А значит, браузер рулит не только вкладками, но и всей вашей ОС (на самом деле пока очень ограниченно).

По собственным заявлениям «паренёк» обходит в success rate и Manus, и GPT agent. Сильные заявления. Но, как покажут тесты далее, — вполне может быть правдой.

👨‍🔬

Все фаундеры врут. Тестируй сам...

С таким лозунгом я подхожу ко всем своременным ИИ сервисам и агентам. Поэтому этот браузер я погонял лично. Вот что получилось:

1. Поиск, где заказать новый iPhone.
С этой задачей справился блестяще. Сформировал полноценный каталог: HTML-страницу со ссылками, ценами, сравнением и даже обзором устройства. Оценка — твёрдая 5.

2. Заказ iPhone
А вот тут начались приключения. На Озоне Fellou завис в вечном ожидании. На Яндекс Маркете попал в бесконечный цикл: добавил товар в корзину, но пока читал всплывающее окно, оно исчезло — и агент продолжал тыкать в пустоту. На сайте МТС удалось продвинуться дальше. В итоге заказ остановился на собранной корзине. В целом неплохо, но может быть и лучше — на 4-.

3. Суммаризация видео.
Fellou умеет суммаризовать ролики на YouTube. Работает честно, но суховато — без кликабельных таймкодов, как у большинства браузеров из первого заезда. VK видео ему не поддался (как и всем, кроме Яндекс браузера).

4. Планирование выходных
С задачей справился идеально: прочитал календарь, проверил погоду, предложил список активностей и даже вывел статистику по часам — сколько уйдёт на спорт, а сколько на рестораны. Если бы я жил по этому расписанию, давно был бы в идеальной форме. Оценка — 5.

5. Ребрендинг Автоваза
Fellou провёл исследование и успел сгенерировать несколько логотипов. До полноценного ребрендинга дело не дошло — закончились токены. Тем не менее, с технической стороны — 4.

6. UI/UX
Интерфейс сделан красиво, но очень непривычно. После обычных браузеров приходится перестраивать привычку и формировать новые «нейронные связи». Поэтому — 4.

7. Допы
"Братишка" умеет больше, чем просто искать и тыкать в браузер: он может генерировать музыку и видео, создавать документы, собирать сайты и приложения, а также запускать задачи по расписанию.

💃

Есть и минусы

- После окончания кредитов Fellou просто превращается в тыкву. Даже самые простые действия на «дешёвой модели» недоступны. Чувство такое, будто у тебя на телефоне закончились минуты, а пополнить баланс некому. Неприятненько.
- Иногда теряет связь, после чего процесс крашится и не перезапускается.
- Есть мелкие баги с вводом задач — раздражающие, но терпимые.
- Ну и, конечно, в РФ только с ВПН работает.

🍵

Вердикт

Fellou — это солидный агентный браузер с большим потенциалом. Он справляется с исследовательскими задачами и простыми действиями, но не всегда умеет довести процесс до конца. Капча и сложные формы ставят его в тупик, а иногда он застревает в цикле бессмысленных кликов и сжигает ваши токены. Но это ограничение технологий в целом, а не конкретно Fellou. Если смотреть в будущее — это сильный кандидат в «заместители» для многих офисных трудяг.

⸻

Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8⚡2❤1

293 views13:49

Заместители

Media is too big

VIEW IN TELEGRAM

Агентный браузер Genspark: мне, пожалуйста, ИИ агентов — взболтать, но не смешивать

Изначально Genspark — это платформа, объединившая в себе много ИИ моделей от разных вендоров и агентов собсвтенной разработки. Ключевая фишка — Super Agent, который может вызывать других агентов по мере необходимости, некий прораб. Такая архитектура позволяет также использовать подход MOA (Mixture-of-Agents). В феврале 2025 платформой пользовались уже 2 млн пользователей ежемесячно. За подписку в 30 баксов (с налогами) в месяц получаешь доступ к куче самых разных моделей и агентов.

Почесали репу создатели, и решили — а чего бы не впихунть все это дело в браузер? И вот уже в сентябре 2025 года выходит Genspark Browser. Его позиционируют как убийцу Google Chrome... Но хватит ли кучи моделек, чтобы стать востребованным браузером? Разбираемся...

👨‍🔬

Первым делом, первым делом тесты...

В рамках экспериментов браузер должен выполнить ряд задач по текстовому промпту. Все результаты и промпты — на видео. А здесь краткие итоги:

1. Поиск, где заказать новый iPhone.
С подбором справился: аккуратная табличка, цены подтянуты верно, ошибок нет. Всё чётко и по делу. Заслуженные 5 баллов.

2. Заказ iPhone
Вот тут Genspark сдулся. Даже когда я прямым текстом попросил положить товар в корзину, он всё равно не справился. Потратил кучу токенов, скроллил, что-то собирал, но в итоге вернулся с объяснением, как мне заказать самому. Для агентного браузера — полный провал.

3. Суммаризация видео
На YouTube суммаризация хорошая: с кликабельными таймкодами, хоть и открывающимися на новой странице. VK Видео не осилил (как и все, кроме Яндекс Браузера). Ставим 5-.

4. Планирование выходных
Справился прекрасно: учёл расписание из моего гугл календаря, предложил маршруты для прогулки, составил детальный план. Построил маршрут в Google Maps. Отличная работа — 5 баллов.

5. Ребрендинг
Это первый браузер (или вернее браузерный агент), который подошёл к задаче глубже логотипа: сделал полноценное подобие брендбука. Правда, лого внутри был неконсистентным, менялся от картинки к картинке. Но по сравнению с остальными участниками гонки — это лучшая работа. Оценка — 5.

6. UI/UX
Самый слабый аспект. Интерфейс будто из начала 2010-х: на базе Chromium, но сыро и некрасиво. В процессе работы агента то и дело вылезает код. На красоту и удобство явно забили. Но путаницы нет: всё на привычных местах, поэтому — 3.

7. Допы и фишки
Разнообразие ИИ агентов и сервисов внутри реально впечатляет:
• генерация видео (Kling, Wan, Veo и др.)
• генерация изображений (Imagen, Nano Banana, Seedream и др.)
• ИИ дизайнер (и снова над ребрендингом поработали — результат был уже солиднее)
• работа с таблицами, документами, презентациями
• разработка приложений и сайтов
• умная нарезка видео
• создание подкастов
• парсинг файлов
• транскрибация и суммаризация встреч
• ИИ факт-чекинг
• и даже ИИ звонки.

Отдельный плюсик в карму за встроенный локальный ИИ (для тех, кто не хочет устанавливать Ollama отдельно). По сути, ничего нового, но удобно: можно работать даже без интернета и когда кредиты закончились.

🐱

Без минусов, конечно, не обойдется

• Оптимизирован плохо, работает откровенно медленно на фоне остальных (и это тоже влияет на и без того кислый UX).
• Без ВПН работают только локальные модели, что странно, могли бы и сами проксировать остальных, как это сделали в Perplexity.

✏️

Вердикт

Чуда не случилось. Genspark — это все еще в первую очередь универсальный мультитул, собравший в себе ИИ от десятков вендоров. В этом он безусловный лидер. Но браузер это посредственный: медленный, сырой, с ощутимым «гиковским» вайбом и без души. Вкладки грузятся тяжело, плавности нет. А без VPN он вообще не работает.

К установке рекомендуется тем, кто постоянно работает с веером разных ИИ моделей и агентов, а также всем гикам, посмотреть до чего прогресс дошел. Всем остальным — не рекомендую.

Если вы таки будете тестить его сами — ловите реф ссылку, которая даст вам доп кредиты для бесплатных тестов.

⸻

Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4🔥21

332 views16:09