Заместители

🗑

ChatGPT - всё?

Решил я проверить ChatGPT Agent — первого ИИ агента от OpenAI. Начал с простого: собираюсь в отпуск и прошу его подобрать мне отель для красивого отдыха на пляже, в моём бюджете и без визы. Результат — подобрать-то подобрал, но ехать туда совсем не хочется. Ладно, думаю, на турагента, допустим, ты не учился — будем гонять по базовым задачам.

⸻

Моделируем ситуацию: вам выступать на конференции, а вы прошлой ночью загуляли. Времени и сил делать презентацию самому нет. Зовём на помощь цифровых помощников. Тема выступления — «ИИ агенты», а аудитория незнакома с ИИ. Ну, значит, так и пишем в промпте (не для того мы ИИ агента используем, чтобы промпт-инжинирингом заниматься):

Подготовь презентацию на русском языке, рассказывающую про ИИ агентов на 5 слайдах для обывателя. Сделай её максимально увлекательной, насыщенной и полезной.

Прогоняем через 4 самых популярных LLM, чтобы ChatGPT Agent не расслаблялся. Помимо основного участника в гонке: Claude Sonnet 4, Gemini 2.5 Pro, Manus.

Вот что получилось 👇

⸻

ChatGPT Agent (1-е видео)

Если бы это была настоящая гонка — ChatGPT мог бы соревноваться только с черепахами. 36 минут 🌟 он делал презентацию. Цель достиг плохо: проигнорировал то, что по условиям задачи зритель — обыватель, и ему сначала нужно объяснить, что такое ИИ агент. Дизайн презы на троечку, зато уложился в требование про 5 слайдов. Помнится мне, троечники в средней школе делали такой визуал по нелюбимому предмету.
Скорость: незачёт
Суть: 4
Дизайн: 3
Итог: 3 с натяжкой. Не хотел бы я выступать с этой презентацией.

Но, может, я слишком строг? Давайте сравним с другими (кстати, всех других я успел протестить, пока ChatGPT думал 😁).

⸻

Manus (2-е видео)

Суточных «кредитов» хватило ровно на эту презентацию (которую, кстати, можно сохранить в pptx, PDF, Google Slides — моё почтение за такой UX!). Думал 8 минут, презентация, на мой взгляд, средняя. Картинки подобраны в тему презентации, но не всегда в тему слайда, визуал — пойдёт. Но это точно на уровень выше, чем у ChatGPT Agent. На конференции я с ней точно смог бы выступить.
Скорость: зачёт
Суть: 5−
Дизайн: 4
Итог: на крепкую четвёрку. Не звёздный проект, но нестыдный.

Ну ладно, Манус, — скажете вы, — ребята занимаются агентами дольше OpenAI! Хорошо, давайте сравним с двумя оставшимися моделями — а там ведь были просто LLM, без всяких агентов.

⸻

Gemini (3-е видео)

Схитрила: сделала просто сайт. Простим — ведь это не полноценный агент, да и я мог бы открыть HTML вместо презентации. Но забавно, что Манус даёт выгружать в Google Slides, а Gemini (гугловая модель) — нет. Генерация заняла 3–4 минуты. По сути вопросов нет, стиль выдержан под обывателя. При этом в конце сразил меня графикой с пользой и рисками агентов. Есть косяки с форматированием — кое-где Markdown не считался. Но общее впечатление не портит.
Скорость: зачёт
Суть: 5
Дизайн: 4
Итог: 5−. До идеала немного полирнуть — и на конференцию!

⸻

Claude (4-е видео)

Самая понятная и яркая презентация (кхм, сайт… да, но опять же — простим, так как не полноценный агент). Если бы конференция была маркетинговая — взял бы просто эту презентацию и пошёл, ничего не исправляя. Можно придираться к неоптимальной цветовой гамме местами, но это некритично. Генерация также заняла 3–4 минуты.
Скорость: зачёт
Суть: 5
Дизайн: 5
Итог: 5. Просто идём и покоряем своим стилем и ярким контентом.

⸻

🫡

Итоги...

...неутешительные для ChatGPT Agent! В результате теста он сделал самую кислую презентацию. А из моего личного опыта — с большинством задач он справляется на таком же уровне. Это лишь яркий пример. Если GPT-5 не произведёт фурор, то OpenAI серьезно рискует своими позициями на рынке.

⸻

Подписывайся, у меня полезное про ИИ агентов без инфошума.

Заместители

Please open Telegram to view this post