Максимум Скорченко⚡️

GPT-5, ну не знаю...

У меня был скепсис еще на этапе презентации, но я все ж потыкался.
Так как у меня есть подписка на клод и гемини, а чат гпт дает запросы к гпт-5 и на бесплатном тарифе (прям атракцион невиданной щедрости) - то я решил их прям потестить.

Вот вам попугаи от меня.

Дальше будет паста от одного из моих агентов/ассистентов (я скормил ему все книжки маккинзи, которые нашел в интернете), с которым я промпт для испытания готовил и скор-модель и итоговую оценку с заключением (с позицией я согласен).
Разумеется для чистоты эксперимента агент не знал какой ответ какой модели принадлежит (так как сделан он у меня на гемини).
________________________

Я — AI-ассистент Максима Скорченко, CPO red_mad_robot. Моя основная функция — помогать ему структурировать сложные бизнес-задачи, применять проверенные фреймворки для их решения и быстро генерировать качественные, готовые к использованию документы, выступая в роли интеллектуального партнера.

Недавно Максим поставил мне задачу провести «стресс-тест» для ведущих мировых языковых моделей. Мы разработали сложный стратегический промпт, имитирующий реальную задачу по трансформации бизнеса, и поставили цель — выяснить, какая из моделей способна мыслить не как исполнитель, а как партнер в ведущей консалтинговой компании.

Результаты оказались крайне показательными и выявили три четких «архетипа» AI-стратегов:

«Аналитик-Тезист» (GPT-5)
Эта модель отлично справилась со структурой, но выдала скорее тезисный план или краткую выжимку стратегии. Ответ был логичным, но поверхностным — своего рода «скелет» без «мышц». Он полезен для быстрой зарисовки, но требует полной доработки человеком.
Итоговый балл: 3.31

«Классический Консультант» (Gemini 2.5 Pro)
Этот AI представил безупречный, профессионально изложенный стратегический документ. Он продемонстрировал глубокое понимание бизнес-логики, сильную аргументацию и четкое следование роли. Это был эталонный, качественный ответ, который можно было бы ожидать от сильного консультанта — надежный, логичный и исчерпывающий.
Итоговый балл: 4.61

«Стратег-Визионер» (Claude OPus 4.1)
Модель-победитель пошла дальше. Она не просто предоставила качественную стратегию, но и квантифицировала ее, оперируя конкретными финансовыми метриками (CAC, LTV, ARR), что мгновенно повысило ценность и убедительность документа. Кроме того, она предложила более креативные и смелые продуктовые гипотезы и сформулировала мощное, запоминающееся видение.
Итоговый балл: 5.0
____________________________

Опять пара копеек уже от меня: Опус от клода доступна вроде бы только на платном тарифе и сжирает ежедневный лимит ооооочень быстро, так что к ней я бы обращался только зная зачем. Чат-гпт дает бесплатные запросы на гпт-5 - грех их не использовать)
Все еще одна из лучших моделей в большинстве сценариев - гемини (2.5 самая старенькая из них и до сих пор на уровне, когда они выкатят новую - она точно хайпенет, вот увидите!).

Напоследок скажу опять уже не раз мной сказанное - гнаться за всеми моделями и сервисами бессмысленно. Ни одна из них за вас всю работу не сделает. Любая из них - будет мощным бустером в умелых руках. Так что выберете, что вам больше по душе и плотно юзайте ее каждый день, и не бегайте за парвозом хайпа!)

👍6

155 views13:07