Как работают бенчмарки для AI моделей и зачем их столько
Каждый раз когда выходит новая модель, везде мелькают цифры: MMLU 87%, HumanEval 92%, SWE-bench 71.7%. Но что это все значит и почему нельзя просто сказать "эта модель лучше"?
Что такое бенчмарк
Бенчмарк — это типа ЕГЭ для AI моделей. Набор задач с правильными ответами, где модель получает процент за то, сколько заданий решила верно. Только вместо одного теста их десятки, и каждый проверяет свою способность.
Основные типы бенчмарков
MMLU — это монстр из 15 000+ вопросов по 57 предметам: от математики до права. Проверяет общие знания модели. Раньше считался золотым стандартом, но сейчас топовые модели решают его на 85-90%, поэтому появились более сложные варианты.
HumanEval — 164 задачи по программированию с юнит-тестами. Модель должна написать код, который реально работает, а не просто выглядит правдоподобно. Claude Sonnet 4.5 и ChatGPT 5.1 тут показывает 95%+, что дикая цифра.
SWE-bench — вообще хардкор. 2294 реальных задачи с GitHub: баги, фичи, рефакторинг. Модель получает issue и должна запилить рабочий патч. В 2023 модели решали 4.4% задач, сейчас лучшие — 71.7%. Это уже серьезно.
Chatbot Arena — здесь все иначе. Живые люди сравнивают ответы двух анонимных моделей и голосуют за лучший. Уже собрано 5+ миллионов голосов. Используется система рейтингов как в шахматах (Elo). Самый близкий к реальности бенчмарк, но есть нюанс: люди часто голосуют за более длинные ответы с эмодзи, хотя они могут быть хуже по сути.
Почему их так много
Потому что одним тестом не измерить все способности модели:
- MMLU — общие знания
- GSM8K — математика школьного уровня
- MATH — сложная математика
- HumanEval — кодинг
- GPQA — вопросы уровня PhD
- MMMU — мультимодальные задачи
Это как мерить разработчика: знание алгоритмов, опыт работы с фреймворками, софт скиллы — нужно смотреть на все.
Проблема насыщения
В 2023 исследователи запилили новые сложные бенчмарки типа MMMU и GPQA. Спустя год модели улучшились на них на 18.8 и 48.9 процентных пунктов соответственно. Бенчмарки устаревают быстрее, чем их успевают нормально использовать.
Поэтому появились экстремально сложные тесты:
- FrontierMath — AI решает только 2% задач
- Humanity's Last Exam — топовые модели набирают меньше 10%
Реальность vs бенчмарки
Самая главная проблема: бенчмарки не отражают реальное использование. Анализ 4+ миллионов промптов показал, что люди используют AI для:
- Технической помощи (65%)
- Ревью работы (59%)
- Генерации контента (25%)
- Поиска информации (17%)
А бенчмарки проверяют абстрактные задачи типа олимпиадных задач по математике.
Что из этого следует
Не стоит зацикливаться на одной цифре. Если модель выигрывает на HumanEval, это не значит что она лучше для написания документации или дебага сложной архитектуры.
По моим ощущениям Claude Sonnet 4.5 лучше всего схватывает контекст и редко тупит, хотя на некоторых бенчмарках может быть не первым. Это мой фаворит, использую ее почти всегда)
> Лучший способ выбрать модель — протестить ее на своих реальных задачах
@ValidatedVibe
Каждый раз когда выходит новая модель, везде мелькают цифры: MMLU 87%, HumanEval 92%, SWE-bench 71.7%. Но что это все значит и почему нельзя просто сказать "эта модель лучше"?
Что такое бенчмарк
Бенчмарк — это типа ЕГЭ для AI моделей. Набор задач с правильными ответами, где модель получает процент за то, сколько заданий решила верно. Только вместо одного теста их десятки, и каждый проверяет свою способность.
Основные типы бенчмарков
MMLU — это монстр из 15 000+ вопросов по 57 предметам: от математики до права. Проверяет общие знания модели. Раньше считался золотым стандартом, но сейчас топовые модели решают его на 85-90%, поэтому появились более сложные варианты.
HumanEval — 164 задачи по программированию с юнит-тестами. Модель должна написать код, который реально работает, а не просто выглядит правдоподобно. Claude Sonnet 4.5 и ChatGPT 5.1 тут показывает 95%+, что дикая цифра.
SWE-bench — вообще хардкор. 2294 реальных задачи с GitHub: баги, фичи, рефакторинг. Модель получает issue и должна запилить рабочий патч. В 2023 модели решали 4.4% задач, сейчас лучшие — 71.7%. Это уже серьезно.
Chatbot Arena — здесь все иначе. Живые люди сравнивают ответы двух анонимных моделей и голосуют за лучший. Уже собрано 5+ миллионов голосов. Используется система рейтингов как в шахматах (Elo). Самый близкий к реальности бенчмарк, но есть нюанс: люди часто голосуют за более длинные ответы с эмодзи, хотя они могут быть хуже по сути.
Почему их так много
Потому что одним тестом не измерить все способности модели:
- MMLU — общие знания
- GSM8K — математика школьного уровня
- MATH — сложная математика
- HumanEval — кодинг
- GPQA — вопросы уровня PhD
- MMMU — мультимодальные задачи
Это как мерить разработчика: знание алгоритмов, опыт работы с фреймворками, софт скиллы — нужно смотреть на все.
Проблема насыщения
В 2023 исследователи запилили новые сложные бенчмарки типа MMMU и GPQA. Спустя год модели улучшились на них на 18.8 и 48.9 процентных пунктов соответственно. Бенчмарки устаревают быстрее, чем их успевают нормально использовать.
Поэтому появились экстремально сложные тесты:
- FrontierMath — AI решает только 2% задач
- Humanity's Last Exam — топовые модели набирают меньше 10%
Реальность vs бенчмарки
Самая главная проблема: бенчмарки не отражают реальное использование. Анализ 4+ миллионов промптов показал, что люди используют AI для:
- Технической помощи (65%)
- Ревью работы (59%)
- Генерации контента (25%)
- Поиска информации (17%)
А бенчмарки проверяют абстрактные задачи типа олимпиадных задач по математике.
Что из этого следует
Не стоит зацикливаться на одной цифре. Если модель выигрывает на HumanEval, это не значит что она лучше для написания документации или дебага сложной архитектуры.
По моим ощущениям Claude Sonnet 4.5 лучше всего схватывает контекст и редко тупит, хотя на некоторых бенчмарках может быть не первым. Это мой фаворит, использую ее почти всегда)
> Лучший способ выбрать модель — протестить ее на своих реальных задачах
@ValidatedVibe
👨💻4 3
Оплата нейронок из РФ
Периодически возникают вопросы про оплату подписок из России. Записал короткое видео, в котором показал, как можно оплатить подписки из РФ.
Я это делаю через 2 сервиса - plati market и ggsel. Это по маркетплейсы цифровых товаров, в которых можно купить аккаунты и оплатить подписки. Из способов оплаты есть российские карты, крипта, webmoney и еще много других.
Вот ссылки на продавцов и товары, которыми я пользовался:
Claude:
- https://gglead.org/go8348
- https://gglead.org/go8305
- https://plati.market/itm/claude-pro-max-5x-20x-claude-4-5-fast-full-warranty/5284146
- https://plati.market/itm/claude-ai-pro-max-code-anthropic-fast/4023986
Cursor:
- https://gglead.org/go8302
- https://gglead.org/go8301
- https://plati.market/itm/cursor-ai-pro-business-ultra-podpiski-bystro/4758785
Chat GPT:
- https://gglead.org/go8304
- https://plati.market/itm/24-7-chat-gpt-5-1-o3-o1-4o-5-plus-pro-no-login-fast/4339002
- https://plati.market/itm/24-7-chat-gpt-5-plus-pro-no-login-renewal/4339392
Claude API
- https://gglead.org/go8664
- https://plati.market/itm/claude-ai-api-quick-balance-refill-api-anthropic/4230219
Chat GPT API:
- https://plati.market/itm/chat-gpt-4-quick-replenishment-of-the-api-balance/4009421
Gmail:
- https://gglead.org/go8489
Видео с демонстрацией процесса оплаты:
- https://youtu.be/FcFvj92OK48
Периодически возникают вопросы про оплату подписок из России. Записал короткое видео, в котором показал, как можно оплатить подписки из РФ.
Я это делаю через 2 сервиса - plati market и ggsel. Это по маркетплейсы цифровых товаров, в которых можно купить аккаунты и оплатить подписки. Из способов оплаты есть российские карты, крипта, webmoney и еще много других.
Вот ссылки на продавцов и товары, которыми я пользовался:
Claude:
- https://gglead.org/go8348
- https://gglead.org/go8305
- https://plati.market/itm/claude-pro-max-5x-20x-claude-4-5-fast-full-warranty/5284146
- https://plati.market/itm/claude-ai-pro-max-code-anthropic-fast/4023986
Cursor:
- https://gglead.org/go8302
- https://gglead.org/go8301
- https://plati.market/itm/cursor-ai-pro-business-ultra-podpiski-bystro/4758785
Chat GPT:
- https://gglead.org/go8304
- https://plati.market/itm/24-7-chat-gpt-5-1-o3-o1-4o-5-plus-pro-no-login-fast/4339002
- https://plati.market/itm/24-7-chat-gpt-5-plus-pro-no-login-renewal/4339392
Claude API
- https://gglead.org/go8664
- https://plati.market/itm/claude-ai-api-quick-balance-refill-api-anthropic/4230219
Chat GPT API:
- https://plati.market/itm/chat-gpt-4-quick-replenishment-of-the-api-balance/4009421
Gmail:
- https://gglead.org/go8489
Видео с демонстрацией процесса оплаты:
- https://youtu.be/FcFvj92OK48
YouTube
Оплата подписок из РФ: Cursor, Claude, Chat GPT, Codex и другие
Показываю как оплатить подписки нейросетей из России. Все мы знаем, что оплата подписок зарубежных сервисов недоступна Российскими картами, а пользоваться ИИ хочется. Выход есть! В этом видео я покажу два маркетплейса цифровых товаров, в которых можно купить…
На днях мне попалась эта картинка, я с нее угарнул)
Но вообще она неплохо отражает подход, который мне нравится. Пофиг, что у тебя проект из кучи велосипедов, главное, что едет)
Несмотря на то, что я изначально из мира трушной разработки без нейронок, где за дублирование кода меня закидают всем, чем только можно... Мне всегда нравилась практичность.
Нейронки сейчас дают возможность завайбкодить проект людям, которые вообще не из IT. Предпринематели могут протестить нишу без больших вложений на разработку, специалисты из разных сфер вайбкодят проекты для своих нужд. А разработчики ускоряют процесс своей работы и делигируют рутину нейронкам.
На мой взгляд это круто)
Конечно, тут есть нюансы. Нейронка не возьмет на себя ответственность. И за безопасность отвечают люди. Вайбкодить программы для медицинских апаратов и запуска ракет в космос, без хорошего понимания разработки и предметной области, конечно, не стоит... Но это наверно и так понятно. Нейронки это инструмент. Молотком можно отбить палец, но и забить гвоздь тоже можно. Про бензопилу я вообще молчу) Так что руководствуемся здравым смыслом и используем инсрументы по назначению.
@ValidatedVibe
Но вообще она неплохо отражает подход, который мне нравится. Пофиг, что у тебя проект из кучи велосипедов, главное, что едет)
Несмотря на то, что я изначально из мира трушной разработки без нейронок, где за дублирование кода меня закидают всем, чем только можно... Мне всегда нравилась практичность.
Нейронки сейчас дают возможность завайбкодить проект людям, которые вообще не из IT. Предпринематели могут протестить нишу без больших вложений на разработку, специалисты из разных сфер вайбкодят проекты для своих нужд. А разработчики ускоряют процесс своей работы и делигируют рутину нейронкам.
На мой взгляд это круто)
Конечно, тут есть нюансы. Нейронка не возьмет на себя ответственность. И за безопасность отвечают люди. Вайбкодить программы для медицинских апаратов и запуска ракет в космос, без хорошего понимания разработки и предметной области, конечно, не стоит... Но это наверно и так понятно. Нейронки это инструмент. Молотком можно отбить палец, но и забить гвоздь тоже можно. Про бензопилу я вообще молчу) Так что руководствуемся здравым смыслом и используем инсрументы по назначению.
@ValidatedVibe
Подключаем Claude API к проекту
Продолжаем вайбкодить сервис для генерации дизайн стайлгайдов. В этом видео подключаем Claude API в проект с помощью anthropic SDK. Теперь стайлгайды генерируются на основе референсов через claude.
Приятного просмотра:
https://youtu.be/DvF6JzWeLWw
Продолжаем вайбкодить сервис для генерации дизайн стайлгайдов. В этом видео подключаем Claude API в проект с помощью anthropic SDK. Теперь стайлгайды генерируются на основе референсов через claude.
Приятного просмотра:
https://youtu.be/DvF6JzWeLWw
YouTube
Вайбкодинг SaaS #5: Интеграция Claude API за 42 минуты – от моков к реальной генерации
Продолжаем вайбкодить SaaS. В этом видео подключаем Claude API в проект для генерации стайлгайдов. До этого у нас были моковые данные, а теперь они генерируются на основе референсов.
За 42 минуты мы с Claude Code интегрируем Anthropic SDK, настраиваем API…
За 42 минуты мы с Claude Code интегрируем Anthropic SDK, настраиваем API…
Меня взломали!
Точнее мой облачный сервер. Есть предположения, как именно это это сделали, но точно я не знаю. В итоге пришлось капитулировать и создавать новый.
Вообще, тема безопасности крайне важна. И в аргументах против вайбкодинга часто упоминается безопасность, что вполне обосновано. Скажу честно, на этом сервере я не уделял этому должного внимания. Пароля 123 у меня, конечно, не было, но все же.
Ничего сверх важного у меня на сервере не крутилось, так что ситуяция мне кажется скорее занимательной и я не переживаю. Для меня это звоночек, что нужно разобраться поглубже в теме и относится к настройке сервера более ответственно.
Что еще могу сказать.. Ну во первых - делайте бекапы. Это меньшее, что вы можете сделать, но это вас спасет. Если код есть в гите, то базы данных и загруженные файлы без бекапов не восстановить.
А во вторых, считаю теперь своим долгом разобраться в теме и рассказать хотя бы какую-то базу, чтобы уберечь вас от подобных ситуаций.
Кстати, как у вас обстоят дела с публикацией (деплоем) своих сервсисов и приложений? Ну в плане как вы это делаете
Точнее мой облачный сервер. Есть предположения, как именно это это сделали, но точно я не знаю. В итоге пришлось капитулировать и создавать новый.
Вообще, тема безопасности крайне важна. И в аргументах против вайбкодинга часто упоминается безопасность, что вполне обосновано. Скажу честно, на этом сервере я не уделял этому должного внимания. Пароля 123 у меня, конечно, не было, но все же.
Ничего сверх важного у меня на сервере не крутилось, так что ситуяция мне кажется скорее занимательной и я не переживаю. Для меня это звоночек, что нужно разобраться поглубже в теме и относится к настройке сервера более ответственно.
Что еще могу сказать.. Ну во первых - делайте бекапы. Это меньшее, что вы можете сделать, но это вас спасет. Если код есть в гите, то базы данных и загруженные файлы без бекапов не восстановить.
А во вторых, считаю теперь своим долгом разобраться в теме и рассказать хотя бы какую-то базу, чтобы уберечь вас от подобных ситуаций.
Кстати, как у вас обстоят дела с публикацией (деплоем) своих сервсисов и приложений? Ну в плане как вы это делаете
👨💻14 4
ИИ-анализ веб-страниц с Playwright
Продолжаем вайбкодить сервис для генерации дизайн стайлгайдов. В этом видео настраиваем playwright для анализа веб страниц по url.
Изначально планировал использовать MCP Playwright сервер, но в процессе понял, что проще подключить библиотеку Playwright в python. Логика получилась аналогичная, как и со скриншотами, только теперь мы делаем скриншоты всей страницы автоматически по url.
Приятного просмотра:
https://youtu.be/5b5heZXeTW8
Продолжаем вайбкодить сервис для генерации дизайн стайлгайдов. В этом видео настраиваем playwright для анализа веб страниц по url.
Изначально планировал использовать MCP Playwright сервер, но в процессе понял, что проще подключить библиотеку Playwright в python. Логика получилась аналогичная, как и со скриншотами, только теперь мы делаем скриншоты всей страницы автоматически по url.
Приятного просмотра:
https://youtu.be/5b5heZXeTW8
YouTube
Вайбкодинг SaaS #6 - ИИ-анализ веб-страниц с Playwright за 37 минут
Продолжаем вайбкодить SaaS для генерации стайлгайдов. В этом видео добавляем анал сайтов по url с помощью playwright. Изначально планировал использовать MCP Playwright сервер, но в процессе понял, что проще и эффективнее подключить библиотеку Playwright в…
Тренда вайбкодинга 2026
Итоги уходящего года я подведу чуть позже, а пока разбирем прогнозы AI-гигантов на 2026 год.
Я проанализировал прогнозы от крупнейших AI-компаний и выделил основные тренды вайбкодинга на предстоящий год. Звучит многообещающе, посмотрим, как все будет на деле)
Приятного просмотра:
youtube | vk video | rutube
Итоги уходящего года я подведу чуть позже, а пока разбирем прогнозы AI-гигантов на 2026 год.
Я проанализировал прогнозы от крупнейших AI-компаний и выделил основные тренды вайбкодинга на предстоящий год. Звучит многообещающе, посмотрим, как все будет на деле)
Приятного просмотра:
youtube | vk video | rutube
YouTube
Тренды Вайбкодинга 2026: 7 прогнозов от AI-гигантов
Тренды вайбкодинга 2026: анализ прогнозов от Microsoft, MIT Technologies Review и Forbes о будущем AI-разработки. Разбираю 7 ключевых трендов искусственного интеллекта в программировании: Memory Native AI, Repository Intelligence, AI-агенты, трансформацию…
С наступающим Новым Годом!
Друзья, уходящий 2025-й год был насыщенным событиями. Нейронки вышли на качественно новый уровень и по-настоящему вайбкодить мы начали именно в 2025-ом. Собственно и сам термин vibecoding появился только в этом году.
С появлением нейронок запускать проекты стало реально весело. Нейронки взяли на себя кучу рутины, которая уже не приносит удовольствия и теперь многие задачи можно делать быстрее и проще. В этом году я словил ощущения, которые были у меня на старте карьеры. Какое-то предвосхищение и восторг от изучения новых инструментов и разработки. Так что да, я реально радуюсь приходу вайбкодинга!
В этом году я начал снимать видео на ютуб и вести телеграм канал. Я кайфую от вайбкодинга и мне нравится рассказывать про это. Я получил много приятных отзывов о гайдах и я очень рад, что эта деятельность приносит кому-то пользу!
Все это привело к тому, что в этом году мы познакомились с вами и для меня это много значит. Спасибо вам, что вы есть! В нашем вайбкодерском чате уже больше 100 человек, а в канале больше 700! Я не рассчитывал на такие цифры за такой небольшой промежуток времени.. Это очень круто!
Желаю вам успехов и побольше годного кода в новом 2026 году!🤙 🤙
Пусть новый год принесет нам много новых классных инструментов, которые упростят нам жизнь)
Еще я записал новогоднее видео, в котором вспомнил, что интересного было за этот год. Приятного просмотра:
youtube | vk video | rutube
Друзья, уходящий 2025-й год был насыщенным событиями. Нейронки вышли на качественно новый уровень и по-настоящему вайбкодить мы начали именно в 2025-ом. Собственно и сам термин vibecoding появился только в этом году.
С появлением нейронок запускать проекты стало реально весело. Нейронки взяли на себя кучу рутины, которая уже не приносит удовольствия и теперь многие задачи можно делать быстрее и проще. В этом году я словил ощущения, которые были у меня на старте карьеры. Какое-то предвосхищение и восторг от изучения новых инструментов и разработки. Так что да, я реально радуюсь приходу вайбкодинга!
В этом году я начал снимать видео на ютуб и вести телеграм канал. Я кайфую от вайбкодинга и мне нравится рассказывать про это. Я получил много приятных отзывов о гайдах и я очень рад, что эта деятельность приносит кому-то пользу!
Все это привело к тому, что в этом году мы познакомились с вами и для меня это много значит. Спасибо вам, что вы есть! В нашем вайбкодерском чате уже больше 100 человек, а в канале больше 700! Я не рассчитывал на такие цифры за такой небольшой промежуток времени.. Это очень круто!
Желаю вам успехов и побольше годного кода в новом 2026 году!
Пусть новый год принесет нам много новых классных инструментов, которые упростят нам жизнь)
Еще я записал новогоднее видео, в котором вспомнил, что интересного было за этот год. Приятного просмотра:
youtube | vk video | rutube
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
С Новым Годом, вайбкодеры! Вспоминаем чудеса 2025 года
Скоро новый год! Уходящий 2025 — год, когда вайбкодинг стал реальностью. Давайте вместе вспомним, что же хорошего произошло в уходящем году. И подведем итоги невероятного года: от рождения термина до AI Darwin Awards. Вспоминаем чудеса, которые произошли.…
1 14 7
Выспался, зарядился — продолжаем вайбкодить
Плавно возвращаемся в рабочий режим. Начнем этот год с продолжения разработки сервиса для генерации стайлгайдов.
Это 7-я часть — добавляем редактирование стайлгайдов и систему версий. Теперь можно исправить любой элемент и откатиться назад, если что-то пошло не так.
Погнали смотреть:
youtube | vk video | rutube
Плавно возвращаемся в рабочий режим. Начнем этот год с продолжения разработки сервиса для генерации стайлгайдов.
Это 7-я часть — добавляем редактирование стайлгайдов и систему версий. Теперь можно исправить любой элемент и откатиться назад, если что-то пошло не так.
Погнали смотреть:
youtube | vk video | rutube
YouTube
Вайбкодинг SaaS #7: Редактирование стайлгайдов, версионирование и оптимизация Claude API
Продолжаем разрабатывать SaaS для генерации стайлгайдов с помощью AI. В этой серии добавляем редактирование стайлгайдов с учетом выбранных секций. Также добавлям версионирование проектов и оптимизацируем затраты на Claude API.
Все части - https://www.yo…
Все части - https://www.yo…
⚡5 2
Начало года - лучшее время для планирования
Так что расскажу, что готовлю для вас в ближайшие месяцы. Будет интересно!
Контент на YouTube:
Доделаем сервис для генерации стайлгайдов. Всего будет где-то 10 серий, после финального видео получится полноценный инструмент, которым можно реально пользоваться.
Новые гайды:
- Роадмап вайбкодера в 2026: с чего начать и как довести проект до релиза
- Создание лендинга в cursor с нуля
- Полный гайд по Cursor
Новое направление: курсы по вайбкодингу
В конце предыдущего года ко мне начали обращаться люди за консультациями по вайбкодингу. Я нигде не афишировал эту возможность, эта опция родилась естественным образом. Да и в целом меня иногда спрашивают про обучение. После нескольких созвонов я понял: запрос есть, и он реальный.
Так что я решил записать несколько курсов по вайбкодингу. В них будем подробно разбирать, как с нуля сделать рабочий продукт в нескольких направлениях:
- Сайты / Веб приложения
- Телеграм боты
- И возмоожно нативные приложения
Что в них будет:
- Пошаговые видео-уроки от А до Я
- Персональные созвоны для разбора индивидуальных ситуаций
- Групповой чат с единомышленниками (если соберется группа)
- Поддержку на всех этапах разработки
Кому интересно какое-то из этих направлений - напишите в комментариях или мне в личку, какое направление интересует. Так я пойму с чего лучше начать. Первым участникам организую скидку.
Конечно, это не отменяет выход гайдов на ютубе, просто это будет другой формат. В курсах будет подробная и структурированная информация от А до Я, поддержка и возможность задавать вопросы по своему проекту.
PS:
Поздравляю всех с началом нового года! Надеюсь, у вас получилось отдохнуть на праздниках. У меня получилось)
Желаю вам продуктивно года, успехов, и реализации планов!
Так что расскажу, что готовлю для вас в ближайшие месяцы. Будет интересно!
Контент на YouTube:
Доделаем сервис для генерации стайлгайдов. Всего будет где-то 10 серий, после финального видео получится полноценный инструмент, которым можно реально пользоваться.
Новые гайды:
- Роадмап вайбкодера в 2026: с чего начать и как довести проект до релиза
- Создание лендинга в cursor с нуля
- Полный гайд по Cursor
Новое направление: курсы по вайбкодингу
В конце предыдущего года ко мне начали обращаться люди за консультациями по вайбкодингу. Я нигде не афишировал эту возможность, эта опция родилась естественным образом. Да и в целом меня иногда спрашивают про обучение. После нескольких созвонов я понял: запрос есть, и он реальный.
Так что я решил записать несколько курсов по вайбкодингу. В них будем подробно разбирать, как с нуля сделать рабочий продукт в нескольких направлениях:
- Сайты / Веб приложения
- Телеграм боты
- И возмоожно нативные приложения
Что в них будет:
- Пошаговые видео-уроки от А до Я
- Персональные созвоны для разбора индивидуальных ситуаций
- Групповой чат с единомышленниками (если соберется группа)
- Поддержку на всех этапах разработки
Кому интересно какое-то из этих направлений - напишите в комментариях или мне в личку, какое направление интересует. Так я пойму с чего лучше начать. Первым участникам организую скидку.
Конечно, это не отменяет выход гайдов на ютубе, просто это будет другой формат. В курсах будет подробная и структурированная информация от А до Я, поддержка и возможность задавать вопросы по своему проекту.
PS:
Поздравляю всех с началом нового года! Надеюсь, у вас получилось отдохнуть на праздниках. У меня получилось)
Желаю вам продуктивно года, успехов, и реализации планов!
⚡8
Внедряем экспорт проектов
Продолжаем вайбкодить сервис для генерации дизайн стайлгайдов. В этой части добавляем экспорт в формате markdown, json и css.
Для полноценного запуска mvp осталось только задеплоить проект и прикрутить платежную систему. Скорей бы уже зарелизить)
Приятного просмотра:
youtube | vk video | rutube
Продолжаем вайбкодить сервис для генерации дизайн стайлгайдов. В этой части добавляем экспорт в формате markdown, json и css.
Для полноценного запуска mvp осталось только задеплоить проект и прикрутить платежную систему. Скорей бы уже зарелизить)
Приятного просмотра:
youtube | vk video | rutube
YouTube
Вайбкодинг SaaS #8: Внедряем экспорт стайл гайдов
Продолжаем разрабатывать SaaS для генерации стайлгайдов с помощью AI. В этом выпуске внедряем функционал экспорта стайлгайдов в трёх форматах: JSON с токенами дизайна, CSS-файл с готовыми стилями и Markdown с инструкциями для AI-агентов. Используем Cursor…
⚡6 2
Во прикол конечно..)
Работал почти весь день в клод коде и думал: "как здорово, лимиты не улетают, хотя гружу его нон стопом!"
Сейчас, уже ночью, мне надо было сделать скриншот для видео. Открываю клод код и вижу, что у меня выбрана модель haiku.))
А прикол в том, что я за день накидал с ней с нуля панель управления для своего сайта и даже не заметил, что выбрана модель не sonnet. Раньше я весьма скептично относился к haiku и для разработки ее не использовал, а оказывается вполне годится.
Стоит отметить, что я предварительно подготовил документацию, сделал большой роадмап и расписал все задачи с опусом, а с хайку просто последовательно их выполнял. И получилось так, что за весь день не уперся в лимит. А с соннетом бы по-любому уперся, про опус вообще молчу.
В общем немного пересмотрел свое отношение к haiku, юзать для разработки можно. Особенно, если предварительно составить подробный план
Работал почти весь день в клод коде и думал: "как здорово, лимиты не улетают, хотя гружу его нон стопом!"
Сейчас, уже ночью, мне надо было сделать скриншот для видео. Открываю клод код и вижу, что у меня выбрана модель haiku.))
А прикол в том, что я за день накидал с ней с нуля панель управления для своего сайта и даже не заметил, что выбрана модель не sonnet. Раньше я весьма скептично относился к haiku и для разработки ее не использовал, а оказывается вполне годится.
Стоит отметить, что я предварительно подготовил документацию, сделал большой роадмап и расписал все задачи с опусом, а с хайку просто последовательно их выполнял. И получилось так, что за весь день не уперся в лимит. А с соннетом бы по-любому уперся, про опус вообще молчу.
В общем немного пересмотрел свое отношение к haiku, юзать для разработки можно. Особенно, если предварительно составить подробный план
1⚡28 4
2026. Вайбкодинг уже не магия для избранных
Записал 40-минутный гайд для тех, кто хочет начать вайбкодить, но не знает, с какой стороны подойти.
Видео рассчитано на начинающих, кто не знает, с чего начать, в каком направлении развиваться и что вообще нужно знать.
Разобрал весь путь от "у меня есть идея" до "мой проект в продакшене":
→ Выбор инструментов
→ Документация
→ Разработка с AI
→ Git
→ База данных
→ Платежи
→ Деплой (публикация проекта)
Старался объяснить максимально по-человечески. Это теоретическая база, понимая её, уже можно копать глубже в конкретные темы.
Да, у каждого инструмента и подхода есть альтернативы. Но для старта важнее начать, чем месяц выбирать между 10 IDE.
В комментах на ютубе уже начался холивар...))
Смотри → применяй → запускай 🚀
youtube | vkvideo | rutube
Записал 40-минутный гайд для тех, кто хочет начать вайбкодить, но не знает, с какой стороны подойти.
Видео рассчитано на начинающих, кто не знает, с чего начать, в каком направлении развиваться и что вообще нужно знать.
Разобрал весь путь от "у меня есть идея" до "мой проект в продакшене":
→ Выбор инструментов
→ Документация
→ Разработка с AI
→ Git
→ База данных
→ Платежи
→ Деплой (публикация проекта)
Старался объяснить максимально по-человечески. Это теоретическая база, понимая её, уже можно копать глубже в конкретные темы.
Да, у каждого инструмента и подхода есть альтернативы. Но для старта важнее начать, чем месяц выбирать между 10 IDE.
В комментах на ютубе уже начался холивар...))
Смотри → применяй → запускай 🚀
youtube | vkvideo | rutube
YouTube
Roadmap Вайбкодера 2026 - с Нуля до Релиза
Полный roadmap вайбкодинга 2026 — от нуля до релиза своего проекта. В этом видео я расскажу, с чего начать изучение вайбкодинга, какие инструменты выбрать (Cursor, Claude Code), как составить документацию, выбрать стек технологий и довести проект до публикации.…
⚡17 3
Мое недавнее открытие
Я тут пару недель назад открыл для себя голосовой набор текста. Это оказало оочень удобно!
Вместо того, чтобы набивать длинные промпты руками, хоткеем запускаю утилиту, диктую и все.) Я даже думаю на ходу, пока наговариваю промпты, могу прям размышлять в процессе и говорить ход мыслей, нейронки понимают.
Еще я обнаружил, что в Cursor появился встроенный голосовой набор. Когда это точно произошло, я не отловил, но штука удобная. Я почему-то не сразу начал им пользоваться. Но у него есть очень классная фича - он может распознавать русскую речь и сразу переводить на английский.
То есть говоришь на русском, а текст появляется сразу на английском. Мега удобно, потому что думать на русском проще, а промпты на английском жрут меньше токенов и возможно даже лучше понимаются нейронкой.
Стандартный голосовой набор на mac меня не устроил, я вообще не понял, как им нормально пользоваться. Так что юзаю Wispr Flow. А промпты на английском - встроенным в Cursor голосовым набором.
Печатать руками почти перестал, уже лень.))
В общем мне на столько зашло, что я даже подписку Wispr опалтил для безлимита, после того как тестовый период закончился. Немного странно отдавать 15$ за диктовалку, в то время как подписки мощных нейронок стоят 20$. Но удобно ппц, так что не обламываюсь.
Советую попробовать, если ещё не пробовали, хотя бы в курсоре
Я тут пару недель назад открыл для себя голосовой набор текста. Это оказало оочень удобно!
Вместо того, чтобы набивать длинные промпты руками, хоткеем запускаю утилиту, диктую и все.) Я даже думаю на ходу, пока наговариваю промпты, могу прям размышлять в процессе и говорить ход мыслей, нейронки понимают.
Еще я обнаружил, что в Cursor появился встроенный голосовой набор. Когда это точно произошло, я не отловил, но штука удобная. Я почему-то не сразу начал им пользоваться. Но у него есть очень классная фича - он может распознавать русскую речь и сразу переводить на английский.
То есть говоришь на русском, а текст появляется сразу на английском. Мега удобно, потому что думать на русском проще, а промпты на английском жрут меньше токенов и возможно даже лучше понимаются нейронкой.
Стандартный голосовой набор на mac меня не устроил, я вообще не понял, как им нормально пользоваться. Так что юзаю Wispr Flow. А промпты на английском - встроенным в Cursor голосовым набором.
Печатать руками почти перестал, уже лень.))
В общем мне на столько зашло, что я даже подписку Wispr опалтил для безлимита, после того как тестовый период закончился. Немного странно отдавать 15$ за диктовалку, в то время как подписки мощных нейронок стоят 20$. Но удобно ппц, так что не обламываюсь.
Советую попробовать, если ещё не пробовали, хотя бы в курсоре
⚡7 1
Заливаем проект на сервер (деплой)
Это пока что не гайд по деплою, который я также планирую записать, с более расширенным и концентрированным содержанием.
Это продолжение серии видео про сервис для генерации стайлгайдов. И в этой части я пытаюсь задеплоить проект на app platform в timeweb cloud. Это мой первый опыт использования таких платформ для автоматического деплоя.
К счастью все получилось: упаковать все в докер и задеплоить. И теперь сервис доступен по адресу makeui.dev . Это еще mvp, но все работает.) Оплату я там уже прикрутил, видео про подключение робокассы выйдет чуть позже.
Upd: Если вы захотите воспользоваться сервисом и у вас возникнут какие-то проблемы - напишите мне в личку , решим. Возможны какие-то баги, по началу это нормально. Буду править.
Видео на платформах:
youtube | vk video | rutube
Это пока что не гайд по деплою, который я также планирую записать, с более расширенным и концентрированным содержанием.
Это продолжение серии видео про сервис для генерации стайлгайдов. И в этой части я пытаюсь задеплоить проект на app platform в timeweb cloud. Это мой первый опыт использования таких платформ для автоматического деплоя.
К счастью все получилось: упаковать все в докер и задеплоить. И теперь сервис доступен по адресу makeui.dev . Это еще mvp, но все работает.) Оплату я там уже прикрутил, видео про подключение робокассы выйдет чуть позже.
Upd: Если вы захотите воспользоваться сервисом и у вас возникнут какие-то проблемы - напишите мне в личку , решим. Возможны какие-то баги, по началу это нормально. Буду править.
Видео на платформах:
youtube | vk video | rutube
YouTube
Вайбкодинг SaaS #9: Деплой проекта ( Заливаем на сервер )
Продолжаем вайбкодить сервис для генерации стайлгайдов. В этом видео мы будет публиковать проект, то есть загрузим на сервер, подключим домен и наше проект будет в открытом доступе, доступным по адресу https://makeui.dev/
Деплоим на app platform - https…
Деплоим на app platform - https…
⚡9
Claude Opus 4.6 - новая топовая модель от Anthropic
Новые модели от Anthropic для меня всегда как долгожданный подарок)
Антропик выкатили апдейт опуса (своей флагманской модели). По их словам, Opus 4.6 стал заметно сильнее в кодинге:
Что есть интересного:
- Контекстное окно 1M токенов (пока в бета) - "in a first for our Opus-class models, Opus 4.6 features a 1M token context window in beta"
- Вывод до 128k токенов за один запрос
- Agent Teams в Claude Code - несколько агентов работают параллельно
- Adaptive Thinking - модель сама решает, когда думать глубже
- Compaction - сжатие контекста теперь доступно на уровне API
- Effort - параметр API с четырьмя уровнями (low, medium, high, max). Контролирует, сколько усилий модель тратит на ответ - баланс между качеством, скоростью и стоимостью. Раньше было только вкл/выкл для extended thinking
Кстати, в курсоре модель уже появилась
В общем что, звучит интригующе, будем пробовать.)
https://www.anthropic.com/news/claude-opus-4-6
Новые модели от Anthropic для меня всегда как долгожданный подарок)
Антропик выкатили апдейт опуса (своей флагманской модели). По их словам, Opus 4.6 стал заметно сильнее в кодинге:
It plans more carefully, sustains agentic tasks for longer, can operate more reliably in larger codebases, and has better code review and debugging skills to catch its own mistakes
Что есть интересного:
- Контекстное окно 1M токенов (пока в бета) - "in a first for our Opus-class models, Opus 4.6 features a 1M token context window in beta"
- Вывод до 128k токенов за один запрос
- Agent Teams в Claude Code - несколько агентов работают параллельно
- Adaptive Thinking - модель сама решает, когда думать глубже
- Compaction - сжатие контекста теперь доступно на уровне API
- Effort - параметр API с четырьмя уровнями (low, medium, high, max). Контролирует, сколько усилий модель тратит на ответ - баланс между качеством, скоростью и стоимостью. Раньше было только вкл/выкл для extended thinking
Кстати, в курсоре модель уже появилась
В общем что, звучит интригующе, будем пробовать.)
https://www.anthropic.com/news/claude-opus-4-6
Anthropic
Introducing Claude Opus 4.6
We’re upgrading our smartest model. Across agentic coding, computer use, tool use, search, and finance, Opus 4.6 is an industry-leading model, often by wide margin.
⚡22
Полный гайд по Cursor в 2026
Давно хотел записать этот разбор, поскольку во всех видео работаю в курсоре, а гайда по нему у меня нет.
К тому же за последнее время в нем появилось много новых функций, с которыми хотел разобраться. В общем убил двух зайцев одним выстрелом, так сказать. Изучил новый функционал и записал гайд.
Постарался сделать так, чтобы даже начинающим было понятно, но и про advanced функции рассказал.
Что в итоге получилось:
- Начинаем с установки
- Разбираем базовые функции и режимы агентов
- Переходим к advanced настройкам, разбираемся с
- Субагентами
- Хуками
- Правилами
- Командами
- Скиллами
- Подключением mcp
- В конце делаем сайт за 1 промпт
В общем по содержанию получилось насыщенно.
На самом деле, некоторые разделы и темы достойны отдельных видео и думаю, я их тоже запишу позже. Тем не менее в этом гайде я разобрал какие вообще сущности есть в курсоре, зачем они, как их создавать и как ими пользоваться.
Будет полезно как новичкам, так и уже опытным пользователям курсора. В описании есть тайм коды, так что мотайте на интересные для вас разделы, если уже что-то знаете.
Приятного просмотра:
youtube | vk video | rutube
Давно хотел записать этот разбор, поскольку во всех видео работаю в курсоре, а гайда по нему у меня нет.
К тому же за последнее время в нем появилось много новых функций, с которыми хотел разобраться. В общем убил двух зайцев одним выстрелом, так сказать. Изучил новый функционал и записал гайд.
Постарался сделать так, чтобы даже начинающим было понятно, но и про advanced функции рассказал.
Что в итоге получилось:
- Начинаем с установки
- Разбираем базовые функции и режимы агентов
- Переходим к advanced настройкам, разбираемся с
- Субагентами
- Хуками
- Правилами
- Командами
- Скиллами
- Подключением mcp
- В конце делаем сайт за 1 промпт
В общем по содержанию получилось насыщенно.
На самом деле, некоторые разделы и темы достойны отдельных видео и думаю, я их тоже запишу позже. Тем не менее в этом гайде я разобрал какие вообще сущности есть в курсоре, зачем они, как их создавать и как ими пользоваться.
Будет полезно как новичкам, так и уже опытным пользователям курсора. В описании есть тайм коды, так что мотайте на интересные для вас разделы, если уже что-то знаете.
Приятного просмотра:
youtube | vk video | rutube
YouTube
Cursor AI: Полный гайд по вайбкодингу с нуля. Subagents, Hooks, Skills, Rules, Commands, MCP
Все, что нужно знать о Cursor AI в 2026 году, чтобы начать вайбкодить на максималках! Полный урок от установки Cursor IDE до создания сайта за 1 промпт. В этом видео мы разберем все возможности и настройки курсора в одном видео.
Годный вайбкодинг в ТГ -…
Годный вайбкодинг в ТГ -…
34⚡37
Запрягаем Claude вести тг канал
Да так, чтобы это не было кринжово
Мы сняли это видео с моим другом Андреем, который занимается созданием AI видео. Показали на примере тг постов, как можно писать текста, сохраняя при этом персональную стилистику.
Вкратце процесс следующий:
- Собираем референсы с текстами
- Анализируем стилистические особенности и сохраняем выжимку в отдельный файл
- Создаем агента, в которого закидываем референсы и даем инструкции, как ими пользоваться
- Генерируем текста в заданном стиле
Мне часто бывает по кайфу писать что-то самому, но иногда я использую такой подход для генерации или форматирования, чтобы ускорить процесс.
Монтаж немного затянулся, поэтому не удивляйтесь, что на календаре 8 ноября))
Приятного просмотра:
https://www.youtube.com/watch?v=Dhd3GiTKrYY
Мы сняли это видео с моим другом Андреем, который занимается созданием AI видео. Показали на примере тг постов, как можно писать текста, сохраняя при этом персональную стилистику.
Вкратце процесс следующий:
- Собираем референсы с текстами
- Анализируем стилистические особенности и сохраняем выжимку в отдельный файл
- Создаем агента, в которого закидываем референсы и даем инструкции, как ими пользоваться
- Генерируем текста в заданном стиле
Мне часто бывает по кайфу писать что-то самому, но иногда я использую такой подход для генерации или форматирования, чтобы ускорить процесс.
Монтаж немного затянулся, поэтому не удивляйтесь, что на календаре 8 ноября))
Приятного просмотра:
https://www.youtube.com/watch?v=Dhd3GiTKrYY
YouTube
CLAUDE полный ГАЙД: как выжать максимум из этой НЕЙРОСЕТИ
Канал Алексея про Вайбкодинг - https://www.youtube.com/@AlexeyTripleA
⚡ Мой авторский курс по ИИ ⇢ https://prompteam.ru
👉 Подписывайтесь в мой Telegram ⇢ https://t.me/andreiaiai
Claude — это AI-ассистент от Anthropic, который может помочь с самыми разными…
⚡ Мой авторский курс по ИИ ⇢ https://prompteam.ru
👉 Подписывайтесь в мой Telegram ⇢ https://t.me/andreiaiai
Claude — это AI-ассистент от Anthropic, который может помочь с самыми разными…
⚡7
Оркестрация суб-агентов в Cursor
В общем, рассказываю. Разобрался как настраивать циклы субагентов, которым можно кидать большие задачи и даже списки задач. И реально уходить на час по делам. Это кайф!
Субагенты декомпозируют задачи, последовательно выполняют подзадачи и проверяют сами себя.
На просторах ютуба крайне мало информации по оркестрации именно в курсоре, так что считаю, это прям ценная инфа для любетелей курсора)
Вкратце, как это работает:
- Создаем субагентов
- В скиллах описываем правила оркестрации
- Делаем команды для запуска разных workflow
При чем такая связка не ограничивает нас от простого подхода. Можно также работать без субагентов, а когда нужно - вызывать воркфлоу оркестрации для больших задач.
Если захотите сэкономить время и токены нейронок, можете скачать мой готовый сетап. Он платный, но кроме файлов вы также получаете доступ к последующим обновлениям и мою поддержку по использованию (можете писать вопросы в тг/форму обратной связи на сайте)
Но сначала обязательно посмотрите видео!
В нем я показал, как с нуля создать такую систему. Пример простой, но по аналогии его можно развивать так, как вам хочется. И очень может быть, что захотите сами все настроить.
В общем рекоммендую к просмотру!
youtube | vk video | rutube
В общем, рассказываю. Разобрался как настраивать циклы субагентов, которым можно кидать большие задачи и даже списки задач. И реально уходить на час по делам. Это кайф!
Субагенты декомпозируют задачи, последовательно выполняют подзадачи и проверяют сами себя.
На просторах ютуба крайне мало информации по оркестрации именно в курсоре, так что считаю, это прям ценная инфа для любетелей курсора)
Вкратце, как это работает:
- Создаем субагентов
- В скиллах описываем правила оркестрации
- Делаем команды для запуска разных workflow
При чем такая связка не ограничивает нас от простого подхода. Можно также работать без субагентов, а когда нужно - вызывать воркфлоу оркестрации для больших задач.
Если захотите сэкономить время и токены нейронок, можете скачать мой готовый сетап. Он платный, но кроме файлов вы также получаете доступ к последующим обновлениям и мою поддержку по использованию (можете писать вопросы в тг/форму обратной связи на сайте)
Но сначала обязательно посмотрите видео!
В нем я показал, как с нуля создать такую систему. Пример простой, но по аналогии его можно развивать так, как вам хочется. И очень может быть, что захотите сами все настроить.
В общем рекоммендую к просмотру!
youtube | vk video | rutube
YouTube
Оркестрация Суб-агентов в Cursor AI: часы автономной работы через циклы агентов
В этом видео показываю способ настройки оркестрации суб-агентов в Cursor, благодаря которому ИИ агенты смогут работать на автопилоте часами без нашего прямого участия. Для этого будем использовать subagents, skills, commands в Cursor IDE, немного затронем…
8⚡16 2
Онлайн встреча и разбор вопросов
Всем привет! Аудитория с каждым днем растет и мне хочется узнать вас получше, чтобы делать для вас максимально полезный контент. Кроме того, в чате родилась идея организовать встречу. И я подумал, что можно "убить двух зайцев одним выстрелом".
Ниже я прикрепил ссылку на опрос, прохождение которого займет +- 3 минуты, не больше.
Всем, кто прошел опрос, отправлю приглашение на вебинар. Тему выберу основываясь на ответах. Кроме обсуждения самой темы, можно будет пообщаться и позадавать вопросы. Также будет запись для участников опроса.
Опрос анонимный, но чтобы получить приглашение, нужно заполнить контакт (необязательное поле). Можно не заполнять, если не заинтересованы в вебинаре, а просто хотите помочь развитию канала.
Заранее спасибо за уделенное время!
https://docs.google.com/forms/d/e/1FAIpQLSdR8C2t6HY5acfYvjdJoIA-8ctBvPU50woFwAND0BsyRuf1zA/viewform?usp=dialog
Всем привет! Аудитория с каждым днем растет и мне хочется узнать вас получше, чтобы делать для вас максимально полезный контент. Кроме того, в чате родилась идея организовать встречу. И я подумал, что можно "убить двух зайцев одним выстрелом".
Ниже я прикрепил ссылку на опрос, прохождение которого займет +- 3 минуты, не больше.
Всем, кто прошел опрос, отправлю приглашение на вебинар. Тему выберу основываясь на ответах. Кроме обсуждения самой темы, можно будет пообщаться и позадавать вопросы. Также будет запись для участников опроса.
Опрос анонимный, но чтобы получить приглашение, нужно заполнить контакт (необязательное поле). Можно не заполнять, если не заинтересованы в вебинаре, а просто хотите помочь развитию канала.
Заранее спасибо за уделенное время!
https://docs.google.com/forms/d/e/1FAIpQLSdR8C2t6HY5acfYvjdJoIA-8ctBvPU50woFwAND0BsyRuf1zA/viewform?usp=dialog
Google Docs
Анкета от Алексей (Годный вайбкодинг)
Привет, спасибо, что согласился пройти короткий опрос!
Аудитория в канале активно растет и мне хочется получше вас узнать, чтобы пилить полезный для вас контент.
В качестве благодарности за прохождение опроса, я приглашаю тебя на закрытый вебинар, тема…
Аудитория в канале активно растет и мне хочется получше вас узнать, чтобы пилить полезный для вас контент.
В качестве благодарности за прохождение опроса, я приглашаю тебя на закрытый вебинар, тема…
5 11⚡7