Vibe Coding: OpenCode, Claude Code, Codex, Cursor, Kilo
3.12K subscribers
652 photos
41 videos
1 file
428 links
Пишу про полностью автоматическую отгрузку Вайб Кода, свежие апдейты, промпты и тесты ИИ-инструментов.
Download Telegram
Что тестируем дальше
Anonymous Poll
26%
GLM-5.1
34%
Qwen3.6
41%
Gemma 4
11🔥1
Протестировал Gemma 4

Ребята, вы просли - я сделал. Надо писать честный обзор...

Gemma - это серия моделей, которые предназначены для запуска на конечных устройствах пользователя - на мобильных телефонах.

Программирование - это вообще не про эти модели. И задание с телефоном нокия 3310 - оно для них ну слишком сложное.

И для меня это тоже был такой экспиримент.

Потому что у моделей серии Гемма есть особенность - это отсутсвие системного промпта. Т.е. он появлися только в 4 версии серии.

Итак, по памяти, у меня есть 24Gb - общей памяти - стоит $2000 я считаю такую конфигурацию не станадратной (т.к. на эти деньги можно покупаь 20 месяцев подписку Макс у Антропиков)

Что 24 гб могут потянуть:
• GPT OSS - 20b !!! - внезапно! это пока лучшее, что я запускал.
• Qwen 3.5 27b, Gemma 4 26b - это все тормозит безбожно, лучше даже не пытаться

Остается Gemma 4:e4b - которая рекомендована оллама по умолчанию... и...

Ну она очень плохо понимает куда она вообще попала, если вставить ее в Claude Code. Если вставить в OpenCode то она ведет себя намного лучше, но все равно, готовьтесь, это жутко тормозит и жутко тупит.

Это 3b vs 350b - это как муравей вышел на ринг против опоссума.

Так что эра когда можно бесплатно прогать на конечном устройстве она еще не настала.

Что же дальше?

Ну дальше запускать из Гугла по АПИ. Но тут как бы изготовится надо, т.к. как это подклчать к Клауд Код и ОпенКод я пока только догадываюсь.
🔥42😁1
Еще раз протестировал Gemma 4 — и это не работает

Но обо все по порядку:

1. Подключил через Google к OpenCode:

models/gemma-4-31b is not found for API version v1beta, or is not supported for generateContent. Call ListModels to see the list of available models and their supported methods. — модель не найдена в эндпоинте v1beta 🙄, воможно надо изменить эндпоинт на v1, но это настройки по дефолту.

2. Подключил Gemma 3 27b (free) через OpenRouter

No endpoints found that support tool use. Try disabling "question". To learn more about provider routing, visit: https://openrouter.ai/docs/guides/routing/provider-selection — модель не поддерживает использование тулов, а занчит для современного вайб кодинга не пригодна.

3. Модель google/gemma-4-31b-it - отсутствует во встроенном реестре моделей OpenCode.

Я не сдаюсь — нужно добавить её вручную в конфиг ~/.config/opencode/opencode.json

Изменение:

Добавить блок openrouter в секцию provider (его там сейчас нет — встроенные OpenRouter модели берутся из реестра OpenCode, а не из конфига):

Создать новую секцию:
"openrouter": {
"models": {
"google/gemma-4-31b-it": {
"name": "Gemma 4 31B IT"
}
}
}


План она написала за 24.5с и ушла в вечный цикл:

Error: The todowrite tool was called with invalid arguments — модель вызывает инструмент todos с неверными аргументами. При этом мы помним, что модель - она ну вообще не понимает, что она делает (только генерирует текст), а никакого лимита в OpenCode на неверные вызовы тулов похоже нет == death loop "вечный цикл" (показал на скриншоте). + еще какие-то ошибки с самим OpenRouter возникают (решается повторными запросами).

Все ребят, сдаюсь. Может, я не до конца разобрался. Но резюме:

1. Серия моделей Gemma - не для программирования вообще, она для запуска на конечных устройствах пользователей (на моб. телефонах) как Phi или Liquid (я больше конкурентов не знаю).
2. В 3 серии моделей даже не было system promp, в 4 серию это уже завезли но с вызовом tools похоже еще пару лет будут проблемы, так, что эра "мобильного вайб кодинга" еще не настала.
3. Для выполнения простых задач - должно быть отлично. Интересно было бы сравнить это с GPT-3.5. Вопрос в том, какую задачу считать простой.

Стоимость модели на ОпенРоутер: $0.40 - столько же, как и DeepSeek v3.2

Следующий шаг может быть протестировать, как это будет работать в OpenClaw, но в первую очередь вызывает вопросы сама методика тестирования.
Please open Telegram to view this post
VIEW IN TELEGRAM
🧠 3000+ часов в Claude Code: от 39 агентов к 3 плагинам

Разработчик, который провёл в Claude Code больше 3000 часов, рассказывает как эволюционировал свой подход. Полгода назад у него был монолитный Orchestrator Kit — 39 агентов, 38 скиллов, 25 слеш-команд. Всё для решения одной проблемы: экономии контекстного окна при 200K токенов.

А потом Anthropic выкатил окно в миллион токенов. И половина архитектурных решений стала оверинжинирингом. Агенты устаревали, скиллы отставали, обновления Claude Code ломали команды. Часы уходили не на продукт, а на починку инфраструктуры.

Результат — три плагина вместо монолита:

🔹 Superpowers — дисциплина, а не инструменты. TDD как обязательный шаг: код не пишется, пока тест не падает по правильной причине. Вертификация перед завершением: Claude обязан запустить проверку и прочитать вывод, а не «предположить что всё ОК».

🔹 Beads (Steve Yegge) — трекер задач в git. Задачи переживают перезапуск сессии, имеют зависимости и блокировки.

🔹 Template Bridge — авторский плагин, дающий доступ к 413+ шаблонам агентов.

Главный инсайт: методология важнее инструментов. Можно дать Claude 100 агентов, и он всё равно будет писать код без тестов. А можно зашить дисциплину в поведение — и тогда всё начинает работать.

🔗 https://habr.com/ru/articles/1017110/

Подпишитесь на @openclawc
👍42🔥1🤯1
🔒 Anthropic запрещает использовать Claude-подписку в сторонних агентах

Anthropic дал ~24 часа, чтобы отключить OpenClaw и другие агентные оболочки от Claude Pro/Max. Официально: использовать подписку вне официального Claude Code больше нельзя. Для всего остального — только API за отдельные деньги.

В честь запуска пакетов услуг каждому подписчику тарифных планов Pro, Max и Team дарят единовременный дополнительный бонус в размере стоимости: Pro - $20, Макс 5х - $100, Max 20x\Team - $200. Получить можно до 17 апреля. Но, не спешите получать - срок действия вашего кредита истекает через 90 дней после даты его получения. Неиспользованная часть кредита не переносится на следующий период.

Пахнет знакомо: сначала зачистить сторонние решения, потом выкатить свой «правильный» аналог.

В общем, это и к лучшему, что компания наконец сформулировала свою политику, а то пробовать и гадать, а не забанят ли тебе аккаунт, как-то не хотелось.

Подпишитесь на @openclawc

А вы на какие модели переключили своих агентов? 👇
Появился elo рейтинг Gemma 4

За что я люблю Гугл - они очень плотно сотрудничают с arena.ai - а это разработанный бывшими русскими сервис.

Но пусть вас эти графики не обманывают. Gemma 4 и GLM-5 разница всего в 4 elo, ну что по мне так это довольно мало, но 31B и 754B - разница очень большая.

Но, как следует из тестов, запустить на МакБук М5 24Гб - пока не получается. В ОпенКоде работать пока не хочет. Ждем, что ollama добавят облачную версию, может и заработает.
Хорошо бы и OpenAI свои модели также чистили, как и Github Copilot

Ну реально устаешь эти длинные списки мусора просматривать...
gemma4:31b-cloud наконец-то добавили в оллама

Не прошло и полгода.

Запуск:

ollama run gemma4:31b-cloud



ollama launch claude --model gemma4:31b-cloud



ollama launch opencode --model gemma4:31b-cloud


Ну что, затестим?

https://ollama.com/library/gemma4
👍4
Протестировал Gemma4 в Claude Code через Ollama-claude еще раз - это не работает

И тут я не выдержал, ну Гемма 4 реально очень плохо понимает куда она попала и что от нее хотят.

Ну не рождена она для кодирования, потому что у модели проблемы с использованием tools, ну не понимает она что это такое. Подробнее причины описал тут.

Модель вообще не вызывает мастер вопросов, и она замахнулась на очень сложную реализацию через TypeScript и она просто не может установить зависимости проекта (показал на скриншоте). Просто по 5 раз по кругу вызывает установщик.

Через 30 минут работы меня это достало и я вырубил.
This media is not supported in your browser
VIEW IN TELEGRAM
Завершение тестирования Gemma4

Ребят, я это сделал! И это полностью не рабочий аппарат! (Из бонусов ровный корпус, но кнопки перепутаны).

Тестировал в связке Ollama Cloude + OpenCode


ollama launch opencode --model gemma4:31b-cloud


Промпт:

Создайте Nokia 3310 с пиксельным экраном, игрой Змейка, составлением SMS и визуализатором классического рингтона.

Имеет смысл попробовать сравнить с каким-нибудь GPT-4.1 из любопытства.

Рекомендуется:
• Для экспириментов, если у вас много свободного времени (и мало денег).

В OpenСlaw я это использовать не рекомендую.

И последний важный вопрос, так сколько же лимитов на это ушло?

Ответ: 0

т.е. Ollama походу денег за это не берет.
1
ну что, погнали дальше?
👍7
#AIДайджест за неделю 27 марта по 4 апреля 2026

* Утечка исходного кода Claude от Anthropic: Код был случайно слит в сеть через реестр npm. Анализ кода раскрыл будущие планы компании: новую трехслойную архитектуру памяти, разработку фонового автономного ИИ-агента KIROS, который работает 24/7, упоминания новой модели следующего поколения Capiara (или Mythos) и скрытую систему терминальных «питомцев» в стиле Тамагочи.
* Рекордные инвестиции и новые планы OpenAI: Компания привлекла 122 милр. долларов при оценке в 852 миллиарда (среди инвесторов — Microsoft). OpenAI планирует создать единое «суперприложение», которое объединит ChatGPT, веб-браузинг и Codex.
* Масштабное обновление интерфейса и функций ChatGPT:
Передача геопозиции: Позволяет делать локализованные запросы, например, искать ближайшие кафе, и получать ответы с интерактивной картой и изображениями.
Умная работа с длинным текстом: Если вы вставляете в чат текст длиной более 5000 символов, он не занимает место в самом сообщении, а автоматически прикрепляется как .txt файл. Это сделано для экономии токенов контекстного окна, но пользователь может нажать специальную кнопку, чтобы принудительно развернуть файл как обычный текст.
Унификация подключенных сервисов: Интеграции с Google Docs, Sheets и Slides теперь объединены в единый коннектор Google Drive. Также были обновлены приложения Box, Notion, Linear и Dropbox внутри чат-бота (нужно перепройти авторизацию).
Редизайн мобильного приложения: Меню стало полноэкранным, элементы интерфейса увеличились, и теперь навигация удобно разделена свайпами между историей чатов и списком GPT.
Улучшенный интерфейс покупок (Shopping): Переработан визуальный стиль отображения товаров внутри чата, и модель стала чаще получать свежие данные о продуктах от брендов-партнеров.
* Новая модель MAI Transcribe 1 от Microsoft: Выпущена новая модель распознавания речи, созданная специально для транскрипций. Она превосходит аналоги (Whisper, Gemini).
* Google выпустила Veo 3.1 Light: Это более дешевая версия модели для генерации видео (стоимость составляет всего 5 центов за видео в 720p). Также было анонсировано снижение цен на версию Veo 3.1 Fast, которое ожидается 7 апреля.
* Запуск AI Inbox от Google: Новая бета-функция для умной сортировки электронной почты и ежедневных персонализированных сводок. Только для Ultra.
* Релиз открытой модели Gemma 4: Google выпустила мощную open-source модель под лицензией Apache 2.0, предназначенную для локального запуска на устройствах Android и ноутбуках.
* Две новые модели от Alibaba: Представлены Qwen 3.5 Omni — модель, работающая с текстом, изображениями, аудио и видео, и Qwen 3.6 Plus — модель для реальных агентов и написания кода, обладающая контекстным окном в 1 миллион токенов по умолчанию.
* Новая модель Trinity Large Thinking от RC: Американская компания выпустила открытую (Apache 2.0) модель, которая по тестам показывает результаты на уровне с передовыми закрытыми моделями.
* Функция управления компьютером в Claude Code: ИИ теперь может управлять мышью и клавиатурой прямо в браузере (функция доступна в предпросмотре для подписчиков Pro и Max).
* Плагин Codex для Claude Code: Пользователи теперь могут использовать API-ключ OpenAI прямо в интерфейсе Claude Code, объединяя возможности двух систем в одном рабочем процессе.
* ChatGPT в Apple CarPlay: Популярный чат-бот теперь интегрирован напрямую в систему Apple CarPlay для автомобилей.
* OpenAI купила подкаст TBPN: Компания приобрела ежедневное прямоэфирное шоу/подкаст о технологиях и бизнесе Tech Business Production Network.
* Perplexity запустила Computer for Taxes: Инструмент загружает налоговые модули для помощи с федеральными налогами США и может самостоятельно заполнять официальные формы IRS.
* Slack получает 30 новых ИИ-функций: Salesforce делает мессенджер более агентным, добавляя транскрипцию встреч (в том числе из Zoom), сохраняемые ИИ-навыки, глубокий поиск и автоматическое обновление данных о клиентах напрямую из чатов.
1
Протестировал GPT-4.1

Ребята, Ребята, посмотрите какую игру змейка сделал старичок GPT-4.1

Промпт:

Создайте Nokia 3310 с пиксельным экраном, игрой Змейка, составлением SMS и визуализатором классического рингтона.

Решил я тут понастальгировать, и чтобы осознать насколько прогресс ушел далеко за эти 3 года, подключил к OpenCode GPT-4.1 из подписки GitHub Copilot

Задание для этих старых моделей настолько сложное, что аппарат получился 100% кривой косой и не рабочий.

GPT-4o тестировать будем?
Протестировал Qwen 3.6 Plus

Оценка 3 из 5 (Может ему не свезло и если делать 10 шотов, то результат получился бы другой).

Промпт:

Создайте Nokia 3310 с пиксельным экраном, игрой Змейка, составлением SMS и визуализатором классического рингтона.

Один апарат поломан, не работает рингтон и смс глючит
Один аппарат полностью поломано смс

Стоит отметить:
• Корпусы все ровные а аккурантые, 4 из 5 экранов не вылазят за пределы корпуса.
• Работает довольно шустро самый быстрый за 53 сек., самый долгий 3 минуты
• Инференс от Алибабы подвисает, на старте так всегда быват (все хотят попробовать модель, мощности еще не масштабировали).

Цена: $3\1M - ну за такие деньги ничего интересного она из себя не представляет. Я думал дешевле будет.

Результаты тестирования GLM-5 и Kimi K2.5
2
Telegram разрешил ботам создавать ботов — что это значит для OpenClaw

Telegram выпустил крупнейшее обновление Bot API: теперь один бот может создавать и управлять другими ботами. Звучит как мелочь? Это меняет всё.

Что нового:

• Боты могут создавать других ботов через API — без участия человека
• Бот может деплоить, масштабировать и управлять сетью ботов
• Ноль кода — AI-бот сам создаёт нужные боты по запросу

Почему это важно для OpenClaw:
OpenClaw работает через Telegram-бот. Сейчас один агент = один бот. С новым обновлением один OpenClaw-агент может создавать специализированных субагентов-ботов под конкретные задачи — мониторинг, уведомления, интеграции — и управлять ими централизованно.

По сути Telegram дал OpenClaw то, чего не хватало — нативную оркестрацию на уровне платформы.

Что ещё в обновлении:

AI-редактор — встроенный в строку ввода, работает через Cocoon Network (privacy-first). Перевод, смена стиля, грамматика. Стили: Formal, Short, Tribal, Corp, Zen, Biblical, Viking
Опросы 2.0 — медиа в вопросах, подсказки от пользователей, таймеры, перемешивание вариантов
Live Photos — нативная поддержка iOS Live Photos и Android Motion Photos

Что это значит на практике:
Если вы задумывались запустить нескольких агентов OpenClaw для разных задач — теперь это можно сделать из одного экземпляра. Агент-оркестратор создаёт ботов-исполнителей, даёт им задачи, собирает результаты.

🔗 https://telegram.org/blog/ai-editor-mighty-polls-and-more

Подпишитесь на @openclawc
1
Новинка Claude Code - визуализация мастера вопросов

Теперь, когда вы проектируете дизайн, Клод Код может предложить вам "Открыть в браузере" - и это потратит доп. токены.

Ну это поудобнее, чем текстом UI\UX делать.
🔥21
Zhipu AI выпустили SOTA модель GLM-5.1

Эта модель не только лучше Opus 4.6 и GPT-5.4 в задачах кодирования, так она еще может вам кофе приготовить!!!

Но, не спешите радоваться:

Для подписчиков тарифного плана GLM Coding Plan: Мы внедряем GLM-5.1 для всех пользователей тарифного плана Coding Plan. Вы можете включить GLM-5.1 прямо сейчас, обновив название модели "GLM-5.1"(например, ~/.claude/settings.jsonдля Claude Code). Как наша самая мощная модель, GLM-5.1 потребляет квоту в 3 раза больше в часы пик и в 2 раза больше в непиковые часы. В рамках ограниченной по времени акции до конца апреля, использование в непиковые часы оплачивается по тарифу 1×. (Часы пик — с 14:00 до 18:00 UTC+8 (Пекинское время) ежедневно)


Цена новинки $4.4\1M - дешевле, чем Haiku, но уже в 2 раза дороже GLM-4.7.

Go тестить?

https://z.ai/blog/glm-5.1
https://docs.z.ai/guides/llm/glm-5.1
👍6