Vibe Coding: OpenCode, Claude Code, Codex, Cursor, Kilo
3.12K subscribers
652 photos
41 videos
1 file
428 links
Пишу про полностью автоматическую отгрузку Вайб Кода, свежие апдейты, промпты и тесты ИИ-инструментов.
Download Telegram
Хорошо бы и OpenAI свои модели также чистили, как и Github Copilot

Ну реально устаешь эти длинные списки мусора просматривать...
gemma4:31b-cloud наконец-то добавили в оллама

Не прошло и полгода.

Запуск:

ollama run gemma4:31b-cloud



ollama launch claude --model gemma4:31b-cloud



ollama launch opencode --model gemma4:31b-cloud


Ну что, затестим?

https://ollama.com/library/gemma4
👍4
Протестировал Gemma4 в Claude Code через Ollama-claude еще раз - это не работает

И тут я не выдержал, ну Гемма 4 реально очень плохо понимает куда она попала и что от нее хотят.

Ну не рождена она для кодирования, потому что у модели проблемы с использованием tools, ну не понимает она что это такое. Подробнее причины описал тут.

Модель вообще не вызывает мастер вопросов, и она замахнулась на очень сложную реализацию через TypeScript и она просто не может установить зависимости проекта (показал на скриншоте). Просто по 5 раз по кругу вызывает установщик.

Через 30 минут работы меня это достало и я вырубил.
This media is not supported in your browser
VIEW IN TELEGRAM
Завершение тестирования Gemma4

Ребят, я это сделал! И это полностью не рабочий аппарат! (Из бонусов ровный корпус, но кнопки перепутаны).

Тестировал в связке Ollama Cloude + OpenCode


ollama launch opencode --model gemma4:31b-cloud


Промпт:

Создайте Nokia 3310 с пиксельным экраном, игрой Змейка, составлением SMS и визуализатором классического рингтона.

Имеет смысл попробовать сравнить с каким-нибудь GPT-4.1 из любопытства.

Рекомендуется:
• Для экспириментов, если у вас много свободного времени (и мало денег).

В OpenСlaw я это использовать не рекомендую.

И последний важный вопрос, так сколько же лимитов на это ушло?

Ответ: 0

т.е. Ollama походу денег за это не берет.
1
ну что, погнали дальше?
👍7
#AIДайджест за неделю 27 марта по 4 апреля 2026

* Утечка исходного кода Claude от Anthropic: Код был случайно слит в сеть через реестр npm. Анализ кода раскрыл будущие планы компании: новую трехслойную архитектуру памяти, разработку фонового автономного ИИ-агента KIROS, который работает 24/7, упоминания новой модели следующего поколения Capiara (или Mythos) и скрытую систему терминальных «питомцев» в стиле Тамагочи.
* Рекордные инвестиции и новые планы OpenAI: Компания привлекла 122 милр. долларов при оценке в 852 миллиарда (среди инвесторов — Microsoft). OpenAI планирует создать единое «суперприложение», которое объединит ChatGPT, веб-браузинг и Codex.
* Масштабное обновление интерфейса и функций ChatGPT:
Передача геопозиции: Позволяет делать локализованные запросы, например, искать ближайшие кафе, и получать ответы с интерактивной картой и изображениями.
Умная работа с длинным текстом: Если вы вставляете в чат текст длиной более 5000 символов, он не занимает место в самом сообщении, а автоматически прикрепляется как .txt файл. Это сделано для экономии токенов контекстного окна, но пользователь может нажать специальную кнопку, чтобы принудительно развернуть файл как обычный текст.
Унификация подключенных сервисов: Интеграции с Google Docs, Sheets и Slides теперь объединены в единый коннектор Google Drive. Также были обновлены приложения Box, Notion, Linear и Dropbox внутри чат-бота (нужно перепройти авторизацию).
Редизайн мобильного приложения: Меню стало полноэкранным, элементы интерфейса увеличились, и теперь навигация удобно разделена свайпами между историей чатов и списком GPT.
Улучшенный интерфейс покупок (Shopping): Переработан визуальный стиль отображения товаров внутри чата, и модель стала чаще получать свежие данные о продуктах от брендов-партнеров.
* Новая модель MAI Transcribe 1 от Microsoft: Выпущена новая модель распознавания речи, созданная специально для транскрипций. Она превосходит аналоги (Whisper, Gemini).
* Google выпустила Veo 3.1 Light: Это более дешевая версия модели для генерации видео (стоимость составляет всего 5 центов за видео в 720p). Также было анонсировано снижение цен на версию Veo 3.1 Fast, которое ожидается 7 апреля.
* Запуск AI Inbox от Google: Новая бета-функция для умной сортировки электронной почты и ежедневных персонализированных сводок. Только для Ultra.
* Релиз открытой модели Gemma 4: Google выпустила мощную open-source модель под лицензией Apache 2.0, предназначенную для локального запуска на устройствах Android и ноутбуках.
* Две новые модели от Alibaba: Представлены Qwen 3.5 Omni — модель, работающая с текстом, изображениями, аудио и видео, и Qwen 3.6 Plus — модель для реальных агентов и написания кода, обладающая контекстным окном в 1 миллион токенов по умолчанию.
* Новая модель Trinity Large Thinking от RC: Американская компания выпустила открытую (Apache 2.0) модель, которая по тестам показывает результаты на уровне с передовыми закрытыми моделями.
* Функция управления компьютером в Claude Code: ИИ теперь может управлять мышью и клавиатурой прямо в браузере (функция доступна в предпросмотре для подписчиков Pro и Max).
* Плагин Codex для Claude Code: Пользователи теперь могут использовать API-ключ OpenAI прямо в интерфейсе Claude Code, объединяя возможности двух систем в одном рабочем процессе.
* ChatGPT в Apple CarPlay: Популярный чат-бот теперь интегрирован напрямую в систему Apple CarPlay для автомобилей.
* OpenAI купила подкаст TBPN: Компания приобрела ежедневное прямоэфирное шоу/подкаст о технологиях и бизнесе Tech Business Production Network.
* Perplexity запустила Computer for Taxes: Инструмент загружает налоговые модули для помощи с федеральными налогами США и может самостоятельно заполнять официальные формы IRS.
* Slack получает 30 новых ИИ-функций: Salesforce делает мессенджер более агентным, добавляя транскрипцию встреч (в том числе из Zoom), сохраняемые ИИ-навыки, глубокий поиск и автоматическое обновление данных о клиентах напрямую из чатов.
1
Протестировал GPT-4.1

Ребята, Ребята, посмотрите какую игру змейка сделал старичок GPT-4.1

Промпт:

Создайте Nokia 3310 с пиксельным экраном, игрой Змейка, составлением SMS и визуализатором классического рингтона.

Решил я тут понастальгировать, и чтобы осознать насколько прогресс ушел далеко за эти 3 года, подключил к OpenCode GPT-4.1 из подписки GitHub Copilot

Задание для этих старых моделей настолько сложное, что аппарат получился 100% кривой косой и не рабочий.

GPT-4o тестировать будем?
Протестировал Qwen 3.6 Plus

Оценка 3 из 5 (Может ему не свезло и если делать 10 шотов, то результат получился бы другой).

Промпт:

Создайте Nokia 3310 с пиксельным экраном, игрой Змейка, составлением SMS и визуализатором классического рингтона.

Один апарат поломан, не работает рингтон и смс глючит
Один аппарат полностью поломано смс

Стоит отметить:
• Корпусы все ровные а аккурантые, 4 из 5 экранов не вылазят за пределы корпуса.
• Работает довольно шустро самый быстрый за 53 сек., самый долгий 3 минуты
• Инференс от Алибабы подвисает, на старте так всегда быват (все хотят попробовать модель, мощности еще не масштабировали).

Цена: $3\1M - ну за такие деньги ничего интересного она из себя не представляет. Я думал дешевле будет.

Результаты тестирования GLM-5 и Kimi K2.5
2
Telegram разрешил ботам создавать ботов — что это значит для OpenClaw

Telegram выпустил крупнейшее обновление Bot API: теперь один бот может создавать и управлять другими ботами. Звучит как мелочь? Это меняет всё.

Что нового:

• Боты могут создавать других ботов через API — без участия человека
• Бот может деплоить, масштабировать и управлять сетью ботов
• Ноль кода — AI-бот сам создаёт нужные боты по запросу

Почему это важно для OpenClaw:
OpenClaw работает через Telegram-бот. Сейчас один агент = один бот. С новым обновлением один OpenClaw-агент может создавать специализированных субагентов-ботов под конкретные задачи — мониторинг, уведомления, интеграции — и управлять ими централизованно.

По сути Telegram дал OpenClaw то, чего не хватало — нативную оркестрацию на уровне платформы.

Что ещё в обновлении:

AI-редактор — встроенный в строку ввода, работает через Cocoon Network (privacy-first). Перевод, смена стиля, грамматика. Стили: Formal, Short, Tribal, Corp, Zen, Biblical, Viking
Опросы 2.0 — медиа в вопросах, подсказки от пользователей, таймеры, перемешивание вариантов
Live Photos — нативная поддержка iOS Live Photos и Android Motion Photos

Что это значит на практике:
Если вы задумывались запустить нескольких агентов OpenClaw для разных задач — теперь это можно сделать из одного экземпляра. Агент-оркестратор создаёт ботов-исполнителей, даёт им задачи, собирает результаты.

🔗 https://telegram.org/blog/ai-editor-mighty-polls-and-more

Подпишитесь на @openclawc
1
Новинка Claude Code - визуализация мастера вопросов

Теперь, когда вы проектируете дизайн, Клод Код может предложить вам "Открыть в браузере" - и это потратит доп. токены.

Ну это поудобнее, чем текстом UI\UX делать.
🔥21
Zhipu AI выпустили SOTA модель GLM-5.1

Эта модель не только лучше Opus 4.6 и GPT-5.4 в задачах кодирования, так она еще может вам кофе приготовить!!!

Но, не спешите радоваться:

Для подписчиков тарифного плана GLM Coding Plan: Мы внедряем GLM-5.1 для всех пользователей тарифного плана Coding Plan. Вы можете включить GLM-5.1 прямо сейчас, обновив название модели "GLM-5.1"(например, ~/.claude/settings.jsonдля Claude Code). Как наша самая мощная модель, GLM-5.1 потребляет квоту в 3 раза больше в часы пик и в 2 раза больше в непиковые часы. В рамках ограниченной по времени акции до конца апреля, использование в непиковые часы оплачивается по тарифу 1×. (Часы пик — с 14:00 до 18:00 UTC+8 (Пекинское время) ежедневно)


Цена новинки $4.4\1M - дешевле, чем Haiku, но уже в 2 раза дороже GLM-4.7.

Go тестить?

https://z.ai/blog/glm-5.1
https://docs.z.ai/guides/llm/glm-5.1
👍6
Разве это не прекрасно?

Интересно ОЗУ хватит, там 4 Гб всего.
А вы тоже замечали, что лимиты в Кодекс какие-то странные?

Один скрнишот я сделал в 8 утра, а второй в 9:30 утра.
2
GLM-5.1 нагнул GPT-5.4 и Gemini 3.1 Pro на arena.ai

1530 elo это не 5.1 - это GLM-6 (или хотя бы 5.5)

Чтобы нагнуть Opus 4.6 не хватило 18 баллов, это разница в 1.1%, и при разнице в цене 468% (4.4$ vs $25).

Лицензия MIT в отличие от MiniMax, а это значит, что скоро мы увидим много много клонов этого GLM-5.1

Ну чего, погнали тестить?
Ребят, кто ждете результатов по GLM-5.1

Плохо ждете, но еще есть шанс перегословоать )))

Кстати, при таких бенчах его уже надо выставлять против чемпиона arena.ai

GLM-5.1 vs Opus 4.6 - бой в сверхтяжелом весе на звание чемпиона вайб кодирования.

Спойлер: По моим предыдущим скриншотам, вы можете догадаться, что я уже чутка потестил GLM-5.1 и результат меня не очень поразил. Поэтому нужно его уже выставлять против Опуса, потому что разница в цене ну в 5 раз... это очень много.
🔥3
Протестировал GLM-5.1

Особой разницы между GLM-5.1 и GLM-5.1 мой тест не находит. Оба набирают по 4 балла из 5, но есть нюансы.

Промпт:

Создайте Nokia 3310 с пиксельным экраном, игрой Змейка, составлением SMS и визуализатором классического рингтона.

Работает ну очень долго:

• Планирование где-то 2 минуты 30 сек. Иногда вопросы задает, иногда не задает (я так догадываюсь, это зависит от тренированности модели использования тулс)
• Реализация 8 минут 53 сек. минимум, а то все 15 минут и дольше. Иногда просто вырубается и ничего не делает, надо писать "продолжи", чтобы снова начал делать.

Но в тесте GLM-5 я уже жаловался на скорость работы, в последтсвии это поправили и сейчас работает намного быстрее и стабильнее, чем при старте инференса.

Корпусы телефонов ровные, 4 из 5, как и у GLM-5.1 (один из экранов вылазит за пределы корпуса)

У одного телефона все шрифты, они не то что вверх ногами они повернуты боком (показал на скриншоте), так что прочитать что написано в меню вообще не возможно.

У одного телефона из 5 не работают смс, поэтому 4 балла из 5.

Будем ли тестировать в CludeCode? Наверное нет, я заметил, что на телефонах с игрой змейка, эти китайские модели в OpenCode лучше себя показывают, так что потратим время на что-то более полезное.