Vibe Coding: OpenCode, Claude Code, Codex, Cursor, Kilo
3.29K subscribers
679 photos
48 videos
1 file
448 links
Пишу про полностью автоматическую отгрузку Вайб Кода, свежие апдейты, промпты и тесты ИИ-инструментов.
Download Telegram
Ребят, еще спасибо вам за ваши репосты

Superpowers неожиданно хорошо зашел - я тестирую, и готовлюсь писать подробный обзор.

Я уже понял, что реакций от вас не допросишься... но вот в избранное вы себе забираете — лучшая награда для меня вам пользу приносить!
5👍4🔥2
Есть тут эксперты по Fig ma?

Объясните мне в комментах, что я делаю не так 👇
Please open Telegram to view this post
VIEW IN TELEGRAM
Антропик? Но как?

За 54 минут 90% лимитов Мах 5х
😁1
Codex теперь генерирует изображения GPT-image-1.5 совершенно за бесплатно*

* Нужна подписка Plus или Pro

Вот это вот основное отличие между CLI и Desktop, что кли он как-то не очень рожден для работы с изображениями.
👍1
Протестировал генерацию изображений в Codex

Промпт:

Создай комикс про девушку из Китая Черри, которая инвестирует в акции американских технологических компаний: NVDA, PLTR, CRCL, TEM и у нее есть друг Eric который ей помогает.

1. Генерит он полную дичь - по два ноутбука у одного человека
2. Консистентности никакой. Каждое новое сообщение генерируется в своей собственной эстетике.

Итого:
• Да, это шаг вперед
• Над консистентностью еще надо работать. (в третьей панели у Эрика очки то появляются то исчезают).

Ксати, с реализацией потом такие же проблемы. Я сам не тестил - но видел в видео на ютубе.
👍3
Антропик сегодня сговорились с OpenAI

Напишите в комментах, хватает ли вам лимитов 👇
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯2
Завезли новые гест пассы на неделю бесплатного использования Клод Код:

https://claude.ai/referral/Ppz9Q_-CKg - осталось 3 штуки.

Только для новых пользователей. Нужно вводить номер банковской карты.
Протестировал orba\superpowers

Как это работает:

• Вы просто устанавливаете плагин из официального репо /plugins он там первый в списке.
• Он просто начинает работать в фоне, дополняя собой стандартный /plan Клод Код.

Сначала:

• brainstorming, он подробно пишет спеку и сохраняет в папку проекта /docs/superpowers/specs
• По спеке writing-plans пишет план и сохраняет его в /docs/superpowers/docs
• Запускает executing-plans - для выполнения плана

Дальше будет вилка:

1. Subagent-Driven (рекомендую) — отдельный агент на каждую задачу, проверка между задачами, быстрая итерация
2. Inline Execution — исполнение в этой сессии с чекпоинтами

Потом:

• Скилл для разбивки на субагенты: superpowers:subagent-driven-development
• После каждой задачи автоматически запускается ревью субагент receiving-code-review (но по мне так review субагент из feature-dev как-то понятнее)

Ну в общем-то и все.

Если после этого нужно запиарить, он запустит: finishing-a-development-branch и так далее.

Вот все скиллы из плагина в виде списка:
• superpowers:using-superpowers — вводный скилл, объясняет, как находить и использовать другие скиллы
• superpowers:brainstorming — превращает идею в дизайн через диалог, пишет спецификацию
• superpowers:writing-plans — создаёт детальный план реализации по спецификации
• superpowers:executing-plans — исполняет план в текущей сессии с чекпоинтами
• superpowers:subagent-driven-development — исполняет план через субагентов с двухэтапным ревью
• superpowers:dispatching-parallel-agents — запускает независимые задачи параллельно
• superpowers:test-driven-development — TDD-workflow для субагентов при реализации фич
• superpowers:systematic-debugging — систематический дебаггинг: анализ, трассировка, исправление
• superpowers:requesting-code-review — шаблон для отправки кода на ревью
• superpowers:receiving-code-review — обработка фидбека от ревью перед внесением правок
• superpowers:verification-before-completion — проверка перед тем, как заявить, что задача выполнена
• superpowers:writing-skills — создание и редактирование самих скиллов
• superpowers:finishing-a-development-branch — финализация ветки: тесты, PR, слияние
• superpowers:using-git-worktrees — изолированная работа через git worktrees

Раньше плагин работал иначе, и использовал сейчас устаревшие команды:
• superpowers:write-plan — заменён на writing-plans
• superpowers:execute-plan — заменён на executing-plans
• superpowers:brainstorm — заменён на brainstorming

Они еще есть в пакете, но в следующей мажорной версии будут удалены.

Чего мне лично не хватило в суперпаверс - так это перепроверки реализации плана. Потому что каждый раз, как я проверяю реализацию плана агентом, каждый раз чего-то не хватает.

Как установить
3
Opus 4.7 набрал 1583 elo по кодированию на arena.ai

Это не так уже и много - ну в общем-то в моих тестах примерно такой же результат.

https://arena.ai/leaderboard/code
👍4
Forwarded from Victor
Наконец-то superpowers устанавливается в codex без танцев с бубнами)
👍21🔥1
Какую модель выбрать?

В комментах постоянно задают один и тот же вопрос: Какую модель выбрать? В то же время, вопрос среды в которой работает агент игнорируется.

Модель — это водитель, программный модуль — это средство передвижения. Ребята, вы пытаетесь найти самого лучшего водителя, и посадить его в старую убитую машину (или не хотите обращать внимание, какое у него авто) или пытаетесь новичка посадить в Феррари и ехать на нем по проселочной дороге.

Что такое Harness для агентов?

— это термин из области ИИ-агентов, то есть автономных систем на базе больших языковых моделей, которые не просто отвечают на вопросы, а самостоятельно выполняют задачи: пишут и запускают код, ищут информацию, работают с файлами, взаимодействуют с внешними сервисами.

Нашел в интернете вот такое определение, приведу в оригинале:

Harness = Tools + Knowledge + Observation + Action Interfaces + Permissions

• Tools: file I/O, shell, network, database, browser
• Knowledge: product docs, domain references, API specs, style guides
• Observation: git diff, error logs, browser state, sensor data
• Action: CLI commands, API calls, UI interactions
• Permissions: sandboxing, approval workflows, trust boundaries


И перевод:

Обвязка = Инструменты + Знания + Наблюдение + Интерфейсы действий + Разрешения

• Инструменты: работа с файлами, командная оболочка, сеть, база данных, браузер
• Знания: документация продукта, предметные справочники, спецификации API, руководства по стилю
• Наблюдение: вывод git diff, журналы ошибок, состояние браузера, данные датчиков
• Действие: команды командной строки, вызовы API, взаимодействие с интерфейсом
• Разрешения: изолированная среда (песочница), процедуры согласования, границы доверия


Практический смысл формулы такой: качество работы ИИ-агента определяется не только тем, насколько умна сама модель, но и тем, насколько грамотно собрана обвязка вокруг неё. Одна и та же модель с хорошей обвязкой справляется с задачей, а с плохой — буксует или совершает ошибки. Это актуальная тема для всех, кто сейчас строит рабочие процессы на базе Claude Code, Cursor, агентов OpenAI и подобных инструментов.

При этом, обвязка - это не только то, что вам дает Антропик (или другой производитель) из коробки, а это еще и тот воркфлоу, который вы создаете самостоятельно под решение своих задач.
👍3🔥1
Kimi K2.6 уже доступна в Ollama

ollama launch claude --model kimi-k2.6:cloud

Официальный API Kimi Platform:
• Вход: $0.95/1M токенов (cache hit: $0.16/1M)
• Выход: $4.00/1M токенов

OpenRouter:
• Вход: $0.60/1M
• Выход: $2.80/1M
👍1
Бенчи по кодированию у Kimi K2.6 очень крутые

Ну что? Кто еще верит китайским бенчам?
Новый генератор изображений от OpenAI GPT-image-2.0 набрал фантастические 1513 elo на arena.ai

Разрыв от предыдущей модели и Nano Banana 2 - более 100 elo баллов!

Что это означает на практике! Когда в августе 2025 года вышла Nano Banana 2 - это был прорыв в редактировании изображений.

Сегодня OpenAI отменяют это обновление и задают новую планку для всей индустрии не достижимую для топовых закрытых китайских моделей.

Цена новинки даже немного подешевела. 1.5 была $32 за 1М, 2.0 по $30\1M

🏆 https://arena.ai/leaderboard/image-edit
Новая опция в Codex "2. Yes, clear context and implement"

Ну что, ждем когда табуляцию сделают, чтобы "No, нажать [таб] и указать что нужно делать" 😂 Потому что, сделать контекстное окно 1м токенов - это ну уж слишком сложно.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Протестировал Haiku 4.5

Ребята, посмотрите, какую игру в Змейка создал Haiku 4.5

Промпт:

Создайте Nokia 3310 с пиксельным экраном, игрой Змейка, составлением SMS и визуализатором классического рингтона.

Формально, аппарат рабочий, но есть несколько но:
1. В меню нет курсора, ничего выбрать не возможно.
2. Змейка очень быстрая.
3. Смс набираются не верно, но можно отправить.
4. Мелодия играет, но без правильной визуализации.

Как видим, задание это для Haiku 4.5 сложновато.

Создавалось это в режиме /plan там в Claude Code работает Sonnet 4.6 и он пытается просканировать верхнеуровневую папку и там находит результаты предыдущих текстов и использует ее. Поэтому приходится его останавливать и писать "Делай проект с нуля".

Дальше при реализации плана переключается на Haiku 4.5.

Лимитов на это ушло 2% от пятичасового Мах х5, значит где-то 10% от обычной Про подписки.
👍2