Please open Telegram to view this post
VIEW IN TELEGRAM
Протестировал генерацию изображений в Codex
Промпт:
1. Генерит он полную дичь - по два ноутбука у одного человека
2. Консистентности никакой. Каждое новое сообщение генерируется в своей собственной эстетике.
Итого:
• Да, это шаг вперед
• Над консистентностью еще надо работать. (в третьей панели у Эрика очки то появляются то исчезают).
Ксати, с реализацией потом такие же проблемы. Я сам не тестил - но видел в видео на ютубе.
Промпт:
Создай комикс про девушку из Китая Черри, которая инвестирует в акции американских технологических компаний: NVDA, PLTR, CRCL, TEM и у нее есть друг Eric который ей помогает.
1. Генерит он полную дичь - по два ноутбука у одного человека
2. Консистентности никакой. Каждое новое сообщение генерируется в своей собственной эстетике.
Итого:
• Да, это шаг вперед
• Над консистентностью еще надо работать. (в третьей панели у Эрика очки то появляются то исчезают).
Ксати, с реализацией потом такие же проблемы. Я сам не тестил - но видел в видео на ютубе.
👍3
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯2
Завезли новые гест пассы на неделю бесплатного использования Клод Код:
https://claude.ai/referral/Ppz9Q_-CKg - осталось 3 штуки.
Только для новых пользователей. Нужно вводить номер банковской карты.
https://claude.ai/referral/Ppz9Q_-CKg - осталось 3 штуки.
Только для новых пользователей. Нужно вводить номер банковской карты.
Claude
Join Claude!
You've been invited to try Claude
Протестировал orba\superpowers
Как это работает:
• Вы просто устанавливаете плагин из официального репо /plugins он там первый в списке.
• Он просто начинает работать в фоне, дополняя собой стандартный /plan Клод Код.
Сначала:
• brainstorming, он подробно пишет спеку и сохраняет в папку проекта /docs/superpowers/specs
• По спеке writing-plans пишет план и сохраняет его в /docs/superpowers/docs
• Запускает executing-plans - для выполнения плана
Дальше будет вилка:
1. Subagent-Driven (рекомендую) — отдельный агент на каждую задачу, проверка между задачами, быстрая итерация
2. Inline Execution — исполнение в этой сессии с чекпоинтами
Потом:
• Скилл для разбивки на субагенты: superpowers:subagent-driven-development
• После каждой задачи автоматически запускается ревью субагент receiving-code-review (но по мне так review субагент из feature-dev как-то понятнее)
Ну в общем-то и все.
Если после этого нужно запиарить, он запустит: finishing-a-development-branch и так далее.
Вот все скиллы из плагина в виде списка:
• superpowers:using-superpowers — вводный скилл, объясняет, как находить и использовать другие скиллы
• superpowers:brainstorming — превращает идею в дизайн через диалог, пишет спецификацию
• superpowers:writing-plans — создаёт детальный план реализации по спецификации
• superpowers:executing-plans — исполняет план в текущей сессии с чекпоинтами
• superpowers:subagent-driven-development — исполняет план через субагентов с двухэтапным ревью
• superpowers:dispatching-parallel-agents — запускает независимые задачи параллельно
• superpowers:test-driven-development — TDD-workflow для субагентов при реализации фич
• superpowers:systematic-debugging — систематический дебаггинг: анализ, трассировка, исправление
• superpowers:requesting-code-review — шаблон для отправки кода на ревью
• superpowers:receiving-code-review — обработка фидбека от ревью перед внесением правок
• superpowers:verification-before-completion — проверка перед тем, как заявить, что задача выполнена
• superpowers:writing-skills — создание и редактирование самих скиллов
• superpowers:finishing-a-development-branch — финализация ветки: тесты, PR, слияние
• superpowers:using-git-worktrees — изолированная работа через git worktrees
Раньше плагин работал иначе, и использовал сейчас устаревшие команды:
• superpowers:write-plan — заменён на writing-plans
• superpowers:execute-plan — заменён на executing-plans
• superpowers:brainstorm — заменён на brainstorming
Они еще есть в пакете, но в следующей мажорной версии будут удалены.
Чего мне лично не хватило в суперпаверс - так это перепроверки реализации плана. Потому что каждый раз, как я проверяю реализацию плана агентом, каждый раз чего-то не хватает.
Как установить
Как это работает:
• Вы просто устанавливаете плагин из официального репо /plugins он там первый в списке.
• Он просто начинает работать в фоне, дополняя собой стандартный /plan Клод Код.
Сначала:
• brainstorming, он подробно пишет спеку и сохраняет в папку проекта /docs/superpowers/specs
• По спеке writing-plans пишет план и сохраняет его в /docs/superpowers/docs
• Запускает executing-plans - для выполнения плана
Дальше будет вилка:
1. Subagent-Driven (рекомендую) — отдельный агент на каждую задачу, проверка между задачами, быстрая итерация
2. Inline Execution — исполнение в этой сессии с чекпоинтами
Потом:
• Скилл для разбивки на субагенты: superpowers:subagent-driven-development
• После каждой задачи автоматически запускается ревью субагент receiving-code-review (но по мне так review субагент из feature-dev как-то понятнее)
Ну в общем-то и все.
Если после этого нужно запиарить, он запустит: finishing-a-development-branch и так далее.
Вот все скиллы из плагина в виде списка:
• superpowers:using-superpowers — вводный скилл, объясняет, как находить и использовать другие скиллы
• superpowers:brainstorming — превращает идею в дизайн через диалог, пишет спецификацию
• superpowers:writing-plans — создаёт детальный план реализации по спецификации
• superpowers:executing-plans — исполняет план в текущей сессии с чекпоинтами
• superpowers:subagent-driven-development — исполняет план через субагентов с двухэтапным ревью
• superpowers:dispatching-parallel-agents — запускает независимые задачи параллельно
• superpowers:test-driven-development — TDD-workflow для субагентов при реализации фич
• superpowers:systematic-debugging — систематический дебаггинг: анализ, трассировка, исправление
• superpowers:requesting-code-review — шаблон для отправки кода на ревью
• superpowers:receiving-code-review — обработка фидбека от ревью перед внесением правок
• superpowers:verification-before-completion — проверка перед тем, как заявить, что задача выполнена
• superpowers:writing-skills — создание и редактирование самих скиллов
• superpowers:finishing-a-development-branch — финализация ветки: тесты, PR, слияние
• superpowers:using-git-worktrees — изолированная работа через git worktrees
Раньше плагин работал иначе, и использовал сейчас устаревшие команды:
• superpowers:write-plan — заменён на writing-plans
• superpowers:execute-plan — заменён на executing-plans
• superpowers:brainstorm — заменён на brainstorming
Они еще есть в пакете, но в следующей мажорной версии будут удалены.
Чего мне лично не хватило в суперпаверс - так это перепроверки реализации плана. Потому что каждый раз, как я проверяю реализацию плана агентом, каждый раз чего-то не хватает.
Как установить
Telegram
Vibe Coding: OpenCode, Claude Code, Codex, Cursor, Kilo
А вы уже пробовали superpowers?
Я вот такие штуки абожаю
Каждая из 10 задач запускается отдельным субагентом и не занимает контекстное окно.
После реализации каждой задачи автомтом запускается ревьювер - все из коробки.
orba/superpowers - есть в стандартном…
Я вот такие штуки абожаю
Каждая из 10 задач запускается отдельным субагентом и не занимает контекстное окно.
После реализации каждой задачи автомтом запускается ревьювер - все из коробки.
orba/superpowers - есть в стандартном…
❤3
Opus 4.7 набрал 1583 elo по кодированию на arena.ai
Это не так уже и много - ну в общем-то в моих тестах примерно такой же результат.
https://arena.ai/leaderboard/code
Это не так уже и много - ну в общем-то в моих тестах примерно такой же результат.
https://arena.ai/leaderboard/code
👍4
Какую модель выбрать?
В комментах постоянно задают один и тот же вопрос: Какую модель выбрать? В то же время, вопрос среды в которой работает агент игнорируется.
Модель — это водитель, программный модуль — это средство передвижения. Ребята, вы пытаетесь найти самого лучшего водителя, и посадить его в старую убитую машину (или не хотите обращать внимание, какое у него авто) или пытаетесь новичка посадить в Феррари и ехать на нем по проселочной дороге.
Что такое Harness для агентов?
— это термин из области ИИ-агентов, то есть автономных систем на базе больших языковых моделей, которые не просто отвечают на вопросы, а самостоятельно выполняют задачи: пишут и запускают код, ищут информацию, работают с файлами, взаимодействуют с внешними сервисами.
Нашел в интернете вот такое определение, приведу в оригинале:
И перевод:
Практический смысл формулы такой: качество работы ИИ-агента определяется не только тем, насколько умна сама модель, но и тем, насколько грамотно собрана обвязка вокруг неё. Одна и та же модель с хорошей обвязкой справляется с задачей, а с плохой — буксует или совершает ошибки. Это актуальная тема для всех, кто сейчас строит рабочие процессы на базе Claude Code, Cursor, агентов OpenAI и подобных инструментов.
При этом, обвязка - это не только то, что вам дает Антропик (или другой производитель) из коробки, а это еще и тот воркфлоу, который вы создаете самостоятельно под решение своих задач.
В комментах постоянно задают один и тот же вопрос: Какую модель выбрать? В то же время, вопрос среды в которой работает агент игнорируется.
Модель — это водитель, программный модуль — это средство передвижения. Ребята, вы пытаетесь найти самого лучшего водителя, и посадить его в старую убитую машину (или не хотите обращать внимание, какое у него авто) или пытаетесь новичка посадить в Феррари и ехать на нем по проселочной дороге.
Что такое Harness для агентов?
— это термин из области ИИ-агентов, то есть автономных систем на базе больших языковых моделей, которые не просто отвечают на вопросы, а самостоятельно выполняют задачи: пишут и запускают код, ищут информацию, работают с файлами, взаимодействуют с внешними сервисами.
Нашел в интернете вот такое определение, приведу в оригинале:
Harness = Tools + Knowledge + Observation + Action Interfaces + Permissions
• Tools: file I/O, shell, network, database, browser
• Knowledge: product docs, domain references, API specs, style guides
• Observation: git diff, error logs, browser state, sensor data
• Action: CLI commands, API calls, UI interactions
• Permissions: sandboxing, approval workflows, trust boundaries
И перевод:
Обвязка = Инструменты + Знания + Наблюдение + Интерфейсы действий + Разрешения
• Инструменты: работа с файлами, командная оболочка, сеть, база данных, браузер
• Знания: документация продукта, предметные справочники, спецификации API, руководства по стилю
• Наблюдение: вывод git diff, журналы ошибок, состояние браузера, данные датчиков
• Действие: команды командной строки, вызовы API, взаимодействие с интерфейсом
• Разрешения: изолированная среда (песочница), процедуры согласования, границы доверия
Практический смысл формулы такой: качество работы ИИ-агента определяется не только тем, насколько умна сама модель, но и тем, насколько грамотно собрана обвязка вокруг неё. Одна и та же модель с хорошей обвязкой справляется с задачей, а с плохой — буксует или совершает ошибки. Это актуальная тема для всех, кто сейчас строит рабочие процессы на базе Claude Code, Cursor, агентов OpenAI и подобных инструментов.
При этом, обвязка - это не только то, что вам дает Антропик (или другой производитель) из коробки, а это еще и тот воркфлоу, который вы создаете самостоятельно под решение своих задач.
👍3🔥1
Forwarded from Да придет ИИ: ChatGPT, Claude, Gemini, Grok
Новый генератор изображений от OpenAI GPT-image-2.0 набрал фантастические 1513 elo на arena.ai
Разрыв от предыдущей модели и Nano Banana 2 - более 100 elo баллов!
Что это означает на практике! Когда в августе 2025 года вышла Nano Banana 2 - это был прорыв в редактировании изображений.
Сегодня OpenAI отменяют это обновление и задают новую планку для всей индустрии не достижимую для топовых закрытых китайских моделей.
Цена новинки даже немного подешевела. 1.5 была $32 за 1М, 2.0 по $30\1M
🏆 https://arena.ai/leaderboard/image-edit
Разрыв от предыдущей модели и Nano Banana 2 - более 100 elo баллов!
Что это означает на практике! Когда в августе 2025 года вышла Nano Banana 2 - это был прорыв в редактировании изображений.
Сегодня OpenAI отменяют это обновление и задают новую планку для всей индустрии не достижимую для топовых закрытых китайских моделей.
Цена новинки даже немного подешевела. 1.5 была $32 за 1М, 2.0 по $30\1M
🏆 https://arena.ai/leaderboard/image-edit
Новая опция в Codex "2. Yes, clear context and implement"
Ну что, ждем когда табуляцию сделают, чтобы "No, нажать [таб] и указать что нужно делать"😂 Потому что, сделать контекстное окно 1м токенов - это ну уж слишком сложно.
Ну что, ждем когда табуляцию сделают, чтобы "No, нажать [таб] и указать что нужно делать"
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Протестировал Haiku 4.5
Ребята, посмотрите, какую игру в Змейка создал Haiku 4.5
Промпт:
Формально, аппарат рабочий, но есть несколько но:
1. В меню нет курсора, ничего выбрать не возможно.
2. Змейка очень быстрая.
3. Смс набираются не верно, но можно отправить.
4. Мелодия играет, но без правильной визуализации.
Как видим, задание это для Haiku 4.5 сложновато.
Создавалось это в режиме /plan там в Claude Code работает Sonnet 4.6 и он пытается просканировать верхнеуровневую папку и там находит результаты предыдущих текстов и использует ее. Поэтому приходится его останавливать и писать "Делай проект с нуля".
Дальше при реализации плана переключается на Haiku 4.5.
Лимитов на это ушло 2% от пятичасового Мах х5, значит где-то 10% от обычной Про подписки.
Ребята, посмотрите, какую игру в Змейка создал Haiku 4.5
Промпт:
Создайте Nokia 3310 с пиксельным экраном, игрой Змейка, составлением SMS и визуализатором классического рингтона.Формально, аппарат рабочий, но есть несколько но:
1. В меню нет курсора, ничего выбрать не возможно.
2. Змейка очень быстрая.
3. Смс набираются не верно, но можно отправить.
4. Мелодия играет, но без правильной визуализации.
Как видим, задание это для Haiku 4.5 сложновато.
Создавалось это в режиме /plan там в Claude Code работает Sonnet 4.6 и он пытается просканировать верхнеуровневую папку и там находит результаты предыдущих текстов и использует ее. Поэтому приходится его останавливать и писать "Делай проект с нуля".
Дальше при реализации плана переключается на Haiku 4.5.
Лимитов на это ушло 2% от пятичасового Мах х5, значит где-то 10% от обычной Про подписки.
👍2