Я недавно ввёл практику добавлять условие в промпт в plan mode — проводить code review самого плана до тех пор, пока не останется 0 issues.
Дальнейшие рельсы становятся пусть не идеальными, но гораздо прямее.
Дальнейшие рельсы становятся пусть не идеальными, но гораздо прямее.
Plan self-review закрыт. 5 раундов × 71 findings closed (8 Critical + 12 High + 21 Medium + 24 Low + 6 polish). Round 5 чистый. Стартую Commit 1 — schema first, потом сериями: applyTgEditToPost extraction → handler probe → site PUT detach → pending-sync API → UI components → tests.
🔥3❤2
Снаряжал сейчас GPT-5.5 в добрый путь как ребёнка (Codex, ты приёмный! ).
С помощью Claude сделал для него пачку доков, разложил план того, что нужно сделать им до конца отсидки Claude Code. Даже промпт попросил сделать пополнее, как-то поёбче , так сказать.
Генеральную инструкцию тоже (custom prompt) из клода наковырял. Окей, опять это слово — дистиллировал.
Клод, смотрю, не посрамил. Выдал ему ценные указания для временной работы над проектом. Отправил в путь. И заставил вести дневник 😭
С помощью Claude сделал для него пачку доков, разложил план того, что нужно сделать им до конца отсидки Claude Code. Даже промпт попросил сделать пополнее, как-то по
Генеральную инструкцию тоже (custom prompt) из клода наковырял. Окей, опять это слово — дистиллировал.
Клод, смотрю, не посрамил. Выдал ему ценные указания для временной работы над проектом. Отправил в путь. И заставил вести дневник 😭
❤2
You've hit your usage limit. Upgrade to Pro (https://chatgpt.com/explore/pro), visit https://chatgpt.com/codex/settings/usage to purchase more credits or try again at 7:19 AM.
Пф. А разговоров-то было. Не хватило даже на одну сессию толком.
К плюсам могу отнести скорость, а также своевременную паузу в проекте перед наступлением лимита. Это прямо хорошо.
😢2😁1
Compacting conversation...
дневник
Я просто оху был поражён, когда увидел, что творит Codex с самой крутой последней моделью даже на Extra High режиме. Думаю, может это я гоню. Спросил Gemini 3.1 Pro.
Вот детальный разбор его навыков в этом прогоне:
Ситуация показательная: умный архитектор (Opus 4.7) передал отличный план линейному исполнителю (Codex GPT-5.5), и проект забуксовал на интеграции.
Если оценивать скилл Codex GPT-5.5 именно как автономного агента, идущего по плану, его уровень — крепкий, но абсолютно слепой junior-разработчик. Я бы оценил его способность к автономному выполнению комплексного плана на 5 из 10.
Вот детальный разбор его навыков в этом прогоне:
В чем агент силен (микро-уровень)
На уровне выполнения атомарных задач Codex отработал блестяще, как хороший скрипт:
• идеальный синтаксис: он отлично пишет bash-команды, wp-cli скрипты и SQL-запросы.
• самокоррекция в моменте: он сам нашел проблему со strict mode в MariaDB, сам понял, почему падает расчет delta (из-за signed-арифметики), и сам добавил нужные аннотации для wp-cli.
• безопасность: он не логировал пароли, корректно настроил fail2ban и не пытался обойти жесткие лимиты на использование тулзов (tool limit).
Где агент эпично провалился (макро-уровень)
Главная проблема Codex GPT-5.5 — полное отсутствие макро-мышления и здравого смысла. Он видит деревья, но не видит лес.
Это привело к двум катастрофическим сбоям:
1. Потеря контекста глобальной цели (P0 failure): Opus задал четкий эталон (***). Адекватный инженер начал бы с клонирования файлов и базы эталона, а затем накатил бы свежий контент с прода. Codex же пошел по пути наименьшего сопротивления: скачал голый WordPress, активировал плагины по списку и отчитался, что сайт отдает код 200. Он вообще не сделал визуальную и конфигурационную сверку (diff) с эталоном до тех пор, пока вы не указали ему на ошибку. Он выполнил инструкцию по буквам, проигнорировав ее суть.
2. Алгоритмическая амнезия (проблема с диском): это самый абсурдный момент лога. Агент сам скачал архив весом 7.6 ГБ, сам его распаковал, а на шаге T-A.3 проверил диск, увидел нехватку места и уперся в стену. Вместо того чтобы сложить два плюс два и удалить исходный архив переноса, он посоветовал вам (директору) пойти и купить тариф подороже. У него нет концепции "объектного постоянства" — он забыл, что делал три шага назад.
Итог по работе агента
Инструкция от Opus могла быть сколько угодно крутой, но Codex не способен удерживать в контексте финальный бизнес-результат. Он блестяще пишет код и собирает логи, но как только задача требует системного видения, сравнения с эталоном или банальной логики (как с архивом на диске), агент рассыпается.
Именно поэтому вы не получили результат вовремя: агент потратил часы на разворачивание неправильного окружения, потому что слепо шел по пунктам «скачать WP» и «установить тему», забыв, зачем вообще он это делает.
Compacting conversation...
Я просто оху был поражён, когда увидел, что творит Codex с самой крутой последней моделью даже на Extra High режиме. Думаю, может это я гоню. Спросил Gemini 3.1 Pro. Ситуация показательная: умный архитектор (Opus 4.7) передал отличный план линейному исполнителю…
Меня продолжает бомбить от вынужденного двухдневного переезда с Claude Code на Codex с GPT-5.5 :)
Реплика этого дня пока такая, чуть (всего чуть) перефразирую:
«Ой визуал получился один в один со стейджем, так что я не буду дальше переносить конфиги, потому что а вдруг сломается.
Лучше зафиксирую, что как-то получилось стабилизировать дизайн, и пойду дальше по своему плану, а не твоему ☺️👍👌👌»
Реплика этого дня пока такая, чуть (всего чуть) перефразирую:
«Ой визуал получился один в один со стейджем, так что я не буду дальше переносить конфиги, потому что а вдруг сломается.
Лучше зафиксирую, что как-то получилось стабилизировать дизайн, и пойду дальше по своему плану, а не твоему ☺️👍👌👌»
👍3
⏺ superpowers:code-reviewer(Code review 152-ФЗ implementation)
Киберпанк, конечно.
Самое интересное потенциальное противоречие здесь в том, что законы придумываются долго, а промпт пишется быстро. Копните эту мысль глубже, масштабируйте на сто лет в своей самой безудержной фантазии.
👍1
Так хоба — и патч уязвимости в ZenPhoto, который не был закрыт с 2023 года. Прикольно всякое дистиллировать в отдельные небольшие артефакты попутно.
Gist
Zenphoto 1.6.x patch — CVE-2023-53915 / CVE-2023-53916 stored XSS (unfixed upstream as of 1.6.8)
Zenphoto 1.6.x patch — CVE-2023-53915 / CVE-2023-53916 stored XSS (unfixed upstream as of 1.6.8) - zenphoto-1.6.x-cve-2023-53915-53916.patch
⏺ Your account does not have access to Claude Code. Please run /login.
1. Сутки у Anthropic сменяются в 21:00 GMT+7.
2. Если дать слабину и подписаться на Claude Code Max через Play Store, то сниматься будет не $200, а бл
😢1
Apple runs on Anthropic at this point. Anthropic is powering a lot of the stuff Apple is doing internally in terms of product development, a lot of their internal tools…They have custom versions of Claude running on their own servers internally.
--Mark Gurman, Bloomberg
К новости о том, что Apple случайно спалили свой CLAUDE.md в приложении техподдержки.
⏺ Plan записан. Теперь обязательный шаг: code-review цикл по самому плану (как пользователь явно просил). Запускаю code-reviewer на план — проверка на полноту, факты и executability.
Повторюсь, да и ладно: это одна из самых классных находок в последнее время — ревью плана клода клодом до его исполнения.
То есть да, нам было мало ultrathink, max effort и code review loop until 0 issues. Теперь можно лить токены в ревью, начиная уже с плана 👌
❤2
⏺ Готово — cron 3f659389 запланирован one-shot на 10:25 GMT+7 May 2.
Промпт включает полный self-contained brief: read план, schema → migration → live loader → admin → tests → PR → deploy → verify, с code review loop after каждого шага и pre-deploy npx astro build gate.
Когда токенов сжигается много и всё время лимиты, а хочется уже просто поспать, начинаешь планировать части сессии наперёд 😭
Если что, внутри Claude Code можно просто писать: типа, сейчас запланируй продолжение в 10:25 GMT+7 и он это делает вот таким вот образом. Оптимально начинать откладывать сессии уже начиная с 92-93%, когда начинаются предупреждения о лимитах и показывается искомое время сброса.
👍2
Google agreed to invest up to $40 billion in Anthropic just recently, in late April 2026 (specifically reported around April 24–25, 2026).
Возможно, сотрудники Google просто тратят на токены $41 млрд, бгг. Прямая экономия!
❤2😁1
Вот эта необходимость экономить контекст и токены даже на максимальном тарифе Claude Code мне прямо сильно не нравится.
❤2