Product Management & AI
Что такое циклическая работа ИИ-агентов (agent looping) и открытые/закрытые циклы (по мотивам Anthropic Workshop: Build Agents That Run for Hours) Последние два года ИИ-агентам давали задания пошагово: одна задача = один промпт. Сейчас этот подход меняется…
Loop Engineering — это замена себя как человека, который пишет промпты ИИ, на Систему, которая делает это за вас
5 компонентов цикла (и один бонусный)
Для цикла нужно пять вещей и одно место, где хранить состояние.
1. Автоматизации, которые срабатывают по расписанию и сами занимаются поиском и сортировкой.
2. Worktrees («рабочие деревья»), чтобы два агента, работающих параллельно, не мешали друг другу.
3. Навыки (Skills) — прописанное знание о проекте, которое агенту не придётся угадывать каждый раз.
4. Плагины и коннекторы для подключения агента к уже используемым инструментам.
5. Суб-агенты, чтобы один агент генерировал идею, а другой её проверял.
И шестое — память: markdown-файл, который живёт вне отдельного разговора и хранит, что уже сделано, а что следующим, потому что ИИ забывает всё между запусками, поэтому память должна быть на диске, а не в контексте.
1. Автоматизации — сердце цикла
Именно автоматизации превращают разовый запуск в настоящий цикл. В Codex вы создаёте автоматизацию на вкладке Automations: выбираете проект, промпт, частоту запуска и то, где он будет выполняться.
Результаты попадают в папку Triage, а те запуски, которые ничего не нашли, просто архивируются. OpenAI использует это внутри для ежедневной сортировки задач, подготовки commit-отчётов и поиска недавно внесённых багов.
Claude Code достигает того же через планирование и хуки: /loop запускает промпт или команду с заданным интервалом, можно настроить cron-задачу, хуки на разных этапах жизненного цикла, или отправить всё в GitHub Actions.
Существует ещё одна важная примитива: /goal — в отличие от /loop, который повторяется по расписанию, /goal продолжает работу, пока не выполнится заданное условие, причём после каждого шага отдельная небольшая модель проверяет, завершена ли цель.
2. Worktrees: чтобы параллельность не превращалась в хаос
Когда запускается больше одного агента, файлы начинают конфликтовать. Git worktree решает эту проблему: это отдельная рабочая директория в своей ветке, но с общей историей репозитория. Codex и Claude Code поддерживают эту изоляцию — либо встроенными средствами, либо через флаг --worktree.
3. Навыки (Skills): чтобы не объяснять проект каждый раз заново
Навык — это папка с файлом SKILL.md, содержащим инструкции и метаданные, а также опционально скрипты, справочные материалы и ресурсы. Codex вызывает навык по $название или /skills, а иногда и сам, когда задача соответствует описанию навыка. Claude Code делает то же самое.
4. Плагины и коннекторы: чтобы цикл касался реальных инструментов
Цикл, который видит только файловую систему, слишком мал.
Коннекторы на основе MCP позволяют агенту читать трекер задач, запрашивать базу данных и вызывать API. Плагины упаковывают коннекторы и навыки вместе, чтобы они могли использовать ваши настройки целиком.
5. Суб-агенты: разделяем созидателя и проверяющего
ИИ, написавшая код, слишком снисходительна к своей собственной работе. Второй агент с другими инструкциями (и иногда другой моделью) ловит ошибки, которые первый сам себе наговорил.
Что цикл всё ещё не делает за вас:
Цикл меняет работу, но не удаляет вас из неё. Проверка всё равно остаётся за вами. И если цикл работает без присмотра, он также и совершает ошибки без присмотра.
Ваше понимание тоже страдает, если вы ему это позволяете: чем быстрее цикл поставляет код, который писали не вы, тем больше разрыв между тем, что существует, и тем, что вы на самом деле понимаете.
И, наконец, удобная поза «наблюдателя» опасна тем, что очень легко перестать иметь своё мнение и просто принимать то, что выдаёт цикл.
Постройте цикл. Но постройте его как тот, кто намерен оставаться инженером/продактом, а не просто нажимателем кнопки
♾️ https://github.com/serenakeyitan/awesome-agent-loops
P.S. Fabel умнее Opus в восемь раз.
5 компонентов цикла (и один бонусный)
Для цикла нужно пять вещей и одно место, где хранить состояние.
1. Автоматизации, которые срабатывают по расписанию и сами занимаются поиском и сортировкой.
2. Worktrees («рабочие деревья»), чтобы два агента, работающих параллельно, не мешали друг другу.
3. Навыки (Skills) — прописанное знание о проекте, которое агенту не придётся угадывать каждый раз.
4. Плагины и коннекторы для подключения агента к уже используемым инструментам.
5. Суб-агенты, чтобы один агент генерировал идею, а другой её проверял.
И шестое — память: markdown-файл, который живёт вне отдельного разговора и хранит, что уже сделано, а что следующим, потому что ИИ забывает всё между запусками, поэтому память должна быть на диске, а не в контексте.
1. Автоматизации — сердце цикла
Именно автоматизации превращают разовый запуск в настоящий цикл. В Codex вы создаёте автоматизацию на вкладке Automations: выбираете проект, промпт, частоту запуска и то, где он будет выполняться.
Результаты попадают в папку Triage, а те запуски, которые ничего не нашли, просто архивируются. OpenAI использует это внутри для ежедневной сортировки задач, подготовки commit-отчётов и поиска недавно внесённых багов.
Claude Code достигает того же через планирование и хуки: /loop запускает промпт или команду с заданным интервалом, можно настроить cron-задачу, хуки на разных этапах жизненного цикла, или отправить всё в GitHub Actions.
Существует ещё одна важная примитива: /goal — в отличие от /loop, который повторяется по расписанию, /goal продолжает работу, пока не выполнится заданное условие, причём после каждого шага отдельная небольшая модель проверяет, завершена ли цель.
2. Worktrees: чтобы параллельность не превращалась в хаос
Когда запускается больше одного агента, файлы начинают конфликтовать. Git worktree решает эту проблему: это отдельная рабочая директория в своей ветке, но с общей историей репозитория. Codex и Claude Code поддерживают эту изоляцию — либо встроенными средствами, либо через флаг --worktree.
3. Навыки (Skills): чтобы не объяснять проект каждый раз заново
Навык — это папка с файлом SKILL.md, содержащим инструкции и метаданные, а также опционально скрипты, справочные материалы и ресурсы. Codex вызывает навык по $название или /skills, а иногда и сам, когда задача соответствует описанию навыка. Claude Code делает то же самое.
Навык — это однократно записанное намерение, которое агент читает при каждом запуске
4. Плагины и коннекторы: чтобы цикл касался реальных инструментов
Цикл, который видит только файловую систему, слишком мал.
Коннекторы на основе MCP позволяют агенту читать трекер задач, запрашивать базу данных и вызывать API. Плагины упаковывают коннекторы и навыки вместе, чтобы они могли использовать ваши настройки целиком.
5. Суб-агенты: разделяем созидателя и проверяющего
Самое полезное структурное решение в цикле — отделить того, кто пишет, от того, кто проверяет.
ИИ, написавшая код, слишком снисходительна к своей собственной работе. Второй агент с другими инструкциями (и иногда другой моделью) ловит ошибки, которые первый сам себе наговорил.
Что цикл всё ещё не делает за вас:
Цикл меняет работу, но не удаляет вас из неё. Проверка всё равно остаётся за вами. И если цикл работает без присмотра, он также и совершает ошибки без присмотра.
Ваше понимание тоже страдает, если вы ему это позволяете: чем быстрее цикл поставляет код, который писали не вы, тем больше разрыв между тем, что существует, и тем, что вы на самом деле понимаете.
И, наконец, удобная поза «наблюдателя» опасна тем, что очень легко перестать иметь своё мнение и просто принимать то, что выдаёт цикл.
Цикл не знает разницы. Вы знаете.
Всё дело в поиске: а) правильного б) Баланса
Постройте цикл. Но постройте его как тот, кто намерен оставаться инженером/продактом, а не просто нажимателем кнопки
♾️ https://github.com/serenakeyitan/awesome-agent-loops
P.S. Fabel умнее Opus в восемь раз.
GitHub
GitHub - serenakeyitan/awesome-agent-loops: A curated collection of the best /loop, /goal, and /schedule uses for Claude Code &…
A curated collection of the best /loop, /goal, and /schedule uses for Claude Code & Codex — real commands sourced from Twitter/X. The awesome-list of agent loops. - serenakeyitan/awesome-ag...
Product Management & AI
Предел сложности или Правило Лапидуса Ценность продукта может быть описана функцией от количества фичей Точка перегиба (функция начинает монотонно убывать) — это некоторое предельное количество фичей (для данной предметной области), при котором сложность…
This media is not supported in your browser
VIEW IN TELEGRAM
Мне не особо нравится популярность правила Парето
Во многих контекстах 80/20 действительно полезно и является отличным способом для быстрого выявления перекосов, утечек производительности и поиска эффективного пути решения проблем в уже существующих Системах.
Но величайшая угроза для Великих компаний кроется именно в этом – неустанной погоне за "эффективностью", которая, по факту тянет к... среднему, которое лишь размывается.
Мышление в духе 80/20, осознанно и добросовестно применяемое, ускоряет это размытие и падение. Так, вы становитесь ещё "успешнее и эффективнее" в том, что уже умеете и что уже работает, но... теряете способность к тому, что ещё не могли вообразить.
И когда правило 80/20 применяют к построению компании под новую идею, продукт, операции или бизнес, оно активно вводит в заблуждение и с самого начала ведёт по неверному пути.
Потому что достичь 80% теоретического потенциала не означает, что вы нашли product‑market fit и создали Нечто, что любят пользователи, или построили бизнес, который может жить сквозь время. Это означает, что вы сделали самую лёгкую часть и теперь занимаетесь оптимизацией ради оптимизации.
Аналогично с 90/10 работает и венчур. Верхние 10% инвестиций в фонде определяют, будет ли фонд хорошим, отличным или легендарным. Ставки внутри распределены неравномерно и они сосредоточены на дальнем конце распределения на компаниях, которые НЕ оптимизировали достижимое, а достигают то, что раньше считалось магией и невозможным.
Достичь 90% достаточно сложно, но это всё ещё лёгкая часть, если смотреть-на-вещи-правильно. Если хотите стать легендарными, посвятите себя тому, чтобы пройти дистанцию «последних 10%».
...Быть первым – быть в 10 раз больше ближайшего конкурента.
Самолет использует 10% своего топлива для взлёта...
Последние первые 10% — это и есть 90% работы и 90% награды.
И в следующий раз, когда речь зайдёт о правиле 80/20, спросите себя, над чем бы вы работали, если бы перестали оптимизировать под «эффективность по Парето» и посвятили себя 10%.
Во многих контекстах 80/20 действительно полезно и является отличным способом для быстрого выявления перекосов, утечек производительности и поиска эффективного пути решения проблем в уже существующих Системах.
Но величайшая угроза для Великих компаний кроется именно в этом – неустанной погоне за "эффективностью", которая, по факту тянет к... среднему, которое лишь размывается.
Мышление в духе 80/20, осознанно и добросовестно применяемое, ускоряет это размытие и падение. Так, вы становитесь ещё "успешнее и эффективнее" в том, что уже умеете и что уже работает, но... теряете способность к тому, что ещё не могли вообразить.
Проблема в том, что основатели не оптимизируют существующие Системы. Они пытаются создать То-чего-ещё-не-существует
И когда правило 80/20 применяют к построению компании под новую идею, продукт, операции или бизнес, оно активно вводит в заблуждение и с самого начала ведёт по неверному пути.
Потому что достичь 80% теоретического потенциала не означает, что вы нашли product‑market fit и создали Нечто, что любят пользователи, или построили бизнес, который может жить сквозь время. Это означает, что вы сделали самую лёгкую часть и теперь занимаетесь оптимизацией ради оптимизации.
Аналогично с 90/10 работает и венчур. Верхние 10% инвестиций в фонде определяют, будет ли фонд хорошим, отличным или легендарным. Ставки внутри распределены неравномерно и они сосредоточены на дальнем конце распределения на компаниях, которые НЕ оптимизировали достижимое, а достигают то, что раньше считалось магией и невозможным.
Если хотите быть Великими, нацельтесь на 90% и выше. Правило 80/20 — это неправильный компас для пути.
Достичь 90% достаточно сложно, но это всё ещё лёгкая часть, если смотреть-на-вещи-правильно. Если хотите стать легендарными, посвятите себя тому, чтобы пройти дистанцию «последних 10%».
...Быть первым – быть в 10 раз больше ближайшего конкурента.
Самолет использует 10% своего топлива для взлёта...
И в следующий раз, когда речь зайдёт о правиле 80/20, спросите себя, над чем бы вы работали, если бы перестали оптимизировать под «эффективность по Парето» и посвятили себя 10%.
Летом 2024 года McDonald’s свернул тестирование голосового ИИ в Макавто и разорвал партнёрство с IBM, потому что ИИ пробивала клиентам мороженое с беконом, сотни наггетсов и путала напитки. Эксперимент обошёлся в круглую сумму, а на выходе компания получила лишь баги и вирусные тиктоки с негативом (но это не остановило её от экспериментов с ИИ).
О чём этот кейс говорит менеджерам и руководителям?
Управлять ИИ-проектом — не то же самое, что пилить классические решения. Стандартные подходы не спасут от галлюцинаций ИИ, грязных данных для обучения и улетевших в космос расходов на токены.
И чтобы не повторить судьбу ИИ-Макавто, нужно понимать специфику ИИ-проектов: как выстроить работу ИИ, как считать экономику, и как контролировать процесс.
Усилить свои компетенции в области ИИ можно на курсе «Управление ИИ-проектами» от Академии Эдюсон.
За 3−4 месяца на практике вы:
– научитесь анализировать готовность компании к внедрению ИИ, проводить аудит бизнес-процессов, оценивать сроки, риски и бюджет;
– научитесь переводить метрики в понятные бизнесу цифры и защищать бюджеты;
– освоите инструменты разработки без кода (n8n, Dify, Flowise, Cursor/Bolt), чтобы создавать ИИ-агентов и автоматизировать нужные процессы;
Обучение построено на опыте экспертов из «Яндекса», «Сбера» и других крупных компаний. Год на связи личный куратор, а доступ к материалам и будущим обновлениям останется у вас навсегда. По окончании курса – портфолио из 8 личных проектов.
Оставьте заявку с промокодом
О чём этот кейс говорит менеджерам и руководителям?
Управлять ИИ-проектом — не то же самое, что пилить классические решения. Стандартные подходы не спасут от галлюцинаций ИИ, грязных данных для обучения и улетевших в космос расходов на токены.
И чтобы не повторить судьбу ИИ-Макавто, нужно понимать специфику ИИ-проектов: как выстроить работу ИИ, как считать экономику, и как контролировать процесс.
Усилить свои компетенции в области ИИ можно на курсе «Управление ИИ-проектами» от Академии Эдюсон.
За 3−4 месяца на практике вы:
– научитесь анализировать готовность компании к внедрению ИИ, проводить аудит бизнес-процессов, оценивать сроки, риски и бюджет;
– научитесь переводить метрики в понятные бизнесу цифры и защищать бюджеты;
– освоите инструменты разработки без кода (n8n, Dify, Flowise, Cursor/Bolt), чтобы создавать ИИ-агентов и автоматизировать нужные процессы;
Обучение построено на опыте экспертов из «Яндекса», «Сбера» и других крупных компаний. Год на связи личный куратор, а доступ к материалам и будущим обновлениям останется у вас навсегда. По окончании курса – портфолио из 8 личных проектов.
Оставьте заявку с промокодом
PMAI и забирайте скидку 65% и второй курс в подарок.Everything Is Recorded Now (с) a16z
Большинство наших рабочих обсуждений теперь записываются по умолчанию. И вам, вероятно, стоит исходить из того, что всё, что вы говорите, отныне записывается.
С технологической точки зрения очевидно, что на основе этого живого контекста компании будет построена новая система, под которую уже выстроена новая категория ПО с ИИ, организованная вокруг голоса, а не текста.
Сегодняшняя система записей — это структурированные данные: записи в CRM, тикеты, вики и документы.
Но наиболее ценный контекст живёт в разговоре: нюанс звонка клиенту, реальный спор на продуктовом обзоре, мимолётное замечание на встрече руководства, которое меняет обсуждение и дорожную карту. ИИ умеют брать эти неструктурированные голосовые данные и делать их структурированными и доступными для поиска и запросов.
Это большая возможность для ПО, и мы всё ещё находимся на ранней стадии понимания того, как будет выглядеть этот программный слой и кому он будет принадлежать.
Granola — яркий пример: у неё лучший контекст о культуре a16z, наших инвестициях и о том, как мы на самом деле думаем, чем почти у любого другого инструмента, которым мы пользуемся, потому что ИИ «была в комнате».
Устные и письменные культуры
Компании делятся на устные (verbal cultures) и письменные (written cultures).
Историческим узким местом для устных культур было то, что важный контекст происходил в разговоре, а затем исчезал. Когда ИИ может посещать каждую встречу и синтезировать произошедшее, устная культура наконец-то масштабируется.
Это не значит, что компании с письменной культурой не выиграют. Предоставление ИИ доступа к продуманным текстам также хороший способ быстро ввести ИИ в курс дела. Но в целом, я думаю, что ИИ будет продвигать и усиливать именно устную культуру.
– Сначала ИИ пришла в ваш корпоративный Gmail, потом в Slack, в таск-менеджер. Теперь ИИ с вами в комнате и на созвонах.
< место для мемаAre they AI in the room with us right now?>
Большинство наших рабочих обсуждений теперь записываются по умолчанию. И вам, вероятно, стоит исходить из того, что всё, что вы говорите, отныне записывается.
С технологической точки зрения очевидно, что на основе этого живого контекста компании будет построена новая система, под которую уже выстроена новая категория ПО с ИИ, организованная вокруг голоса, а не текста.
Сегодняшняя система записей — это структурированные данные: записи в CRM, тикеты, вики и документы.
Но наиболее ценный контекст живёт в разговоре: нюанс звонка клиенту, реальный спор на продуктовом обзоре, мимолётное замечание на встрече руководства, которое меняет обсуждение и дорожную карту. ИИ умеют брать эти неструктурированные голосовые данные и делать их структурированными и доступными для поиска и запросов.
Это большая возможность для ПО, и мы всё ещё находимся на ранней стадии понимания того, как будет выглядеть этот программный слой и кому он будет принадлежать.
Granola — яркий пример: у неё лучший контекст о культуре a16z, наших инвестициях и о том, как мы на самом деле думаем, чем почти у любого другого инструмента, которым мы пользуемся, потому что ИИ «была в комнате».
Устные и письменные культуры
Компании делятся на устные (verbal cultures) и письменные (written cultures).
Историческим узким местом для устных культур было то, что важный контекст происходил в разговоре, а затем исчезал. Когда ИИ может посещать каждую встречу и синтезировать произошедшее, устная культура наконец-то масштабируется.
Это не значит, что компании с письменной культурой не выиграют. Предоставление ИИ доступа к продуманным текстам также хороший способ быстро ввести ИИ в курс дела. Но в целом, я думаю, что ИИ будет продвигать и усиливать именно устную культуру.
– Сначала ИИ пришла в ваш корпоративный Gmail, потом в Slack, в таск-менеджер. Теперь ИИ с вами в комнате и на созвонах.
< место для мема
Product Management & AI
Ребята из Стенфорда обновили свой ИИ-фреймворк Storm до новой версии Co-STORM, добавив в протокол управления ходами совместного дискурса ИИ-агентов участие человека: – Эксперты LLM Co-STORM – этот тип агента генерирует ответы, основанные на внешних источниках…
Метод Стэнфорда — это прежде всего способ мышления через многосторонний обзор + карту противоречий + синтез + взаимную проверку
4 последовательных промпта от ребят из Стенфорда, которые помогут с написанием статьи, отчёта и презентацией, перед принятием важного бизнес-решения, собеседованием, переговорами, инвестированием и освоением нового навыка.
Никакого ПО, никакого GitHub, никакой сложной настройки — скопируйте и вставьте промпты и через 5 минут вы будете знать о выбранной теме больше, чем те, кто потратил на её изучениедесятилетия, годы, месяцы, недели, дни (Господи, что я несу, как же дико это звучит)
4 последовательных промпта от ребят из Стенфорда, которые помогут с написанием статьи, отчёта и презентацией, перед принятием важного бизнес-решения, собеседованием, переговорами, инвестированием и освоением нового навыка.
Никакого ПО, никакого GitHub, никакой сложной настройки — скопируйте и вставьте промпты и через 5 минут вы будете знать о выбранной теме больше, чем те, кто потратил на её изучение
Telegraph
Метод Stanford STORM: как проводить исследования на уровне доктора наук
Большинство людей используют ИИ как обычную строку поиска: задал вопрос, получил ответ, закрыл вкладку. Так они упускают из виду самую ценную функцию этого инструмента. В Стэнфорде разработали исследовательскую систему под названием STORM. В ходе независимого…
Product Management & AI
Видение – умение соединять линиями несоединённые точки Несоединённые точки те, которые никто не видит одновременно. Видеть – держать перед глазами много таких точек, смотря на прошлое-настоящее-возможное в движении к Единой Точке. Точка = Линия. Ищи узоры…
This media is not supported in your browser
VIEW IN TELEGRAM
Следующее Приложение — это не приложение
Если прямо сейчас открыть телефон и пересчитать иконки приложений, то можно насчитать от десятка до сотни иконок.
И каждое приложение за иконкой это очередная обёртка-обещание продакта и продукта: «Скачай меня и ___ станет проще/дешевле/веселее *» (и у каждой аппы: «* Но сначала потрудись изучить меня от и до»).
Мы все с этим смирились и приняли это как данность: нужно сначала найти самую яркую иконку в множественной яркости других, открыть её, вспомнить, как работает этот апп, добраться до нужной функции, воспользоваться ей, увидеть и осознать результат, и т.д. что там по CJM.
Но интерфейсы и механики всегда упрощаются (а это значит – исчезают), потому что лучший интерфейс — это отсутствие интерфейса
Поэтому в эпоху ИИ иконок больше не будет.
Появятся «нити пространства диалогов», находящиеся в Том-Самом-Нечто, выполняющим работу, которую раньше приходилось делать с помощью разноцветных иконок.
Если прямо сейчас открыть телефон и пересчитать иконки приложений, то можно насчитать от десятка до сотни иконок.
И каждое приложение за иконкой это очередная обёртка-обещание продакта и продукта: «Скачай меня и ___ станет проще/дешевле/веселее *» (и у каждой аппы: «* Но сначала потрудись изучить меня от и до»).
Но интерфейсы и механики всегда упрощаются (а это значит – исчезают), потому что лучший интерфейс — это отсутствие интерфейса
Поэтому в эпоху ИИ иконок больше не будет.
Появятся «нити пространства диалогов», находящиеся в Том-Самом-Нечто, выполняющим работу, которую раньше приходилось делать с помощью разноцветных иконок.
Следующее "приложение" – Пространство
Product Management & AI
Loop Engineering — это замена себя как человека, который пишет промпты ИИ, на Систему, которая делает это за вас 5 компонентов цикла (и один бонусный) Для цикла нужно пять вещей и одно место, где хранить состояние. 1. Автоматизации, которые срабатывают…
Loop Engineering for Product Managers
Лучшими продакт-менеджерами станут не те, у кого самая большая библиотека промптов, а те, кто понимает, какие этапы продуктовой работы стоит превратить в устойчивые циклы, какие артефакты должны ими управлять, и какие решения должны оставаться прерогативой человека.
Анатомия и структура продуктовых ИИ-циклов, практика их создания, частые сбои и чем продакту снова поможет GitHub в материале ниже
♾️ Бонус: Loop Library
Лучшими продакт-менеджерами станут не те, у кого самая большая библиотека промптов, а те, кто понимает, какие этапы продуктовой работы стоит превратить в устойчивые циклы, какие артефакты должны ими управлять, и какие решения должны оставаться прерогативой человека.
Анатомия и структура продуктовых ИИ-циклов, практика их создания, частые сбои и чем продакту снова поможет GitHub в материале ниже
♾️ Бонус: Loop Library
Telegraph
Loop Engineering for Product Managers
Цикл — это процесс, который ваша система ИИ проходит неоднократно: вы меняете что-то, что формирует поведение агента; вы управляете агентом; вы оцениваете результат; вы сохраняете изменения, если качество улучшается, и отменяете их, если качество падает.…
Product Management & AI
Распространенные (и не очень) ошибки при генерации продуктовых идей и гипотез: – Отсутствие фокуса. Рассмотрение слишком многих идей без концентрации на Видении и понимании стратегии рассеивает ресурсы и Энергию команды, продукта и пользователей. – Отсутствие…
This media is not supported in your browser
VIEW IN TELEGRAM
8 советов по работе с логами продукта
1. Ведите decision log с условиями пересмотра, а не просто с решениями
Записывайте не только «что решили», но и «при каком сигнале пересмотрим», например, «откатим, если retention упадёт ниже X».
Так решение превращается из мнения в понятную и для всех проверяемую ставку, а вы с командой перестаёте каждый раз спорить о том, что уже обсуждали ранее. Полгода спустя этот лог будет лучшим свидетельством того, какие (и чьи) гипотезы сбылись, а какие нет.
2. Калибруйте собственные прогнозы и лог: дата релиза, ожидаемое внедрение, ожидаемый эффект и через время сверяйте их с фактом.
Почти никто этого не делает, поэтому почти никто не знает, систематически ли он оптимист по срокам или пессимист по импакту. В то время, как через десяток подобных записей вы начнёте давать оценки, которым можно доверять всё больше и больше.
3. Размечайте решения как «дверь в одну сторону» или «в две стороны»
Обратимые решения принимайте быстро и дёшево, необратимые – с реальной строгостью.
Ошибка многих продактов в том, что они тратят одинаковую энергию себя и команды на оба типа, и в этом главная утечка скорости. Само наличие такого тега заставляет команду не раздувать процессы там, где цена ошибки это просто один откат фичи.
4. Инструментируйте спеку, а не продукт
Определяй метрики и названия событий прямо в PRD, ещё ДО разработки (а не «допишем аналитику потом»). Потому что «мы забыли это трекать» это самая частая и самая дорогая (и лекго предотвратимая) ошибка продакта.
5. Ведите в лог карту допущений с осями «уверенность × влияние»
Отделяйте discovery-долг от delivery-долга как список открытых вопросов и допущений с явной пометкой, насколько вы в них уверены.
6. Делайте pre-mortem с триггерами, а не как разовое упражнение
Опишите провал до запуска, а к каждому сценарию провала привяжите опережающий индикатор из пункта 1 и 2.
Так pre-mortem превращается из психологической разминки в настройку, благодаря которой вы заранее знаете, какую метрику и график будете смотреть и какое его значение означает, что пора вмешаться.
7. Заведите «кладбище» отклонённых идей с причинами. Каждая зарезанная фича отправляется в searchable-список продуктовой wiki с строкой «почему нет».
Это лекарство от бесконечного цикла переобсуждения одного и того же командой и одновременно ваш самый честный материал для раздела «Не делаем» в новых PRD.
8. Кодифицируй ход мышления-решений
«Как ты узнал?» / «У нас метрика Х упала, ааачоделать?» / «СЕО опять принёс идею, что ответить» и прочее повторяющееся изо дня в день выпиши как личную библиотеку подходов и приёмов.
Ответы:«Подумал, уточнил, проверил» / «Проверил фичи, что релизили недавно» / «Вернём ему проблему»
Управление контекстом вокруг контента и есть тот самый недооценённый актив команды продукта и главный навык продакта.
1. Ведите decision log с условиями пересмотра, а не просто с решениями
Записывайте не только «что решили», но и «при каком сигнале пересмотрим», например, «откатим, если retention упадёт ниже X».
Так решение превращается из мнения в понятную и для всех проверяемую ставку, а вы с командой перестаёте каждый раз спорить о том, что уже обсуждали ранее. Полгода спустя этот лог будет лучшим свидетельством того, какие (и чьи) гипотезы сбылись, а какие нет.
2. Калибруйте собственные прогнозы и лог: дата релиза, ожидаемое внедрение, ожидаемый эффект и через время сверяйте их с фактом.
Почти никто этого не делает, поэтому почти никто не знает, систематически ли он оптимист по срокам или пессимист по импакту. В то время, как через десяток подобных записей вы начнёте давать оценки, которым можно доверять всё больше и больше.
3. Размечайте решения как «дверь в одну сторону» или «в две стороны»
Обратимые решения принимайте быстро и дёшево, необратимые – с реальной строгостью.
Ошибка многих продактов в том, что они тратят одинаковую энергию себя и команды на оба типа, и в этом главная утечка скорости. Само наличие такого тега заставляет команду не раздувать процессы там, где цена ошибки это просто один откат фичи.
4. Инструментируйте спеку, а не продукт
Определяй метрики и названия событий прямо в PRD, ещё ДО разработки (а не «допишем аналитику потом»). Потому что «мы забыли это трекать» это самая частая и самая дорогая (и лекго предотвратимая) ошибка продакта.
События/метрик нет в документе = их и не будет после
5. Ведите в лог карту допущений с осями «уверенность × влияние»
Отделяйте discovery-долг от delivery-долга как список открытых вопросов и допущений с явной пометкой, насколько вы в них уверены.
Де-рискинг самого опасного допущения и вот вы уже перестаёте строить уверенно поверх того, во что на самом деле не верите
6. Делайте pre-mortem с триггерами, а не как разовое упражнение
Опишите провал до запуска, а к каждому сценарию провала привяжите опережающий индикатор из пункта 1 и 2.
Так pre-mortem превращается из психологической разминки в настройку, благодаря которой вы заранее знаете, какую метрику и график будете смотреть и какое его значение означает, что пора вмешаться.
7. Заведите «кладбище» отклонённых идей с причинами. Каждая зарезанная фича отправляется в searchable-список продуктовой wiki с строкой «почему нет».
Это лекарство от бесконечного цикла переобсуждения одного и того же командой и одновременно ваш самый честный материал для раздела «Не делаем» в новых PRD.
Сильный продакт узнаётся по тому, как быстро он объясняет, почему "нет"
8. Кодифицируй ход мышления-решений
«Как ты узнал?» / «У нас метрика Х упала, ааачоделать?» / «СЕО опять принёс идею, что ответить» и прочее повторяющееся изо дня в день выпиши как личную библиотеку подходов и приёмов.
Ответы:
Управление контекстом вокруг контента и есть тот самый недооценённый актив команды продукта и главный навык продакта.
Product Management & AI
Loop Engineering for Product Managers Лучшими продакт-менеджерами станут не те, у кого самая большая библиотека промптов, а те, кто понимает, какие этапы продуктовой работы стоит превратить в устойчивые циклы, какие артефакты должны ими управлять, и какие…
Совершенствуем не только продуктовые процессы, но и собственные рабочие с помощью loop engineering и ИИ
– Самые важные знания, возможности и инсайты скрываются в паттернах и закономерностях, лежащих в основе результата, и только потом в результате
– Ценность представляет контролируемое накопление улучшений
– Цикл, который нужно запускать вручную, вспоминая о нём — это не цикл
♾️ agent loop skills
♾️ agent improvement loop
♾️ AI agent orchestration loop
– Самые важные знания, возможности и инсайты скрываются в паттернах и закономерностях, лежащих в основе результата, и только потом в результате
– Ценность представляет контролируемое накопление улучшений
– Цикл, который нужно запускать вручную, вспоминая о нём — это не цикл
♾️ agent loop skills
♾️ agent improvement loop
♾️ AI agent orchestration loop
Telegraph
Цикл самосовершенствования ИИ продакт-менеджера (и снова loop engineering)
Я трачу уйму времени на то, что со стороны выглядит как работа продакта: пишу PRD, синхронизируюсь с разрабами и дизайнерами, провожу discovery, разбираю метрики, чищу бэклог, объясняю стейкхолдерам, и иногда отвечаю на сообщения в Slack быстрее, чем успеваю…
Product Management & AI
Бернард Лонерган (1904-1984), выдающийся канадский философ, теолог, экономист и главный архитектор «обобщенного эмпирического метода» (GEM). – Разум достигает знания путем восхождения от данных через гипотезу к проверке. – Лонерган расширил понятие данных…
Что фундаментально изменило мир к худшему, но люди этого ещё не осознали?
То, что смартфоны и алгоритмические ленты сделали со скукой и... пользой от неё.
Потому что на протяжении большей части человеческой истории скука не была проблемой, которую нужно было решать.
Это было когнитивное состояние, которое переводило мозг в режим, который сегодня мы называем «сеть пассивного режима работы мозга» (default mode network) – своего рода фоновую ментальную обработку, во время которой он консолидирует воспоминания, развивая мышление через (не)осознанное воображение, фантазию, эмпатию, генерируя творческие и бизнес-идеи и выстраивая связ(ан)ное-ощущение-Себя-и-мира.
Когда мы смотрели в окно, ждали автобус или тихо сидели после ужина, наш мозг выполнял одну из самых важных своих работ.
Скука была, в самом прямом смысле... двигателем сознания и внутренней жизни.
То, что смартфоны и алгоритмические ленты сделали со скукой и... пользой от неё.
Потому что на протяжении большей части человеческой истории скука не была проблемой, которую нужно было решать.
Это было когнитивное состояние, которое переводило мозг в режим, который сегодня мы называем «сеть пассивного режима работы мозга» (default mode network) – своего рода фоновую ментальную обработку, во время которой он консолидирует воспоминания, развивая мышление через (не)осознанное воображение, фантазию, эмпатию, генерируя творческие и бизнес-идеи и выстраивая связ(ан)ное-ощущение-Себя-и-мира.
Когда мы смотрели в окно, ждали автобус или тихо сидели после ужина, наш мозг выполнял одну из самых важных своих работ.
Скука была, в самом прямом смысле... двигателем сознания и внутренней жизни.
Авито открыл набор на магистерские программы по ML и продакт-менеджменту, разработанные совместно с МФТИ и НИУ ВШЭ
В основе всех программ реальные кейсы из самого Авито, а занятия ведут эксперты компании, которые поделятся опытом разработки, запуска и управления сервисами.
Магистратура «Управление продуктом в IT-бизнесе» в ВШБ НИУ ВШЭ опирается на матрицу компетенций продакт-менеджера в Авито и охватывает всё управление продуктами: от аналитики и пользовательских исследований до бизнес-моделей и работы с данными.
В рамках «Прикладное машинное обучение и анализ данных» и «Машинное обучение (ML) в цифровом продукте» будут осваивать навыки, начиная от классического ML и компьютерного зрения до рекомендательных систем и генеративного ИИ.
👉 Больше информации о магистратуре
Сейчас у Авито запущено всего 12 программ высшего образования, включая магистратуры, для студентов и выпускников со всей страны.
В основе всех программ реальные кейсы из самого Авито, а занятия ведут эксперты компании, которые поделятся опытом разработки, запуска и управления сервисами.
Магистратура «Управление продуктом в IT-бизнесе» в ВШБ НИУ ВШЭ опирается на матрицу компетенций продакт-менеджера в Авито и охватывает всё управление продуктами: от аналитики и пользовательских исследований до бизнес-моделей и работы с данными.
В рамках «Прикладное машинное обучение и анализ данных» и «Машинное обучение (ML) в цифровом продукте» будут осваивать навыки, начиная от классического ML и компьютерного зрения до рекомендательных систем и генеративного ИИ.
👉 Больше информации о магистратуре
Сейчас у Авито запущено всего 12 программ высшего образования, включая магистратуры, для студентов и выпускников со всей страны.
Product Management & AI
Насколько продакт может должен шарить в UX/UI? Есть 5 уровней компетентности продакт-менеджера в UI/UX: Нулевая компетентность в UI/UX Когда продакт абсолютно ничего не знает о UX/UI, понимает это (что самое интересное) и на 100% опирается в этой области…
По мере того как роли в сферах разработки продуктов, дизайна, Data Science и других сливаются воедино благодаря ИИ, я размышлял о том, как они могут выглядеть в будущем (Boris Cherny, Claude Code)
Например, глядя на команду Claude Code, я выделяю пять архетипов:
1. Прототипировщик (Prototyper): генерирует совершенно новые идеи; выдает множество идей, большинство из которых не доходят до стадии реализации.
2. Создатель (Builder) быстро превращает прототип или идею в готовый к эксплуатации продукт или инфраструктуру.
3. Упорядочиватель (Sweeper): приводит в порядок интерфейс, упрощает код и систему, удаляет лишнее, оптимизирует производительность.
4. Развиватель (Grower): берёт уже созданный продукт и дорабатывает его для улучшения соответствия продукта рынку (Product-Market Fit).
5. Поддержка (Maintainer): отвечает за зрелую систему, обеспечивая её безопасность, надёжность, быстродействие и эффективность по мере масштабирования.
Многие специалисты совмещают две, а иногда и три роли. Я также заметил, что эти роли не жестко привязаны к должностным обязанностям.
Например, в Anthropic есть дизайнеры, соответствующие категориям 1, 2 или 3; то же самое касается инженеров, продакт-менеджеров и специалистов по данным.
- Для нового продукта, ещё не нашедшего соответствие рынку (pre-PMF), нужны люди с сильными навыками типов 1, 2 и 3.
- Для растущего продукта, нашедшего соответствие рынку, нужны типы 2, 3, 4 и отчасти 5.
- Для продукта с сильным соответствием рынку нужны типы 3, 4, 5 и отчасти 2.
Возможно, именно так будут выглядеть продуктовые роли будущего, а не как нынешние узкоспециализированные должности.
– 3 основных типа лидеров продукта
– Новая структура любого отдела в компании
– Командные роли по Белбину
Например, глядя на команду Claude Code, я выделяю пять архетипов:
1. Прототипировщик (Prototyper): генерирует совершенно новые идеи; выдает множество идей, большинство из которых не доходят до стадии реализации.
2. Создатель (Builder) быстро превращает прототип или идею в готовый к эксплуатации продукт или инфраструктуру.
3. Упорядочиватель (Sweeper): приводит в порядок интерфейс, упрощает код и систему, удаляет лишнее, оптимизирует производительность.
4. Развиватель (Grower): берёт уже созданный продукт и дорабатывает его для улучшения соответствия продукта рынку (Product-Market Fit).
5. Поддержка (Maintainer): отвечает за зрелую систему, обеспечивая её безопасность, надёжность, быстродействие и эффективность по мере масштабирования.
Многие специалисты совмещают две, а иногда и три роли. Я также заметил, что эти роли не жестко привязаны к должностным обязанностям.
Например, в Anthropic есть дизайнеры, соответствующие категориям 1, 2 или 3; то же самое касается инженеров, продакт-менеджеров и специалистов по данным.
Здоровой команде требуется сочетание этих ролей в зависимости от продукта:
- Для нового продукта, ещё не нашедшего соответствие рынку (pre-PMF), нужны люди с сильными навыками типов 1, 2 и 3.
- Для растущего продукта, нашедшего соответствие рынку, нужны типы 2, 3, 4 и отчасти 5.
- Для продукта с сильным соответствием рынку нужны типы 3, 4, 5 и отчасти 2.
Возможно, именно так будут выглядеть продуктовые роли будущего, а не как нынешние узкоспециализированные должности.
– 3 основных типа лидеров продукта
– Новая структура любого отдела в компании
– Командные роли по Белбину
Product Management & AI
8 советов по работе с логами продукта 1. Ведите decision log с условиями пересмотра, а не просто с решениями Записывайте не только «что решили», но и «при каком сигнале пересмотрим», например, «откатим, если retention упадёт ниже X». Так решение превращается…
Трамп отменил ограничения на Fable и она снова доступна 🔥 По такому случаю поделюсь опытом, который был отложен как раз до этого дня:
TLDR: Fable – самая умная и быстрая ИИ, что я видел за всё время
Она способна системно анализировать огромные объёмы данных (и сжигать токены с такой же скоростью), совершая теоретический ноль ошибок по сравнению с предыдущими моделями и выдавая просто фантастические результаты.
В вайб-кодинге я застал её раскатку в самом начале пока её режим авто-защиты и переключения на более глупые модели при запросах на анализ безопасности кода ещё не был нормально прокачан, и успел ради теста прогнать через неё целиком один опенсорсный таск-менеджер.
В общем... за 5 минут Fable нашла в нём порядка 6 критических уязвимостей, дающих полный доступ ко всем проектам и данным внутри системы и ещё около десятка мелких, расписав по шагам как их активировать и использовать.
Прикинув, сколько лет заключения начинало бы светиться на кончиках моих пальцев, начни я проверять это всё на практике, я быстренько закрыл сессию от греха подальше и удалил её на всякий случай 🙂
Окей, к продуктам:
1. Отдавай Fable только «последнюю милю» рассуждения, а не весь процесс, ибо прогонять весь объём работы через самую сильную модель дорого и нецелесообразно.
Sonnet расширяет (собирает варианты, черновики, сырой список идей), Fable сужает (выбирает и обосновывает лучший вариант с учётом trade-off'ов), Sonnet снова расширяет (превращает решение в конкретные тикеты, сообщения, план действий). Или наоборот.
Смысл Fable в том, чтобы она добавляла именно тот последний процент, который остальные ИИ упускают. Так Fable работает ровно на той стадии, где нужно суждение, а не генерация объёма.
2. Используй Fable как самого-главного-менеджера, а не как ревьюера, попросив сыграть роль самого скептичного CPO/CEO, (который ставит под сомнение и режет фичи) и разнести кейс по существу.
Обычное ревью ищет опечатки в логике, в то время как ролевая атака Fable ищет дыры в самой стратегии логики, и именно в этом разница в интеллекте Fable ощущается сильнее всего.
3. Для этого прогоняй одну и ту же стратегическую задачу через Fable трижды в разных фреймингах
Первый раз оптимизируй под использование, второй раз под масштабирование, третий раз под риски. Четвертый раз в этой же сессии попроси сделать финальный анализ.
В Fable разница между всеми тремя ответами будет более содержательной, а финальное расхождение между прогонами – это и есть то, над чем должен работать человек.
Чем сильнее модель (а Fable сейчас сильнее всех), тем правдоподобнее она достроит недостающий контекст сама и тем незаметнее будет ошибка, если ей подсунули устаревшую метрику или неверное допущение.
С дешёвой моделью плохой инпут даёт явно кривой и глючный аутпут, который сразу видно и его ещё можно успеть исправить.
5. Держи Fable отдельно от документа, который писала НЕ она!
Для стратегического ревью открывай новый диалог и давай только финальный артефакт без истории черновиков, без твоих промежуточных рассуждений. Иначе Fable наследует твою же рамку мышления и соглашается с ней, вместо того чтобы дать свой независимый взгляд.
6. Проси Fable явно проговорить, при каком условии она неправа. Не просто "дай рекомендацию", а "дай рекомендацию и укажи, какой факт, если он окажется неверным, полностью всё сломает".
7. Прогоняй через Fable процессы, а не документы
Раз в квартал давайте модели не PRD, а свой шаблон PRD или свой процесс приоритизации целиком и спрашивайте, какой систематический слепой участок в них вами упущен.
Это применение той же логики внешнего цикла, но на уровне не одной сессии, а всей вашей продуктовой методологии и именно в таком контексте сильнее всего окупается разница между Sonnet/Opus и Fable.
– He was a friend to me and went everywhere with me. But honestly, he’s still with me right There ))
TLDR: Fable – самая умная и быстрая ИИ, что я видел за всё время
Она способна системно анализировать огромные объёмы данных (и сжигать токены с такой же скоростью), совершая теоретический ноль ошибок по сравнению с предыдущими моделями и выдавая просто фантастические результаты.
В вайб-кодинге я застал её раскатку в самом начале пока её режим авто-защиты и переключения на более глупые модели при запросах на анализ безопасности кода ещё не был нормально прокачан, и успел ради теста прогнать через неё целиком один опенсорсный таск-менеджер.
В общем... за 5 минут Fable нашла в нём порядка 6 критических уязвимостей, дающих полный доступ ко всем проектам и данным внутри системы и ещё около десятка мелких, расписав по шагам как их активировать и использовать.
Прикинув, сколько лет заключения начинало бы светиться на кончиках моих пальцев, начни я проверять это всё на практике, я быстренько закрыл сессию от греха подальше и удалил её на всякий случай 🙂
Окей, к продуктам:
1. Отдавай Fable только «последнюю милю» рассуждения, а не весь процесс, ибо прогонять весь объём работы через самую сильную модель дорого и нецелесообразно.
Используй связку Sonnet → Fable → Sonnet как цикл
ИЛИ
Fable → Sonnet → Fable
Sonnet расширяет (собирает варианты, черновики, сырой список идей), Fable сужает (выбирает и обосновывает лучший вариант с учётом trade-off'ов), Sonnet снова расширяет (превращает решение в конкретные тикеты, сообщения, план действий). Или наоборот.
Прибереги Fable для decision log, а не для повседневных апдейтов
Смысл Fable в том, чтобы она добавляла именно тот последний процент, который остальные ИИ упускают. Так Fable работает ровно на той стадии, где нужно суждение, а не генерация объёма.
2. Используй Fable как самого-главного-менеджера, а не как ревьюера, попросив сыграть роль самого скептичного CPO/CEO, (который ставит под сомнение и режет фичи) и разнести кейс по существу.
Обычное ревью ищет опечатки в логике, в то время как ролевая атака Fable ищет дыры в самой стратегии логики, и именно в этом разница в интеллекте Fable ощущается сильнее всего.
3. Для этого прогоняй одну и ту же стратегическую задачу через Fable трижды в разных фреймингах
Первый раз оптимизируй под использование, второй раз под масштабирование, третий раз под риски. Четвертый раз в этой же сессии попроси сделать финальный анализ.
В Fable разница между всеми тремя ответами будет более содержательной, а финальное расхождение между прогонами – это и есть то, над чем должен работать человек.
4. Не давай Fable контекст, который ты сам не перечитал
Чем сильнее модель (а Fable сейчас сильнее всех), тем правдоподобнее она достроит недостающий контекст сама и тем незаметнее будет ошибка, если ей подсунули устаревшую метрику или неверное допущение.
С дешёвой моделью плохой инпут даёт явно кривой и глючный аутпут, который сразу видно и его ещё можно успеть исправить.
5. Держи Fable отдельно от документа, который писала НЕ она!
Для стратегического ревью открывай новый диалог и давай только финальный артефакт без истории черновиков, без твоих промежуточных рассуждений. Иначе Fable наследует твою же рамку мышления и соглашается с ней, вместо того чтобы дать свой независимый взгляд.
6. Проси Fable явно проговорить, при каком условии она неправа. Не просто "дай рекомендацию", а "дай рекомендацию и укажи, какой факт, если он окажется неверным, полностью всё сломает".
7. Прогоняй через Fable процессы, а не документы
Раз в квартал давайте модели не PRD, а свой шаблон PRD или свой процесс приоритизации целиком и спрашивайте, какой систематический слепой участок в них вами упущен.
Это применение той же логики внешнего цикла, но на уровне не одной сессии, а всей вашей продуктовой методологии и именно в таком контексте сильнее всего окупается разница между Sonnet/Opus и Fable.
– He was a friend to me and went everywhere with me. But honestly, he’s still with me right There ))
YouTube
Robert Miles - Fable (Official Video)
Robert Miles - Fable (Official Video)
Listen on Spotify – http://smarturl.it/RM_Spotify
Listen on Apple Music – http://smarturl.it/RM_AppleM
Amazon – http://smarturl.it/RM_Amazon
Facebook - https://www.facebook.com/robertmilespage/
Twitter - https:/…
Listen on Spotify – http://smarturl.it/RM_Spotify
Listen on Apple Music – http://smarturl.it/RM_AppleM
Amazon – http://smarturl.it/RM_Amazon
Facebook - https://www.facebook.com/robertmilespage/
Twitter - https:/…
Product Management & AI
Трамп отменил ограничения на Fable и она снова доступна 🔥 По такому случаю поделюсь опытом, который был отложен как раз до этого дня: TLDR: Fable – самая умная и быстрая ИИ, что я видел за всё время Она способна системно анализировать огромные объёмы данных…
ClaudeMD автоматического выбора ИИ-модели для продуктовой работы
Рейтинги – это стартовая калибровка, а не фиксированные данные и чем выше число, тем лучше.
Модель / Стоимость / Интеллект / Вкус
sonnet-5 / 8 / 6 / 6 /
opus-4. / 8 / 5 / 8 / 7 /
fable-5 / 3 / 9 / 8 /
– Стоимость. То, что ощущается в лимитах токенов и скорости.
– Интеллект. Насколько сложную, многошаговую или неоднозначную задачу можно доверить модели без присмотра.
– Вкус. Качество структуры документа, формулировок, тона в коммуникации и чуткость к контексту.
Откалибруй эти цифры под собственный опыт после пары недель использования. Важна не точность чисел, а сам принцип: не гонять сложные решения через дешёвую модель и не тратить дорогую модель на рутину.
Как применять:
– Это дефолты, а не ограничения. Если результат дешёвой модели не дотягивает, то не спрашивай разрешения, перезапускай с более сильной. Суди по результату, а не по тому, что модель просто должна была справиться.
– Когда параметры конфликтуют для чего-то, что реально влияет на решения или уходит наружу, опирайся на:
1. Интеллект > 2. Вкус > 3. Стоимость
– Массовая механическая работа (расшифровка транскриптов интервью, разметка тикетов, сведение таблиц с метриками, черновой синтез фидбека из десятков источников): sonnet-5.
– Всё, что уходит наружу стейкхолдерам, клиентам, руководству (питчи, обоснование приоритизации, деликатные апдейты о задержках, переговоры о scope): нужен вкус ≥ 7.
– Ревью и вторая пара глаз (проверка PRD перед отправкой инженерам, стресс-тест roadmap, поиск дыр в бизнес-кейсе): fable-5 или opus-4.8, по возможности оба как независимые мнения, если решение необратимое.
– Стратегические и неоднозначные решения (trade-off между конкурирующими метриками, приоритизация, спорные ставки без явного правильного ответа): fable-5.
– Никогда не используй самую слабую модель для документов, которые пойдут выше вашего уровня или станут прецедентом для команды.
Режимы работы
– Написание PRD и спек с нуля → opus-4.8 как основа → fable-5 для финального ревью перед отправкой в разработку.
– Discovery-синтез sonnet-5 для чистой расшифровки на входе (несколько интервью → инсайты → гипотезы) → fable-5 для самого синтеза (нужен интеллект, чтобы не сгладить противоречия)
– Приоритизация бэклога / RICE-скоринг → sonnet-5 для механического прогона по формуле → opus-4.8 для проверки, не искажает ли формула реальный контекст → fable-5 для синтеза
– Коммуникация о задержках и плохих новостях стейкхолдерам → fable-5 или opus-4.8. Тон и причины здесь важнее скорости.
– Рутинные апдейты статуса, саммари встречи, заметки в трекер → sonnet-5.
– Pre-mortem, поиск слабых мест в плане запуска → opus-4.8 → fable-5 как отдельная независимая проверка.
– Черновик поста / статьи / контента на основе рабочих заметок → opus-4.8 для черновика → fable-5 для финальной правки тона и структуры.
– Анализ больших выгрузок данных / метрик → sonnet-5 для первого прохода и агрегации → эскалация на opus-4.8, если нужна интерпретация неоднозначных паттернов → fable-5 для финальной проверки паттернов.
Рейтинги – это стартовая калибровка, а не фиксированные данные и чем выше число, тем лучше.
Модель / Стоимость / Интеллект / Вкус
sonnet-5 / 8 / 6 / 6 /
opus-4. / 8 / 5 / 8 / 7 /
fable-5 / 3 / 9 / 8 /
– Стоимость. То, что ощущается в лимитах токенов и скорости.
– Интеллект. Насколько сложную, многошаговую или неоднозначную задачу можно доверить модели без присмотра.
– Вкус. Качество структуры документа, формулировок, тона в коммуникации и чуткость к контексту.
Откалибруй эти цифры под собственный опыт после пары недель использования. Важна не точность чисел, а сам принцип: не гонять сложные решения через дешёвую модель и не тратить дорогую модель на рутину.
Как применять:
– Это дефолты, а не ограничения. Если результат дешёвой модели не дотягивает, то не спрашивай разрешения, перезапускай с более сильной. Суди по результату, а не по тому, что модель просто должна была справиться.
Пересогласование стоит дешевле, чем решение, принятое на слабом анализе
– Когда параметры конфликтуют для чего-то, что реально влияет на решения или уходит наружу, опирайся на:
1. Интеллект > 2. Вкус > 3. Стоимость
– Массовая механическая работа (расшифровка транскриптов интервью, разметка тикетов, сведение таблиц с метриками, черновой синтез фидбека из десятков источников): sonnet-5.
– Всё, что уходит наружу стейкхолдерам, клиентам, руководству (питчи, обоснование приоритизации, деликатные апдейты о задержках, переговоры о scope): нужен вкус ≥ 7.
– Ревью и вторая пара глаз (проверка PRD перед отправкой инженерам, стресс-тест roadmap, поиск дыр в бизнес-кейсе): fable-5 или opus-4.8, по возможности оба как независимые мнения, если решение необратимое.
– Стратегические и неоднозначные решения (trade-off между конкурирующими метриками, приоритизация, спорные ставки без явного правильного ответа): fable-5.
– Никогда не используй самую слабую модель для документов, которые пойдут выше вашего уровня или станут прецедентом для команды.
Режимы работы
– Написание PRD и спек с нуля → opus-4.8 как основа → fable-5 для финального ревью перед отправкой в разработку.
– Discovery-синтез sonnet-5 для чистой расшифровки на входе (несколько интервью → инсайты → гипотезы) → fable-5 для самого синтеза (нужен интеллект, чтобы не сгладить противоречия)
– Приоритизация бэклога / RICE-скоринг → sonnet-5 для механического прогона по формуле → opus-4.8 для проверки, не искажает ли формула реальный контекст → fable-5 для синтеза
– Коммуникация о задержках и плохих новостях стейкхолдерам → fable-5 или opus-4.8. Тон и причины здесь важнее скорости.
– Рутинные апдейты статуса, саммари встречи, заметки в трекер → sonnet-5.
– Pre-mortem, поиск слабых мест в плане запуска → opus-4.8 → fable-5 как отдельная независимая проверка.
– Черновик поста / статьи / контента на основе рабочих заметок → opus-4.8 для черновика → fable-5 для финальной правки тона и структуры.
– Анализ больших выгрузок данных / метрик → sonnet-5 для первого прохода и агрегации → эскалация на opus-4.8, если нужна интерпретация неоднозначных паттернов → fable-5 для финальной проверки паттернов.
Product Management & AI
Видение – умение соединять линиями несоединённые точки Несоединённые точки те, которые никто не видит одновременно. Видеть – держать перед глазами много таких точек, смотря на прошлое-настоящее-возможное в движении к Единой Точке. Точка = Линия. Ищи узоры…
Почему ИИ на самом деле не научился «видеть» так, как видим мы
Профессор Стэнфорда Джуди Фан выступила на сцене MIT и объяснила, почему люди так хорошо умеют делать невидимое видимым.
1. Природа никогда не давала нам прямых линий или острых углов. Числовая прямая, координатная плоскость, основы геометрии — всё это изобретения человека.
Мы создали инструменты, которых не существует в природе, просто потому, что нам нужен был способ мыслить яснее.
2. Система координат, изобретенная Декартом, решила проблему, которая веками ставила математиков в тупик — удвоение объёма куба. После изобретения этот инструмент стал настолько незаменимым, что практически каждая математическая программа на Земле до сих пор зависит от него.
4. Каждый крупный научный прорыв опирался на визуальный инструмент, который делал невидимое видимым. Дарвину нужны были изображения зябликов, расположенные рядом, чтобы увидеть вариации, которые иначе были бы слишком незначительными, чтобы их заметить. Кахалю нужны были подробные рисунки нейронов под микроскопом, чтобы составить карту строения нервной системы.
Когда два человека играли в игру с рисованием, участники использовали гораздо больше деталей, когда у целевого объекта были близкие конкуренты, чем когда он стоял один, вплоть до использования меньшего количества штрихов и меньшего времени, когда более подробная информация не требовалась.
6. Люди не просто копируют то, что видят. Они постоянно принимают решения о том, какой уровень детализации действительно служит цели коммуникации, и делают это естественно, никогда не обучаясь теории, лежащей в основе этого.
7. Существует реальная разница между изображением чего-либо таким образом, чтобы кто-то мог это идентифицировать И изображением чего-либо таким образом, чтобы кто-то мог понять, как это работает.
В одном исследовании участники рисовали пояснительные диаграммы, которые подчеркивали движущиеся, причинно-следственные части машины, в то время как изобразительные рисунки акцентировали внимание на фоне и общем внешнем виде, хотя оба варианта изображали один и тот же объект.
Пояснительные рисунки действительно лучше помогали кому-то понять, как управлять машиной, но хуже помогали определить, какая именно это машина.
И остается большой, измеримый разрыв между тем, насколько уверенно модели ИИ распознают эскизы, и тем, насколько уверенно это делают люди, даже когда обе группы отвечают на одни и те же вопросы об одних и тех же изображениях.
11. Когда исследователи сравнивали эскизы, созданные людьми, с эскизами, сгенерированными ИИ, при ограниченном количестве штрихов, оба варианта были одинаково узнаваемы при большем количестве штрихов, но резко расходились по мере сокращения лимита штрихов.
12. Чтение графика — навык, который включает в себя восприятие, знание, куда смотреть, сопоставление этой визуальной информации с фактическим задаваемым вопросом, а затем преобразование этого сопоставления в ответ.
При непосредственном сравнении с людьми в задачах чтения графиков, модели ИИ показали существенный разрыв в производительности. И даже когда общая точность модели приближалась к человеческому уровню, модель ошибок ИИ совершенно не походила на то, как на самом деле ошибаются люди.
13. Люди выбирают совершенно разные типы диаграмм в зависимости от того, на какой конкретный вопрос они пытаются ответить, а не из-за общего предпочтения столбчатых диаграмм или диаграмм рассеивания.
Наш выбор диаграмм тесно коррелирует с тем, какая визуализация действительно поможет человеку интуитивно и правильно ответить на конкретный запрос.
Профессор Стэнфорда Джуди Фан выступила на сцене MIT и объяснила, почему люди так хорошо умеют делать невидимое видимым.
1. Природа никогда не давала нам прямых линий или острых углов. Числовая прямая, координатная плоскость, основы геометрии — всё это изобретения человека.
Мы создали инструменты, которых не существует в природе, просто потому, что нам нужен был способ мыслить яснее.
2. Система координат, изобретенная Декартом, решила проблему, которая веками ставила математиков в тупик — удвоение объёма куба. После изобретения этот инструмент стал настолько незаменимым, что практически каждая математическая программа на Земле до сих пор зависит от него.
4. Каждый крупный научный прорыв опирался на визуальный инструмент, который делал невидимое видимым. Дарвину нужны были изображения зябликов, расположенные рядом, чтобы увидеть вариации, которые иначе были бы слишком незначительными, чтобы их заметить. Кахалю нужны были подробные рисунки нейронов под микроскопом, чтобы составить карту строения нервной системы.
Исследовательская группа Фан изучает нечто обманчиво простое: как люди решают, что включить в рисунок, а что опустить
Когда два человека играли в игру с рисованием, участники использовали гораздо больше деталей, когда у целевого объекта были близкие конкуренты, чем когда он стоял один, вплоть до использования меньшего количества штрихов и меньшего времени, когда более подробная информация не требовалась.
6. Люди не просто копируют то, что видят. Они постоянно принимают решения о том, какой уровень детализации действительно служит цели коммуникации, и делают это естественно, никогда не обучаясь теории, лежащей в основе этого.
7. Существует реальная разница между изображением чего-либо таким образом, чтобы кто-то мог это идентифицировать И изображением чего-либо таким образом, чтобы кто-то мог понять, как это работает.
В одном исследовании участники рисовали пояснительные диаграммы, которые подчеркивали движущиеся, причинно-следственные части машины, в то время как изобразительные рисунки акцентировали внимание на фоне и общем внешнем виде, хотя оба варианта изображали один и тот же объект.
Пояснительные рисунки действительно лучше помогали кому-то понять, как управлять машиной, но хуже помогали определить, какая именно это машина.
Нельзя оптимизировать один рисунок для достижения обеих целей одновременно. Визуальная коммуникация всегда предполагает компромиссы
И остается большой, измеримый разрыв между тем, насколько уверенно модели ИИ распознают эскизы, и тем, насколько уверенно это делают люди, даже когда обе группы отвечают на одни и те же вопросы об одних и тех же изображениях.
11. Когда исследователи сравнивали эскизы, созданные людьми, с эскизами, сгенерированными ИИ, при ограниченном количестве штрихов, оба варианта были одинаково узнаваемы при большем количестве штрихов, но резко расходились по мере сокращения лимита штрихов.
Люди и системы ИИ упрощают рисунки принципиально разными способами, когда ресурсы становятся дефицитными.
12. Чтение графика — навык, который включает в себя восприятие, знание, куда смотреть, сопоставление этой визуальной информации с фактическим задаваемым вопросом, а затем преобразование этого сопоставления в ответ.
При непосредственном сравнении с людьми в задачах чтения графиков, модели ИИ показали существенный разрыв в производительности. И даже когда общая точность модели приближалась к человеческому уровню, модель ошибок ИИ совершенно не походила на то, как на самом деле ошибаются люди.
13. Люди выбирают совершенно разные типы диаграмм в зависимости от того, на какой конкретный вопрос они пытаются ответить, а не из-за общего предпочтения столбчатых диаграмм или диаграмм рассеивания.
Наш выбор диаграмм тесно коррелирует с тем, какая визуализация действительно поможет человеку интуитивно и правильно ответить на конкретный запрос.
X (formerly Twitter)
Yasmine Khosrowshahi (@yasminekho) on X
Stanford professor Judy Fan went on stage at MIT and broke down why humans are so good at making the invisible visible...
And why AI hasn't actually learned to "see" the way we do.
It completely changes how you think about Human Intelligence v/s Artificial…
And why AI hasn't actually learned to "see" the way we do.
It completely changes how you think about Human Intelligence v/s Artificial…
This media is not supported in your browser
VIEW IN TELEGRAM
Займи слот ИТ-Пикником от Т-Банка
8 августа — время отложить ноутбуки и встретиться офлайн на ИТ-Пикнике от Т-Банка в музее-заповеднике «Коломенское».
Вот сколько всего запланировано:
— научпоп-лекции;
— мастер-классы;
— дискуссии об ИИ и больших языковых моделях;
— доклады о кибербезопасности;
— примеры, как данные из логов становятся решениями;
— много музыки.
Бери с собой друзей, супругов и детей — каждый найдёт себе что-то по душе.
Зарегистрироваться и узнать больше можно здесь
8 августа — время отложить ноутбуки и встретиться офлайн на ИТ-Пикнике от Т-Банка в музее-заповеднике «Коломенское».
Вот сколько всего запланировано:
— научпоп-лекции;
— мастер-классы;
— дискуссии об ИИ и больших языковых моделях;
— доклады о кибербезопасности;
— примеры, как данные из логов становятся решениями;
— много музыки.
Бери с собой друзей, супругов и детей — каждый найдёт себе что-то по душе.
Зарегистрироваться и узнать больше можно здесь