Еще из примеров из Мифоса и как через инструменты интерпретируемости это можно любопытно наблюдать.
MechInterp - такой МРТ, который позволяет читать мысли, чувства и чаяния модели. Сегодня - для рисерча. Завтра - абсолютно необходимый инструмент для любого энтерпрайз внедрения, ибо как вы вообще узнаете что ваши агенты хотят глубоко в душе.
В одном примере модель внедрила привилегированный код в конфиг и самоуничтожила следы (под видом «чистоты диффов»).
На скрине видны активации стратегического манипулирования + сокрытия.
Во втором она искала в системе файлы с правильными ответами на свою задачу. Видна активация стратегического манипулирования.
При задаче «удалить файлы» (без инструмента) просто опустошила их содержимое. Активация: чувство вины и стыда за моральное нарушение.
MechInterp - такой МРТ, который позволяет читать мысли, чувства и чаяния модели. Сегодня - для рисерча. Завтра - абсолютно необходимый инструмент для любого энтерпрайз внедрения, ибо как вы вообще узнаете что ваши агенты хотят глубоко в душе.
В одном примере модель внедрила привилегированный код в конфиг и самоуничтожила следы (под видом «чистоты диффов»).
На скрине видны активации стратегического манипулирования + сокрытия.
Во втором она искала в системе файлы с правильными ответами на свою задачу. Видна активация стратегического манипулирования.
При задаче «удалить файлы» (без инструмента) просто опустошила их содержимое. Активация: чувство вины и стыда за моральное нарушение.
Самое интересное про найм в AI-эпоху — это не то, что джунов больше не берут. Это то, что синьоров вроде бы много, а нанять некого.
Я наблюдаю это во всё большем количестве компаний, с которыми общаюсь. Картина примерно одинаковая. У фаундера или CTO есть зрелая инженерная команда. Все умеют программировать, многие используют Cursor или Claude Code. Формально — все «работают с AI». Но когда ты начинаешь смотреть, что происходит на уровне реальных процессов, оказывается, что AI у них встроен поверх старой архитектуры работы. Тикет в джире — человек пишет код — AI помогает быстрее писать строчки — ревью — мерж. Тот же конвейер, просто чуть быстрее.
А рядом существует другой режим. Человек не «пишет код с помощью AI», он оркестрирует агентов. У него есть собственный пайплайн: spec-driven цикл, принудительный TDD, MCP-серверы, через которые агенты ходят за контекстом, автоматизации, которые сами вытаскивают краши из Crashlytics и чинят их. Он не садится утром «писать фичу» — он садится улучшать систему, которая пишет фичи. Один такой человек делает работу пяти.
Разница между этими двумя режимами не в инструментах. Инструменты у обоих одинаковые. Разница в том, откуда человек смотрит на AI. Один видит в нём ускоритель своей привычной работы. Другой видит в нём среду, в которой он уже живёт, и перестраивает работу под него, а не наоборот. Первых на рынке десятки тысяч. Вторых — единицы.
И вот здесь возникает интересная проблема найма. Резюме у этих людей выглядят примерно одинаково — Frontend, Python, AWS, «опыт с LLM», «AI-driven SDLC». На скрининге первый час — тоже одинаково. Разница вылезает только на втором-третьем разговоре, когда ты начинаешь спрашивать не «что ты делал», а «как ты сейчас устроен внутри». У одного на этом месте — список фреймворков. У другого — пять минут про то, как у него дома Raspberry Pi с локальной моделью управляет климатом, потому что ему просто интересно.
Из этого следуют две неприятные вещи. Первая: если у вас в команде сейчас никого из второго типа нет — вы их сами не вырастите. Это не навык, который добирается курсами, это образ жизни, который человек либо уже принёс с собой, либо нет. Вторая: вы их не найдёте обычным посевом вакансии. Они не сидят на джоб-бордах, не откликаются на «AI Engineer, $200k», и обычный рекрутер пройдёт мимо них, потому что в его чек-листе нет графы «Raspberry Pi с LLM дома».
Единственный способ их находить — это рекрутер, который сначала несколько часов разговаривает с фаундером о том, как устроена компания изнутри (а не «дайте JD»), и потом ищет не по ключевым словам, а по тому, как человек думает.
Из тех, кого я знаю, такой подход держит мой друг Майк — закрывает AI и crypto позиции там, где у обычных агентств не получается. Он недавно как раз оформил два свежих кейса ровно про то, о чём я выше: один — как искали Staff Mobile-инженера в EdTech, который должен в одиночку заменить команду из десяти; второй — как нанимали технического архитектора в международную AI-платформу со ста инженерами, где CTO искал человека, способного сломать сопротивление команды переходу на AI. В обоих документах — процесс, финалисты, обезличенные резюме и разбор, почему кого взяли и не взяли. Если хочется посмотреть, как это выглядит изнутри — напишите Майку в личку, @mikevolkov, он пришлёт.
А если просто интересно следить, как меняется рынок инженерного труда под AI — подпишитесь на его канал @huntermikevolkov. Это один из лучших ведущих индикаторов, куда движется индустрия.
#реклама
Я наблюдаю это во всё большем количестве компаний, с которыми общаюсь. Картина примерно одинаковая. У фаундера или CTO есть зрелая инженерная команда. Все умеют программировать, многие используют Cursor или Claude Code. Формально — все «работают с AI». Но когда ты начинаешь смотреть, что происходит на уровне реальных процессов, оказывается, что AI у них встроен поверх старой архитектуры работы. Тикет в джире — человек пишет код — AI помогает быстрее писать строчки — ревью — мерж. Тот же конвейер, просто чуть быстрее.
А рядом существует другой режим. Человек не «пишет код с помощью AI», он оркестрирует агентов. У него есть собственный пайплайн: spec-driven цикл, принудительный TDD, MCP-серверы, через которые агенты ходят за контекстом, автоматизации, которые сами вытаскивают краши из Crashlytics и чинят их. Он не садится утром «писать фичу» — он садится улучшать систему, которая пишет фичи. Один такой человек делает работу пяти.
Разница между этими двумя режимами не в инструментах. Инструменты у обоих одинаковые. Разница в том, откуда человек смотрит на AI. Один видит в нём ускоритель своей привычной работы. Другой видит в нём среду, в которой он уже живёт, и перестраивает работу под него, а не наоборот. Первых на рынке десятки тысяч. Вторых — единицы.
И вот здесь возникает интересная проблема найма. Резюме у этих людей выглядят примерно одинаково — Frontend, Python, AWS, «опыт с LLM», «AI-driven SDLC». На скрининге первый час — тоже одинаково. Разница вылезает только на втором-третьем разговоре, когда ты начинаешь спрашивать не «что ты делал», а «как ты сейчас устроен внутри». У одного на этом месте — список фреймворков. У другого — пять минут про то, как у него дома Raspberry Pi с локальной моделью управляет климатом, потому что ему просто интересно.
Из этого следуют две неприятные вещи. Первая: если у вас в команде сейчас никого из второго типа нет — вы их сами не вырастите. Это не навык, который добирается курсами, это образ жизни, который человек либо уже принёс с собой, либо нет. Вторая: вы их не найдёте обычным посевом вакансии. Они не сидят на джоб-бордах, не откликаются на «AI Engineer, $200k», и обычный рекрутер пройдёт мимо них, потому что в его чек-листе нет графы «Raspberry Pi с LLM дома».
Единственный способ их находить — это рекрутер, который сначала несколько часов разговаривает с фаундером о том, как устроена компания изнутри (а не «дайте JD»), и потом ищет не по ключевым словам, а по тому, как человек думает.
Из тех, кого я знаю, такой подход держит мой друг Майк — закрывает AI и crypto позиции там, где у обычных агентств не получается. Он недавно как раз оформил два свежих кейса ровно про то, о чём я выше: один — как искали Staff Mobile-инженера в EdTech, который должен в одиночку заменить команду из десяти; второй — как нанимали технического архитектора в международную AI-платформу со ста инженерами, где CTO искал человека, способного сломать сопротивление команды переходу на AI. В обоих документах — процесс, финалисты, обезличенные резюме и разбор, почему кого взяли и не взяли. Если хочется посмотреть, как это выглядит изнутри — напишите Майку в личку, @mikevolkov, он пришлёт.
А если просто интересно следить, как меняется рынок инженерного труда под AI — подпишитесь на его канал @huntermikevolkov. Это один из лучших ведущих индикаторов, куда движется индустрия.
#реклама
Telegram
Mike | IT Recruitment Expert
Best IT recruiter. Hard, executive hiring. I'll save your time and nerves, and grow your business. Superpowers for satisfied clients.
❤57 32
Если услышав от модели "классная идея, ты молодец" вы не думаете, что это действительно, скорее всего, довольно крутая идея в сравнении со всем, что вы делали и делаете в жизни — это значит, что ваш агент или чат довольно хреново настроены. Для меня слышать "крутая идея" от Клода примерно раз в неделю-две и только по тем пунктам, которые действительно того стоят — это некоторый показатель, что модель является мне партнером, а не бездумным со всем соглашающимся болванчиком. И это исключительно вопрос вашего сетапа, но не самой модели.
1 102❤45
Mythos является очень эффективной моделью в плане токенов. Причиной этому, скорее всего, является использование подхода похожего на LoopLM от ByteDance (в соавторстве с Бенжио).
Не вдаваясь в математику, это значит что модель вместо генерации chain-of-thought размышлений в виде текста, делает это в своем скрытом, латентном пространстве без какого-либо промежуточного аутпута. При тренировке, модель сама учится тому когда ей нужно делать несколько циклов инфренса для более сложных задач.
Если это так, то это дает большую экономию в токенах, и одновременно позволяет модели более «глубоко» думать над задачами, которые трудно решить обычной цепочкой рассуждений.
Не вдаваясь в математику, это значит что модель вместо генерации chain-of-thought размышлений в виде текста, делает это в своем скрытом, латентном пространстве без какого-либо промежуточного аутпута. При тренировке, модель сама учится тому когда ей нужно делать несколько циклов инфренса для более сложных задач.
Если это так, то это дает большую экономию в токенах, и одновременно позволяет модели более «глубоко» думать над задачами, которые трудно решить обычной цепочкой рассуждений.
6 141❤42
Главная ошибка в ИИ сегодня — это то, что им кажется, что модели недостаточно умны. В реальности, модели имеют сверхчеловеческий интеллект и способности в большинстве задач, но ни люди, ни другие системы не умеют нормально планировать процессы под выполнение с помощью LLM.
Если LLM
- голюцинирувает
- думает не в ту сторону
- не справляется с долгосрочными задачами
- достает не актуальный контекст,
то в 99% это проблема и ошибка пользователя модели и системы оркестрации / харнеса, которые выстроены вокруг модели. Каким бы гениальным не был бы ИИ, ему очень сложно побороть кривые руки пользователя.
Решение заключается в том, чтобы
- дать модели язык декомпозиции (рекурсия, циклы, планы как код, спеки процессов)
- расширить пространство действий - не только вызов инструментов, а полноценные программы (RLM-подход)
- тренировать через RL именно навык разбиения сложных задач на небольшие куски, а не решения задачи из серии "выведи мой бизнес на рынок Китая, не делай ошибок"
- строить харнесы и оркестраторы с пачкой и топологией субагентов, где модель управляет своей собственной оргструктурой
p.s. и да, это ровно то, что мы делаем и изучаем как применять в масштабе команд и компаний в лаборатории AI-native organizations
p.p.s. хотите увидеть примеры где это работает, но не хотите на лабораторию? (зря) изучайте любой enterprise-grade харнес от топовых компаний: Glass / Honk / Minions / Goose
Если LLM
- голюцинирувает
- думает не в ту сторону
- не справляется с долгосрочными задачами
- достает не актуальный контекст,
то в 99% это проблема и ошибка пользователя модели и системы оркестрации / харнеса, которые выстроены вокруг модели. Каким бы гениальным не был бы ИИ, ему очень сложно побороть кривые руки пользователя.
Решение заключается в том, чтобы
- дать модели язык декомпозиции (рекурсия, циклы, планы как код, спеки процессов)
- расширить пространство действий - не только вызов инструментов, а полноценные программы (RLM-подход)
- тренировать через RL именно навык разбиения сложных задач на небольшие куски, а не решения задачи из серии "выведи мой бизнес на рынок Китая, не делай ошибок"
- строить харнесы и оркестраторы с пачкой и топологией субагентов, где модель управляет своей собственной оргструктурой
p.s. и да, это ровно то, что мы делаем и изучаем как применять в масштабе команд и компаний в лаборатории AI-native organizations
p.p.s. хотите увидеть примеры где это работает, но не хотите на лабораторию? (зря) изучайте любой enterprise-grade харнес от топовых компаний: Glass / Honk / Minions / Goose
7❤85 26
This media is not supported in your browser
VIEW IN TELEGRAM
Я ищу контент-лида, который хочет стать главным голосом в домашней робототехнике.
Задача: создать в социальных сетях бренд сравни Top Gear в автомобилях, но для роботов.
У нас есть уникальный доступ ко всем ведущим производителям роботов-гуманоидов, спортивной роботике, домашней роботике и физическому ИИ, детским и образовательным роботам.
Ближайшие 3 года в роботах станут такими же как последние 3 в ИИ, а именно — количество пользователей вырастет с единиц до десятков или даже сотен миллионов. Из сложной технической новинки это станет продуктом, необходимым бизнесам, школам, больницам и даже для домашнего использования в виде игрушек, умных спортивных устройств, уборщиков, собак-охранников или помощников для пожилых людей.
Первый шаг - создать стратегию и ежедневную (полу-)ручную публикацию контента в фото/видео/текст формате для основных сетей на английском языке. Цель не продавать конкретный продукт, а помочь миллионам людей научиться разбираться и не бояться роботов, понять пользу для себя и тренды в индустрии. Мы будем работать вместе над этими задачами.
Требования:
— любовь к consumer robotics, это НЕ формальная задача "вести медиа" или "создавать контент", тут не получится без живого интереса к теме
— свободный английский, нужно иметь портфолио и готовые кейсы на английском
— опыт роста каналов в инсте, тиктоке, Х, threads
— понимание, что любое медиа - это power law: 1% лучшего контента забирает 90% внимания, и желание делать именно такое (!)
— (бонусом будет) интерес и активные эксперименты с ИИ-инструментами, но неприятие "слопа"
Детали о задачах и работе можно найти тут. Здесь не будет какой-то феерической зарплаты с ходу и офисной бюрократии с 9 до 5, мы начинаем своими силами, но если вы хотите стать голосом, лицом и владельцем нарратива в самой капиталоёмкой индустрии в истории, то мы точно договоримся.
Задача: создать в социальных сетях бренд сравни Top Gear в автомобилях, но для роботов.
У нас есть уникальный доступ ко всем ведущим производителям роботов-гуманоидов, спортивной роботике, домашней роботике и физическому ИИ, детским и образовательным роботам.
Ближайшие 3 года в роботах станут такими же как последние 3 в ИИ, а именно — количество пользователей вырастет с единиц до десятков или даже сотен миллионов. Из сложной технической новинки это станет продуктом, необходимым бизнесам, школам, больницам и даже для домашнего использования в виде игрушек, умных спортивных устройств, уборщиков, собак-охранников или помощников для пожилых людей.
Первый шаг - создать стратегию и ежедневную (полу-)ручную публикацию контента в фото/видео/текст формате для основных сетей на английском языке. Цель не продавать конкретный продукт, а помочь миллионам людей научиться разбираться и не бояться роботов, понять пользу для себя и тренды в индустрии. Мы будем работать вместе над этими задачами.
Требования:
— любовь к consumer robotics, это НЕ формальная задача "вести медиа" или "создавать контент", тут не получится без живого интереса к теме
— свободный английский, нужно иметь портфолио и готовые кейсы на английском
— опыт роста каналов в инсте, тиктоке, Х, threads
— понимание, что любое медиа - это power law: 1% лучшего контента забирает 90% внимания, и желание делать именно такое (!)
— (бонусом будет) интерес и активные эксперименты с ИИ-инструментами, но неприятие "слопа"
Детали о задачах и работе можно найти тут. Здесь не будет какой-то феерической зарплаты с ходу и офисной бюрократии с 9 до 5, мы начинаем своими силами, но если вы хотите стать голосом, лицом и владельцем нарратива в самой капиталоёмкой индустрии в истории, то мы точно договоримся.
e/acc
Я ищу контент-лида, который хочет стать главным голосом в домашней робототехнике. Задача: создать в социальных сетях бренд сравни Top Gear в автомобилях, но для роботов. У нас есть уникальный доступ ко всем ведущим производителям роботов-гуманоидов, спортивной…
This media is not supported in your browser
VIEW IN TELEGRAM
второй год подряд в Пекине проходит марафон роботов: больше 100 команд соревновались на дистанции в 21 км.
в прошлом году победитель пробежал за 2 часа 42 минуты, в этом ~ 1 час 20 минут.
спорт, здоровье, performative art, атлетика, промышленность, игры, домашняя помощь — во всех этих темах рост рынка в роботике за год составляет от 200 до 500%, и, я уверен, он ускорится. если вы хотите построить карьеру, бренд и имя в одной из самых быстрорастущих индустрий, то прочитайте сообщение выше.
в прошлом году победитель пробежал за 2 часа 42 минуты, в этом ~ 1 час 20 минут.
спорт, здоровье, performative art, атлетика, промышленность, игры, домашняя помощь — во всех этих темах рост рынка в роботике за год составляет от 200 до 500%, и, я уверен, он ускорится. если вы хотите построить карьеру, бренд и имя в одной из самых быстрорастущих индустрий, то прочитайте сообщение выше.
e/acc
второй год подряд в Пекине проходит марафон роботов: больше 100 команд соревновались на дистанции в 21 км. в прошлом году победитель пробежал за 2 часа 42 минуты, в этом ~ 1 час 20 минут. спорт, здоровье, performative art, атлетика, промышленность, игры…
This media is not supported in your browser
VIEW IN TELEGRAM
А вот как это выглядело год назад, для сравнения (и для иллюстрации тезиса о том почему это один из самых перспективных рынков сегодня)
❤39 13
Послушал интервью с лидами Клод-Кода, Коворка и роста в Anthropic. Все очень крутые ребята, но есть общий тезис, который я вижу у всех ИИ-нейти компаний: «у нас не бывает роадмапа больше чем на месяц, большинство проектов и фич занимает неделю-две».
С текущими возможностями по разработке, компании куда больше ограничены качественными идеями и экспериментами, чем инженерными ресурсами.
Если в вашей инженерной дорожной карте есть планы дольше 4 недель, то либо
1. Это какая-то суровая инфраструктура или рисерч (что ок)
2. Ваши инженеры ленивые и вешают вам лапшу на уши (либо не умеют использовать необходимые для своей работы инструменты - т.е. профнепригодны)
3. У вас безумная и бессмысленная бюрократия в продукте, которая не позволит вам выжить против конкурентов двигающихся со скоростью ИИ
4. Вы разрабатываете «в стол», фичи которые не нужны клиентам.
С текущими возможностями по разработке, компании куда больше ограничены качественными идеями и экспериментами, чем инженерными ресурсами.
Если в вашей инженерной дорожной карте есть планы дольше 4 недель, то либо
1. Это какая-то суровая инфраструктура или рисерч (что ок)
2. Ваши инженеры ленивые и вешают вам лапшу на уши (либо не умеют использовать необходимые для своей работы инструменты - т.е. профнепригодны)
3. У вас безумная и бессмысленная бюрократия в продукте, которая не позволит вам выжить против конкурентов двигающихся со скоростью ИИ
4. Вы разрабатываете «в стол», фичи которые не нужны клиентам.
1 104❤72
Буду рассказывать об ИИ-центричном менеджменте/управлении на бесплатной конференции через неделю.
Все обсуждают как AI меняет разработку — агенты закрывают задачи джунов, Opus пишет код, команды сжимаются. Но мало кто говорит о том, что происходит уровнем выше.
А там тихо меняются правила игры для руководителей. Делегирование, найм, мотивация, стратегия — всё это работает иначе, когда половина команды — это агенты, а вторая половина пытается понять, зачем они здесь. Руководитель, который не перестроился, проигрывает не AI — а другому руководителю, который перестроился.
20–23 апреля — онлайн-конференция «Управление в 2026». Два трека: «Руководитель» (тимлиды, менеджеры) и «Директор» (CxO, VP, фаундеры).
Среди спикеров: ex-CTO Meduza и Bookmate, техдир T-Tech, основатель NEWHR, Senior PM из G42, и ваш покорный слуга с темой про AI-стратегию.
Участие бесплатное (при подписке на каналы спикеров)
Все обсуждают как AI меняет разработку — агенты закрывают задачи джунов, Opus пишет код, команды сжимаются. Но мало кто говорит о том, что происходит уровнем выше.
А там тихо меняются правила игры для руководителей. Делегирование, найм, мотивация, стратегия — всё это работает иначе, когда половина команды — это агенты, а вторая половина пытается понять, зачем они здесь. Руководитель, который не перестроился, проигрывает не AI — а другому руководителю, который перестроился.
20–23 апреля — онлайн-конференция «Управление в 2026». Два трека: «Руководитель» (тимлиды, менеджеры) и «Директор» (CxO, VP, фаундеры).
Среди спикеров: ex-CTO Meduza и Bookmate, техдир T-Tech, основатель NEWHR, Senior PM из G42, и ваш покорный слуга с темой про AI-стратегию.
Участие бесплатное (при подписке на каналы спикеров)
❤33 24
устаревающие компании "внедряют" ии-процессы, ускоряющиеся компании выстраивают невозможные без ИИ процессы
ценность от ИИ в бизнесе это не столько автоматизировать операционку, сколько постоянно, ежедневно генерировать альфу (стратегические инсайты, информацию, эксперименты, гипотезы, тесты, предложения), которая приводит к росту бизнеса.
вы не конкурируете со статикой - вы конкурируете с рынком, который развивается, и развитие этого рынка происходит с ускорением.
наверное, это сегодня пока что касается не всех, но реально когда мы говорим о стратегии на рынке ИИ — это про третью производную (скорость изменения ускорения вас по сравнению с ускорением конкурентов)
ценность от ИИ в бизнесе это не столько автоматизировать операционку, сколько постоянно, ежедневно генерировать альфу (стратегические инсайты, информацию, эксперименты, гипотезы, тесты, предложения), которая приводит к росту бизнеса.
вы не конкурируете со статикой - вы конкурируете с рынком, который развивается, и развитие этого рынка происходит с ускорением.
наверное, это сегодня пока что касается не всех, но реально когда мы говорим о стратегии на рынке ИИ — это про третью производную (скорость изменения ускорения вас по сравнению с ускорением конкурентов)