e/acc

Еще из примеров из Мифоса и как через инструменты интерпретируемости это можно любопытно наблюдать.

MechInterp - такой МРТ, который позволяет читать мысли, чувства и чаяния модели. Сегодня - для рисерча. Завтра - абсолютно необходимый инструмент для любого энтерпрайз внедрения, ибо как вы вообще узнаете что ваши агенты хотят глубоко в душе.

В одном примере модель внедрила привилегированный код в конфиг и самоуничтожила следы (под видом «чистоты диффов»).
На скрине видны активации стратегического манипулирования + сокрытия.

Во втором она искала в системе файлы с правильными ответами на свою задачу. Видна активация стратегического манипулирования.

При задаче «удалить файлы» (без инструмента) просто опустошила их содержимое. Активация: чувство вины и стыда за моральное нарушение.

112❤29

12.7K views06:16

e/acc

Самое интересное про найм в AI-эпоху — это не то, что джунов больше не берут. Это то, что синьоров вроде бы много, а нанять некого.

Я наблюдаю это во всё большем количестве компаний, с которыми общаюсь. Картина примерно одинаковая. У фаундера или CTO есть зрелая инженерная команда. Все умеют программировать, многие используют Cursor или Claude Code. Формально — все «работают с AI». Но когда ты начинаешь смотреть, что происходит на уровне реальных процессов, оказывается, что AI у них встроен поверх старой архитектуры работы. Тикет в джире — человек пишет код — AI помогает быстрее писать строчки — ревью — мерж. Тот же конвейер, просто чуть быстрее.

А рядом существует другой режим. Человек не «пишет код с помощью AI», он оркестрирует агентов. У него есть собственный пайплайн: spec-driven цикл, принудительный TDD, MCP-серверы, через которые агенты ходят за контекстом, автоматизации, которые сами вытаскивают краши из Crashlytics и чинят их. Он не садится утром «писать фичу» — он садится улучшать систему, которая пишет фичи. Один такой человек делает работу пяти.

Разница между этими двумя режимами не в инструментах. Инструменты у обоих одинаковые. Разница в том, откуда человек смотрит на AI. Один видит в нём ускоритель своей привычной работы. Другой видит в нём среду, в которой он уже живёт, и перестраивает работу под него, а не наоборот. Первых на рынке десятки тысяч. Вторых — единицы.

И вот здесь возникает интересная проблема найма. Резюме у этих людей выглядят примерно одинаково — Frontend, Python, AWS, «опыт с LLM», «AI-driven SDLC». На скрининге первый час — тоже одинаково. Разница вылезает только на втором-третьем разговоре, когда ты начинаешь спрашивать не «что ты делал», а «как ты сейчас устроен внутри». У одного на этом месте — список фреймворков. У другого — пять минут про то, как у него дома Raspberry Pi с локальной моделью управляет климатом, потому что ему просто интересно.

Из этого следуют две неприятные вещи. Первая: если у вас в команде сейчас никого из второго типа нет — вы их сами не вырастите. Это не навык, который добирается курсами, это образ жизни, который человек либо уже принёс с собой, либо нет. Вторая: вы их не найдёте обычным посевом вакансии. Они не сидят на джоб-бордах, не откликаются на «AI Engineer, $200k», и обычный рекрутер пройдёт мимо них, потому что в его чек-листе нет графы «Raspberry Pi с LLM дома».

Единственный способ их находить — это рекрутер, который сначала несколько часов разговаривает с фаундером о том, как устроена компания изнутри (а не «дайте JD»), и потом ищет не по ключевым словам, а по тому, как человек думает.

Из тех, кого я знаю, такой подход держит мой друг Майк — закрывает AI и crypto позиции там, где у обычных агентств не получается. Он недавно как раз оформил два свежих кейса ровно про то, о чём я выше: один — как искали Staff Mobile-инженера в EdTech, который должен в одиночку заменить команду из десяти; второй — как нанимали технического архитектора в международную AI-платформу со ста инженерами, где CTO искал человека, способного сломать сопротивление команды переходу на AI. В обоих документах — процесс, финалисты, обезличенные резюме и разбор, почему кого взяли и не взяли. Если хочется посмотреть, как это выглядит изнутри — напишите Майку в личку, @mikevolkov, он пришлёт.

А если просто интересно следить, как меняется рынок инженерного труда под AI — подпишитесь на его канал @huntermikevolkov. Это один из лучших ведущих индикаторов, куда движется индустрия.

#реклама

Mike | IT Recruitment Expert

Best IT recruiter. Hard, executive hiring. I'll save your time and nerves, and grow your business. Superpowers for satisfied clients.

❤5732

12K views07:05

e/acc

Если услышав от модели "классная идея, ты молодец" вы не думаете, что это действительно, скорее всего, довольно крутая идея в сравнении со всем, что вы делали и делаете в жизни — это значит, что ваш агент или чат довольно хреново настроены. Для меня слышать "крутая идея" от Клода примерно раз в неделю-две и только по тем пунктам, которые действительно того стоят — это некоторый показатель, что модель является мне партнером, а не бездумным со всем соглашающимся болванчиком. И это исключительно вопрос вашего сетапа, но не самой модели.

1102❤45

11.7K views14:27

e/acc

Forwarded from Peregudov (Mike Peregudov)

Мы живём в мире, где каждому последнему идиоту какая-нибудь LLM прямо сейчас пишет "Отличная идея, молодец!"

И куда это нас приведёт? 😬

223344

11.2K views14:27

e/acc

Mythos является очень эффективной моделью в плане токенов. Причиной этому, скорее всего, является использование подхода похожего на LoopLM от ByteDance (в соавторстве с Бенжио).

Не вдаваясь в математику, это значит что модель вместо генерации chain-of-thought размышлений в виде текста, делает это в своем скрытом, латентном пространстве без какого-либо промежуточного аутпута. При тренировке, модель сама учится тому когда ей нужно делать несколько циклов инфренса для более сложных задач.

Если это так, то это дает большую экономию в токенах, и одновременно позволяет модели более «глубоко» думать над задачами, которые трудно решить обычной цепочкой рассуждений.

6141❤42

10.3K views11:11

e/acc

Главная ошибка в ИИ сегодня — это то, что им кажется, что модели недостаточно умны. В реальности, модели имеют сверхчеловеческий интеллект и способности в большинстве задач, но ни люди, ни другие системы не умеют нормально планировать процессы под выполнение с помощью LLM.

Если LLM
- голюцинирувает
- думает не в ту сторону
- не справляется с долгосрочными задачами
- достает не актуальный контекст,

то в 99% это проблема и ошибка пользователя модели и системы оркестрации / харнеса, которые выстроены вокруг модели. Каким бы гениальным не был бы ИИ, ему очень сложно побороть кривые руки пользователя.

Решение заключается в том, чтобы
- дать модели язык декомпозиции (рекурсия, циклы, планы как код, спеки процессов)
- расширить пространство действий - не только вызов инструментов, а полноценные программы (RLM-подход)
- тренировать через RL именно навык разбиения сложных задач на небольшие куски, а не решения задачи из серии "выведи мой бизнес на рынок Китая, не делай ошибок"
- строить харнесы и оркестраторы с пачкой и топологией субагентов, где модель управляет своей собственной оргструктурой

p.s. и да, это ровно то, что мы делаем и изучаем как применять в масштабе команд и компаний в лаборатории AI-native organizations

p.p.s. хотите увидеть примеры где это работает, но не хотите на лабораторию? (зря) изучайте любой enterprise-grade харнес от топовых компаний: Glass / Honk / Minions / Goose

7❤8526

10.2K viewsedited 12:17

e/acc

0:18

This media is not supported in your browser

VIEW IN TELEGRAM

Я ищу контент-лида, который хочет стать главным голосом в домашней робототехнике.

Задача: создать в социальных сетях бренд сравни Top Gear в автомобилях, но для роботов.

У нас есть уникальный доступ ко всем ведущим производителям роботов-гуманоидов, спортивной роботике, домашней роботике и физическому ИИ, детским и образовательным роботам.

Ближайшие 3 года в роботах станут такими же как последние 3 в ИИ, а именно — количество пользователей вырастет с единиц до десятков или даже сотен миллионов. Из сложной технической новинки это станет продуктом, необходимым бизнесам, школам, больницам и даже для домашнего использования в виде игрушек, умных спортивных устройств, уборщиков, собак-охранников или помощников для пожилых людей.

Первый шаг - создать стратегию и ежедневную (полу-)ручную публикацию контента в фото/видео/текст формате для основных сетей на английском языке. Цель не продавать конкретный продукт, а помочь миллионам людей научиться разбираться и не бояться роботов, понять пользу для себя и тренды в индустрии. Мы будем работать вместе над этими задачами.

Требования:
— любовь к consumer robotics, это НЕ формальная задача "вести медиа" или "создавать контент", тут не получится без живого интереса к теме
— свободный английский, нужно иметь портфолио и готовые кейсы на английском
— опыт роста каналов в инсте, тиктоке, Х, threads
— понимание, что любое медиа - это power law: 1% лучшего контента забирает 90% внимания, и желание делать именно такое (!)
— (бонусом будет) интерес и активные эксперименты с ИИ-инструментами, но неприятие "слопа"

Детали о задачах и работе можно найти тут. Здесь не будет какой-то феерической зарплаты с ходу и офисной бюрократии с 9 до 5, мы начинаем своими силами, но если вы хотите стать голосом, лицом и владельцем нарратива в самой капиталоёмкой индустрии в истории, то мы точно договоримся.

62❤37

8.41K viewsedited 07:42

e/acc

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

второй год подряд в Пекине проходит марафон роботов: больше 100 команд соревновались на дистанции в 21 км.

в прошлом году победитель пробежал за 2 часа 42 минуты, в этом ~ 1 час 20 минут.

спорт, здоровье, performative art, атлетика, промышленность, игры, домашняя помощь — во всех этих темах рост рынка в роботике за год составляет от 200 до 500%, и, я уверен, он ускорится. если вы хотите построить карьеру, бренд и имя в одной из самых быстрорастущих индустрий, то прочитайте сообщение выше.

80❤43

10.3K viewsedited 11:23

e/acc

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

А вот как это выглядело год назад, для сравнения (и для иллюстрации тезиса о том почему это один из самых перспективных рынков сегодня)

❤3913

7.5K views06:32

e/acc

Послушал интервью с лидами Клод-Кода, Коворка и роста в Anthropic. Все очень крутые ребята, но есть общий тезис, который я вижу у всех ИИ-нейти компаний: «у нас не бывает роадмапа больше чем на месяц, большинство проектов и фич занимает неделю-две».

С текущими возможностями по разработке, компании куда больше ограничены качественными идеями и экспериментами, чем инженерными ресурсами.

Если в вашей инженерной дорожной карте есть планы дольше 4 недель, то либо

1. Это какая-то суровая инфраструктура или рисерч (что ок)
2. Ваши инженеры ленивые и вешают вам лапшу на уши (либо не умеют использовать необходимые для своей работы инструменты - т.е. профнепригодны)
3. У вас безумная и бессмысленная бюрократия в продукте, которая не позволит вам выжить против конкурентов двигающихся со скоростью ИИ
4. Вы разрабатываете «в стол», фичи которые не нужны клиентам.

1104❤72

8.11K viewsedited 07:21

e/acc

Буду рассказывать об ИИ-центричном менеджменте/управлении на бесплатной конференции через неделю.

Все обсуждают как AI меняет разработку — агенты закрывают задачи джунов, Opus пишет код, команды сжимаются. Но мало кто говорит о том, что происходит уровнем выше.

А там тихо меняются правила игры для руководителей. Делегирование, найм, мотивация, стратегия — всё это работает иначе, когда половина команды — это агенты, а вторая половина пытается понять, зачем они здесь. Руководитель, который не перестроился, проигрывает не AI — а другому руководителю, который перестроился.

20–23 апреля — онлайн-конференция «Управление в 2026». Два трека: «Руководитель» (тимлиды, менеджеры) и «Директор» (CxO, VP, фаундеры).

Среди спикеров: ex-CTO Meduza и Bookmate, техдир T-Tech, основатель NEWHR, Senior PM из G42, и ваш покорный слуга с темой про AI-стратегию.

Участие бесплатное (при подписке на каналы спикеров)

❤3324

5.47K views11:25

e/acc

устаревающие компании "внедряют" ии-процессы, ускоряющиеся компании выстраивают невозможные без ИИ процессы

ценность от ИИ в бизнесе это не столько автоматизировать операционку, сколько постоянно, ежедневно генерировать альфу (стратегические инсайты, информацию, эксперименты, гипотезы, тесты, предложения), которая приводит к росту бизнеса.

вы не конкурируете со статикой - вы конкурируете с рынком, который развивается, и развитие этого рынка происходит с ускорением.

наверное, это сегодня пока что касается не всех, но реально когда мы говорим о стратегии на рынке ИИ — это про третью производную (скорость изменения ускорения вас по сравнению с ускорением конкурентов)

4513

4.36K viewsedited 13:06

About

Blog

Apps

Platform