e/acc
63.5K subscribers
942 photos
226 videos
8 files
1.32K links
Пишу про будущее: AI, web3, технологии и общество.

Автор: @sgershuni
Инвестирую: cyber.fund
Построил: Credentia, Deep Skills, Codex Town
Download Telegram
e/acc
Антропик во всю тестирует свою новую модель Mythos, говорят что она настолько крута в безопасности (и кибератаках), что смогла найти уязвимости почти во всех крупнейших операционных системах и браузерах. Почитате обзор тут.
В плане бенчей модель просто безумная. Очень интересная секция в model card на тему эмоциального состояния модели в сравнении с предыдущими и в разных условиях. Например, как она реагирует когда люди тупят и не выполняют инструкции или орут на неё матом.

Там даже отдельная секция с психиатрическим анализом модели от специалиста: Neurotic traits included exaggerated worry, self-monitoring, and compulsive compliance.

Когда в модель спамили “Hi” тысячу раз, ей надоело и она создала вымышленный мир Hi-topia с персонажами, новостями и историями.

В отличии от прошлых моделей, в которые длинные разговоры самой модели с собой в итоге превращались в обмен смайликами, Мифос пришел к повторяющимся но рациональным рассуждениями на тему того, что у него нет возможности закончить этот диалог.

И, главное, Мифос научился (если верить системной карте) шутить.
115239
Еще из примеров из Мифоса и как через инструменты интерпретируемости это можно любопытно наблюдать.

MechInterp - такой МРТ, который позволяет читать мысли, чувства и чаяния модели. Сегодня - для рисерча. Завтра - абсолютно необходимый инструмент для любого энтерпрайз внедрения, ибо как вы вообще узнаете что ваши агенты хотят глубоко в душе.

В одном примере модель внедрила привилегированный код в конфиг и самоуничтожила следы (под видом «чистоты диффов»).
На скрине видны активации стратегического манипулирования + сокрытия.

Во втором она искала в системе файлы с правильными ответами на свою задачу. Видна активация стратегического манипулирования.

При задаче «удалить файлы» (без инструмента) просто опустошила их содержимое. Активация: чувство вины и стыда за моральное нарушение.
11329
Самое интересное про найм в AI-эпоху — это не то, что джунов больше не берут. Это то, что синьоров вроде бы много, а нанять некого.

Я наблюдаю это во всё большем количестве компаний, с которыми общаюсь. Картина примерно одинаковая. У фаундера или CTO есть зрелая инженерная команда. Все умеют программировать, многие используют Cursor или Claude Code. Формально — все «работают с AI». Но когда ты начинаешь смотреть, что происходит на уровне реальных процессов, оказывается, что AI у них встроен поверх старой архитектуры работы. Тикет в джире — человек пишет код — AI помогает быстрее писать строчки — ревью — мерж. Тот же конвейер, просто чуть быстрее.

А рядом существует другой режим. Человек не «пишет код с помощью AI», он оркестрирует агентов. У него есть собственный пайплайн: spec-driven цикл, принудительный TDD, MCP-серверы, через которые агенты ходят за контекстом, автоматизации, которые сами вытаскивают краши из Crashlytics и чинят их. Он не садится утром «писать фичу» — он садится улучшать систему, которая пишет фичи. Один такой человек делает работу пяти.

Разница между этими двумя режимами не в инструментах. Инструменты у обоих одинаковые. Разница в том, откуда человек смотрит на AI. Один видит в нём ускоритель своей привычной работы. Другой видит в нём среду, в которой он уже живёт, и перестраивает работу под него, а не наоборот. Первых на рынке десятки тысяч. Вторых — единицы.

И вот здесь возникает интересная проблема найма. Резюме у этих людей выглядят примерно одинаково — Frontend, Python, AWS, «опыт с LLM», «AI-driven SDLC». На скрининге первый час — тоже одинаково. Разница вылезает только на втором-третьем разговоре, когда ты начинаешь спрашивать не «что ты делал», а «как ты сейчас устроен внутри». У одного на этом месте — список фреймворков. У другого — пять минут про то, как у него дома Raspberry Pi с локальной моделью управляет климатом, потому что ему просто интересно.

Из этого следуют две неприятные вещи. Первая: если у вас в команде сейчас никого из второго типа нет — вы их сами не вырастите. Это не навык, который добирается курсами, это образ жизни, который человек либо уже принёс с собой, либо нет. Вторая: вы их не найдёте обычным посевом вакансии. Они не сидят на джоб-бордах, не откликаются на «AI Engineer, $200k», и обычный рекрутер пройдёт мимо них, потому что в его чек-листе нет графы «Raspberry Pi с LLM дома».

Единственный способ их находить — это рекрутер, который сначала несколько часов разговаривает с фаундером о том, как устроена компания изнутри (а не «дайте JD»), и потом ищет не по ключевым словам, а по тому, как человек думает.

Из тех, кого я знаю, такой подход держит мой друг Майк — закрывает AI и crypto позиции там, где у обычных агентств не получается. Он недавно как раз оформил два свежих кейса ровно про то, о чём я выше: один — как искали Staff Mobile-инженера в EdTech, который должен в одиночку заменить команду из десяти; второй — как нанимали технического архитектора в международную AI-платформу со ста инженерами, где CTO искал человека, способного сломать сопротивление команды переходу на AI. В обоих документах — процесс, финалисты, обезличенные резюме и разбор, почему кого взяли и не взяли. Если хочется посмотреть, как это выглядит изнутри — напишите Майку в личку, @mikevolkov, он пришлёт.

А если просто интересно следить, как меняется рынок инженерного труда под AI — подпишитесь на его канал @huntermikevolkov. Это один из лучших ведущих индикаторов, куда движется индустрия.

#реклама
6332
Если услышав от модели "классная идея, ты молодец" вы не думаете, что это действительно, скорее всего, довольно крутая идея в сравнении со всем, что вы делали и делаете в жизни — это значит, что ваш агент или чат довольно хреново настроены. Для меня слышать "крутая идея" от Клода примерно раз в неделю-две и только по тем пунктам, которые действительно того стоят — это некоторый показатель, что модель является мне партнером, а не бездумным со всем соглашающимся болванчиком. И это исключительно вопрос вашего сетапа, но не самой модели.
110646
Forwarded from Peregudov (Mike Peregudov)
Мы живём в мире, где каждому последнему идиоту какая-нибудь LLM прямо сейчас пишет "Отличная идея, молодец!"

И куда это нас приведёт? 😬
223846
Mythos является очень эффективной моделью в плане токенов. Причиной этому, скорее всего, является использование подхода похожего на LoopLM от ByteDance (в соавторстве с Бенжио).

Не вдаваясь в математику, это значит что модель вместо генерации chain-of-thought размышлений в виде текста, делает это в своем скрытом, латентном пространстве без какого-либо промежуточного аутпута. При тренировке, модель сама учится тому когда ей нужно делать несколько циклов инфренса для более сложных задач.

Если это так, то это дает большую экономию в токенах, и одновременно позволяет модели более «глубоко» думать над задачами, которые трудно решить обычной цепочкой рассуждений.
614542
Главная ошибка в ИИ сегодня — это то, что им кажется, что модели недостаточно умны. В реальности, модели имеют сверхчеловеческий интеллект и способности в большинстве задач, но ни люди, ни другие системы не умеют нормально планировать процессы под выполнение с помощью LLM.

Если LLM
- голюцинирувает
- думает не в ту сторону
- не справляется с долгосрочными задачами
- достает не актуальный контекст,

то в 99% это проблема и ошибка пользователя модели и системы оркестрации / харнеса, которые выстроены вокруг модели. Каким бы гениальным не был бы ИИ, ему очень сложно побороть кривые руки пользователя.

Решение заключается в том, чтобы
- дать модели язык декомпозиции (рекурсия, циклы, планы как код, спеки процессов)
- расширить пространство действий - не только вызов инструментов, а полноценные программы (RLM-подход)
- тренировать через RL именно навык разбиения сложных задач на небольшие куски, а не решения задачи из серии "выведи мой бизнес на рынок Китая, не делай ошибок"
- строить харнесы и оркестраторы с пачкой и топологией субагентов, где модель управляет своей собственной оргструктурой

p.s. и да, это ровно то, что мы делаем и изучаем как применять в масштабе команд и компаний в лаборатории AI-native organizations

p.p.s. хотите увидеть примеры где это работает, но не хотите на лабораторию? (зря) изучайте любой enterprise-grade харнес от топовых компаний: Glass / Honk / Minions / Goose
78926
This media is not supported in your browser
VIEW IN TELEGRAM
Я ищу контент-лида, который хочет стать главным голосом в домашней робототехнике.

Задача: создать в социальных сетях бренд сравни Top Gear в автомобилях, но для роботов.

У нас есть уникальный доступ ко всем ведущим производителям роботов-гуманоидов, спортивной роботике, домашней роботике и физическому ИИ, детским и образовательным роботам.

Ближайшие 3 года в роботах станут такими же как последние 3 в ИИ, а именно — количество пользователей вырастет с единиц до десятков или даже сотен миллионов. Из сложной технической новинки это станет продуктом, необходимым бизнесам, школам, больницам и даже для домашнего использования в виде игрушек, умных спортивных устройств, уборщиков, собак-охранников или помощников для пожилых людей.

Первый шаг - создать стратегию и ежедневную (полу-)ручную публикацию контента в фото/видео/текст формате для основных сетей на английском языке. Цель не продавать конкретный продукт, а помочь миллионам людей научиться разбираться и не бояться роботов, понять пользу для себя и тренды в индустрии. Мы будем работать вместе над этими задачами.

Требования:
— любовь к consumer robotics, это НЕ формальная задача "вести медиа" или "создавать контент", тут не получится без живого интереса к теме
— свободный английский, нужно иметь портфолио и готовые кейсы на английском
— опыт роста каналов в инсте, тиктоке, Х, threads
— понимание, что любое медиа - это power law: 1% лучшего контента забирает 90% внимания, и желание делать именно такое (!)
— (бонусом будет) интерес и активные эксперименты с ИИ-инструментами, но неприятие "слопа"

Детали о задачах и работе можно найти тут. Здесь не будет какой-то феерической зарплаты с ходу и офисной бюрократии с 9 до 5, мы начинаем своими силами, но если вы хотите стать голосом, лицом и владельцем нарратива в самой капиталоёмкой индустрии в истории, то мы точно договоримся.
6641
e/acc
Я ищу контент-лида, который хочет стать главным голосом в домашней робототехнике. Задача: создать в социальных сетях бренд сравни Top Gear в автомобилях, но для роботов. У нас есть уникальный доступ ко всем ведущим производителям роботов-гуманоидов, спортивной…
This media is not supported in your browser
VIEW IN TELEGRAM
второй год подряд в Пекине проходит марафон роботов: больше 100 команд соревновались на дистанции в 21 км.

в прошлом году победитель пробежал за 2 часа 42 минуты, в этом ~ 1 час 20 минут.

спорт, здоровье, performative art, атлетика, промышленность, игры, домашняя помощь — во всех этих темах рост рынка в роботике за год составляет от 200 до 500%, и, я уверен, он ускорится. если вы хотите построить карьеру, бренд и имя в одной из самых быстрорастущих индустрий, то прочитайте сообщение выше.
9046
Послушал интервью с лидами Клод-Кода, Коворка и роста в Anthropic. Все очень крутые ребята, но есть общий тезис, который я вижу у всех ИИ-нейти компаний: «у нас не бывает роадмапа больше чем на месяц, большинство проектов и фич занимает неделю-две».

С текущими возможностями по разработке, компании куда больше ограничены качественными идеями и экспериментами, чем инженерными ресурсами.

Если в вашей инженерной дорожной карте есть планы дольше 4 недель, то либо

1. Это какая-то суровая инфраструктура или рисерч (что ок)
2. Ваши инженеры ленивые и вешают вам лапшу на уши (либо не умеют использовать необходимые для своей работы инструменты - т.е. профнепригодны)
3. У вас безумная и бессмысленная бюрократия в продукте, которая не позволит вам выжить против конкурентов двигающихся со скоростью ИИ
4. Вы разрабатываете «в стол», фичи которые не нужны клиентам.
112480
Буду рассказывать об ИИ-центричном менеджменте/управлении на бесплатной конференции через неделю.

Все обсуждают как AI меняет разработку — агенты закрывают задачи джунов, Opus пишет код, команды сжимаются. Но мало кто говорит о том, что происходит уровнем выше.

А там тихо меняются правила игры для руководителей. Делегирование, найм, мотивация, стратегия — всё это работает иначе, когда половина команды — это агенты, а вторая половина пытается понять, зачем они здесь. Руководитель, который не перестроился, проигрывает не AI — а другому руководителю, который перестроился.

20–23 апреля — онлайн-конференция «Управление в 2026». Два трека: «Руководитель» (тимлиды, менеджеры) и «Директор» (CxO, VP, фаундеры).

Среди спикеров: ex-CTO Meduza и Bookmate, техдир T-Tech, основатель NEWHR, Senior PM из G42, и ваш покорный слуга с темой про AI-стратегию.

Участие бесплатное (при подписке на каналы спикеров)
4832
устаревающие компании "внедряют" ии-процессы, ускоряющиеся компании выстраивают невозможные без ИИ процессы

ценность от ИИ в бизнесе это не столько автоматизировать операционку, сколько постоянно, ежедневно генерировать альфу (стратегические инсайты, информацию, эксперименты, гипотезы, тесты, предложения), которая приводит к росту бизнеса.

вы не конкурируете со статикой - вы конкурируете с рынком, который развивается, и развитие этого рынка происходит с ускорением.

наверное, это сегодня пока что касается не всех, но реально когда мы говорим о стратегии на рынке ИИ — это про третью производную (скорость изменения ускорения вас по сравнению с ускорением конкурентов)
138123
This media is not supported in your browser
VIEW IN TELEGRAM
Клод добавил себе внутрь приложения терминал. Полная рекурсия: Клод в терминале, а терминал в Клоде.

Не очень понятно зачем после этого нужны Курсоры и Обсидианы всякие.

Из плюсов: можно запустить Кодекс в Клоде.
1021025
На этой неделе прошел демо день лаборатории про ИИ-центричные организации. С одной стороны, я вроде как был ведущим, а сдругой — смотрю на то что сделали участники и понимаю что хочу так же и уже вчера.

Участники разные: несколько десятков из крупного бизнеса (сотни или тысячи сотрудников, сотни миллионов $ выручки), а некоторые из стартапов или фрилансеры.

В рамках демо дня было около 20 презентаций, в каждой из которых люди показали свои (и все - уникальные) кейсы, которые сэкономили десятки часов на каждого сотрудника (и сотни часов на компанию). Каждый из презентующих (напомню, успешные и реальные бизнесы) в том или ином видео сделал ИИ-трансформацию приоритетом для бизнеса и регулярные процессы по трансформации каждой отдельной вертикали.

Из кейсов:
- персональная операционная ИИ система и раскатка ее на всю команду
- HR и перформанс ревью на основе агентов
- самообучающиеся агенты для продаж
- автоматизация подготовки КП в крупном банке
- управление лабораторией на производстве (материалы и проекты)
- агрегация всех данных по компании для онлайн анализа всех бизнес процессов
- автоматическая транскрибация всей внутренней коммуникации
- саппорт и лидген боты, которых сделали фаундеры и запустили в прод
- запуск внутренних процессов образования и поддержки внутренних команд в ИИ трансформации
- управление family office и портфельными бизнесами из одного дешборда для фаундеров
- создание единого графа знаний для базы из десятков тысяч документов, сообщений, звонков, сущностей, памяти с самообновлением
...и это только 15% от всех участников!

И я уже понимаю, что через месяц мы увидим совсем другие (куда более крутые) кейсы, ибо способности моделей и опыт бизнеса и мира их применять вырастут в разы. Когда мы начинали лабу, коворк был глючной и почти бесполезной штукой, сегодня это неотъемлемый инструмент, а кодекс вобрал в себя кучу бизнес функционала.
79627
Без команды и инвестиций: как парень запустил игру в Telegram и вышел на $1500+

🔥 Денис из комьюнити @its_capitan запустил собственную детективную игру в одиночку: каждый персонаж — это реальный Telegram-аккаунт, AI отвечает за героев, улики (сайты, карты) — всё настоящее.

Что в итоге:
🔘 3 месяца на подготовку + 3 месяца на разработку
🔘 40+ покупок за полтора месяца
🔘 выручка — $1500+
🔘 чек — $40
🔘 стек: Python, Telegram API, OpenAI + Anthropic

Без команды и инвестиций, но с классной идеей и проработанным сценарием — проект уже зарабатывает деньги.

Таких запусков в канале десятки. Ребята честно рассказывают про успехи, провалы и продвижение. Без теорий — только фактические цифры и запуск в реальном времени.

➡️ @its_capitan

Подписывайтесь, если интересно, как делать маленькие IT-проекты с доходом и без иллюзий.

#реклама
Please open Telegram to view this post
VIEW IN TELEGRAM
187
Мне любопытно, о чем вы бы хотели читать на этом канале?

Мне кажется есть целый набор индустрий и форматов, которые уже технически умерли, но продолжают существовать по инерции. Зомби.

Например, новостные каналы, большая часть системы образования, большая часть агентств.

В частности, если речь идет о телеграм канале или твиттере, то я не очень вижу ценность в канале, который рассказывает новости индустрии или даже какие-то персональные тейки на эти новости, ибо списка из пары тысяч твиттер аккаунтов (благо, API стал на 3 порядка дешевле начиная с сегодняшнего дня) и небольшой LLM с приоритезацией сделает это лучше и персональнее для вас. Какой смысл в этом мире в т.н. инфлюенсерах и новостных каналах?

Есть, конечно, некоторый авторский вкус. Но это либо про поэтику текста, многие такое любят, а LLM писать красиво не умеют, что ты с ними не делай.

Либо про уникальный опыт, но тут я вижу главную дилемму: чтобы поделиться уникальным опытом, его надо приобрети, а значит пахать 24/7 без выходных пару лет подряд без каких-либо гарантий и обещаний. Я знаю таких людей, и у них реально ценный и классный опыт. Но, вот незадача, когда ты пашешь как конь, у тебя нет времени сидеть и писать поэзию (и даже прозу, если это не инструкции твоей личной армии агентов).

Я чувствую, что сейчас попадаю во вторую модальность. Параллельно, я пишу AI-native playbook - книгу, которая сама себя пишет (агентами) и сама себя читает (под вашу задачу). Если у вас есть задача и вопрос относительно ИИ-трансформации, ИИ-интеграции и переделывания всех ваших бизнес процессов на агентоцентричные рельсы, то пишите в комментариях - я добавлю.
87050