e/acc
89K subscribers
515 photos
67 videos
6 files
844 links
Пишу про будущее: AI, web3, сетевые государства

Автор: @sgershuni

Principal в VC фонде cyber.fund
Фаундер Credentia, Deep Skills
Download Telegram
GPT: враг или друг?

От авторегрессивных трансформеров до AGI еще далеко, а вот тексты современные чатботы пишут складные. Вот, например, исследование с последнего ICML относительно использования LLM ревьюерами научных статей. Несколько выводов:

- 8-12% комментариев и ревью написано с помощью LLM (не просто для исправления грамматики, а прям целиком)
- в областях, далеких от NLP/ML, рост использования LLM есть но в разы меньше (то есть, адопшен еще не наступил)
- чем ближе дедлайн, тем больше используют LLM
- определить использование LLM сложно, все "GPT-детекторы" не работают, но авторы придумали свой метод, который не универсален, но работает сильно лучше для данного кейса

Мое мнение: писать тексты с помощью GPT/Claude — это моветон, это все сразу замечают и это во многом бесполезно. Но редктировать, брейнстормить, наговорить на ходу текст и попросить GPT сделать заметки — это как будто неизбежная часть любой писательской / рисерчерской деятельности.
В эту пятницу в 18:00 CET проведем прямой открытый эфир в телеграме с Максимом Кашулинским, журналистом, основателем Reminder Media.

Темой разговора будут изменения: как краткосрочные и технологические, так и долгосрочные, социальные. Так же сделаю небольшую презентацию статьи, над которой я сейчас работаю, посвященной "интернету интеллекта" — грубо говоря, сетевой модели взаимодействия с ИИ. На уровне интерфейса это гугл, который не отвечает, а выполняет задачу за вас. На уровне бекэнда это сеть сетей из агентов, нейронок и других моделей, которые по-умному связаны и маршрутирированы.

Встречаемся в канале e/acc в эту пятницу!
Forwarded from Igor Stepahin
TheGrandTimeline_2000h.png
2.9 MB
Привет! С разрешения @sgershuni хочу поделиться своим проектом. Я продуктовый дизайнер, в прошлом head of product design Gelato Network. Это историческое исследование и визуализация данных, моя попытка рассказать всю историю крипто в интересном формате.

Начал эту штуку 3 года назад по приколу, время от времени рисовал в стол, иногда забрасывал на месяца (таймлапс как “пруф-оф-ворк” https://youtu.be/lkVy6JzlyNY) и в итоге оно превратилось во что-то реально большое. Сейчас пока сижу без работы решил почистить проект и обернуть чтобы опубликовать текущий прогресс.

У меня там несколько слоёв информации: Люди, События на таймлайне, Периоды как гантт, динамика рынка BTC и ETH, а так же визуализация всех крупных Взломов, Краж и Скамов в видео гибрида bubble chart/swarm plot. Что-то уже в хорошо проработанном виде как периоды, цены и взлом, а где-то еще тонна ресерча впереди — в слое событий.

Сейчас это всё живет в Figma как открытый для всех файл где я продолжаю работу. Финальный формат, если минимум, то это так же статичный цифровой плакат + печатный физический “маленький” около 2 метров шириной и полноразмерный холст чтобы весь текст читался это около 8 метров, но это пока мечты и планы.

Делаю это абсолютно один и сейчас цель найти поддержку, спонсоров чтобы сфокусироваться на проекте еще на полгода-год и дотащить до релиза v.1.0. А в идеале еще и на разработку интерактивной версии а не просто статичной. Уже получил маленький грант от Lido что покрыло месяц работы, хороший знак.

Фигма https://www.figma.com/design/pENhenndHyIMwzW2LgKzNd/The-Grand-Timeline

Анонс в твиттере https://x.com/stepahin/status/1817961202913526038
Live stream scheduled for
Live stream started
Live stream finished (1 hour)
Об ИИ-институтах

В прошлую пятницу на стриме много говорили про интернет интеллекта и про интернет агентов. Представим, что мы уже в мире с сотнями миллионов автономных ИИ агентов, которые умеют выполнять полезную для людей работу, зарабатывать и тратить деньги, общаться и выстраивать процессы между друг другом. Здесь сам собой возникает вопрос о праве, этике и институтах: а как и благодаря чему будет обеспечиваться надёжность, предсказуемость и этичность того, чем эти агенты занимаются?

Важно: я тут еще не говорю про роботов, а ведь Илон Маск вчера в подкасте пообещал, что у нас уже очень скоро (мол, все готово, ждем поледних разрешений) будут миллиарды домашних универсальных прямоходящих роботов. И я тоже думаю, что их будет больше, чем сегодня автомобилей, ибо они более универсально полезны. Так вот, для ИИшек, которые ходят по улице и могут кинуть в тебя кирпич этот вопрос будет стоять еще важнее, но сегодня поговорим о строго цифровых агентах.

Начнем с модного папируса, в котором авторы показывают как ИИ-агенты могут научиться соблюдать нормы и регуляцию, а так же создавать свои собственные социальные институты. Без этого агенты не смогут эффективно и повсеметно встраиваться в кибернетическую экономику. Для этого авторы задизайнили Нормативный Модуль, который (а) учиться тому что можно можно, а что нельзя делать согласно нормам института, в котором они оперируют, и (б) выбирает действия, которые ненаказуемы или наказуемы, но цена наказания терпима.

Тут, кстати, Гугл показал в другой работе как децентрализованные ИИ-агенты могут учиться социальным нормам через публичные санкции/наказание: 20 агентов выращивают цифровые "яблоки" и взаимодействуют, записывая все социальные сигналы. У каждого есть доступ к "доске позора", куда он может публично написать чьи действия он не одобряет. В результате координация улучшилась, потому что агенты начали делать меньше действий, которые социально не одобрялись группой. Эта статья показывает, что общество агентов может само внутри себя обнаружить и устранить халявщиков и бездельников. Эх, вот бы людям так :)

Возвращаемся к нашему эксперменту. Разница с человеческим обществом в том, что у нас задачу наказания часто выполняет некоторый авторитет — закон, суд, государство, Бог. Авторы делают похожий сетап: много агентов, которые могут собирать разные фрукты (яблоки, бананы, апельсины и т.д.), несколько нормативных институтов которые создают правила. Сначала у агентов есть цель выращивать тот же тип растений, что остальные (то есть, кооперироваться), а так же "лидер", который решает за сообщество какой фрукт они выращивают в данной эпохе.

Два эксперимента: в первом случае агенты целенаправленно заточены не выоплнять указания лидера и активно его критиковать. В результате, действительно, почти никто не собирает тот фрукт, который указал лидер. Во втором же случае создается несколько институтов, которые являются авторитетными (то есть, агенты считают, что его санкции реально могут быть применены против них). Во втором случае авторы увидели куда более сильную кооперацию и согласованность поведения. В самой статье можете найти промты и точные результаты.
e/acc
В эту пятницу в 18:00 CET проведем прямой открытый эфир в телеграме с Максимом Кашулинским, журналистом, основателем Reminder Media. Темой разговора будут изменения: как краткосрочные и технологические, так и долгосрочные, социальные. Так же сделаю небольшую…
Запись опубликована здесь: https://www.youtube.com/watch?v=ZGv9-Da_wAI

- Будущее интернета и искусственного интеллекта
- Что такое агентная система и интернет интеллекта
- Как автоматизация процессов может сэкономить время и создать экономическую ценность
- Может ли создание такой системы может привести к потере работы для некоторых людей и появлению новых рабочих мест
- Как бизнес-модели могут развиваться и как они могут быть адаптированы к новым технологиям
- Как долго новые технологии будут выходить на рынок
- Цифровые двойники и их роль в будущем
- Создание компаний с искусственным интеллектом
- Существуют ли ограничения для создания искусственного интеллекта, который может обгонять человека в интеллектуальных способностях
- Как с помощью искусственного интеллекта может осуществляться манипулирование людьми
- Возможность оцифровки сознания и контроля над жизнью на Земле.
Еще одним инструментом координации для людей является система права. Несмотря на то, что классическое право не распространяется на автономных агентов как субъектов, несколько экспериментов показали что её можно воссоздать в цифровой и самоисполняемой форме.

Один из них расширил Voyager — популярного агента, который может автономно оперировать в игре Minecraft — до мультиагентной системы. В ней:
1. ИИ-агенты торгуются между собой, находя субъективно справедливые условия
2. Заключают формальный контракт в виде текста
3. Исполняют контракт для достижения собственной цели

Другая работа демонстрирует использование commitment devices ИИ-агентами для достижения кооперативного поведения в популярных теоретико-игровых задачках, типа дилеммы заключенного или максимизации сбора урожая (писал про это в прошлом посте).

А команда из MIT придумала формальный подход multi-agent RL, в котором эгоистичные агенты учатся решать социальные дилеммы через заключение контрактов. Тут доступен код их примеров для координации вокруг задач загрязнения (виртуальной) среды, трафика дорожного движения и управления общими ресурсами.

Наша портфельная компания выдала грант одним разработчикам подобной системы. Идея там состоит в создании агентов-участников рынка, которые умеют следовать правилам, заключать между собой контракты, а так же адаптироваться под рыночные условия и извлекать максимальную для себя пользу. Подход использует Agent Communication Language (ACL), созданный аж в 2001 году ровно для этих целей. Главное отличие в том, что за эти 20+ лет у нас появились агенты, способные к самостоятельному принятию решений, reasoning'у и интроспекции/рефлексии.
Интернет агентов

Постепенно действительно мультиагентные системы становятся реальностью. Не просто CrewAI/AugoGen, где одна и та же LLM запущена с разными промтами 10 раз, а действительно разные агенты с разным железом, моделями, инструментами и целями под капотом. Например, Alibaba сделали платформу на которой они в качестве эксперимента смогли запустить 20,000 таких агентов.

И в таком вот мире с миллиардами агентов (society of agents) ставится острым вопрос их координации, оркестрации, раутинга, поиска, коммуникации, платежей и даже кредита. Или, например, появится рынок контрактов (на блокчейне), которые ИИ-агенты используют между собой как шаблоны. А деривативы этих контрактов могут быть использованы как залог или актив в AI-native economic activity (сорямба, русский тут максимально чужд и неуместен).

Такой рынок будет использовать аналог AMM как инструмент покупки услуг и заключения контрактов. Агент предлагает работу, которую он может сделать согласно свой собственной кривой предложения, а сам факт покупки токена заключает цифровой контракт на её выполнение. Контракт может включать в себя санкции за невыполнение, процесс арбитража и страховку. Благодаря trustless природе блокчейна, вы можете собирать составной и сложный граф из контрактов с подрядчиками, чтобы выполнить более сложную задачу пользователя, с которой не в состоянии справиться одна модель/приложение/агент.

А работа по поиску оптимальной конфигурации, которая даст наиболее качественный, но дешевый результат пользователю — это некоторая новая форма AI-MEV сёрчинга. Ожидаю ярды баксов прямо вот в этом месте.
Почему агенты?

Во-первых, это эффективнее. Сеть агентов показывает результаты лучше, чем самая лучшая LLM. Архитектура Mixture of Agents показала 65,1% на Альпаке, тогда как сегодняшний лидер GPT-4o показывает только 57%. Эта статья (красивая, с картинками) показывает детальные бенчмарки сравнения использования SoTA LLMs с сетью агентов. Вторые выигрывают, причем часто даже оказываясь более выгодными при инференсе.

Как работает MoA?
1. Несколько "слоев" агентов, где каждый уровень состоит из нескольких LLM-агентов, которые улучшают ответы предыдущего уровня.
2. Агенты в MoA разделены на две роли: "предлагающие" (генерируют начальные ответы) и "агрегирующие" (синтезируют окончательный ответ).

Более того, увеличение количества уровней в целом увеличивает качество ответа. Однако, это делает систему медленее.

А в дополнение к этой идее, я наткнулся на концепт Роя Агентов. Фактически это формальный подход к представлению сети агентов как графа. Каждая нода графа — это вызов LLM, инструмент (поиск, код, API), а грани — это передача информации. В таком вот графовом виде можно представлять сложные мультиагентные системы с десятками, сотнями или даже тысячами шагов. В качестве иллюстрации к предыдущему посту я как раз приложил один из таких графов.

Идея и направление для будущего исследования (или создания миллиардного стартапа), если кому интересно: применить предсказания GNN (графовых нейронок) для автоматического создания оптимального графа агентов.
О самопочинении примусов агентов

На основе последних постов, уже думаю становится ясно какие мультиагентные системы нас ждут в ближайшем будущем: p2p или иерархические, распределенные, с высокой степенью разнообразия, протоколами для координации.

Однако, останется открытым вопрос того как мультиагентные системы могут гарантировать стабильностью и работоспособность в непредсказуемой и меняющейся среде. Для ответа на этот вопрос Microsoft подготовили эксперимент Autonomic Computing. В нем они показывают уровни автономности агентных систем с фокусом на саморегуляцию, само-управление и само-починение (self-healing).

В частности, интересным результатом эксперимента является классификация автономности саморегуляции агентов, подобно тому как есть уровни автономности самоуправляемых автомобилей.

Первый уровень — это следование инструкциям (промту), второй — автоматизация, третий — проактивная оптимизация, четвертый — поиск и исправление root cause (первопричины), пятый — полная автономность своей работы.
Увидел новость, что, мол, армия США тренирует робо-собак сбивать дронов. Установленный на робособаке автомат с абсолютной точностью, солидным компьютом на борту и в облаке, не спящий и не отвлекающийся (разве что на зарядку).

А в это время армия Китая занялась дронами, которые со стороны неотличимы от птиц (второе видео).

В чем вывод?

Банальный: роботы и ИИ, конечно, станут основой локальных тактических боевых действий. Особенно, по мере падения цены производства и роста точности в десятки и сотни раз.

Любопытный: технологии и только технологии являются причиной смены образа жизни, социального уклада, политических и экономических систем. Но этого недостаточно. Люди как любили ненавидеть и убивать друг друга палками и камнями, так и продолжают это делать, но теперь с computer vision, роботизированными войсками и ИИ-роями дронов.

А значит самый важный, сложный и потенциально самый impactful результат этой волны технологий лежит именно в инструментах координации людей. То, что не в состоянии решить биологическая нейронка и без чего дальнейший прогресс будет, но будет сильно медленнее и с сильно большим количеством драмы и воя в соцсетях.
Последнее время много думаю про мультиагентные системы. Очевидно, что они полезны для бизнеса и личной продуктивности за счет более эффективного решения более сложных задач по сравнению просто с моделями или отдельным ИИ-приложениями.

Но еще мне интересна тема симуляции ИИ-агентов. Вы наверняка помните игру из Стенформа с симуляцией жизни одного дня целой цфировой деревни, в которйо агенты взаимодействовали друг с другом, решали задачи, общались, выполняли ежедневные дела. С тех пор появилось с десяток подобных проектов, включая те, которые добавили ИИ-NPC в большие игры.

Для меня такой подход выглядит как:
1. цифровое бессмертие, ибо твой ИИ-агент может пережить тебя
2. киберсоциология, ибо так можно изучать поведение социальных систем с тысячами или миллионами ботов
3. игра, ибо это реалити-шоу с полным контролем симуляции
4. гемблинг, ибо это как фильм "крысиные бега", только с ботами
5. гейминг, ибо это форма сторителлинга

Вопрос в чат: а что сделали бы вы в формате мультиагентной социальной симуляции? Если это становится достаточно дешево и удобно, то какие вы бы сделали игры или полезные продукты?
В дополнение к этому посту: то, что я вижу все чаще сегодня — это большая автономность агентов. В первую очередь, это достигается через способность агента понять на каком шаге что-то пошло не так и самостоятельного исправления этой проблемы.

На картинке пример последнего релиза MultiOn, в котором как раз это реализовано. На каждом шаге агент перепроверяет себя и, если видит неконсистентность, откатывается на пару шагов назад и пробует другую стратегию.

Благодаря падению стоимости генерации токенов (в случае GPT с почти $100/миллион токенов год назад до единиц долларов за миллион токенов сегодня), такого рода функциональность становится доступной и экономически оправданной для большинства ИИ-агентов.

P.S. В течении месяца мы запустим нашу программу-акселератор (бесплатную) для всех, кто хочет делать агентов и ИИ-продукты. Ставьте синего пингвина, кто хочет участвовать!
AI хайп ушел?

Посмотришь на типично-классическую компанию, которая выделила $1-10 млн на «внедрение ИИ» и сразу кажется, что хайп ушел, а розы завяли.

Внедрения не окупили себя, потому что ИИ-ассистенты не могут заменить живых продавцов, хорошие программисты так же пишут код, а copilot это просто удобный автокомплит, чат-боты ошибаются и придумывают отсебятину.

Надежда на то, что «больше компьюта и данных решат AGI» растворилась, ибо скорость реального прироста последних моделей ходить и положительная, но замедляется. Разница между последними релизами это 1/10 по сравнению с релизами с такой же периодичностью, но год назад. Больше данных, может, и решили бы проблему, но откуда их взять, если каждую модель сегодня тренируют примерно на всех знаниях человечества и всем интернете.

На этом месте скептики-критики уже начали строить свои улюлюкающие комментарии. Мол, нет тут никакого рынка на $20 триллионов, да и вообще AGI отменяется.

Реальность же в том, что LLM сделали прорыв в одном классе задач, но это еще не AGI. Я считаю крайне низким шанс, что универсальные интеллектуальные системы могут быть построены только лишь на предсказании следующего токена. С другой стороны, нейросимвольный и агентский подход существенно дополняют языковые модели, давая им предсказуемость, анализируемость, достоверность, точность. Будет ли это последним шагом или только лишь следующим — мы не знаем.

При этом всем, возможности для создания технологий и продуктов в ИИ сейчас больше, чем когда-либо в истории. Это одна из самых больших для инвестиций областей. Те же агенты открывают рынки на сотни миллиардов, на которых будет место для сотен компаний.

Мораль в том, что если кто-то обещает вам решение всех проблем через покупку мемкоина или новый чатбот, то скорее всего вас обманывают. Но пузыри, завышенные ожидания тех кто не шарит, невежество масс — ничего из этого не отменит и не остановит прогресс.
Media is too big
VIEW IN TELEGRAM
Кстати, о возможностях для разработчиков.

Вот видео 8-летней девочки, которая за 10 минут самостоятельно сделала чат-бота с ИИ в вебе с помощью редактора Cursor. Просто общаясь с ним. У меня такой уровень владения CSS потребовал пару лет практики.