Малоизвестное интересное
64.8K subscribers
96 photos
1 video
11 files
1.8K links
Авторский канал Сергея Карелова о самом важном на фронтирах науки и технологий, что кардинально изменит людей и общество в ближайшие 10 лет.




Рекламы, ВП и т.п. в канале нет.
Пишите на @karelovs
Download Telegram
Полуживые роботы уже на подходе.

Люди привыкли считать, что робот не может быть живым (иначе это уже иное живое существо). А т.к. изготавливать живых существ мы пока не умеем, то и нечего пока говорить о живых роботах.
Однако, такое умозаключение ошибочно. Живые роботы уже на подходе. Точнее, их 1е поколение – полуживые роботы (ПЖРы).

ПЖР – это робот, не обладающий возможностями к размножению и эволюции, однако способный наращивать свои адаптационные возможности, физически развивая свое искусственное тело, используя для этого подручные материалы.
Иначе говоря, ПЖРы растут и развиваются в течение жизни. А поскольку жить ПЖР может сильно долго (а по человеческим меркам и бесконечно), получается, что ПЖРу размножение и эволюция не нужны. Достаточно умения расти.
И, следовательно, такой ПЖР становится уже не полуживым, а живым существом, не нуждающимся в размножении и эволюции и эволюционирующим в течение своей бесконечной жизни.

Вышеприведенные соображения – не плод фантазии. Направление исследований по созданию растущих роботов (исследователи побаиваются использовать определения типа ПЖР) бурно развивается.
Только что вышедший фундаментальный обзор «На пути к растущим роботам: историческая эволюция сотовой и растительной робототехники» https://goo.gl/mRAaNr помогает понять состояние и перспективы ПЖРов.

Попробую отжать сухой остаток обзора, который я вам рекомендую хотя бы пролистать, просмотрев отличные иллюстрации типа этой https://goo.gl/3fzwCL, сравнивающей биомодели человека и ПЖРа.

1) Есть разные подходы к решению задачи морфологической адаптации искусственных систем, например, самосборка, самоперестраиваемость, эволюция виртуальных существ и т.д.

2) В обзоре рассмотрены основные вехи развития ПЖРов, начиная с оригинальной концепции авторепликационного автомата и заканчивая новейшими концепциями, навеянными растениями (типа саморазвивающихся мягких роботов, способных двигаться, выращивая и строя свою корневую систему путем использования аддитивных технологий https://goo.gl/hJXXTw - правда ведь круто!).

3) Рассмотрено 1е поколение ПЖРов – сотовые роботы, – описанные еще у Лема в «Непобедимом». Это что-то типа роя простых или примитивных интеллектов (типа социальных насекомых), организующихся в группы или сообщества для координации и сотрудничества. Они реализуют концепцию динамической реконфигурации и могут взаимодействовать друг с другом, автоматически подключаясь и отключаясь, образуя единый модуль (типа ткани в нашем понимании), а несколько модулей собираются для создания единого ПЖРа.
4) Рассмотрено 2е поколение – молекулярных роботов, – вдохновленных полимеризацией молекул при образовании ДНК. Они основаны на броуновском движении, не способны на активное отключение, но приобретают функционализацию после установления связи, что приводит к образованию сборок, трактуемых как рост.
5) Помимо молекулярных роботов, позволяющих «печатать» 2D и 3D модули ПЖРов размером до 10х10х10 см, существуют клеткоподобные и организмоподобные ПЖРы, позволяющие «печатать» модули размером, соответственно, до 26 см и 50 см по одной из 3D координат (см. https://goo.gl/tyeUeF)
6) Также рассмотрено 3е поколение – гибридных ПЖРов, – лежащих на границе между роевым роботом и самомонтирующимся мобильным роботом.
7) Ну и самое крутое 4е поколение организмоподобных ПЖРов, вдохновленных стратегиями роста грибов и растений. В отличие от клеткоподобных ПЖРов, организмоподобные ПЖРы включают в себя одномодульные системы, которые могут постепенно добавлять материал в определенные области своего тела.

За резюме отправляю вас к обзору (из него слова не выкинешь).

От себя добавлю. Пока люди будут спорить, чем отличаются искусственный и естественный интеллекты, само понятие искусственности может исчезнуть, поскольку изменятся понятия живых существ, их эволюции и самой жизни. И все это из-за ПЖРов.

#Роботы
Самодельный робот-собачка за $1K – предвестник революции роботов
Многие считают, что техно-революции происходят при скачкообразном росте возможностей продуктов новых технологий. Однако, на самом деле, это совсем не так.
Техно-революции происходят при скачкообразном снижении цен на такие продукты. Персоналки, лаптопы, айподы, айпады, айфоны и т.п., к моменту их превращения в массовый продукт, обладали возможностями (функционалом), придуманными и реализованными за годы до этого.
Но вот бах – цена на гаджет вдруг резко упала … И началась очередная техно-революция.

С роботами все произойдет ровно так же.
Как ни чаруют нас пируэты, выписываемые четвероногими роботами, типа SpotMini и RHex от Boston Dynamics, но никому даже не приходит в голову говорить о техно-революции, пока эти «песики» стоят как хорошее авто.
А за сколько бы вы купили себе механического четвероногого друга, способного выполнять широчайший набор функций – от антидепрессанта до поводыря?

Исследователи из Центра киберфизических систем, IISc, Бангалор, Индия, совершили прорыв, создав робота-собачку за $1K. Его зовут Stoch (на русском имя надо менять во избежание ассоциации «чтоб ты stoch»).
Помимо главного отличия – цены, в 30 раз ниже всех подобных роботов, этот песик размером с болонку:
- собирается, подобно мебели IKEA из набора стандартных деталей, часть из которых печатается на 3D принтере;
- способен бегать разными аллюрами (рысь, галоп, …) без всякого там Глубокого Обучения, и даже без датчиков обратной связи.

Т.е. ни тебе больших данных, ни высокой вычислительной производительности, ничего дорого и сложного. Всего-то 4 ноги с сегментами по 120 мм и суставами, гнущимися под 45 и 70 градусов со скоростью 461 градус в сек. Да по сервомоторчику 16W на каждую ногу. Да одна плата Raspberry Pi 3b, рассчитывающая с помощью системы нелинейных дифф-уравнений координаты, которые затем используются для генерации углов соединения посредством обратной кинематики. И всё!
А бегает и скачет собачка вполне приемлемо. И когда ей добавят несколько датчиков обратной связи будет хоть вальс танцевать, хоть на задних лапках служить.

И учтите, будучи запущенной в серию, даже с учетом украшения собачки пушистой шкурой с хвостом, цена собачки будет не дороже смартфона.
А значит революция роботов начинается.

• 2 минутное видео про Stoch (конструкция, принцип работы и живое бегание) https://www.youtube.com/watch?v=Wxx9pwwTIL4&feature=youtu.be
• Исчерпывающая авторская статья про Stoch https://arxiv.org/abs/1901.00697
#Роботы
Только представьте эту картину не слишком отдаленного будущего.
Роботизированные катера патрулируют океаны, выпуская подводные глайдеры для сбора информации об окружающей среде, и служа базой для дронов, управляющих глайдерами, собирающих их на роботизированные катера, а также служащих своего рода распределенной в воздухе антенной для ретрансляции радио сигналов между катерами и глайдерами.
А теперь представьте, что люди смогут сделать с помощью таких систем.
Это будет новый дивный OceanWorld, полный роботов, чувствующих и мгновенно реагирующих на легчайшие колебания в окружающей среде и тем самым позволяющий человечеству решать немыслимые раньше задачи.

Читать мой новый пост (в продолжение и прояснение предыдущего поста про робота-собачку) на 4 мин.:
- на Medium https://goo.gl/SE2cWX
- на Яндекс Дзен https://clck.ru/FG4oz
#Роботы
Роботы уже меняют нашу мораль.
В нас растут жестокость к людям и непреодолимая тяга к
роботам.
Нагрузить вас перед уикендом сразу двумя крутыми исследованиями было бы не гуманно. Но исследования реально крутые и очень интересные. А фишка в том, что нужно их читать параллельно.
Но нам повезло. На помощь пришла Sigal Samuel, опубликовав в Vox синтетический анализ обоих исследований: популярным языком и со всеми полезными ссылками.
Мне же остается лишь сделать для вас наводку на резкость в этой теме.

Суть в том, что под влиянием роботов люди уже начали меняться. Причем, не в лучшую сторону и с ускорением.
1) Мы становимся более нетерпимыми и даже жестокими, перенося вседозволенность по отношению к роботам на людей.
2) Мы неуклонно движемся к тому, чтобы всюду, где это будет возможным, предпочитать общение с роботами, вместо людей (от кол-центра до постели)

Новое исследование Embodiment into a robot increases its acceptability – прорывное. Впервые экспериментально доказали, что процесс роста нашей жестокости к роботам можно остановить, и даже повернуть вспять.
Для этого оказывается достаточным:
А) начать видеть мир глазами робота;
Б) в буквальном смысле, влезть в его шкуру (то бишь, тело).
Изумительная выдумка авторов исследования сработала. Достаточно, надев VR очки и посмотрев на себя в зеркале, увидеть там Чудо-юдо Ужасное, как мы начинаем проникаться в нему симпатией и всяческой толерантностью. Короче, перечитайте «Превращение» Кафки и только представьте, насколько проще было бы семье Грегора Замза смириться с его новым гадким видом, имей они тогда VR очки с хорошим софтом.

Второе исследование Social Robots and Empathy: The Harmful Effects of Always Getting What We Want показывает, что сопереживание роботам может снижать нашу эмпатию к людям. Роботы устраняют для нас необходимость сопереживать другим людям, предоставляя нам возможность получать от роботов ровно то, что мы хотим (и как хотим) без каких-либо компромиссов.
Не поленитесь сходить и по иллюстративным ссылкам. Например, про китайское приложение Love and Producer, на которое в Поднебесной подсели уже миллионы женщин. И всего-то дел, - простенький симулятор свиданий с четырьмя мужчинами, с которыми можно развивать отношения по ходу сюжета игры. Плюс чуть-чуть мистики и немного фэнтези... И вот уже дамы берут смартфон в постель, предпочитая сладкоголосого виртуального героя мужу.

Прочтите пятиминутный пост Sigal Samuel
https://www.vox.com/future-perfect/2019/8/2/20746236/ai-robot-empathy-ethics-racism-gender-bias
А уж пойти ли по многочисленным приведенным там ссылкам, решите по ходу.

P.S. И вся эта гадость по отношению к виртуальным персонажам и роботам начинает проявляться в людях лишь после 30 месячного возраста. А до того матушка-природа уберегла, - нет в малых детях никакой тяги к виртуалам. Малышам нужны лишь живые люди. Получается, что первые 30 месяцев жизни дети всё еще пребывают как бы в раю. Ну а потом искушения е-культуры берут своё
https://news.vanderbilt.edu/2019/07/31/toddler-brains-resist-learning-from-screens-even-video-chat/

#Роботы #Эмпатия #Мораль
​​ИИ – это Инопланетный Интеллект.
Но сделана 1я попытка превратить его в земной.

Интеллект Чужого (Alien) кардинально отличается от интеллекта любого земного существа от мыши до человека.
Например, интеллект «чужих» трисоляриан из трилогии Лю Цысиня стал принципиально иным, чем земной, из-за иной системы коммуникаций между особями – чтение мыслей, точнее, образов и их экзограмм. Это привело к формированию интеллекта, в котором отсутствует ложь. Кстати, подобный интеллект есть и на нашей планете. Но он не земной, а водный. Это дельфины, читающие мысли друг друга и потому не знающие лжи. Но про это как-нибудь в следующий раз.

Вот понятный пример, показывающий принципиальное отличие ИИ от интеллекта человека или мыши – ориентация и навигация в пространстве.

ИИ навигаторов в этом столь же преуспел, как и в настольных играх. Ориентироваться в городских пробках и прокладывать оптимальные маршруты он умеет лучше любого из нас. Однако:
- он делает это совсем иначе, чем мы;
- мы имеем в голове (1) модель пространства, (2) модель своего тела и его возможностей, (3) оптимизатор достижения целей с учетом 1 и 2;
- ИИ навигатора имеет в «голове» 1 и 3. Но 2 – абсолютно иной. Это море данных о движении многих тысяч авто по модели пространства.
При этом, ИИ навигатор не может решить, можно ли убрать с дороги легкое препятствие или перепрыгнуть небольшую канаву.
Из-за этой разницы, в вопросах навигации наш интеллект (или мыши) – универсальный земной. А ИИ навигатора – специализированный неземной.

Т.е. человек или мышь могут решать любую задачу о прокладывании маршрута из А в Б.
Например, при движении по комнате, где нужно огибать неустранимые препятствия (типа шкафа) и убирать или преодолевать устранимые (типа стула или фикуса). И в целом, соизмерять свои возможности с динамикой перемещения в конкретном физическом пространстве (см. рис.)
А ИИ навигатор этого не может.

Но что если вложить в голову ИИ навигатору нового поколения 3х мерную модель пространства и модель его тела и его возможностей?
Ведь это будет заветный мост между роботами и ИИ. Мост, которого почти нет. А есть лишь убогие «веревочные лестницы» через пропасть.

Роботы-собачки от Boston Dynamics или «луноход» робота-курьера Яндекса способны огибать препятствия, но у них все еще нет возможностей для универсальной ориентации и навигации в пространстве. Они неспособны сами воссоздавать в своей «голове» модель пространства и, зная возможности своего «тела», находить оптимальный маршрут передвижения к цели.

Попыткой решить эту задачу стал «Интерактивный Гибсон» - навигатор/оптимизатор интерактивной навигации в загроможденных средах. Его работа основана на нахождении компромисса между эффективностью пути навигации и возможными нарушениями положения окружающих объектов.
Сначала его научили «земному» способу навигации в виртуальных пространствах с учетом физических взаимодействий со средой. Теперь на очереди материальная физическая среда.
https://arxiv.org/abs/1910.14442

Как сказал по этому поводу Джек Кларк - «миры робототехники и ИИ становятся все более и более смешанными. Вопрос на $1 триллион состоит в том, в какой момент обе технологии объединятся, разовьются и дадут возможности, превышающие сумму их частей».
#ИИ #Роботы
Это может быть революцией роботов.
За которой маячит революция AGI.
Проясняется, на что рассчитывает DeepMind, прожигая миллиарды. И честно говоря, задача того стоит. Это действительно ИИ общего назначения (AGI). Собственно, руководство DeepMind этого и не скрывало. Но вот как они планируют этого добиться, было непонятно. А теперь проясняется.

Стратегическая логика здесь такова.
1) AGI должен быть воплощенным.
Значит полагаться только на алгоритмы настольных и компьютерных игр (всякие там AlphaGo, Alphazero … ) нет смысла.
2) Значит речь о роботах, материализованных и действующих в физическом мире.
3) Первейший ключевой навык для робота – движение (сенсорно-моторные навыки, направленные на достижения цели). И главный фокус здесь в том, чтобы для обучения движению роботу не требовалось море данных, как это принято у алгоритмов типа Alphazero. Надо чтобы робот попробовал некое разумное число раз, - и научился.
4) Но движение бывает разное. Для муравья, воробья и карася – это совсем не одно и то же (разные среды). Более того: для сухопутных паука, червяка и барсука– это тоже совсем не одно и то же (разные способы и механизмы движения).
Значит нужно, чтобы робот мог самостоятельно учиться УНИВЕРСАЛЬНОМУ движению.
5) Что потом? Да понятно что. Ведь из примитивов универсального движения, возможно, и складывается механизм мышления. И значит, второе может быть получено на основе первого.

К реализации п. 3 DeepMind приступил 2 года назад, создав новую парадигму обучения — Scheduled Auxiliary Control или SAC-X (запланированное вспомогательное управление). Подробней см. здесь.
Парадигма SAC-X основана на идее, что для выполнения сложных задач ИИ должен сначала научиться исследовать доступную зону и овладеть набором базовых навыков.

С реализацией п. 4 связана опубликованная на днях работа «Towards General and Autonomous Learning of Core Skills: A Case Study in Locomotion». В ней на основе SAC-X предложено универсальное решение управления моторикой непосредственно из исходных сенсорных входов. DeepMind разработал систему обучения, которая может учиться сложному поведению локомоции для широкого спектра N-ногих роботов, таких как двуногие, трехногие, четвероногие, шестиногие … включая колесные варианты (см. приложенное видео)
DeepMind сделал это, не изменив функции вознаграждения для разных роботов. Их подход позволяет научиться управлять новыми роботами всего за пару часов. Суть подхода в том, что он многозадачен: эффективнее пытаться учиться сразу нескольким навыкам, а не учиться им последовательно.

Если новый подход DeepMind взлетит, - это будет революция в мире роботов.
Ну а дальше будут пытаться реализовать п.5.
Благо зацепки, как из примитивов универсального движения эволюционно получить примитивы мышления уже есть. И хотя это было пока что сделано только для дельфинов (для их локомоции в водной среде), но и с универсальным движением может получиться.
И тогда случится революция AGI.

#Роботы #AGI
Проект имени предводителя всех медиумов планеты позволит людям преодолеть «зловещую долину».
Сегодня во WEEKEND VIDEO новый ролик о реалистичном роботе-гуманоиде Ameca компании Engineered Arts, который уже довел до кипения споры экспертов вокруг этого проекта.
• Его сторонники восхищаются тем, что Ameca теперь не только очень похоже имитирует мимику, жесты и даже «кокетство» людей, но первым среди роботов-гуманоидов, обрел «чувство собственного пространства». Совсем недавно об имитации подобных «чувств» у роботов не было и речи. Они лишь, подобно Софии (Sophia) бесстрастно вещали человеческим голосом, не вызывая у видящих их людей ничего, кроме снисходительной улыбки. Ameca же, как признаются его разработчики, уже начинает своей реалистичностью их самих пугать… Эта имитация действует уже на уровне подсознания людей.
• Противники же проекта продолжают настаивать на его, якобы, бессмысленности. Мол, кому и зачем нужны такие человекоподобный роботы, кроме как с понтом народ удивлять на выставках и шоу?

Но все не так просто, ибо у Engineered Arts есть сверхзадача, о которой они пока публично не говорят (но есть шанс, что объявят в январе на CES 2022).

Дело в том, что компания намерена совершить прорыв в робототехнике – найти способ обхода «зловещей долины».

Согласно гипотезы "зловещей долины" японского робототехника Масахиро Мори, робот-гуманоид, выглядящий и действующий почти как человек, вызывает отвращение у людей.
Казалось бы, чем больше робот похож на человека, тем симпатичнее он должен казаться людям. Но оказывается, что так происходит до определенной границы, за которой провал в симпатиях людей - "зловещая долина" с зомби, трупами и отвращением к протезам частей человеческого тела. То есть гуманоид, выглядящий почти как человек, но подсознательно воспринимаемый не человеком, нас пугает.

Как заставить наше подсознание не пугаться "зловещей долины" - задача на много миллиардов. Уже через несколько лет роботы начнут заменять людей в деятельности, проходящей среди людей (а не только на заводах и складах, как сегодня). И вот тут-то и понадобиться умение сделать таких гуманоидных роботов, чтобы они вызывали у людей не испуг, не отвращение и даже не равнодушие. Нужно, чтобы они на подсознательном уровне вызывали расположение людей.

Для решения этой задачи в Engineered Arts уже несколько лет ведется зонтичный проект Месмер (видео), от которого отпочковался фронт-проект Ameca. Оба проекта работают на решение сдвоенной вышеназванной сверхзадачи: кожа, волосы, глаза, рот проекта Mesmer, а также мимика и движения проекта Ameca – все в комплексе должно подсознательно вызывать у людей расположение, позволяющее преодолеть "зловещую долину".

В заключение, почему проект назван Месмер.
• Франц Антон Месмер (Mesmer 1734-1815) — австрийский врач, создатель учения животного магнетизма («месмеризм»). Согласно Месмеру, люди выделяют особого рода энергию (флюиды), которые позволяют им устанавливать телепатическую связь друг с другом.
• В романе Пелевина «Смотритель» (процитирую Г. Юзефович) «предводитель всех медиумов планеты Франц-Антон Месмер — силою мысли сумели надуть огромный ментальный пузырь, то есть визуализировать, а после расширить и обжить целый новый мир (Идиллиум), основанный на так называемом Флюиде — особом веществе, связывающем дух и материю, а по проявлениям очень похожем на джедайскую Силу».

Однако, как показано в романе Пелевина, Идиллиума не существует. Это всего лишь проекция человеческого сознания, существующая только благодаря тому, что герой романа на него смотрит.

Названием Месмер авторы проекта также дают понять, что и "зловещая долина" – лишь плод нашего сознания. И поэтому проект Месмер вовсе не про роботов-гуманоидов, а про нас.
#роботы
Бегающими, прыгающими и танцующими роботами уже мало кого удивишь. Но вот чтоб роботу были доступны любые аллюры - от галопа и рыси до тёльта и пасо фино, - это что-то новое.
Но это только присказка циклических движений.
А сказка впереди – умение робота выполнять ациклические движения, требующие уникальной координации всех конечностей и тела.
Вот пример в стиле Джеки Чана - удар в прыжке пяткой в ухо противника (первые 5 сек видео).
А дальше еще на 4 мин WEEKEND VIDEO робот-лошарик бегает разными аллюрами.
https://www.youtube.com/watch?v=dS_HUq1-pQY

А вот как этого добились https://arxiv.org/pdf/2201.07601.pdf
#Роботы
​​Создан первый частично самоосознающий себя робот.
Прорыв в понимании важной части модели мира – модели самого себя.

Пока Илон Маск пиарится на дутой разработке «дружелюбного» человекоподобного робота с ИИ (это чистая разводка для хайпа), в мире ИИ происходит воистину тектонический сдвиг. Создан первый в мире робот не с абстрактным ИИ, а с самоосознающим ИИ.

Это значит следующее:
робот, интеллект которого изначально не имеет никакой модели самого себя (точнее, действий своего тела в окружающем пространстве), может самостоятельно построить эту модель;
• он делает это без помощи людей, а лишь наблюдая за своими движениями, в ходе обретения им практического опыта;
• используя полученную модель самого себя, робот может предельно точно действовать в окружающем мире;
• при повреждении своего тела (типа ногу сломал, руку оторвало и т.д.) робот, подобно животным и людям, сам адаптируется к новой ситуации, реконструировав свои программы движений;
• а если, например, завтра после включения робота, он узнает, что у него теперь не одна рука, а семь, он также сам адаптируется к новой ситуации, реконструировав свои программы движений в стиле осьминога.

Принципиальный прорыв совершён за счет сочетания 2х прорывных моментов:
✔️люди не закладывают в робота знание того:
• как устроено его тело,
• какова кинематика движений его подвижных частей,
• каковы способы их сочленения - углы, амплитуды и траектории движений частей
✔️ вместо этого, глубокую нейронную сеть научили определять положение частей своего тела в окружающем пространстве:
• поместили роборуку (рука пока одна, но это дело наживное) в круг из пяти видеокамер, транслирующих в нейронную сеть прямую трансляцию о движениях роборуки,
• в ходе движений роборука наблюдает за собой через камеры, а её внутренняя сеть определяет положение суставов по отношению к объему, занимаемому роборукой в окружающей среде.

Через три часа нейросеть робруки построила полную визуальную модель самой себя и своих движений.
Эта собственная модель позволяет роботу планировать действия и избегать препятствий, поскольку он знает, будет ли место в пространстве занято, если его суставы сместятся под определенными углами, а части сдвинутся по такой траектории с определенной амплитудой.

Тестовая задача была коснуться мяча любой частью тела. Планирование движения, созданное на основе собственной модели, достигло 97% успеха при выполнении поставленных задач и является таким же точным, как и реальное выполнение.

Значимость этой работы выходит далеко за пределы робототехники по двум причинам.
1. Это первый робот, управляющий своим движением подобно мозгу.
Модель мозга строится с использованием картографических систем отсчета. Системы отсчета сообщают нам, где вещи (и где мы сами) расположены относительно друг друга, и позволяют нам двигаться, планировать и достигать целей.
2. Модель управления движением может оказаться универсальной моделью познавательных способностей, позволяющей понять, как в материальном мозге рождается нематериальные сознание и мышление.
Согласно «гипотезе интеллекта и воплощения» (intelligence and embodiment hypothesis — см. мой пост), познавательная способность разума, реализуемая механизмом мышления, возникла в результате переадаптации системы управления движением в ходе миллионов лет экспериментов «самоделкина» — эволюции. Т.е. с эволюционной точки зрения обширный нейронный механизм, разработанный для контроля движения животных, был расширен, чтобы контролировать новые структуры мозга вместо мышц.

Идя этим путем, возможно, удастся понять, описать и повторить не только уникальную моторику людей (в роботах), но и уникальные познавательные способности разума людей (в искусственном интеллекте).

#ВоплощенныйИнтеллект #Разум #Движение #Роботы

PS Самоосознание своего тела – лишь малая (но важная) часть самоосознания.
PSS Новость поста столь горячая, что я пустил ее вместо 2й части лонгрида «У землян всего два варианта будущего» – 2я часть на подходе ))
Робототехника дала альтернативный сценарий развития Homo.
Можно было очеловечиться, не потеряв способность быстро бегать.

Такая возможность была продемонстрирована на прошлой неделе на Международной конференции по интеллектуальным роботам IROS 2022 в Японии.
Казалось бы, где роботы и где эволюция Homo. Но дело вот в чём.

Сценарии эволюции видов, скорее всего, неповторимы. И если люди таки угробят свой вид, то новый носитель высшего интеллекта вряд ли эволюционирует по пути гоминид. Каким может быть альтернативный путь, до последнего времени, был исключительно вопросом фантастов. Но с развитием робототехники, кое-что стало проясняться.
И вот появился первый замечательный пример – как животное может эволюционировать из четвероногого в двуногое, не потеряв при этом в скорости бега.

Тренированные люди могут бежать со скоростью 15-20 км/ч. Это вдвое медленнее коровы, вчетверо – тигра и всемеро – гепарда.
Такова плата за двуногость, запустившую процесс «очеловечивания» наших предков. Из совокупности 3-х признаков, характерных только для людей (двуногость, хватательная кисть и объемный, высокоразвитый мозг), двуногость эволюционно развилась первой, что сыграло ключевую роль для всей последующей истории гоминид.
Двуногость освободила руки, без чего не было бы сложных орудий и вообще нашей культуры. Но за это пришлось дорого заплатить трудностями при вынашивании плода и при родах, нарушением в кровообращении, пищеварении и самым очевидным преимуществом – скоростью бега (столь важной для выживания).

А можно ли обрести двуногость, сохранив преимущество быстрого бега на 4-х?

На IROS 2022 исследователи из WPI Robotics Engineering и Шанхайского технологического университета представили обобщенный метод превращения 4-хногого робота в двуногого с помощью умного алгоритма и небольшой модификации.

Если бы эволюция развила у наших предков отросток на голени задних конечностей, это обеспечило бы устойчивость при ходьбе на 2-х, сохранив способность к быстрому бегу на 4-х. Конечно, потребовалась бы еще «перепрошивка» двигательных программ мозга иным алгоритмом обучения. Но подобное перепрограммирование эволюцией освоено в совершенстве.

Результат такого альтернативного сценария эволюции двуногости у робота разработки WPI Robotics Engineering и Шанхайского технологического университета можно увидеть на этом видео.

Это видео не столь эмоционально потрясает, как фрагмент знаменитого фильма «2001: Космическая одиссея», где «Черный монолит» заработал, запустив процесс антропогенеза под музыку Рихарда Штрауса «Так говорил Заратустра» (подробней о том, что это было, см. в моём посте).

Однако, по сути, это видео вставшего и пошедшего на двух ногах робота не менее потрясающе.
Не тем, что 4-х ногий робот пошел на 2-х. Такое уже делали на специально разработанных роботах. Здесь же мы видим универсальное простое решение, подходящее для трансформации любых (!) четвероногих в мультимодальных (ходящих на 2-х и бегающих на 4-х). И тем самым, мы наглядно видим, как эволюция предков людей могла запросто пойти по иному сценарию.

Ну а то, насколько искусно эволюция умеет делать подобные вещи, мы знаем на реальных примерах. Чего стоит «двойная эволюция» китообразных: сначала сотни миллионов лет приспособления к сухопутной среде, а потом еще полсотни миллионов – к водной (с полной перестройкой тела и тотальной “перепрошивкой” мозга сухопутных китопарнокопытных). И уж если с превращением лап в плавники у эволюции проблем не было, то уж с костным отростком на голени она справилась бы запросто. А смена алгоритма обучения на бимодальный, как показал эксперимент с роботом, оказалась весьма несложной и продуктивной.

И бегали бы люди по улицам городов с ограниченной правилами скоростью. А распространенность легковых авто была бы, как сейчас у частных самолетов – тысяч 20 на весь мир.
#Эволюция #Роботы
Google DeepMind сумела запустить когнитивную эволюцию роботов
Это может открыть путь к гибридному обществу людей и андроидов

1я ноябрьская ИИ-революция (Революция ChatGPT) началась год назад - в ноябре 2022. Она ознаменовала появление на планете нового носителя высшего интеллекта — цифрового ИИ, способного достичь (и, возможно, превзойти) людей в любых видах интеллектуальной деятельности.
Но не смотря на сравнимый с людьми уровень, этот новый носитель высшего интеллекта оказался абсолютно нечеловекоподобным.
Он принадлежит к классу генеративного ИИ больших языковых моделей, не умеющих (и в принципе не способных) не то что мечтать об электроовцах, но и просто мыслить и познавать мир, как это делают люди. И потому, даже превзойдя по уровню людей, он так и останется для человечества «чужим» — иным типом интеллекта, столь же непостижимым для понимания, как интеллект квинтян из романа Станислава Лема «Фиаско».

Причина нечеловекоподобия генеративных ИИ больших языковых моделей заключается в их кардинально иной природе.
✔️ Наш интеллект – результат миллионов лет когнитивной эволюции биологических интеллектуальных агентов, позволившей людям из животных превратиться в сверхразумные существа, построивших на Земле цивилизацию планетарного уровня, начавшую освоение космоса.
✔️ ИИ больших языковых моделей – продукт машинного обучения компьютерных программ на колоссальных объемах цифровых данных.

Преодолеть это принципиальное отличие можно, если найти ключ к запуску когнитивной эволюции ИИ.
И этот ключ предложен в ноябре 2023 инициаторами 2й ноябрьской ИИ-революции (Революции когнитивной эволюции ИИ) в опубликованном журналом Nature исследовании Google DeepMind.
• Движком когнитивной эволюции ИИ авторы предлагают сделать (как и у людей) социальное обучение — когда один интеллектуальный агент (человек, животное или ИИ) приобретает навыки и знания у другого путем копирования (жизненно важного для процесса развития интеллектуальных агентов).
• Ища вдохновение в социальном обучении людей, исследователи стремились найти способ, позволяющий агентам ИИ учиться у других агентов ИИ и у людей с эффективностью, сравнимой с человеческим социальным обучением.
• Команде исследователей удалось использовать обучение с подкреплением для обучения агента ИИ, способного идентифицировать новых для себя экспертов (среди других агентов ИИ и людей), имитировать их поведение и запоминать полученные знания в течение всего нескольких минут.

"Наши агенты успешно имитируют человека в реальном времени в новых контекстах, не используя никаких предварительно собранных людьми данных. Мы определили удивительно простой набор ингредиентов, достаточный для культурной передачи, и разработали эволюционную методологию для ее систематической оценки. Это открывает путь к тому, чтобы культурная эволюция играла алгоритмическую роль в развитии искусственного общего интеллекта", - говорится в исследовании.

Запуск когнитивной эволюции ИИ позволит не только создать «человекоподобный ИИ» у роботов – андроидов, но и разрешить при их создании Парадокс Моравека (высококогнитивные процессы требуют относительно мало вычислений, а низкоуровневые сенсомоторные операции требуют огромных вычислительных ресурсов) и Сверхзадачу Минского (произвести обратную разработку навыков, получаемых в процессе передачи неявных знаний - невербализованных и, часто, бессознательных)

Т.о. не будет большим преувеличением сказать, что 2я ноябрьская революция ИИ открывает путь к гибридному обществу людей и андроидов, – многократно описанному в фантастических романах, но до сих пор остававшемуся практически нереализуемым на ближнем временном горизонте.

Подробный разбор вопросов когнитивной эволюции путем копирования, а также революционного подхода к ее запуску, предложенного Google DeepMind, см. в моем новом лонгриде (еще 10 мин чтения):
- на Medium https://bit.ly/486AfEN
- на Дзене https://clck.ru/36wWQc
#ИИ #Интеллект #Разум #Эволюция #Культура #АлгокогнитивнаяКультура #Роботы
Наконец-то снято проклятье Моравека-Минского.
Первый в мире
робот – домработница: уборка, стирка, уход, готовка, мытье посуды и т.д.
Пока мы праздновали, в мире случился реальный прорыв в робототехнике, сопоставимый с «революцией ChatGPT» (см. видео на англ [1] и с переводом [2])
Робот Mobile Aloha - разработка Стэнфордского универа [3]:
• преодолел «парадокс Моравека» (высококогнитивные процессы требуют относительно мало вычислений, а низкоуровневые сенсомоторные операции требуют огромных вычислительных ресурсов), из-за которого обучение робота – домработницы стоило раньше огромных денег;
• решил «сверхзадачу Минского» (произвести обратную разработку навыков, которые являются бессознательными), - ведь именно бессознательно домработница выполняет почти все работы по дому 😊 (подробней см. [4]).

Прорыв оказался возможным благодаря имитационному обучения робота. Он учится, как дети, - на основе полусотни демонстраций обучающих действий людьми (Imitation learning from human-provided demonstrations).
- как это происходит см. на видео.

Дополнительными факторами прорыва стали:
• умение согласованно использовать две руки-манипуляторы (быть эффективной однорукой домработницей весьма затруднительно);
• контроль всего тела (а не только рук) при выполнении мобильных задач (попробуйте, например, без этого просто собрать разбросанные по дому вещи).

Стоимость прототипа такой домработницы всего $32 тыс. На Trossenrobotics уже предлагают за $20 тыс. Ну а при массовом производстве снизить цену на порядок – как нечего делать.
И тогда через пяток лет роботы – домработницы могут стать столь же распространенными, как сейчас пылесосы - т.е. есть у всех.
При таком раскладе Илону Маску, возможно, стоит забить на разработку своих андроидов в стиле Голливуда и переключиться на невзрачных, но простых и полезных механических домработниц.
#Роботы
1 https://www.youtube.com/watch?v=ysZCGhgZTsA
2 https://www.youtube.com/watch?v=WJ2WTYS33Lo
3 https://mobile-aloha.github.io/
4 https://t.me/theworldisnoteasy/1854
Революция роботов намечена на март.
Такого техно-прорыва не было со времен Прометея.

Суть ожидаемого прорыва – разрешение парадокса Моравека, несокрушимой стеной преграждающего путь к человекоподобному Сильному-ИИ (AGI), а потом и к Супер-ИИ.
Логика здесь проста:
• Для достижения уровня AGI, интеллектуальный агент должен иметь тело (именно оно будет «жить», адаптируясь к внешней среде и взаимодействуя с ней и себе подобными)
• Однако, на пути к отелесниванию ИИ стоит парадокс Моравека, согласно которому. управление низкоуровневыми сенсомоторными операциями (операциями тела) требует огромных вычислительных ресурсов, - даже больших, чем управление высококогнитивными процессами (сложными мысленными операциями мозга).
• Т.е. без человекоподобного тела (робота - андроида) не будет AGI, а для «жизни» андроиду не хватает вычислительных ресурсов.

Что обещают в марте.
Бернт Борних - СЕО компании 1Х (на которую OpenAI сделал ставку в робототехнике андроидов), - объявил, что в марте, похоже, будет доказано, что ограничение парадокса Моравека было ложное, и оно возникало всего лишь из-за банальной нехватки данных [1].

Речь, скорее всего, идет о выпуске андроида NEO - «брата» Евы (андроид EVE). NEO будет превосходить «сестру» во многом и кроме того, будет передвигаться на ногах, а не на колесах.
Январская демонстрация Евы (демонстрация [2] и ее разбор [0]) была настолько поразительной, что редакция IEEE Spectrum даже провела свое расследование – не прятались ли под костюмами андроидов люди. Но все оказалось чисто – не подкопаешься [3].

Фишка андроидов компании 1Х в движке, разработанном OpenAI. Это нейронка, как и разум человека, работает, учась на данных, поступающих от зрения, и генерирующая действия (управление движением, руками, захватами, туловищем и головой) с частотой 10 Гц.
«Базовая модель» понимает широкий спектр физического поведения: от уборки дома до сбора предметов на складе и социального взаимодействия с людьми и другими роботами. Но самое главное в том, что новые навыки появляются у андроида всего за несколько минут сбора данных и обучения, - путем наблюдения за тем, как это делают люди.

Для скептиков, сомневающихся в грядущем опровержении парадокса Моравека (даже если за этим видны уши OpenAI), рекомендую объявление, сделанное позавчера Тэдом Сяо (главным спецом по робототехнике (Senior Research Scientist) в Google DeepMind Robotics).
Тэд написал так [4]:
«В ближайшие недели выйдет 3-4 крупных новости, которые потрясут сферу робототехники и искусственного интеллекта.
Скорректируйте свои планы, 2024 год будет сумасшедшим.»


О том же пишет и Джеймс Дарпиниан в лучшем на сегодня обзоре ТОР 20-тки андроидов мира [5]:
Святой Грааль - ходячий, говорящий и полезный андроид из научной фантастики, -внезапно оказывается в пределах досягаемости.

Так что, ждем революцию роботов в марте.

#Роботы
0 https://www.youtube.com/watch?v=PkTshLeC-R4
1 https://twitter.com/BerntBornich/status/1760546614530228450
2 https://www.youtube.com/watch?v=iHXuU3nTXfQ
3 https://spectrum.ieee.org/1x-robotics-video
4 https://twitter.com/xiao_ted/status/1760591701410799682
5 https://james.darpinian.com/blog/you-havent-seen-these-real-humanoid-robot-demos
Богатейшее частное государство мира создаст воплощенных AGI-агентов для любого типа реальности.
Цель суперкоманды Джима Фана - чувствующие и понимающие агенты физического и виртуальных миров.

По доходам сегодняшняя NVIDIA – 12е государство мира. И при этом, это крупнейшее «частное государство» на свете [1].
И поэтому объявление компании о формировании исследовательской супер-команды GEAR (Generalist Embodied Agent Research), возглавляемой Джимом Фаном и Юкэ Чжу, с миссией - создание универсальных воплощенных агентов в физическом (робототехника) и виртуальных (игры и любые симуляции) мирах, - это самое важное событие в области ИИ первых 2х месяцев 2024 [2].

«Мы верим в будущее, в котором каждая движущаяся машина будет автономной, а роботы и смоделированные виртуальные агенты будут такими же вездесущими, как iPhone… Мы отправляемся в миссию по высадке на Луну, и до того, как мы туда доберемся, мы получим горы знаний и сделаем много открытий» - пишет Фан.

Джим Фан имеет веские основания так говорить. Ибо он [3]:
• самый известный в мире практик в деле создания ИИ-агентов (Voyager - первый ИИ-агент, который умело играет в Minecraft, MineDojo - агент с открытым исходным кодом, обучающийся, просматривая 100 000 видеороликов Minecraft на YouTube, Eureka - робот-рука с пятью пальцами, выполняющий чрезвычайно тонкие и сложные задачи) и VIMA - одна из первых базовых мультимодальных моделей фундамент для манипулирования роботами)
• с совершенно уникальной карьерой (он работал в OpenAI с Ильей Суцкевером и Андреем Карпати, в Baidu AI Labs с Эндрю Нг и Дарио Амодеем и в MILA с Йошуа Бенджио)

Принципиальное отличие AGI-агентов, разрабатываемых GEAR, в следующем:
Они будут универсально-воплощенными – способными учиться и «жить» в обоих типах миров (физическом и виртуальном/цифровом).
Это будет достигаться путем синтеза 3х типов данных: из материального мира, из ноосферы (Интернета) и синтетических данных (порождаемых «ИИ-спецагентами, типа Eureka, уже разработанного Фаном для NVIDIA [5])

Год назад я писал «Поворотный момент пройден - AGI появится через 1,5 года. Сработает сочетание больших денег, открытых фреймворков и превращение LLM в когнитивных агентов» [6].
И создание NVIDIA GEAR – важнейший шаг в воплощении этого прогноза.
#ВоплощенныйИнтеллект #AGI #Роботы

0 https://www.youtube.com/watch?v=URHt3p6tbrY
1 https://bit.ly/49MYj0d
2 https://research.nvidia.com/labs/gear/
3 https://jimfan.me/
4 https://bit.ly/3uO4O42
5 https://www.toolify.ai/ai-news/eureka-nvidias-revolutionary-ai-breakthrough-towards-agi-1542610
6 https://t.me/theworldisnoteasy/1696
Мартовская революция роботов началась.
Всего за пару недель Андроиды превратились в Гуманоидов.


Так ИИ-сингулярность сжимает масштаб времени в робототехнике.

Партнерству робототехнического стартапа FigureAI с OpenAI по разработке специальной разговорной модели для роботов – андроидов всего несколько недель. Но представленный вчера первый результат ошеломил публику.
Робот- андроид Figure 01, умевший в конце февраля самостоятельно учиться выполнять разнообразные физические задачи, к середине марта превратился в гуманоида. Он по-прежнему хорошо владеет руками, но теперь он еще и свободно болтает с людьми в процессе любой своей деятельности: как по делу (объясняя, что, как и зачем он делает), так и просто поговорить (хоть про него, хоть про людей, хоть про погоду).

Вот иллюстрация:
• короткое 2 мин демо от FigureAI [1]
• 20 мин видео анализ этого демо [2]

Три недели назад в посте о входе развития ИИ-систем в зону сингулярности я написал [3] -«Если в какой-то области все самое главное случается на последней неделе, - прогресс в этой области близок к сингулярности».

Полагаю, что до момента, когда робот - гуманоид типа Figure 01 будет владеть руками на уровне профессионального напёрсточника, нас также отделяет всего несколько недель. И всего-то надо перевести Figure 01 с языковой моделью от OpenAI с электромоторчиков на гидравлику, как это уже работает на андроиде Феникс от Sanctuary AI [4].

А 25 февраля я прогнозировал [5], что «Революция роботов намечена на март. Такого техно-прорыва не было со времен Прометея».

И вот она уже началась. Но общающийся с людьми гуманоид Figure 01- лишь1й шаг. За ним идет Нэо («брат» Евы от компании 1Х).
Вот тогда и рухнет, наконец, парадокс Моравека…
А будет это всего через несколько недель.
#Роботы
1 https://www.youtube.com/watch?v=Sq1QZB5baNw
2 https://www.youtube.com/watch?v=TMF8dqqLXro
3 https://t.me/theworldisnoteasy/1898
4 https://www.youtube.com/watch?v=fDCRdwZUgIU
5 https://t.me/theworldisnoteasy/1900
Очень скоро война превратится в 5=ю казнь апокалипсиса.
Против умной «саранчи в железных нагрудниках» все бессильно.


«И грудь у неё была, словно железная броня, а шум её крыльев был подобен грохоту множества колесниц, влекомых скакунами, рвущимися в бой.» Откровение 9:7—9)

По Библии, пятой казнью апокалипсиса будет «саранча в железных нагрудниках», против которой никто и ничто не устоит.

В технологическом переложении 20-го века непобедимость роя «железной саранчи» прекрасно описал Станислав Лем в романе «Непобедимый». Там даже самый мощный робот космического корабля со знаковым именем «Непобедимый», вооружённый системой силовых полей и сферическим излучателем антиматерии, оказался бессилен перед миллиардным роем крохотных летающих роботов.

В современном переложении об этом пишут Эллиот Акерман и адмирал Джеймс Ставридис:
• в формате эссе «Рои беспилотников изменят баланс военной мощи» [1]
• в формате романа «2054», в котором они размышляют о многих аспектах и роли ИИ в будущих военных конфликтах [2].

Ключевая идея этих авторов проста и безотбойна – сочетание роя дронов с ИИ кардинально меняет ход боя.

«По своей сути ИИ — это технология, основанная на распознавании образов. В военной теории взаимодействие между распознаванием образов и принятием решений известно как цикл НОРД — наблюдать, ориентироваться, решать, действовать. Теория петли (цикла) НОРД, разработанная в 1950-х годах летчиком-истребителем ВВС Джоном Бойдом, утверждает, что сторона в конфликте, которая сможет быстрее пройти через петлю НОРД, будет обладать решающим преимуществом на поле боя».

Для максимально быстрого прохождения петли НОРД нужно автономное и адаптивное оружие.
• Промышленные роботы являются примером автономных, но неадаптивных машин: они неоднократно выполняют одну и ту же последовательность действий.
• И наоборот, беспилотные дроны являются примером адаптивных, но неавтономных машин: они демонстрируют адаптивные возможности своих удаленных людей-операторов.

Рой дронов столь же адаптивен, но неавтономен, как и единственный дрон. Но для дрона-одиночки эта проблема решается его связкой с оператором (или примитивизацией функций). А для роя дронов такого числа операторов не напасешься (и функции упрощать не хочется). Но невозможно запустить тысячи автономных дронов, пилотируемых отдельными людьми. А вычислительные возможности ИИ делают такие рои возможными.

Если роем будет управлять ИИ, проблема адаптивности и автономности роя более не существует. Связка роя и ИИ станет самым быстрым исполнителем прохождения петли НОРД.

Акерман и Ставридис пишут:
«Это изменит ведение войны. Гонка будет вестись не за лучшие платформы, а за лучший ИИ, управляющий этими платформами. Это война циклов НОРД, рой против роя. Победит та сторона, которая разработает систему принятия решений на основе ИИ, способную опередить противника. Война движется к конфликту "мозг против мозга"»

И оба мозга будут электронные, - добавлю я от себя.

P.S. В одном Аккерман и Ставридис, имхо, ошибаются:
• Рои дронов с ИИ – это лишь ближняя перспектива (т.н. ПЖРы – полуживые роботы [3])
• В 2054, про который пишется в романе, ПЖР уже уступят место еще более интеллектуально продвинутому «жидкому мозгу» [4]

#БПЛА #Война #ИИ #Роботы
1 https://www.wsj.com/tech/drone-swarms-are-about-to-change-the-balance-of-military-power-e091aa6f
2 https://www.penguinrandomhouse.com/books/696977/2054-by-elliot-ackerman-and-admiral-james-stavridis/
3 https://t.me/theworldisnoteasy/454
4 https://t.me/theworldisnoteasy/654
DeepMind подготовил эволюционный скачок в миропонимании роботов.
Найден простой и эффективный способ обучения
роботов, как людей.
Представьте, что к вам впервые пришел сотрудник сервиса по генеральной уборке офисов. Вы водите его по всем помещениям, показываете, что и где нужно сделать и чего делать нельзя: тут вымыть, там пропылесосить, шторы в конференц зале постирать, санузлы дезинфицировать, весь мусор собрать, но на столах ничего не трогать, прочистить бытовую технику от кофемашин до кондиционеров и т.д. и т.п.
Т.е. вы просто все показываете и рассказываете. А работник, если что-то не понятно, переспрашивает и уточняет. Причем, работник толковый. И если ему, например, специально не показывали на флипчарты в переговорных, а просто в конце тура по офису добавили – оторви все исписанные листы на флипчартах и, не путая их порядок, сложи на стол перед дверью в архив, - сотрудник сам найдет все флипчарты и сделает ровно так, как ему сказано.

Примерно так же, но даже без реального тура по офису, а просто засняв его на смартфон со своими комментариями, мы очень скоро будем учить роботов.

Информация к размышлению.
Эволюционное развитие у млекопитающих способностей осмысления окружающей среды и целенаправленной навигации передвижений заняло более 200 млн лет.
На много порядков меньшее время (всего какие-то несколько сотен тысяч лет) потребовалось для следующего «эволюционного скачка» в развитии самого когнитивно одаренного млекопитающего – людей. На освоение ими языков абстрактных понятий эволюции (уже не генной, а генно-культурной) потребовалось всего лишь несколько сотен тысяч лет.
У формирующегося на Земле нового небиологического (цифрового) вида эти процессы:
1. во-первых, идут с несопоставимо огромной скоростью;
2. а во-вторых, имеют обратную последовательность.
Последнее оказалось возможным из-за нематериальности и бестелесности «цифровых сущностей» генеративного ИИ на основе больших языковых моделей.
Сначала, они всего за пару лет эволюционировали до уровня людей в оперировании языками абстрактных понятий. А теперь, вселясь в тела роботов, они, скорее всего, за какие-то месяцы сделают второй «эволюционный скачок» – став «материализованными цифровыми сущностями».
Вместе с обретением тел они обретут способности осмысления окружающей среды и навигации своих передвижений в соответствии с намерениями и целями.

Представленная Google DeepMind система обучения роботов объединяет подсистему «мультимодальной навигации по инструкциям с демонстрационными турами (MINT)» и подсистему «интеграции зрения, языка и действий» Vision-Language-Action (VLA). Это объединение позволило интегрировать понимание окружающей среды и силу рассуждений на основе здравого смысла больших языковых моделей с огромным контекстным окном в 1.5 млн токенов.

Проще говоря, гении из DeepMind разработали способ, с помощью которого роботы понимают и ориентируются в сложных средах, используя комбинацию слов, изображений и видеотуров. При этом роботы могут получать от людей команды на выполнение действий в сложных средах мультимодально: устно, письменно, в виде картинок (карты, планы, схемы, идеограммы и т.д.), а также на основе жестов людей (типа объяснений на пальцах) и (в следующей версии) их мимики.

На представленных Google демо их система Mobility VLA на основе Gemini 1.5 Pro интеллектуально обходит GPT-4o и GPT-4V.
Напр. на обращение к роботу «Хочу еще вот этого» с показом пальцем на пустую банку колы, робот с Mobility VLA сам нашел холодильник, где этого добра было много. С чем прочие модели справились плохо (одни не поняли, что надо, другие – где это взять).

Картинка: архитектура Mobility VLA и сравнение с другими моделями https://telegra.ph/file/cc78760f7102b6b803bf2.jpg
Статья https://arxiv.org/abs/2407.07775
Видео демо https://x.com/GoogleDeepMind/status/1811401347477991932
#роботы
Революция Tesla в области автономных роботов.
Запатентован иной способ зрительного восприятия, отличный от придуманных эволюцией на Земле.

Tesla только что подала патент на систему зрительного восприятия окружающего мира мыслящими субъектами на базе ИИ (называемыми «эго») [1]
Это новая система зрения отличается от всех сформировавшихся эволюционно на Земле способов и механизмов зрения и названа Voxel-Based Vision (VBV) - зрение, основанное на вокселях.


Особенности VBV таковы.
• Кардинально меняется то, как автономные роботы воспринимают и ориентируются в окружающей среде: используются только данные с камеры без использования лидара или радара.
• VBV делит пространство на трехмерные воксели, прогнозируя занятость, форму, семантические данные и движение для каждого вокселя в режиме реального времени.

VBV предназначена для работы на бортовом компьютере робота (как в автомобили Tesla, так и в человекоподобных роботах, типа Optimus, и позволяет принимать решения о действиях в пространстве практически мгновенно (в реальном времени).
VBV позволяет роботу самостоятельно и без предварительной подготовки ориентироваться в разнообразных средах и адаптироваться к изменениям в реальном времени. Это устраняет необходимость в обширном предварительном картографировании и ускоряет появление доступных автономных роботов.

Революционную суть изобретенной технологии можно также сформулировать так.
✔️ Процесс зрения (видения) происходит не в глазах, а в мозге.
✔️ Т.к. способность видеть окружающий мир столь полезна, эволюция сформировала процессы видения множество раз и по разным траекториям (для разных животных).
✔️ Например, глаза осьминога поразительно похожи на наши (и это при том, что нашим последним общим предком было слепое морское существо, типа слизняка или улитки, жившее более полумиллиарда лет назад).
✔️ Однако VBV в принципе отличается от всех придуманных эволюцией траекторий, будучи оптимален для ИИ, а не для биологического мозга.

Прототип VBV был доложен на конференции год назад [2].
За год систему довели и теперь запатентовали.

Картинка https://telegra.ph/file/b2fc96180b2a233836c19.jpg
1 https://x.com/seti_park/status/1819406901257568709
2 https://www.youtube.com/watch?v=6x-Xb_uT7ts
#Роботы #Зрение