Santry's Singularity blog
2.28K subscribers
276 photos
39 videos
6 files
417 links
Авторский блог техноредактора. Научная журналистика, инсайды и нерегулярные записки о приближении сингулярности.
Not generated. Written by @Santry

Art: https://cults3d.com/ru/polzovateli/SantrY/3d-modeli
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
The Next Big Thing

Инженеры Disney Research не скрывают восторга, создавая дроидов из вселенной «Звёздных войн». А теперь, благодаря Антуану Пирроне, каждый может собрать мини-дроида примерно за 400 долларов. И хотя он выглядит как забавная игрушка, подобные роботы имеют все шансы перешагнуть границы тематических парков и войти в повседневную жизнь.

Похоже, в робототехнике произошел тот самый скачок из количества в качество, о котором талдычили на философии. Машины теперь без особых усилий осваивают навыки, которые раньше приходилось жестко прописывать в коде.

Исследователи из Columbia Engineering недавно продемонстрировали это наглядно: их роботы самостоятельно изучают структуру собственного тела и принципы движения, просто наблюдая за собой через камеру. Буквально смотрят в зеркало и познают себя!

Компания Figure показала Helix — универсальную модель машинного обучения типа Vision-Language-Action (VLA) для гуманоидных роботов. Эта система одновременно обрабатывает изображения и команды на обычном человеческом языке, а затем управляет роботами в реальном времени. Благодаря Helix роботы могут узнавать и работать с тысячами обычных домашних предметов. Кроме того, Figure объявила о создании BotQ — завода по производству роботов. Для начала он будет выпускать до 12 000 гуманоидов ежегодно.

А на прошлой неделе Google DeepMind анонсировала сразу две новые модели: Gemini Robotics с технологией Vision-Language-Action (VLA) и Gemini Robotics-ER с технологией Embodied Reasoning. Обе они работают на базе Google Gemini — многомодальной базовой модели, которая понимает текст, голос и изображения, отвечает на вопросы и дает рекомендации.

Gemini Robotics, в DeepMind назвали "продвинутой системой зрения-языка-действия". Она воспринимает ту же информацию, что и базовая Gemini, но может преобразовывать ее в команды для физических действий робота. Причем она совместима с любым железом. На сайте проекта есть впечатляющие демонстрации работы системы. Интересно узнать больше? Загляните в статью "Внедрение ИИ в физический мир".

К слову, не только Google развивает робототехнику. Apple тоже проявляет интерес — компания показала милую и услужливую роботизированную лампу, и, по слухам, работает над созданием андроидов.

Если нейронные VLA-сети пойдут по тому же пути развития, что и языковые модели (LLM), то скоро в интернете появятся открытые нейросети для управления роботами. И да, эта технология может быть гораздо доступнее, чем многие думают сейчас. По крайней мере частично.

Конечно, собрать в гараже человекоподобного робота пока нереально, но вот с роботизированными манипуляторами дела обстоят иначе. Открытых проектов уже хватает: PAROL6, toolboxrobotics, arctosrobotics, Thor — и это лишь верхушка айсберга. С учетом развития программного обеспечения, идея собрать такую роборуку становится все заманчивее. Лично я планирую научить свою готовить не хуже робошефа Зиппи.

#ИИ #робототехника #DIY #будущее
Media is too big
VIEW IN TELEGRAM
Вышло даже быстрее, чем я ожидал. Сегодня NVIDIA представила базовую модель для управления роботами и сразу же опубликовала ее на GitHub и Hugging Face. Особенно интересно, что демонстрацию провели на том самом дроиде от Disney Research.

#ИИ #робототехника #opensorce #будущее
Доски 👨‍🏫

На этой неделе я познакомился с фотопроектом под названием Momentum фотографа Алехандро Гихарро (Alejandro Guijarro). Он путешествовал по университетам — Кембриджу, Оксфорду, Стэнфорду — фотографируя доски с уравнениями квантовой механики.

Формулы на этих кадрах выглядят скорее как импровизированное абстрактное искусство. Есть нечто завораживающее в том, как научные идеи записываются, стираются и развиваются с течением времени. Интересно и то, что для выставок эти фотографии печатают точно по размеру настоящих досок, чтобы передать ощущение присутствия в университетской аудитории.

Сразу захотелось показать их Марату Хамадееву с N+1, который написал серию статей с разбором формул с досок в разных компьютерных играх: Black Mesa, Control и Quantum Break.

#арт #физика #искусство
Так много ссылок и так мало времени… импровизированный #дайджест на начало апреля.

Лонгриды
Защита от нечестных диаграмм — отличное интерактивное руководство, показывающее, как на самом деле работают графики и как легко манипулировать данными.

🌍 Как ощутить «эффект обзора» на Земле — астронавты, наблюдающие Землю из космоса, испытывают особое чувство благоговения. Астронавт Эдгар Митчелл назвал это "взрывом осознанности". Статья Forbes рассказывает, как получить такой эффект, не покидая планету.

Что теоретическая физика может рассказать нам и вязании? — несмотря на популярность вязания, физические принципы этого процесса до сих пор остаются малоизученными.

💫 Взрывы крошечных звезд, приводящие в действие закон Мура — математические модели сверхновых делают возможным производство современных процессоров.

Озеленение Солнечной системы — исследование возможностей превращения Марса во второй дом для человечества.

🍍 Король фруктов — неожиданно увлекательная история выращивания ананаса, охватывающая сельское хозяйство, индустриализацию, мировую торговлю и кулинарию.

Почему небоскребы превратились в стеклянные коробки — небоскребы не всегда строились в этом стиле, но кое-что изменилось.

⚪️ Как силикагель завоевал мир — происхождение знакомых всем пакетиков с прозрачными шариками из коробок с обувью.

Краткая история чудо-бактерии — рассказ о Serratia marcescens, патогене, удивительно похожем на кровь, оказавшем огромное влияние на современную науку.

Видео
🐍 Subpixel Snake — версия игры "Змейка", настолько мелкая, что для её просмотра понадобится микроскоп.

Как создаются шедевры навесной пайки Мохита Бхойта — рассказ из первых уст.

💰 Денежный поток — познавательное видео о машине MONIAC (она же машина Филлипса), использующей поток воды для экономического моделирования.

Разное
Wikenigma — энциклопедия известных неизвестных. Впечатляющий перечень неотвеченных вопросов, неразгаданных тайн и белых пятен в наших коллективных знаниях.

#мастриды #лонгрид #статьи #видео
Forwarded from эйай ньюз
Умная роборука за $110

Я уже писал про LeRobot — красавчики из Hugging Face продолжают пилить годноту для тех, кто хочет собрать и натренировать собственного робота дома. С последнего поста вышло столько обновлений, что пора делать вторую часть.

Во-первых, новые конфигурации. Теперь есть SO-100 — роботизированная рука всего за $110. А ещё LeKiwi — та же рука, но уже на подвижной базе. Этот уже может собирать разбросанные по комнате вещи в корзину. Выглядит мило — прям хочется завести такого дома.

Во-вторых, процесс тренировки серьезно прокачали. Оптимизировали всё, что можно, и выложили новый датасет, который можно за ночь зафайнтюнить под свои задачи. Установка может показаться сложноватой для новичков, но если уметь читать инструкции и не боишься спросить у LLM, как завести код, справится даже гуманитарий. Всё в открытом доступе, энтузиасты уже вовсю пилят свои версии. Вон, даже гуманоида за 300 баксов собрали (без учета привязанного к нему макбука).

Еще недавно добавили поддержку моделей вроде π0 и π0-FAST от Physical Intelligence — первых "фундаментальных" моделей для робототехники, которые понимают естественный язык и действия. π0-FAST, кстати, в пять раз быстрее в обучении благодаря новой токенизации действий — это уже уровень, где робот может адаптироваться к новым задачам на лету (за день, хах).

Ну и самое жирное — зарелизили датасет на 90 терабайт данных и 5000 часов записей с 6 камер для тренировки беспилотных автомобилей. Hugging Face недавно скооперировались с Yaak и выкатили Learning to Drive (L2D). Всё это также будет использовано против вас в LeRobot.

Гитхаб
Обнимающее лицо
SO-100

@ai_newz