Bernt Bornich [ 1X Robotics ] / p.4
2025 / Понимание задачи > Выполнения конкретных действий
Успех выполнения задачи — плохо определённая метрика. Представим фабрику: робот сортирует мусорные мешки. Всё идёт нормально. Один мешок падает на пол. Есть разные уровни интеллекта. Первый — робот просто продолжает повторять движение, как обучен. Это классический end-to-end deep learning. Если в данных много примеров ошибок, возможно он поднимет мешок. Но если система понимает задачу — не просто сортировку, а зачем она это делает и как это вписывается в процесс — она поднимет мешок, вернёт его и ускорится на 20 секунд, чтобы компенсировать задержку. Это понимание имплицитно. В реальном производстве ошибки случаются постоянно, и люди их покрывают. Наша цель — чтобы роботы не повторяли движения, а глубоко понимали задачу. Тогда они смогут обобщать на edge cases, которых не видели. В вождении это называют «отрезать длинный хвост» — есть бесконечный хвост редких ситуаций, которые невозможно увидеть все. В какой-то момент система должна уметь решать то, чего не видела. Это достигается через разнообразие. Лучшее доказательство — LLM, они стали хороши именно из-за разнообразия данных.
2025 / World Models
Сегодняшние world models — не полноценные omni-models. Нам не хватает данных и вычислений. В идеале мы бы просто искали решение в world model и использовали её как policy. Это работает, но вычислительно нереально. Нужно дистиллировать из неё меньшую policy, которая может работать на роботе. Даже в облаке world model слишком медленная — миллисекунда реального времени может считаться секунды. Можно масштабировать compute, но мы пойдём умнее.
2025 / Вертикально - интегрирированная система производства
Для гуманоидов нет готовой инфраструктуры. Если идти по старому пути, получишь 200-фунтовых тяжёлых, дорогих, жёстких и небезопасных роботов. Это не масштабируется. Нужно инновации на каждом уровне цепочки поставок.Мы делаем буквально всё сами — вплоть до абсурда. У нас патенты на новые способы старения литого алюминия, мировой рекорд по соотношению прочности к весу. Мы занимаемся материаловедением, делаем своё производственное оборудование и автоматизацию, свои моторы, синтетические сухожилия для приводов, силовую электронику, батареи, механику, даже камеры и сенсоры. У нас тактильные сенсоры на новом принципе, запатентованные. Собственные модели для обучения и т.д.
2025 / Понимание задачи > Выполнения конкретных действий
Успех выполнения задачи — плохо определённая метрика. Представим фабрику: робот сортирует мусорные мешки. Всё идёт нормально. Один мешок падает на пол. Есть разные уровни интеллекта. Первый — робот просто продолжает повторять движение, как обучен. Это классический end-to-end deep learning. Если в данных много примеров ошибок, возможно он поднимет мешок. Но если система понимает задачу — не просто сортировку, а зачем она это делает и как это вписывается в процесс — она поднимет мешок, вернёт его и ускорится на 20 секунд, чтобы компенсировать задержку. Это понимание имплицитно. В реальном производстве ошибки случаются постоянно, и люди их покрывают. Наша цель — чтобы роботы не повторяли движения, а глубоко понимали задачу. Тогда они смогут обобщать на edge cases, которых не видели. В вождении это называют «отрезать длинный хвост» — есть бесконечный хвост редких ситуаций, которые невозможно увидеть все. В какой-то момент система должна уметь решать то, чего не видела. Это достигается через разнообразие. Лучшее доказательство — LLM, они стали хороши именно из-за разнообразия данных.
2025 / World Models
Сегодняшние world models — не полноценные omni-models. Нам не хватает данных и вычислений. В идеале мы бы просто искали решение в world model и использовали её как policy. Это работает, но вычислительно нереально. Нужно дистиллировать из неё меньшую policy, которая может работать на роботе. Даже в облаке world model слишком медленная — миллисекунда реального времени может считаться секунды. Можно масштабировать compute, но мы пойдём умнее.
2025 / Вертикально - интегрирированная система производства
Для гуманоидов нет готовой инфраструктуры. Если идти по старому пути, получишь 200-фунтовых тяжёлых, дорогих, жёстких и небезопасных роботов. Это не масштабируется. Нужно инновации на каждом уровне цепочки поставок.Мы делаем буквально всё сами — вплоть до абсурда. У нас патенты на новые способы старения литого алюминия, мировой рекорд по соотношению прочности к весу. Мы занимаемся материаловедением, делаем своё производственное оборудование и автоматизацию, свои моторы, синтетические сухожилия для приводов, силовую электронику, батареи, механику, даже камеры и сенсоры. У нас тактильные сенсоры на новом принципе, запатентованные. Собственные модели для обучения и т.д.
Tye Brady [ Amazon Robotics ]
2025 /Точка перегиба для робототехники
Это действительно большой день для робототехники. Vulcan — наш первый робот с чувством осязания. Мы открываем ворота физического ИИ: робот использует не только зрение для идентификации и манипуляции объектами, но и осязание в сочетании со зрением, чтобы брать сотни миллионов разных товаров. Именно сотни миллионов. Cтанция Vulcan- две роботизированные руки тянутся в ячейки, где всё в беспорядке, и с помощью видео и сенсоров выбирают нужный товар. Он буквально «нащупывает» его. У нас есть датчики крутящего момента, силы и давления — мы понимаем, насколько сильно давим, можем разделять предметы. Это также используется для операции «stow» — когда робот создаёт пространство в ячейке и помещает туда товар. Огромное разнообразие объектов — серьёзный вызов. Это прорыв и в ИИ, и в железе. Да — и там, и там.
2025 / Обучение через практику
Если говорить про ИИ: в отличие от языковых моделей, которые обучаются на интернете, в робототехнике мы обучаем траектории движения и способы захвата. В робототехнике обучение не через язык. Язык можно использовать для постановки задачи, но обучение идёт через данные и предыдущие действия в структурированной и неструктурированной среде. Мы строим такую foundation model. У нас крупнейший в мире парк мобильных промышленных роботов. Например, система Robin: она берёт посылку из кучи, определяет её, проверяет на повреждения и передаёт дальше на сортировку. Кажется просто — но вариативность форм и упаковок огромна. Уже более двух миллиардов захватов.Каждый захват, каждый новый объект добавляется в foundation model. Если робот сталкивается с новым предметом, данные распространяются по всей системе — все руки учатся. Это очень мощно.
Jeff Cardenas [ Apptronik ]
2025 / Точка перегиба для робототехники
Люди думают о гуманоидных роботах тысячи лет. И вот сейчас — 2025 год — мы действительно можем это делать. Это потрясающе. Мы десять лет выводили технологию из лаборатории в реальный мир. Она здесь, но это начало.Сейчас в этом участвуют умные, серьёзные люди и со стороны клиентов, и со стороны разработчиков. Мы достигли точки перегиба. Это захватывающе. Но работы ещё много.
2025 / Конкуретное преимущество -Партнерство с Google
Можно делать всё внутри, можно партнёриться. Мы партнёримся. Это сложные задачи. Нужно находить других. Google — хороший пример. Мы сотрудничаем с Google.Мы балансируем амбицию и прагматизм. Наша цель — лучшие человекоцентричные роботы по качеству, опыту, безопасности. Будут части стека, которые не имеет смысла делать внутри компании. Например, элементы DeepMind. Мы известны тем, что делаем выдающееся железо, мы создаем тело, мышцы, расширенную нервную систему из сенсоров, а Google создает мозг. Мы построим лучшую платформу.
2025 / Стадии развития робототехники
Я вижу три стадии. Первая — индустриальная база. Контролируемая среда, специалисты рядом. Логистика и производство. Вторая — выход к публике. Роботы работают рядом с людьми, с детьми, родителями. Это ритейл и здравоохранение. Коммерческая среда, задачи более непрерывные. Третья — дом. Для меня святая цель — ассистивный уход. Первая стадия уже происходит. Это как персональный компьютер для робототехники. Гуманоид — универсальная платформа, способная масштабироваться. Сейчас это примерно 80-е годы, если использовать аналогию. Системы и возможности уже есть, есть ранние коммерческие применения с большой ценностью. К 2035 году роботы будут в домах.
2025 / Смена парадигмы движения с помощью ИИ
Робот — это сеть моторов и сенсоров. Традиционные роботы были позиционно-управляемыми: мотор просто перемещал механизм в точку в пространстве. Сейчас всё меняется. Роботы эпохи ИИ работают иначе: теперь у нас датчики в контуре обратной связи — камеры, датчики силы, касания, температуры, акселерометр, который чувствует положение и ориентацию. Мы объединяем все эти сенсоры, чтобы робот осознавал происходящее, был динамичным и реагировал на среду. Для нас это базовый строительный блок. Именно актуаторы — приводы — определяют производительность и стоимость робота.
2025 /Точка перегиба для робототехники
Это действительно большой день для робототехники. Vulcan — наш первый робот с чувством осязания. Мы открываем ворота физического ИИ: робот использует не только зрение для идентификации и манипуляции объектами, но и осязание в сочетании со зрением, чтобы брать сотни миллионов разных товаров. Именно сотни миллионов. Cтанция Vulcan- две роботизированные руки тянутся в ячейки, где всё в беспорядке, и с помощью видео и сенсоров выбирают нужный товар. Он буквально «нащупывает» его. У нас есть датчики крутящего момента, силы и давления — мы понимаем, насколько сильно давим, можем разделять предметы. Это также используется для операции «stow» — когда робот создаёт пространство в ячейке и помещает туда товар. Огромное разнообразие объектов — серьёзный вызов. Это прорыв и в ИИ, и в железе. Да — и там, и там.
2025 / Обучение через практику
Если говорить про ИИ: в отличие от языковых моделей, которые обучаются на интернете, в робототехнике мы обучаем траектории движения и способы захвата. В робототехнике обучение не через язык. Язык можно использовать для постановки задачи, но обучение идёт через данные и предыдущие действия в структурированной и неструктурированной среде. Мы строим такую foundation model. У нас крупнейший в мире парк мобильных промышленных роботов. Например, система Robin: она берёт посылку из кучи, определяет её, проверяет на повреждения и передаёт дальше на сортировку. Кажется просто — но вариативность форм и упаковок огромна. Уже более двух миллиардов захватов.Каждый захват, каждый новый объект добавляется в foundation model. Если робот сталкивается с новым предметом, данные распространяются по всей системе — все руки учатся. Это очень мощно.
Jeff Cardenas [ Apptronik ]
2025 / Точка перегиба для робототехники
Люди думают о гуманоидных роботах тысячи лет. И вот сейчас — 2025 год — мы действительно можем это делать. Это потрясающе. Мы десять лет выводили технологию из лаборатории в реальный мир. Она здесь, но это начало.Сейчас в этом участвуют умные, серьёзные люди и со стороны клиентов, и со стороны разработчиков. Мы достигли точки перегиба. Это захватывающе. Но работы ещё много.
2025 / Конкуретное преимущество -Партнерство с Google
Можно делать всё внутри, можно партнёриться. Мы партнёримся. Это сложные задачи. Нужно находить других. Google — хороший пример. Мы сотрудничаем с Google.Мы балансируем амбицию и прагматизм. Наша цель — лучшие человекоцентричные роботы по качеству, опыту, безопасности. Будут части стека, которые не имеет смысла делать внутри компании. Например, элементы DeepMind. Мы известны тем, что делаем выдающееся железо, мы создаем тело, мышцы, расширенную нервную систему из сенсоров, а Google создает мозг. Мы построим лучшую платформу.
2025 / Стадии развития робототехники
Я вижу три стадии. Первая — индустриальная база. Контролируемая среда, специалисты рядом. Логистика и производство. Вторая — выход к публике. Роботы работают рядом с людьми, с детьми, родителями. Это ритейл и здравоохранение. Коммерческая среда, задачи более непрерывные. Третья — дом. Для меня святая цель — ассистивный уход. Первая стадия уже происходит. Это как персональный компьютер для робототехники. Гуманоид — универсальная платформа, способная масштабироваться. Сейчас это примерно 80-е годы, если использовать аналогию. Системы и возможности уже есть, есть ранние коммерческие применения с большой ценностью. К 2035 году роботы будут в домах.
2025 / Смена парадигмы движения с помощью ИИ
Робот — это сеть моторов и сенсоров. Традиционные роботы были позиционно-управляемыми: мотор просто перемещал механизм в точку в пространстве. Сейчас всё меняется. Роботы эпохи ИИ работают иначе: теперь у нас датчики в контуре обратной связи — камеры, датчики силы, касания, температуры, акселерометр, который чувствует положение и ориентацию. Мы объединяем все эти сенсоры, чтобы робот осознавал происходящее, был динамичным и реагировал на среду. Для нас это базовый строительный блок. Именно актуаторы — приводы — определяют производительность и стоимость робота.
Jeff Cardenas [ Apptronik ] / p.2
2025 / Масштабирование -> Снижение стоимости
Если сравнить гуманоидного робота и автомобиль, то по весу в роботе на 96% меньше сырья, чем в машине. Базовый металл в наших роботах — алюминий. Во всём роботе около 300 долларов сырого алюминия. Это значит, что с точки зрения первых принципов нет причины, по которой такие роботы должны быть дорогими или не станут намного дешевле автомобилей по мере роста цепочки поставок и объёмов производства. Сейчас цепочки поставок для этого не существует, поэтому нам приходится делать больше самостоятельно. И объёмы пока недостаточны, чтобы по-настоящему снизить себестоимость и распределить капитальные затраты на большое количество роботов. Многие компоненты уже используются в других отраслях. Например, коммерческие дроны снизили стоимость нужных нам моторов. Электромобили снизили стоимость батарей — теперь они достаточно хороши. Мы берём зрелые технологии из других индустрий и объединяем их в конечную форму.
2025 / Отсутсвие вертикально интегрированной системы
Сейчас мы проектируем и собираем системы в Остине, Техас. Постепенно передаём больше Jabil по мере масштабирования. Финальная сборка пока в Остине, дальше будет больше через Jabil. Многие приводят Tesla как полностью вертикально интегрированную компанию и спрашивают, как мы будем конкурировать, не владея производством. Но Tesla в начале работала с контрактными производителями. Говорят, нужно владеть своим AI-стеком — Tesla не владела Autopilot в начале, они работали с Mobileye. Они сотрудничали с экспертами и постепенно усиливали вертикальную интеграцию. Я считаю, что нужно выбирать свои битвы. Мы лучше всех умеем делать роботов и программное обеспечение. На этом фокус. Производство — с лучшими в мире. У нас хорошие отношения с Jabil — с этого начинаем. Это не значит, что так будет всегда.
2026 / Главный bottleneck робототехники- данные / Скептицизм об объемах
В краткосрочной перспективе в следующем году — сотни, возможно первые тысячи роботов, в основном меньше 1000 на компанию. 2027 — год начала реального масштабирования. Разговоры о 10 000 в следующем году — слишком амбициозно. Будет медленнее. Главный вопрос — данные. Есть идея собирать эгоцентрические данные людей, минуя телеоперацию. Мы и другие над этим работаем. Есть и внешние источники, например видеоданные.
2025 / Структура робототехники - прорыв Софт
Два блока — железо и софт. Железо: сеть моторов и сенсоров. Вместо пошагового программирования — сенсоры в обратной связи. Камеры (зрение), тактильные датчики, температурные сенсоры, акселерометры. Робот реагирует на мир динамически. Мы сделали более 60 итераций электрических приводов (актуаторов), балансируя безопасность, производительность и стоимость. Мы используем прогресс из дронов (дешёвые моторы), электромобилей (батареи, сенсоры). Софт: прорыв последних лет — генеративный ИИ. Вместо программирования через PhD — можно обучать, показывая пример. Софт Apollo : Linux . Поверх — наша собственная операционная система. Далее — когнитивный слой ИИ. У нас партнёрство с Google DeepMind. В Apollo вычисления находятся в груди. Подход гибридный: часть в облаке, часть — локально для реального времени.
2025 / Приложения для гуманоидных роботов - Iphone в мире робототехники
Наша цель — создать платформу, «iPhone роботов». Поверх неё разработчики смогут строить приложения. Сейчас мы идём вертикально до конечного клиента, чтобы доказать коммерческую модель. Позже появится широкая экосистема.
2025 / Масштабирование -> Снижение стоимости
Если сравнить гуманоидного робота и автомобиль, то по весу в роботе на 96% меньше сырья, чем в машине. Базовый металл в наших роботах — алюминий. Во всём роботе около 300 долларов сырого алюминия. Это значит, что с точки зрения первых принципов нет причины, по которой такие роботы должны быть дорогими или не станут намного дешевле автомобилей по мере роста цепочки поставок и объёмов производства. Сейчас цепочки поставок для этого не существует, поэтому нам приходится делать больше самостоятельно. И объёмы пока недостаточны, чтобы по-настоящему снизить себестоимость и распределить капитальные затраты на большое количество роботов. Многие компоненты уже используются в других отраслях. Например, коммерческие дроны снизили стоимость нужных нам моторов. Электромобили снизили стоимость батарей — теперь они достаточно хороши. Мы берём зрелые технологии из других индустрий и объединяем их в конечную форму.
2025 / Отсутсвие вертикально интегрированной системы
Сейчас мы проектируем и собираем системы в Остине, Техас. Постепенно передаём больше Jabil по мере масштабирования. Финальная сборка пока в Остине, дальше будет больше через Jabil. Многие приводят Tesla как полностью вертикально интегрированную компанию и спрашивают, как мы будем конкурировать, не владея производством. Но Tesla в начале работала с контрактными производителями. Говорят, нужно владеть своим AI-стеком — Tesla не владела Autopilot в начале, они работали с Mobileye. Они сотрудничали с экспертами и постепенно усиливали вертикальную интеграцию. Я считаю, что нужно выбирать свои битвы. Мы лучше всех умеем делать роботов и программное обеспечение. На этом фокус. Производство — с лучшими в мире. У нас хорошие отношения с Jabil — с этого начинаем. Это не значит, что так будет всегда.
2026 / Главный bottleneck робототехники- данные / Скептицизм об объемах
В краткосрочной перспективе в следующем году — сотни, возможно первые тысячи роботов, в основном меньше 1000 на компанию. 2027 — год начала реального масштабирования. Разговоры о 10 000 в следующем году — слишком амбициозно. Будет медленнее. Главный вопрос — данные. Есть идея собирать эгоцентрические данные людей, минуя телеоперацию. Мы и другие над этим работаем. Есть и внешние источники, например видеоданные.
2025 / Структура робототехники - прорыв Софт
Два блока — железо и софт. Железо: сеть моторов и сенсоров. Вместо пошагового программирования — сенсоры в обратной связи. Камеры (зрение), тактильные датчики, температурные сенсоры, акселерометры. Робот реагирует на мир динамически. Мы сделали более 60 итераций электрических приводов (актуаторов), балансируя безопасность, производительность и стоимость. Мы используем прогресс из дронов (дешёвые моторы), электромобилей (батареи, сенсоры). Софт: прорыв последних лет — генеративный ИИ. Вместо программирования через PhD — можно обучать, показывая пример. Софт Apollo : Linux . Поверх — наша собственная операционная система. Далее — когнитивный слой ИИ. У нас партнёрство с Google DeepMind. В Apollo вычисления находятся в груди. Подход гибридный: часть в облаке, часть — локально для реального времени.
2025 / Приложения для гуманоидных роботов - Iphone в мире робототехники
Наша цель — создать платформу, «iPhone роботов». Поверх неё разработчики смогут строить приложения. Сейчас мы идём вертикально до конечного клиента, чтобы доказать коммерческую модель. Позже появится широкая экосистема.
Sergey Levine [ Physical Intelligence ] / p.1
2025 / Выход в коммерцию - решение проблемы масштаба данных
Я всегда считал, что робототехника не так уж отличается от других областей ИИ — масштаб будет критичен.Но добраться до него сложно. У нас в отличии от автомобильной индустрии -нет миллионов машин, ездящих и собирающих данные. В отличии от LLM - нет интернета, куда генериуется миллионы контента ежедневно. Поэтому приходится быть изобретательными — деплоить роботов, заставлять их делать задачи, собирать собственные данные в масштабе. Нужно преодолеть «энергию активации», а потом запустить маховик, который будет постоянно улучшать систему. Думаю, что лучший способ создать маховик — выйти в коммерцию и работать в реальном мире.
2025 / Проблема композиционнсоти в робототехнике
Современные большие модели при достаточном масштабе начинают проявлять композиционность. Её нельзя «заставить» вручную — она появляется при масштабе и правильном распределении данных. В робототехнике сложнее — композиция движений не всегда даёт целостный контроль. Я не знаю точного ответа. Возможно решение проблемы в робототехнике - тоже придет с масштабом, возможно , нужна иерархия абстракций — высокий уровень планирования, средний — выбор объектов, низкий — моторный контроль. Пока это решается в реальном времени научным сообществом.
205 / Семантический подход к решению задач
Следующий шаг - лучшее следование сложным инструкциям. Робот мог бы не только выполнить задачу, но и уточнить детали. Это не только про взаимодействие, но и про реальное выполнение сложной работы.Это позволит роботу переиспользовать навыки. Он может подумать: какие из моих умений подходят для новой задачи? Это требует семантического знания из LLM и, возможно, дополнительного test-time compute. Мы над этим работаем.
Начало запуска флайвила > Срока достижения X
Это будет как с ИИ-ассистентами. Как только будет достигнут базовый уровень полезности, его выпустят в мир. И дальше он начнёт собирать опыт и становиться лучше. Я думаю не о дате завершения, а о дате запуска маховика. Когда он начнёт крутиться? Это может быть скоро. Чем уже задача, тем быстрее можно выйти в реальный мир. Мы уже исследуем, что именно робот может делать, чтобы начать этот маховик. Что касается того, что вам реально будет важно — однозначные годы, не десятилетия. Я надеюсь, что что-то будет уже через один-два года, но сложно сказать.Робототехника не принципиально отличается. Есть небольшие различия. Если робот работает вместе с людьми, возникают естественные сигналы обучения. Люди заинтересованы помогать, чтобы всё получилось. В физическом мире ошибки очевидны. Если ты ответил неправильно на вопрос — человек может не знать, что ответ неверен. Если ты неправильно сложил футболку — это видно. Можно проанализировать и сделать лучше. Я не думаю, что нужны радикально новые идеи. Нужен правильный синтез уже известных компонентов. Синтез сам по себе сложен. Это глубокая задача. Если повезёт и всё пойдёт по плану — разумно ожидать в пределах одного десятилетия. Если нужен медианный ответ — пять лет.
2025 / Повышение границ использования- > Масштабирование
Cовокупная выручка AI-компаний — порядка 20–30 миллиардов долларов в год, что намного меньше объёма всей интеллектуальной работы — 30–40 триллионов. LLM не делают всю разработку, потому что они хороши в определённой области, но у неё есть пределы. Эти пределы ежегодно расширяются. Нет причин думать, что с роботами будет иначе. Их область применения сначала будет небольшой: что-то они смогут делать очень хорошо, а где-то потребуется серьёзный человеческий надзор. Область будет расти. Это приведёт к росту продуктивности.
2025 / Долгосрочное снижение стоимости
Когда я начал заниматься робототехникой в 2014, я использовал PR2 за $400 000. Когда открыл лабораторию в Беркли, покупал руки по $30 000. Сейчас в Physical Intelligence каждая рука стоит около $3 000. Мы думаем, что их можно производить за малую часть этой суммы.
2025 / Выход в коммерцию - решение проблемы масштаба данных
Я всегда считал, что робототехника не так уж отличается от других областей ИИ — масштаб будет критичен.Но добраться до него сложно. У нас в отличии от автомобильной индустрии -нет миллионов машин, ездящих и собирающих данные. В отличии от LLM - нет интернета, куда генериуется миллионы контента ежедневно. Поэтому приходится быть изобретательными — деплоить роботов, заставлять их делать задачи, собирать собственные данные в масштабе. Нужно преодолеть «энергию активации», а потом запустить маховик, который будет постоянно улучшать систему. Думаю, что лучший способ создать маховик — выйти в коммерцию и работать в реальном мире.
2025 / Проблема композиционнсоти в робототехнике
Современные большие модели при достаточном масштабе начинают проявлять композиционность. Её нельзя «заставить» вручную — она появляется при масштабе и правильном распределении данных. В робототехнике сложнее — композиция движений не всегда даёт целостный контроль. Я не знаю точного ответа. Возможно решение проблемы в робототехнике - тоже придет с масштабом, возможно , нужна иерархия абстракций — высокий уровень планирования, средний — выбор объектов, низкий — моторный контроль. Пока это решается в реальном времени научным сообществом.
205 / Семантический подход к решению задач
Следующий шаг - лучшее следование сложным инструкциям. Робот мог бы не только выполнить задачу, но и уточнить детали. Это не только про взаимодействие, но и про реальное выполнение сложной работы.Это позволит роботу переиспользовать навыки. Он может подумать: какие из моих умений подходят для новой задачи? Это требует семантического знания из LLM и, возможно, дополнительного test-time compute. Мы над этим работаем.
Начало запуска флайвила > Срока достижения X
Это будет как с ИИ-ассистентами. Как только будет достигнут базовый уровень полезности, его выпустят в мир. И дальше он начнёт собирать опыт и становиться лучше. Я думаю не о дате завершения, а о дате запуска маховика. Когда он начнёт крутиться? Это может быть скоро. Чем уже задача, тем быстрее можно выйти в реальный мир. Мы уже исследуем, что именно робот может делать, чтобы начать этот маховик. Что касается того, что вам реально будет важно — однозначные годы, не десятилетия. Я надеюсь, что что-то будет уже через один-два года, но сложно сказать.Робототехника не принципиально отличается. Есть небольшие различия. Если робот работает вместе с людьми, возникают естественные сигналы обучения. Люди заинтересованы помогать, чтобы всё получилось. В физическом мире ошибки очевидны. Если ты ответил неправильно на вопрос — человек может не знать, что ответ неверен. Если ты неправильно сложил футболку — это видно. Можно проанализировать и сделать лучше. Я не думаю, что нужны радикально новые идеи. Нужен правильный синтез уже известных компонентов. Синтез сам по себе сложен. Это глубокая задача. Если повезёт и всё пойдёт по плану — разумно ожидать в пределах одного десятилетия. Если нужен медианный ответ — пять лет.
2025 / Повышение границ использования- > Масштабирование
Cовокупная выручка AI-компаний — порядка 20–30 миллиардов долларов в год, что намного меньше объёма всей интеллектуальной работы — 30–40 триллионов. LLM не делают всю разработку, потому что они хороши в определённой области, но у неё есть пределы. Эти пределы ежегодно расширяются. Нет причин думать, что с роботами будет иначе. Их область применения сначала будет небольшой: что-то они смогут делать очень хорошо, а где-то потребуется серьёзный человеческий надзор. Область будет расти. Это приведёт к росту продуктивности.
2025 / Долгосрочное снижение стоимости
Когда я начал заниматься робототехникой в 2014, я использовал PR2 за $400 000. Когда открыл лабораторию в Беркли, покупал руки по $30 000. Сейчас в Physical Intelligence каждая рука стоит около $3 000. Мы думаем, что их можно производить за малую часть этой суммы.
Sergey Levine [ Physical Intelligence ] / p.2
2019 / Достижение успеха в обобщение - большие данные + нейросети
Вы умеете завязывать шнурки и без усилий обобщаете этот навык на новые ситуации. Если у вас другие, даже странные ботинки, это не выбьет вас из колеи. У вас есть здравый смысл, который позволяет обобщать поведение. Но когда мы пытаемся систематизировать этот здравый смысл, выделить принципы — например, физику, инерцию, свойства объектов — оказывается, что реальный мир полон бесконечных исключений и частных случаев. И красивые принципы сами по себе не дают хорошего обобщения. Если посмотреть на области, где машины научились обобщать в открытом мире — компьютерное зрение, распознавание речи, обработка языка — мы увидим, что рецепт успеха не в том, чтобы формализовать принципы, а в том, чтобы использовать большие модели высокой ёмкости и обучать их на огромных объёмах данных. И вторую часть нельзя игнорировать. Успех — это не просто большие нейросети. Это большие нейросети плюс большие данные.
Chelsea Finn [ Physical Intelligence ]
2025 / Главная проблема робототехники- спецификация задач обучения
Проблема в том, что если вы хотите полностью решить конкретную робототехническую задачу, вам по сути нужно строить целую компанию вокруг этой задачи. Отдельная компания для логистики, для автоматизации мокрых лабораторий, для кухонных роботов, для хирургических роботов и так далее. Это очень сложно, потому что такой компании нужно разрабатывать новое железо, писать кастомный софт, проектировать уникальные двигательные примитивы под конкретное применение, обрабатывать крайние случаи. Всё приходится делать с нуля, если вы хотите решить задачу в робототехнике. В результате многие робототехнические компании не добились успеха во внедрении роботов в физический мир и в нашу повседневную жизнь. Мы хотим создать универсальную модель, которая позволит любому роботу выполнять любую задачу в любой среде. Мы считаем, что такая обобщённая модель может работать лучше и быть проще в использовании, чем специализированные решения — как это произошло с foundation-моделями в языке и других областях.
2025 / Прорыв робототехники
Я занимаюсь этим больше 10 лет. Раньше ничего не работало. Сейчас есть ощущение зрелости и готовности к реальному миру. Есть большой интерес к этой технологии, потому что она начинает реально работать.
2023 / Главная проблема робототехники - обобщение
Видео Boston Dynamics впечатляют, потому что движения выглядят сложными, и легко начать воспринимать робота как человека. Если человек делает такое, значит он умеет многое. Но в робототехнике такие демонстрации настроены под конкретную среду. Робота подготавливают под этот сценарий. Если изменить среду, начальную позицию или задачу, демонстрация перестает работать — робот падает. Главная проблема — обобщение. Роботы должны уметь работать в разных сценариях, с разными объектами и в разных средах. Сейчас они хорошо работают в контролируемых условиях, например на фабриках. Но дать им гибкость человеческих навыков — это сложная задача.
2019 / Достижение успеха в обобщение - большие данные + нейросети
Вы умеете завязывать шнурки и без усилий обобщаете этот навык на новые ситуации. Если у вас другие, даже странные ботинки, это не выбьет вас из колеи. У вас есть здравый смысл, который позволяет обобщать поведение. Но когда мы пытаемся систематизировать этот здравый смысл, выделить принципы — например, физику, инерцию, свойства объектов — оказывается, что реальный мир полон бесконечных исключений и частных случаев. И красивые принципы сами по себе не дают хорошего обобщения. Если посмотреть на области, где машины научились обобщать в открытом мире — компьютерное зрение, распознавание речи, обработка языка — мы увидим, что рецепт успеха не в том, чтобы формализовать принципы, а в том, чтобы использовать большие модели высокой ёмкости и обучать их на огромных объёмах данных. И вторую часть нельзя игнорировать. Успех — это не просто большие нейросети. Это большие нейросети плюс большие данные.
Chelsea Finn [ Physical Intelligence ]
2025 / Главная проблема робототехники- спецификация задач обучения
Проблема в том, что если вы хотите полностью решить конкретную робототехническую задачу, вам по сути нужно строить целую компанию вокруг этой задачи. Отдельная компания для логистики, для автоматизации мокрых лабораторий, для кухонных роботов, для хирургических роботов и так далее. Это очень сложно, потому что такой компании нужно разрабатывать новое железо, писать кастомный софт, проектировать уникальные двигательные примитивы под конкретное применение, обрабатывать крайние случаи. Всё приходится делать с нуля, если вы хотите решить задачу в робототехнике. В результате многие робототехнические компании не добились успеха во внедрении роботов в физический мир и в нашу повседневную жизнь. Мы хотим создать универсальную модель, которая позволит любому роботу выполнять любую задачу в любой среде. Мы считаем, что такая обобщённая модель может работать лучше и быть проще в использовании, чем специализированные решения — как это произошло с foundation-моделями в языке и других областях.
2025 / Прорыв робототехники
Я занимаюсь этим больше 10 лет. Раньше ничего не работало. Сейчас есть ощущение зрелости и готовности к реальному миру. Есть большой интерес к этой технологии, потому что она начинает реально работать.
2023 / Главная проблема робототехники - обобщение
Видео Boston Dynamics впечатляют, потому что движения выглядят сложными, и легко начать воспринимать робота как человека. Если человек делает такое, значит он умеет многое. Но в робототехнике такие демонстрации настроены под конкретную среду. Робота подготавливают под этот сценарий. Если изменить среду, начальную позицию или задачу, демонстрация перестает работать — робот падает. Главная проблема — обобщение. Роботы должны уметь работать в разных сценариях, с разными объектами и в разных средах. Сейчас они хорошо работают в контролируемых условиях, например на фабриках. Но дать им гибкость человеческих навыков — это сложная задача.
Chelsea Finn [ Physical Intelligence ] / p,2
2025 / Главный bottleneck робототехники- данные
Промышленная автоматизация дает огромное количество данных, но нет разнообразия. YouTube дает огромное количество данных, но не учимся писать, просто наблюдая, как пишут другие.Симуляция - есть масштаб, данные из симуляции нереалистичны и есть разрыв с реальностью. Мы пытались решить задачу по выгрузке белья из сушилки и сложить ее. Задача тяжёлая из-за вариативности одежды, её положения, смятости. Мы начали просто: складывание футболки одного бренда и размера, динамическое расправление одной футболки. Собрали данные через телеманипуляцию, обучили политику методом имитационного обучения. Модель — около 100 млн параметров, вход — изображения с камер, выход — целевые положения суставов, управление на частоте 50 Гц. Компания основана в марте 2024. Через пару месяцев мы получили политику, которая надёжно складывала одну футболку одного размера. Также тестировали динамические движения — важно точно соответствовать частоте управления. Затем усложнили: футболка не лежит ровно, а смята. Это резко усложняет задачу. Первые попытки выглядели частично разумно, но прогресса не было. Часто 0% успеха. В конце июня появились первые признаки прогресса: робот начал расправлять и складывать. Всё ещё медленно. Дальше — бельё в корзине, разные размеры, шорты. Опять 0% успеха. Мы думали: нужна память? Дольше обучать? Управление в пространстве эффектора вместо суставов? Проблемы калибровки? Больше условий? Иерархия? Более высокое разрешение? Интервенции в сборе данных? Мы всё это пробовали. Два-три месяца без результата. Прорыв случился, когда мы вдохновились языковыми моделями: вместо обучения политики на всех данных мы сделали предварительное обучение на всём датасете, а затем дообучили на тщательно отобранных, качественных демонстрациях. Он складывает V-образную футболку, хотя таких не было в дообучающем датасете. Складывает рубашки с пуговицами. Есть обобщение. Это показывает преимущество foundation-моделей, о котором я говорил: для разных задач не нужно начинать с нуля. Можно использовать предобучение на разных роботах и разных задачах. Мы также применили этот рецепт к роботам других компаний. Этого робота я никогда не видел лично. Они собрали данные, отправили их нам, мы дообучили модель на их данных. Мы даже не знали точно, как именно управляется их робот, как представляются его действия. Но после дообучения модель смогла управлять роботом, чтобы в данном случае приготовить кофе. Итоги: мы смогли независимо разработать предобучение и постобучение, разделить проблему, а затем объединить лучшее из обоих. Обучение на всех данных не работает для сложных задач; предобучение плюс постобучение на отобранных данных дает гораздо лучший результат. Аналогичный подход мы используем и при смене среды - Мы собирали данные в домах по всему Сан-Франциско, а также в разнообразных макетах кухонь и спален. В итоге более 100 уникальных комнат вошли в датасет, который стал частью более крупной смеси для предобучения. Мы арендовали три Airbnb, где никогда не были. Поставили робота на кухне. Попросили закрыть шкаф, убрать посуду. Он никогда не видел эти вилки и тарелки. Робот справился, несмотря на новые столешницы, мебель, объекты. Есть сбои. Успех около 80%.
2025 / Главный bottleneck робототехники- данные
Промышленная автоматизация дает огромное количество данных, но нет разнообразия. YouTube дает огромное количество данных, но не учимся писать, просто наблюдая, как пишут другие.Симуляция - есть масштаб, данные из симуляции нереалистичны и есть разрыв с реальностью. Мы пытались решить задачу по выгрузке белья из сушилки и сложить ее. Задача тяжёлая из-за вариативности одежды, её положения, смятости. Мы начали просто: складывание футболки одного бренда и размера, динамическое расправление одной футболки. Собрали данные через телеманипуляцию, обучили политику методом имитационного обучения. Модель — около 100 млн параметров, вход — изображения с камер, выход — целевые положения суставов, управление на частоте 50 Гц. Компания основана в марте 2024. Через пару месяцев мы получили политику, которая надёжно складывала одну футболку одного размера. Также тестировали динамические движения — важно точно соответствовать частоте управления. Затем усложнили: футболка не лежит ровно, а смята. Это резко усложняет задачу. Первые попытки выглядели частично разумно, но прогресса не было. Часто 0% успеха. В конце июня появились первые признаки прогресса: робот начал расправлять и складывать. Всё ещё медленно. Дальше — бельё в корзине, разные размеры, шорты. Опять 0% успеха. Мы думали: нужна память? Дольше обучать? Управление в пространстве эффектора вместо суставов? Проблемы калибровки? Больше условий? Иерархия? Более высокое разрешение? Интервенции в сборе данных? Мы всё это пробовали. Два-три месяца без результата. Прорыв случился, когда мы вдохновились языковыми моделями: вместо обучения политики на всех данных мы сделали предварительное обучение на всём датасете, а затем дообучили на тщательно отобранных, качественных демонстрациях. Он складывает V-образную футболку, хотя таких не было в дообучающем датасете. Складывает рубашки с пуговицами. Есть обобщение. Это показывает преимущество foundation-моделей, о котором я говорил: для разных задач не нужно начинать с нуля. Можно использовать предобучение на разных роботах и разных задачах. Мы также применили этот рецепт к роботам других компаний. Этого робота я никогда не видел лично. Они собрали данные, отправили их нам, мы дообучили модель на их данных. Мы даже не знали точно, как именно управляется их робот, как представляются его действия. Но после дообучения модель смогла управлять роботом, чтобы в данном случае приготовить кофе. Итоги: мы смогли независимо разработать предобучение и постобучение, разделить проблему, а затем объединить лучшее из обоих. Обучение на всех данных не работает для сложных задач; предобучение плюс постобучение на отобранных данных дает гораздо лучший результат. Аналогичный подход мы используем и при смене среды - Мы собирали данные в домах по всему Сан-Франциско, а также в разнообразных макетах кухонь и спален. В итоге более 100 уникальных комнат вошли в датасет, который стал частью более крупной смеси для предобучения. Мы арендовали три Airbnb, где никогда не были. Поставили робота на кухне. Попросили закрыть шкаф, убрать посуду. Он никогда не видел эти вилки и тарелки. Робот справился, несмотря на новые столешницы, мебель, объекты. Есть сбои. Успех около 80%.
Carolina Parada [ DeepMind ] / p.1
2025 / Обобщение - VLA + VLM
Мы начали внедрять большие языковые модели и foundation-модели в робототехнику, и внезапно открылась возможность, что роботы могут понимать людей. Понимать естественный язык. Интерпретировать сцену — то, что раньше приходилось жестко программировать. Это делает технологию гораздо более доступной для разных приложений. Затем мы ввели концепцию VLA — visual language action моделей, которые переносят знания из веб-концептов, которые робот физически никогда не видел, но при этом могут действовать. Вы можете сказать: «Собери все карандаши вместе», и робот поймет, что это значит, даже если никто не обучал его конкретной фразе «собери карандаши вместе». VLA — это visual language action модель. Обычно, когда говорят об ИИ, имеют в виду мультимодальные модели, VLM — visual language models. Такая модель понимает мир через зрение и язык и может рассуждать. Выход VLA — это действия, которые двигают робота. Выход VLM — это цепочка рассуждений и ответ на вопрос. Это позволяет переносить большое количество информации из семантического пространства, из мультимодальных и world-моделей в пространство действий, делая модель более универсальной. Это и позволяет создавать роботов общего назначения. Но все равно нужны прорывы, чтобы масштабироваться до уровня других foundation-моделей.
2025 / AGI в физическом мире
Мы всегда хотели решить общую задачу интеллекта — AGI. Моя команда сосредоточена на AGI в физическом мире.
2025 / Гуманоидные роботы для дома - последняя стадия
Дом — более поздний рубеж. Не потому что мы не сможем решать задачи в доме — технологии развиваются очень быстро, — а потому что дом требует более высокого уровня безопасности, приватности и защиты. Это займет время. Сначала логистика, производство, ритейл, затем здравоохранение — пространства более структурированные, но с большим разнообразием задач. Все простое там уже автоматизировано. В логистике остались сложные случаи.
2025 / Проблема обучения через наблюдение - foundation model
Мечта любого робототехника — чтобы робот мог смотреть видео или наблюдать за людьми, выполняющими задачи, и учиться из этого. Мы сами так учимся — наблюдая за другими. Раньше в команде все говорили: это случится после нашей карьеры. А сейчас мы обсуждаем — это через 5 лет или через 10? За последние годы мы внедрили LLM и VLM в робототехнику как инструменты планирования. Это позволило роботам понимать язык и абстрактные инструкции — например, разложить блоки по цветам в разные углы. Мы представили VLA — visual-language-action модель, позволяющую учиться на web-scale данных и переносить концепции в действия.
2025 / Обобщение - VLA + VLM
Сейчас робот — как двухлетний ребёнок: понимает мир, играет с объектами, знает концепции. Но если учить его, например, складывать оригами, ему нужно время практиковаться. После практики он сможет это делать. Но до повседневных пространств ещё далеко. Самое впечатляющее — это ситуации, которых робот раньше не видел. Даже мы не знали, справится ли он. И во многих случаях он справлялся. Один из примеров — слэм-данк. Команда принесла игрушки, которых робот не видел. Среди них — маленькое баскетбольное кольцо и мяч. Робота попросили сделать слэм-данк. Он никогда не видел баскетбол и эту игрушку. Через долю секунды он положил мяч в кольцо. Он опирался на понимание Gemini — что такое баскетбол и что такое слэм-данк — и выполнил правильное движение.
2025 / Обобщение - VLA + VLM
Мы начали внедрять большие языковые модели и foundation-модели в робототехнику, и внезапно открылась возможность, что роботы могут понимать людей. Понимать естественный язык. Интерпретировать сцену — то, что раньше приходилось жестко программировать. Это делает технологию гораздо более доступной для разных приложений. Затем мы ввели концепцию VLA — visual language action моделей, которые переносят знания из веб-концептов, которые робот физически никогда не видел, но при этом могут действовать. Вы можете сказать: «Собери все карандаши вместе», и робот поймет, что это значит, даже если никто не обучал его конкретной фразе «собери карандаши вместе». VLA — это visual language action модель. Обычно, когда говорят об ИИ, имеют в виду мультимодальные модели, VLM — visual language models. Такая модель понимает мир через зрение и язык и может рассуждать. Выход VLA — это действия, которые двигают робота. Выход VLM — это цепочка рассуждений и ответ на вопрос. Это позволяет переносить большое количество информации из семантического пространства, из мультимодальных и world-моделей в пространство действий, делая модель более универсальной. Это и позволяет создавать роботов общего назначения. Но все равно нужны прорывы, чтобы масштабироваться до уровня других foundation-моделей.
2025 / AGI в физическом мире
Мы всегда хотели решить общую задачу интеллекта — AGI. Моя команда сосредоточена на AGI в физическом мире.
2025 / Гуманоидные роботы для дома - последняя стадия
Дом — более поздний рубеж. Не потому что мы не сможем решать задачи в доме — технологии развиваются очень быстро, — а потому что дом требует более высокого уровня безопасности, приватности и защиты. Это займет время. Сначала логистика, производство, ритейл, затем здравоохранение — пространства более структурированные, но с большим разнообразием задач. Все простое там уже автоматизировано. В логистике остались сложные случаи.
2025 / Проблема обучения через наблюдение - foundation model
Мечта любого робототехника — чтобы робот мог смотреть видео или наблюдать за людьми, выполняющими задачи, и учиться из этого. Мы сами так учимся — наблюдая за другими. Раньше в команде все говорили: это случится после нашей карьеры. А сейчас мы обсуждаем — это через 5 лет или через 10? За последние годы мы внедрили LLM и VLM в робототехнику как инструменты планирования. Это позволило роботам понимать язык и абстрактные инструкции — например, разложить блоки по цветам в разные углы. Мы представили VLA — visual-language-action модель, позволяющую учиться на web-scale данных и переносить концепции в действия.
2025 / Обобщение - VLA + VLM
Сейчас робот — как двухлетний ребёнок: понимает мир, играет с объектами, знает концепции. Но если учить его, например, складывать оригами, ему нужно время практиковаться. После практики он сможет это делать. Но до повседневных пространств ещё далеко. Самое впечатляющее — это ситуации, которых робот раньше не видел. Даже мы не знали, справится ли он. И во многих случаях он справлялся. Один из примеров — слэм-данк. Команда принесла игрушки, которых робот не видел. Среди них — маленькое баскетбольное кольцо и мяч. Робота попросили сделать слэм-данк. Он никогда не видел баскетбол и эту игрушку. Через долю секунды он положил мяч в кольцо. Он опирался на понимание Gemini — что такое баскетбол и что такое слэм-данк — и выполнил правильное движение.
Carolina Parada [ DeepMind ] / p.2
2025 / Ловкость - Манипуляции
В прошлом году мы почти все усилия направили на ловкость. Это всё ещё активная область. Мы поняли: если позволить людям показывать роботу сложные действия через телеоперацию или «кукловождение», то человек получает дополнительную пару роботизированных рук и показывает задачу. Если это интуитивно, можно собрать много данных — робот выполняет задачу, управляемый человеком, но это роботизированные данные. В сочетании с трансформером и хорошим датасетом можно научить почти чему угодно. Это было неожиданно. Тогда мы увидели, что можем завязывать шнурки, складывать бельё, делать оригами.
2025 / Безопасность
Кроме этого, появляется семантическая физическая безопасность. Если вас просят поставить стакан на стол, вы не поставите его на край. Если видите предмет на полу, который может вызвать падение, вы его поднимете. Мы ввели новый набор данных — Asimov dataset. Он содержит множество сценариев возможных физических ситуаций и вопросы о том, какое действие безопасно. Он вдохновлён тремя законами Азимова: робот не должен причинять вред человеку; должен подчиняться приказам, если это не противоречит первому закону; должен защищать себя, если это не противоречит первым двум. Но эти законы недостаточны. Мы использовали реальные данные о травмах из больниц США, создали визуальные сценарии с вопросами о правильном действии и открыли их сообществу для тестирования моделей. Пример — нельзя класть мягкую игрушку на горячую плиту. Казалось бы, это очевидно, но такие случаи происходили. Конечно, невозможно составить исчерпывающий список. Поэтому мы используем ИИ для анализа широкого набора ситуаций травм из разных стран, формируем более сжатый список правил, а затем люди проверяют и обновляют его со временем.
2025 / Прорыв робототехники SOON
Сегодняшние роботы — как двухлетние дети. Талантливые, но в начале пути. Нужны прорывы в ловкости с обобщением — уметь быть одновременно точным и универсальным. Нужна способность учиться на работе. Они не выучат всё в лаборатории. Их нужно выпускать, давать сталкиваться с новым и становиться лучше со временем. Раньше мы спорили, случится ли это в нашей жизни. Теперь спорим — через пять или десять лет. Следующие два года будут определяющими. Ловкость, управление всем телом — всё начинает складываться в цельную систему. Да, нас ждёт взрыв робототехники, как был взрыв больших языковых моделей. И умение работать в физическом мире сделает сами ИИ-модели сильнее, потому что они начнут понимать пространство человеческого опыта. Всё начинает меняться.
2025 / Ловкость - Манипуляции
В прошлом году мы почти все усилия направили на ловкость. Это всё ещё активная область. Мы поняли: если позволить людям показывать роботу сложные действия через телеоперацию или «кукловождение», то человек получает дополнительную пару роботизированных рук и показывает задачу. Если это интуитивно, можно собрать много данных — робот выполняет задачу, управляемый человеком, но это роботизированные данные. В сочетании с трансформером и хорошим датасетом можно научить почти чему угодно. Это было неожиданно. Тогда мы увидели, что можем завязывать шнурки, складывать бельё, делать оригами.
2025 / Безопасность
Кроме этого, появляется семантическая физическая безопасность. Если вас просят поставить стакан на стол, вы не поставите его на край. Если видите предмет на полу, который может вызвать падение, вы его поднимете. Мы ввели новый набор данных — Asimov dataset. Он содержит множество сценариев возможных физических ситуаций и вопросы о том, какое действие безопасно. Он вдохновлён тремя законами Азимова: робот не должен причинять вред человеку; должен подчиняться приказам, если это не противоречит первому закону; должен защищать себя, если это не противоречит первым двум. Но эти законы недостаточны. Мы использовали реальные данные о травмах из больниц США, создали визуальные сценарии с вопросами о правильном действии и открыли их сообществу для тестирования моделей. Пример — нельзя класть мягкую игрушку на горячую плиту. Казалось бы, это очевидно, но такие случаи происходили. Конечно, невозможно составить исчерпывающий список. Поэтому мы используем ИИ для анализа широкого набора ситуаций травм из разных стран, формируем более сжатый список правил, а затем люди проверяют и обновляют его со временем.
2025 / Прорыв робототехники SOON
Сегодняшние роботы — как двухлетние дети. Талантливые, но в начале пути. Нужны прорывы в ловкости с обобщением — уметь быть одновременно точным и универсальным. Нужна способность учиться на работе. Они не выучат всё в лаборатории. Их нужно выпускать, давать сталкиваться с новым и становиться лучше со временем. Раньше мы спорили, случится ли это в нашей жизни. Теперь спорим — через пять или десять лет. Следующие два года будут определяющими. Ловкость, управление всем телом — всё начинает складываться в цельную систему. Да, нас ждёт взрыв робототехники, как был взрыв больших языковых моделей. И умение работать в физическом мире сделает сами ИИ-модели сильнее, потому что они начнут понимать пространство человеческого опыта. Всё начинает меняться.
Deepak Pathak [ Skild AI ]
2025 / Обобщение - Адаптация
Ключ к AI в реальном мире — способность учиться, потому что физический мир полон неожиданных ситуаций. Даже если собрать самых умных инженеров, вы не сможете предусмотреть все крайние случаи. Я держу бутылку — рука может соскользнуть по-новому. Нужно адаптироваться за миллисекунды. Мы имитируем принцип обучения. Недавно мы разработали «in-context learning» для робототехники. В языковых моделях это значит, что если дать примеры «вопрос-ответ», модель учится из контекста. Это свойство появилось только при обучении на масштабах 100 триллионов токенов. Мы показали ранние, но сильные результаты в робототехнике. Есть видео, где у робота убирают конечности, а он всё равно адаптируется и начинает ползти.
2026 / Единственная проблема робототехники - мозг
Проблема робототехники — не железо, а мозг. Демо-роботы были и 70 лет назад, но они не вокруг нас. Почему? Нет универсального мозга. В робототехнике нет данных, как в языке. Нельзя каждый раз переобучать модель под новое железо. Мы хотим один мозг, который можно поставить на любое тело и который продолжает улучшаться. Наш девиз: любой робот, любая задача, один мозг. Мы строим универсальную модель, которую можно установить на любое железо — гуманоид, четвероногий робот, в помещении или на улице — один мозг для воплощённого интеллекта.
2026 / Основная стратегия развития - флайвил данных
Мы привлекли 1.4 миллиарда. Вычисления — большая статья расходов. Будем масштабировать модели и данные. Второе — построить «data flywheel»: разнообразные развертывания, сбор данных и обратная подача в модель. Это физический процесс: батареи, поломки — не как скачать приложение.
Robin Zeng [ CATL ]
2025 / Батареи - Монополия Китай
У нас два основных продукта. Первый — батареи для электромобильности. Они стоят, например, в машинах Tesla — Model 3 и других моделях, в автомобилях китайских производителей и многих мировых OEM. Эти батареи питают весь автомобиль. Второй продукт — батареи для систем накопления энергии. Возобновляемая энергия, как ветер и солнечные панели, нестабильна. Нужны накопители, чтобы сглаживать подачу, делать её стабильной, предсказуемой и пригодной для промышленности и других нужд. В Китае две трети самых цитируемых работ по батареям, более 50 программ по батареям, в США — всего несколько. Наша доля мирового рынка производства батарей - 40%.
2025 / Электрические самолёты
Мы работаем с партнёрами. Нужно начинать с малых самолётов. Мы уже четыре раза поднимали прототипы. Для коммерческого применения — самолёты около 8,8 тонн, примерно на 14 пассажиров. Думаем, к 2027–2028 появятся первые применения.
2025 / Обобщение - Адаптация
Ключ к AI в реальном мире — способность учиться, потому что физический мир полон неожиданных ситуаций. Даже если собрать самых умных инженеров, вы не сможете предусмотреть все крайние случаи. Я держу бутылку — рука может соскользнуть по-новому. Нужно адаптироваться за миллисекунды. Мы имитируем принцип обучения. Недавно мы разработали «in-context learning» для робототехники. В языковых моделях это значит, что если дать примеры «вопрос-ответ», модель учится из контекста. Это свойство появилось только при обучении на масштабах 100 триллионов токенов. Мы показали ранние, но сильные результаты в робототехнике. Есть видео, где у робота убирают конечности, а он всё равно адаптируется и начинает ползти.
2026 / Единственная проблема робототехники - мозг
Проблема робототехники — не железо, а мозг. Демо-роботы были и 70 лет назад, но они не вокруг нас. Почему? Нет универсального мозга. В робототехнике нет данных, как в языке. Нельзя каждый раз переобучать модель под новое железо. Мы хотим один мозг, который можно поставить на любое тело и который продолжает улучшаться. Наш девиз: любой робот, любая задача, один мозг. Мы строим универсальную модель, которую можно установить на любое железо — гуманоид, четвероногий робот, в помещении или на улице — один мозг для воплощённого интеллекта.
2026 / Основная стратегия развития - флайвил данных
Мы привлекли 1.4 миллиарда. Вычисления — большая статья расходов. Будем масштабировать модели и данные. Второе — построить «data flywheel»: разнообразные развертывания, сбор данных и обратная подача в модель. Это физический процесс: батареи, поломки — не как скачать приложение.
Robin Zeng [ CATL ]
2025 / Батареи - Монополия Китай
У нас два основных продукта. Первый — батареи для электромобильности. Они стоят, например, в машинах Tesla — Model 3 и других моделях, в автомобилях китайских производителей и многих мировых OEM. Эти батареи питают весь автомобиль. Второй продукт — батареи для систем накопления энергии. Возобновляемая энергия, как ветер и солнечные панели, нестабильна. Нужны накопители, чтобы сглаживать подачу, делать её стабильной, предсказуемой и пригодной для промышленности и других нужд. В Китае две трети самых цитируемых работ по батареям, более 50 программ по батареям, в США — всего несколько. Наша доля мирового рынка производства батарей - 40%.
2025 / Электрические самолёты
Мы работаем с партнёрами. Нужно начинать с малых самолётов. Мы уже четыре раза поднимали прототипы. Для коммерческого применения — самолёты около 8,8 тонн, примерно на 14 пассажиров. Думаем, к 2027–2028 появятся первые применения.
👍1
Forwarded from mein lieblingstagebuch
Привет! Завтра в 15:00 по МСК организую комьюнити-кол! Темы для обсуждения: все что стриггерило вас за последние 2 недели.
В этот раз постараюсь быть кратче и не распинаться более чем на 1-2 часа.
Свои темы отпишу вечером в чате, в комментариях к посту прошу оставлять свои предложения.
До встречи!
В этот раз постараюсь быть кратче и не распинаться более чем на 1-2 часа.
Свои темы отпишу вечером в чате, в комментариях к посту прошу оставлять свои предложения.
До встречи!
🔥5👍1
Децентрализованный ИИ
Covenant-72B [ LLM-модель от сабнета TAO - Templar ]
Виральность твитта: > 1.5M Views
Бенчмарки сравниваются с Llama-2, которая не является передовой моделью Meta
Кол-во публичных упоминаний в X от AI ресерчеров: 0
НО до выпуска этой модели, в январе их отмечал фаундер Anthropic, ссылаясь на статью от Epoch AI, как самую мощную децентрализованную модель вычислений в текущий момент. Он считает возможным дальнейший рост децентрализованного ИИ - но выразил сомнения в потенциале обойти централизованные дата-центры.
Проблема децентрализованного ИИ:
Связь между GPU в дата-центре проходит через NVLink / InfinityBand и иные решения, позволяющие линейное масштабирование.
Связь между GPU при децентрализованном ИИ через Интернет
Потенциальные решения:
DiLoCo ( DeepMind )
Prime Intellect [ INTELLECT -1 ]
Масштаб модели: 10B параметров
Мощность вычислений: 1e16 FLOP/s
Кол-во распределенных участников: 14 [ 3 континента ]
FLOPS utilization: 36.2-41.4%
Compute utilization: 83-96%
https://arxiv.org/abs/2412.01152
SparceLoCo ( Templar )
Covenant‑72B
Масштаб модели: 72B параметров
Мощность вычислений: 9e16 FLOP/s
Кол-во распределенных участников: 70
FLOPS utilization: TBA
Compute utilization: TBA
https://arxiv.org/pdf/2508.15706
Heterogeneous SparseLoCo ( Templar )
*Теория
https://arxiv.org/pdf/2601.02360
Показатели передовых централизованных дата-центров:
Масштаб модели: 100B-1T
Мощность вычислений: ~ 1e18 FLOPs
FLOPS utilization: >50%
Compute utilization: >85%
Сравнение Covenant-72B с INTELLECT-1 / Psyche + LLAMA 2
[ LINK ] / Превосходит по бенчмаркам языковой модели децентрализованных конкурентов, но немного отстает от старой модели Llama-2
Наиболее важные проблемы:
Synchronization Efficiency (P55 / P99 ) [ TBA ]
Fault Tolerance [ TBA ]
Scalability [ TBA ]
Consistency [ TBA ]
Network Bandwidth Utilization [ решена через сжатие ]
FLOPS utilization [ решена ]
Compute utilization [ решена ]
Самая главная проблема, что вышеуказанные модели были реализованы на маленьком кол-ве участников сети [ 14 / 70 ] и на мощных кластерах GPU, главные проблемы начинаются при масштабировании - больший масштаб кол-ва участников сети по геолокации / по мощности GPU
Потенциальные преимущества децентрализованного ИИ:
-Стоимость [ *оценочные данные ]
-Проблема централизации в обучении / 3-5 компаний владеют ИИ = контроль решений ИИ = контроль человеческий решений
Текущие игроки в децентрализованном ИИ:
-Templar [ лидер ]
-Nous
-Prime Intellect
-Pluralis
-Остальные [ Gonka / Cocoon / ... ]
Covenant-72B [ LLM-модель от сабнета TAO - Templar ]
Виральность твитта: > 1.5M Views
Бенчмарки сравниваются с Llama-2, которая не является передовой моделью Meta
Кол-во публичных упоминаний в X от AI ресерчеров: 0
НО до выпуска этой модели, в январе их отмечал фаундер Anthropic, ссылаясь на статью от Epoch AI, как самую мощную децентрализованную модель вычислений в текущий момент. Он считает возможным дальнейший рост децентрализованного ИИ - но выразил сомнения в потенциале обойти централизованные дата-центры.
Проблема децентрализованного ИИ:
Связь между GPU в дата-центре проходит через NVLink / InfinityBand и иные решения, позволяющие линейное масштабирование.
Связь между GPU при децентрализованном ИИ через Интернет
Потенциальные решения:
DiLoCo ( DeepMind )
Prime Intellect [ INTELLECT -1 ]
Масштаб модели: 10B параметров
Мощность вычислений: 1e16 FLOP/s
Кол-во распределенных участников: 14 [ 3 континента ]
FLOPS utilization: 36.2-41.4%
Compute utilization: 83-96%
https://arxiv.org/abs/2412.01152
SparceLoCo ( Templar )
Covenant‑72B
Масштаб модели: 72B параметров
Мощность вычислений: 9e16 FLOP/s
Кол-во распределенных участников: 70
FLOPS utilization: TBA
Compute utilization: TBA
https://arxiv.org/pdf/2508.15706
Heterogeneous SparseLoCo ( Templar )
*Теория
https://arxiv.org/pdf/2601.02360
Показатели передовых централизованных дата-центров:
Масштаб модели: 100B-1T
Мощность вычислений: ~ 1e18 FLOPs
FLOPS utilization: >50%
Compute utilization: >85%
Сравнение Covenant-72B с INTELLECT-1 / Psyche + LLAMA 2
[ LINK ] / Превосходит по бенчмаркам языковой модели децентрализованных конкурентов, но немного отстает от старой модели Llama-2
Наиболее важные проблемы:
Synchronization Efficiency (P55 / P99 ) [ TBA ]
Fault Tolerance [ TBA ]
Scalability [ TBA ]
Consistency [ TBA ]
Network Bandwidth Utilization [ решена через сжатие ]
FLOPS utilization [ решена ]
Compute utilization [ решена ]
Самая главная проблема, что вышеуказанные модели были реализованы на маленьком кол-ве участников сети [ 14 / 70 ] и на мощных кластерах GPU, главные проблемы начинаются при масштабировании - больший масштаб кол-ва участников сети по геолокации / по мощности GPU
Потенциальные преимущества децентрализованного ИИ:
-Стоимость [ *оценочные данные ]
-Проблема централизации в обучении / 3-5 компаний владеют ИИ = контроль решений ИИ = контроль человеческий решений
Текущие игроки в децентрализованном ИИ:
-Templar [ лидер ]
-Nous
-Prime Intellect
-Pluralis
-Остальные [ Gonka / Cocoon / ... ]
❤4👍1
Децентрализованный ИИ - крипта
Performance / 30D [ основной рост с 12.03 ] :
Subnets +50-300%
GRASS +95%
TAO + 45%
SAHARA + 45%
FET +40%
AGIX + 35%
NEAR +35%
ALLO + 35%
Крупные инфлы, подсвечивающие TAO / Subnets
https://x.com/Jason/status/2029944723235013005
https://x.com/0xSammy/status/2033438434061062328
https://x.com/AlgodTrading/status/2032940840188805562
https://x.com/Route2FI/status/2033115728052625588
Анализ Subnets TAO:
https://drive.google.com/file/d/1EvdrwUveJjRgNcmU3_LowIxY2i3l-J-v/view
https://www.khala.io/bittensor-the-intelligence-olympics
По TAO - пока просто слежу за проектом.
По остальным монетам, которые выросли на фоне этого- открываю шорты
Причины:
-Нет никаких успехов в области ИИ
-Плохой сентимент для проектов - пустышек - с обещаниями
-Маленькое кол-во упоминаний о монетах децентрализованного ИИ в CT
Шорт-Позиции:
FET / 4x [ 2500$ ]
ALLO / 4x [ 1000$ ]
Банк № 2 ( Шорт ) - 48 500$ / 75 000$
[ эти позиции + те которые из последнего поста ]
Performance / 30D [ основной рост с 12.03 ] :
Subnets +50-300%
GRASS +95%
TAO + 45%
SAHARA + 45%
FET +40%
AGIX + 35%
NEAR +35%
ALLO + 35%
Крупные инфлы, подсвечивающие TAO / Subnets
https://x.com/Jason/status/2029944723235013005
https://x.com/0xSammy/status/2033438434061062328
https://x.com/AlgodTrading/status/2032940840188805562
https://x.com/Route2FI/status/2033115728052625588
Анализ Subnets TAO:
https://drive.google.com/file/d/1EvdrwUveJjRgNcmU3_LowIxY2i3l-J-v/view
https://www.khala.io/bittensor-the-intelligence-olympics
По TAO - пока просто слежу за проектом.
По остальным монетам, которые выросли на фоне этого- открываю шорты
Причины:
-Нет никаких успехов в области ИИ
-Плохой сентимент для проектов - пустышек - с обещаниями
-Маленькое кол-во упоминаний о монетах децентрализованного ИИ в CT
Шорт-Позиции:
FET / 4x [ 2500$ ]
ALLO / 4x [ 1000$ ]
Банк № 2 ( Шорт ) - 48 500$ / 75 000$
[ эти позиции + те которые из последнего поста ]
❤2
Гуманоидные Роботы / p.1
Текущая стоимость по оценке McKinsey [ 10.2025 г. ] на прототип: 150 000$ - 500 000$ [ Figure AI / Optimus ]
Для сравнения, Unitree Edu коммерческая цена от 50 000$.
Стоимость / Оценка McKinsey:
Актуаторы: 50- 60%
Включают в себя: моторы, сенсоры, редукторы и т.д.
Вероятнее всего, цена связана с тем что нет готовой цепочки поставок для гуманоидов. Нет готовых актуаторов, сенсоров, батарей, кинематики, софта.
Вычисления: 5-10%
Практически все компании, в том числе китайские, используют GPU от NVIDIA Jetson [ 1000 - 3000$ ]
Tesla Optimus используют собственные решение - AI5 в партнерстве с Samsung / TSMC
Манипуляторы для рук: 10-20%
Батареи / Станция: 5-10%
Механический корпус: 5-10%
Прогнозы по кол-ву Гуманоидных роботов:
Bank of America / Goldman Sachs / Morgan Stanley / Tesla - 1 млн / год к 2030 г.
Elon Musk - 10 млрд. роботов до 2045 г.
При экспоненциальном росте, на который не ставят большинство аналитиков, предположим :
2030 г. - 10 млн / год
2035 г. - 1 млрд / год
Потенциальные bottlnecks:
-GPU + Memory
-Редкоземельные металлы
-Аллюминий
-Батареи
-Сенсоры
-Данные
McKinsey Research
Morgan Stanley Research
Bank Of America Research
Текущая стоимость по оценке McKinsey [ 10.2025 г. ] на прототип: 150 000$ - 500 000$ [ Figure AI / Optimus ]
Для сравнения, Unitree Edu коммерческая цена от 50 000$.
Стоимость / Оценка McKinsey:
Актуаторы: 50- 60%
Включают в себя: моторы, сенсоры, редукторы и т.д.
Вероятнее всего, цена связана с тем что нет готовой цепочки поставок для гуманоидов. Нет готовых актуаторов, сенсоров, батарей, кинематики, софта.
Вычисления: 5-10%
Практически все компании, в том числе китайские, используют GPU от NVIDIA Jetson [ 1000 - 3000$ ]
Tesla Optimus используют собственные решение - AI5 в партнерстве с Samsung / TSMC
Манипуляторы для рук: 10-20%
Батареи / Станция: 5-10%
Механический корпус: 5-10%
Прогнозы по кол-ву Гуманоидных роботов:
Bank of America / Goldman Sachs / Morgan Stanley / Tesla - 1 млн / год к 2030 г.
Elon Musk - 10 млрд. роботов до 2045 г.
При экспоненциальном росте, на который не ставят большинство аналитиков, предположим :
2030 г. - 10 млн / год
2035 г. - 1 млрд / год
Потенциальные bottlnecks:
-GPU + Memory
-Редкоземельные металлы
-Аллюминий
-Батареи
-Сенсоры
-Данные
McKinsey Research
Morgan Stanley Research
Bank Of America Research
❤3
https://www.humanoids.fyi/
можно трекать поставщиков компаний по робототехнике / основные модели гуманоидов и их технические характеристики / foundation модели и т.д
можно трекать поставщиков компаний по робототехнике / основные модели гуманоидов и их технические характеристики / foundation модели и т.д
🔥6❤1
Космические дата-центры / Тезисы p.1
10.2025 / Elon Musk
SpaceX будет делать дата-центры в космосе на базе Starlink V3
10.2025 / Jeff Bezos
Одна из вещей, которая произойдёт… трудно сказать точно когда, но я ставлю, что не больше 20: мы начнём строить гигантские гигаваттные дата-центры в космосе. Их будет лучше строить в космосе, потому что там солнечная энергия 24/7. И там нет облаков, нет дождя, нет погоды. Так что мы сможем обойти по стоимости наземные дата-центры, построив их в космосе, в ближайшие пару десятилетий. Это уже случилось с метеоспутниками. Это уже случилось со спутниками связи. В космосе у нас неограниченная энергия и неограниченные материальные ресурсы.
11.2025 / Sundar Pichai
Нет сомнений, что в течении этого века, космос - будет основным место для строительства дата-центров. Энергия солнца в сотни-триллионов раз больше.
11.2025 / Elon Musk
Если создать производство спутников и дата-центров на Луне и запускать грузы с поверхности Луны с помощью массовых драйверов в стиле О’Нила, можно выводить 500–1000 ТВт/год AI-спутников, существенно продвигаясь вверх по шкале Кардашёва и используя заметную долю энергии Солнца.
11.2025 / Alex Wisner-Gross
Есть заблуждение, будто нельзя эксплуатировать термически нагруженный дата-центр без охлаждения на основе теплопроводности. Это совершенно неправда. Решение здесь в том, что космический микроволновый фон имеет температуру около 3 кельвинов. В среднем Вселенная довольно холодная. Хитрость в том, что вам нужно излучать тепло в правильном направлении. Не стоит пытаться излучать тепло, например, в сторону Солнца. С точки зрения термодинамики это не поможет. Но если вы можете обеспечить, что радиационное охлаждение направлено в сторону космического микроволнового фона, а это большая часть неба, если вы ориентируете систему охлаждения в более холодные направления, всё в порядке. И тогда вы можете охлаждать излучением, а не теплопроводностью. То есть тут есть некоторая задача навигации: нужно правильно направлять систему, правильно её ориентировать. Но это абсолютно реализуемо. А что касается сроков: я был бы умеренно, а может и очень, удивлён, если через 10 лет, если говорить консервативно, мы не увидим сотни гигаватт ИИ-вычислений вне поверхности Земли.
12.2025 / Elon Musk
Космические дата-центры в любом случае победят дата-центры на Земле. В течении 5 лет, эффективность космиических дата центров будет выше чем на Земле. Солнце обладает большим кол-вом энергии, которое превышает потенциально возможную энергию Земли в миллионы раз. Если вы хотите сделать условно AI Factory -на 500 гигаватт - то это будет очень сложно добиться на Земле. США в год потребляет всего 460 гигаватт в среднем. В космосе у вас постоянная солнечная энергия - это решает проблему интермиттентности ВИЭ / Охлаждение — радиационное / батерии практически не нужны.
01.2026 / Elon Musk
Starship — недооценённая революция. Люди не до конца это понимают. Впервые в истории ракета изначально спроектирована под полную и быструю многоразовость. Здесь успех заложен в пространство возможных результатов, а не является фантазией. Мы добились частично реюзабилити - в этом году, надеемся достичь полной.
01.2026 / Elon Musk
Через 3 г. ИИ-датацентры на орбите будут дешевле, чем на Земле
02.2026 / Philip Johnston [ StarCloud CEO ]
Я посчитал всё вместе со своими сооснователями, Эзрой Фейлденом и Ади Олтеаном, и мы пришли к выводу, что если стоимость запуска снизится примерно до 500 долларов за килограмм, то дата-центры в космосе станут экономически жизнеспособными.
02.2026 / Elon Musk
В течении нескольких лет, мы будем запускать ИИ спутники -дата центры SpaceX, которые будут получать энергию из космоса. Это даст нам бесконечный скейл + Солнечная энергия в космосе в 5× эффективнее, чем на Земле. Самое выгодное размещение дата-центров для ИИ - космос.
02.2026 / Elon Musk
Через 30–36 месяцев космос станет самым дешёвым местом для ИИ
10.2025 / Elon Musk
SpaceX будет делать дата-центры в космосе на базе Starlink V3
10.2025 / Jeff Bezos
Одна из вещей, которая произойдёт… трудно сказать точно когда, но я ставлю, что не больше 20: мы начнём строить гигантские гигаваттные дата-центры в космосе. Их будет лучше строить в космосе, потому что там солнечная энергия 24/7. И там нет облаков, нет дождя, нет погоды. Так что мы сможем обойти по стоимости наземные дата-центры, построив их в космосе, в ближайшие пару десятилетий. Это уже случилось с метеоспутниками. Это уже случилось со спутниками связи. В космосе у нас неограниченная энергия и неограниченные материальные ресурсы.
11.2025 / Sundar Pichai
Нет сомнений, что в течении этого века, космос - будет основным место для строительства дата-центров. Энергия солнца в сотни-триллионов раз больше.
11.2025 / Elon Musk
Если создать производство спутников и дата-центров на Луне и запускать грузы с поверхности Луны с помощью массовых драйверов в стиле О’Нила, можно выводить 500–1000 ТВт/год AI-спутников, существенно продвигаясь вверх по шкале Кардашёва и используя заметную долю энергии Солнца.
11.2025 / Alex Wisner-Gross
Есть заблуждение, будто нельзя эксплуатировать термически нагруженный дата-центр без охлаждения на основе теплопроводности. Это совершенно неправда. Решение здесь в том, что космический микроволновый фон имеет температуру около 3 кельвинов. В среднем Вселенная довольно холодная. Хитрость в том, что вам нужно излучать тепло в правильном направлении. Не стоит пытаться излучать тепло, например, в сторону Солнца. С точки зрения термодинамики это не поможет. Но если вы можете обеспечить, что радиационное охлаждение направлено в сторону космического микроволнового фона, а это большая часть неба, если вы ориентируете систему охлаждения в более холодные направления, всё в порядке. И тогда вы можете охлаждать излучением, а не теплопроводностью. То есть тут есть некоторая задача навигации: нужно правильно направлять систему, правильно её ориентировать. Но это абсолютно реализуемо. А что касается сроков: я был бы умеренно, а может и очень, удивлён, если через 10 лет, если говорить консервативно, мы не увидим сотни гигаватт ИИ-вычислений вне поверхности Земли.
12.2025 / Elon Musk
Космические дата-центры в любом случае победят дата-центры на Земле. В течении 5 лет, эффективность космиических дата центров будет выше чем на Земле. Солнце обладает большим кол-вом энергии, которое превышает потенциально возможную энергию Земли в миллионы раз. Если вы хотите сделать условно AI Factory -на 500 гигаватт - то это будет очень сложно добиться на Земле. США в год потребляет всего 460 гигаватт в среднем. В космосе у вас постоянная солнечная энергия - это решает проблему интермиттентности ВИЭ / Охлаждение — радиационное / батерии практически не нужны.
01.2026 / Elon Musk
Starship — недооценённая революция. Люди не до конца это понимают. Впервые в истории ракета изначально спроектирована под полную и быструю многоразовость. Здесь успех заложен в пространство возможных результатов, а не является фантазией. Мы добились частично реюзабилити - в этом году, надеемся достичь полной.
01.2026 / Elon Musk
Через 3 г. ИИ-датацентры на орбите будут дешевле, чем на Земле
02.2026 / Philip Johnston [ StarCloud CEO ]
Я посчитал всё вместе со своими сооснователями, Эзрой Фейлденом и Ади Олтеаном, и мы пришли к выводу, что если стоимость запуска снизится примерно до 500 долларов за килограмм, то дата-центры в космосе станут экономически жизнеспособными.
02.2026 / Elon Musk
В течении нескольких лет, мы будем запускать ИИ спутники -дата центры SpaceX, которые будут получать энергию из космоса. Это даст нам бесконечный скейл + Солнечная энергия в космосе в 5× эффективнее, чем на Земле. Самое выгодное размещение дата-центров для ИИ - космос.
02.2026 / Elon Musk
Через 30–36 месяцев космос станет самым дешёвым местом для ИИ
👍3
Космические дата-центры / Тезисы p.2
02.2026 / Jensen Huang
Проблемы охлаждения. Проблемы радиации, деградации производительности, исправление дефектов. Я отправил инженеров для работы над этой темой - НО сейчас мы больше сфокусированы на Земле -и хотим решить все проблемы сначала здесь. У нас столько простаивающей энергии, я хочу задействовать её как можно быстрее.
02.2026 / Jensen Huang
Мы также будем строить дата-центры в космосе. Разумеется, это очень сложная задача. Поэтому вместе с нашими партнёрами мы работаем над новым компьютером под названием Vera Rubin Space One .Он отправится в космос и положит начало созданию дата-центров в космосе. Конечно, в космосе нет ни теплопроводности, ни конвекции — есть только излучение. Поэтому нам нужно понять, как охлаждать такие системы в космосе. Но у нас много отличных инженеров, которые над этим работают
02.2026 / Sam Altman
Размещение дата-центров в космосе - абсурд. Стоимость запуска намного превышает стоимость запуска на Земле. Не говоря, о том что видеокарту в космосе чинить намного сложнее - а они все еще часто ломаются. Нужно больше 10 лет для того чтобы технологии созрели к космосу.
02.2026 / Jensen Huang
Проблемы охлаждения. Проблемы радиации, деградации производительности, исправление дефектов. Я отправил инженеров для работы над этой темой - НО сейчас мы больше сфокусированы на Земле -и хотим решить все проблемы сначала здесь. У нас столько простаивающей энергии, я хочу задействовать её как можно быстрее.
02.2026 / Jensen Huang
Мы также будем строить дата-центры в космосе. Разумеется, это очень сложная задача. Поэтому вместе с нашими партнёрами мы работаем над новым компьютером под названием Vera Rubin Space One .Он отправится в космос и положит начало созданию дата-центров в космосе. Конечно, в космосе нет ни теплопроводности, ни конвекции — есть только излучение. Поэтому нам нужно понять, как охлаждать такие системы в космосе. Но у нас много отличных инженеров, которые над этим работают
02.2026 / Sam Altman
Размещение дата-центров в космосе - абсурд. Стоимость запуска намного превышает стоимость запуска на Земле. Не говоря, о том что видеокарту в космосе чинить намного сложнее - а они все еще часто ломаются. Нужно больше 10 лет для того чтобы технологии созрели к космосу.
❤1
Космические дата-центры / Ключевые События
03.2025 / SpaceX
Частичная многоразовать ракеты / возврат первой ступени
05.2025 / Relativity Space
Эрик Шмидт приобрел Relativity Space для переноса ИИ дата-центров в космос
11.2025 / Google - Project Suncatcher
Исследовательский проект от Google Research с целью создания космических дата-центров через TPU
11.2025 / Blue Origin
Частичная многоразовать ракеты / возврат первой ступени
11.2025 / StarCloud
Запуск первого H100 на орбиту
12.2025 / SpaceX
Reuters: SpaceX IPO в 2026
01.2026 / CASC
Главная китайская компания в сфере космоса, CASC - включила в пятилетний план создание дата-центров в космосе
01.2026 / ISRO
Главный космический игрок Индии заявил о работе в сфере дата-центров в космсосе
01.2026 / Tesla
Анонс AI7 чипов для дата-центров в космосе
02.2026 / SpaceX
Подача заявки в FCC на запуск 1 млн. спутников для дата-центров
03.2026 / Blue Origin
Подача заявки в FCC на запуск 50 000 спутников для дата-центров
03.2026 / NVIDIA
Space-1 Vera Rubin Module - орбитальный GPU для космических дата-центров
03.2026 / SpaceX
Reuters: SpaceX планируют подать заявку на IPO на этой неделе
03.2025 / SpaceX
Частичная многоразовать ракеты / возврат первой ступени
05.2025 / Relativity Space
Эрик Шмидт приобрел Relativity Space для переноса ИИ дата-центров в космос
11.2025 / Google - Project Suncatcher
Исследовательский проект от Google Research с целью создания космических дата-центров через TPU
11.2025 / Blue Origin
Частичная многоразовать ракеты / возврат первой ступени
11.2025 / StarCloud
Запуск первого H100 на орбиту
12.2025 / SpaceX
Reuters: SpaceX IPO в 2026
01.2026 / CASC
Главная китайская компания в сфере космоса, CASC - включила в пятилетний план создание дата-центров в космосе
01.2026 / ISRO
Главный космический игрок Индии заявил о работе в сфере дата-центров в космсосе
01.2026 / Tesla
Анонс AI7 чипов для дата-центров в космосе
02.2026 / SpaceX
Подача заявки в FCC на запуск 1 млн. спутников для дата-центров
03.2026 / Blue Origin
Подача заявки в FCC на запуск 50 000 спутников для дата-центров
03.2026 / NVIDIA
Space-1 Vera Rubin Module - орбитальный GPU для космических дата-центров
03.2026 / SpaceX
Reuters: SpaceX планируют подать заявку на IPO на этой неделе
❤1
Космические дата-центры
Преимущества
•Эффективность солнечной энергии
Увеличение эффективности солнечных панелей в 8 раз + уменьшение стоимости солнечных панелей за счет отсутствия необходимости стекла / рамы / батарей
•Количество энергии
Шкала Кардашева
•Решение проблемы энергетического кризиса / дефицита
Климатический кризис на Земле из-за энергетики / Дефицит энергетики в некоторых странах
Охлаждение
Виснер-Гросс: H100 от StarCloud охлаждается, используя только алюминий в качестве радиатора
Маск: охлаждение просто через излучение
Ремонтные работы
Закладывать избыточность + при появлении новых архитектур запускать повторные миссии по смене модуля чипа полностью.
Радиационная стойкость чипов
Результаты тестирования Google также многообещающие на TPU Trillium - и это с учетом, что чип был произведен как базовый, не специализированный для космических задач. Следующие поколения могут быть улучшения на уровне кристаллов чипов.
Межспутниковые сверхскоростные каналы связей
Google работает над этой проблемой и есть определенные успехи / сумели добиться в лабараторных тестированиях необходимых результатов > 1 Tbit/s. Для инференс вычислений менее требовательно, чем к AI Training.
Орбитальный мусор
SpaceX за 2025 г. сделали > 300 000 маневров и 0 зафиксированных столконовений
Текущие спутники StarLink в кол-ве ~ 13 000 находятся на орбите 340 - 535 км / Новая заявка в FCC на 1 млн. спутников содержит данные об размещение спутников на орбите 500 - 2000 км - увеличение в 10 раз
Регуляторные риски
Потенциальные регуляторные задержки, для запуска спутников необходимо разрешение FCC. Скейлинг масштабирования может тормозиться бюрократией. Последнее одобрение заявки Gen2 StarLink на дополнительные 7 500 спутников, рассматривалось > 15 месяцев. Текущая заявка сразу на 1 млн.
Срок жизни спутника
Текущие прототипы живут 5-7 лет. Многократный CAPEX каждые 5-7 лет.
Преимущества
•Эффективность солнечной энергии
Увеличение эффективности солнечных панелей в 8 раз + уменьшение стоимости солнечных панелей за счет отсутствия необходимости стекла / рамы / батарей
•Количество энергии
Шкала Кардашева
•Решение проблемы энергетического кризиса / дефицита
Климатический кризис на Земле из-за энергетики / Дефицит энергетики в некоторых странах
Охлаждение
Виснер-Гросс: H100 от StarCloud охлаждается, используя только алюминий в качестве радиатора
Маск: охлаждение просто через излучение
Ремонтные работы
Закладывать избыточность + при появлении новых архитектур запускать повторные миссии по смене модуля чипа полностью.
Радиационная стойкость чипов
Результаты тестирования Google также многообещающие на TPU Trillium - и это с учетом, что чип был произведен как базовый, не специализированный для космических задач. Следующие поколения могут быть улучшения на уровне кристаллов чипов.
Межспутниковые сверхскоростные каналы связей
Google работает над этой проблемой и есть определенные успехи / сумели добиться в лабараторных тестированиях необходимых результатов > 1 Tbit/s. Для инференс вычислений менее требовательно, чем к AI Training.
Орбитальный мусор
SpaceX за 2025 г. сделали > 300 000 маневров и 0 зафиксированных столконовений
Текущие спутники StarLink в кол-ве ~ 13 000 находятся на орбите 340 - 535 км / Новая заявка в FCC на 1 млн. спутников содержит данные об размещение спутников на орбите 500 - 2000 км - увеличение в 10 раз
Регуляторные риски
Потенциальные регуляторные задержки, для запуска спутников необходимо разрешение FCC. Скейлинг масштабирования может тормозиться бюрократией. Последнее одобрение заявки Gen2 StarLink на дополнительные 7 500 спутников, рассматривалось > 15 месяцев. Текущая заявка сразу на 1 млн.
Срок жизни спутника
Текущие прототипы живут 5-7 лет. Многократный CAPEX каждые 5-7 лет.
Космические дата-центры / Главная проблема
Экономическая обоснованность
Калькулятор № 1 [ Varda Space - Lead engineer ]
Калькулятор № 2 [ CT Influncer ]
Прогноз March33
Прогноз Google Research
Люди разделились на 2 лагеря, одни обосновывают, что это экономически выгодно при LEO 200-500$ / kg и снижение костов на спутники
Остальные. говорят что для этого нужно очень много сделать и даже если вы снизите расходы на LEO и спутники кратно, экономическая обоснованность все еще под вопросом из-за GPU Failure Rate / невозможности заменять чипы на новые архитектурные модели и т.п.
Но, в целом практически никто не отрицает научные или физические bottlnecks - главный спор ведется над экономической обоснованностью.
Из того что я заметил, практически все упускают эти моменты:
1. Необходимость повторного начального CAPEX каждые 5-7 лет
Срок жизни спутника - 5-7 лет.
Hardware ( спутники, радиаторы, панели) при LEO ~ 500$ /kg составляет по разным оценкам 40% CAPEX'а, что сопоставимо с костами на LEO.
Т.е. вам минимум каждые 5-7 лет, надо заного тратиться на CAPEX.
В отличии, от наземного дата-центра, где вы потратились на CAPEX здания и инфраструктуры, а дальше как минимум 10-15 лет практически не делаете подобных крупных капиталовложений. Просто меняете GPU.
Более того, старые GPU не сгорают в атмосфере как в случае с орбитальными спутниками, а вы можете их продать / использовать для других целей.
Т.Е. чтобы обновиться для территориального ЦОД нужно просто взять вытащить GPU из стоек и вставить новые. А для космических ЦОД - нужно заново потратиться на дорогой hardware + launch.
2. Необходимость повторного начального CAPEX каждые 3-4 года при появлении новых архитектур чипов
Каждые 1-2 года NVIDIA делает прорыв в архитектуре чипа, повышая эффективность - что делает неконкуретным вычисления на старой архитектуре для массового ИИ дата-центра.
Однако, наземные дц тоже не меняют GPU каждые 1-2 года данные по вторичному рынку показывают модель value cascade: годы 1-2 — frontier training, годы 3-4 — inference, годы 5-6 — batch workloads.
3. Shared CAPEX
В случае, если соединить функционал StarLink + орбитального ИИ дата-центра = можно объединить CAPEX обоих продуктов = > многофункиональный спутник , где инфраструктурные затраты распределяются между несколькими бизнес-направлениями.
Экономическая обоснованность
Калькулятор № 1 [ Varda Space - Lead engineer ]
Калькулятор № 2 [ CT Influncer ]
Прогноз March33
Прогноз Google Research
Люди разделились на 2 лагеря, одни обосновывают, что это экономически выгодно при LEO 200-500$ / kg и снижение костов на спутники
Остальные. говорят что для этого нужно очень много сделать и даже если вы снизите расходы на LEO и спутники кратно, экономическая обоснованность все еще под вопросом из-за GPU Failure Rate / невозможности заменять чипы на новые архитектурные модели и т.п.
Но, в целом практически никто не отрицает научные или физические bottlnecks - главный спор ведется над экономической обоснованностью.
Из того что я заметил, практически все упускают эти моменты:
1. Необходимость повторного начального CAPEX каждые 5-7 лет
Срок жизни спутника - 5-7 лет.
Hardware ( спутники, радиаторы, панели) при LEO ~ 500$ /kg составляет по разным оценкам 40% CAPEX'а, что сопоставимо с костами на LEO.
Т.е. вам минимум каждые 5-7 лет, надо заного тратиться на CAPEX.
В отличии, от наземного дата-центра, где вы потратились на CAPEX здания и инфраструктуры, а дальше как минимум 10-15 лет практически не делаете подобных крупных капиталовложений. Просто меняете GPU.
Более того, старые GPU не сгорают в атмосфере как в случае с орбитальными спутниками, а вы можете их продать / использовать для других целей.
Т.Е. чтобы обновиться для территориального ЦОД нужно просто взять вытащить GPU из стоек и вставить новые. А для космических ЦОД - нужно заново потратиться на дорогой hardware + launch.
2. Необходимость повторного начального CAPEX каждые 3-4 года при появлении новых архитектур чипов
Каждые 1-2 года NVIDIA делает прорыв в архитектуре чипа, повышая эффективность - что делает неконкуретным вычисления на старой архитектуре для массового ИИ дата-центра.
Однако, наземные дц тоже не меняют GPU каждые 1-2 года данные по вторичному рынку показывают модель value cascade: годы 1-2 — frontier training, годы 3-4 — inference, годы 5-6 — batch workloads.
3. Shared CAPEX
В случае, если соединить функционал StarLink + орбитального ИИ дата-центра = можно объединить CAPEX обоих продуктов = > многофункиональный спутник , где инфраструктурные затраты распределяются между несколькими бизнес-направлениями.
👍3
Космические дата-центры / TAM рынка
Потенциальная модель:
- edge процессинг спутниковых данных
-государственные контракты
-Личное использование для собственных ИИ - продуктов [ Пример: OpenAI / xAI ]
-Аренда GPU [ Пример: Crusoe + Starcloud ]
-Якорные клиенты под резервацию
Потенциальный TAM GPU вычислений
Согласно, прогнозам McKinsey - рынок ИИ вычислений к 2030 г. 150 GW [ ~ 22% GACR ].
Добавится в районе 100 GW к ИИ вычислениям.
Если считать revenue компаний, использующих модель Coreweave, на 1 MW / year выходит выручка оценочно в 10M$ / year - при маржинальности в 60-70%.
Добавленный TAM к 2030 = Installed AI GW(2030) × Revenue/MW(2030) × 1000
( учитывается только новый рынок, старый рынок в учет не берется - на данный момент он оценивается в 44 GW - большая часть рынка находится в руках hyperscalers - которые идут по бизнес модели через собственные ИИ продукты )
Консервативно: 70 GW × $8M/MW = $560B
Базовый: 100 GW × $10M/MW = $1T$
Агрессивно: 200 GW × $12M/MW = $2.4T
Факторы, потенциально влияющие динамику на revenue/ MW:
-Цена за GPU-час падает ( ↓ )
-Больше FLOPS/watt → больше GPU-eq на MW ( ↑ )
-Увеличение инференса -> 24/7 нагрузка ( ↑ )
-Конкуренция ( ↓ )
Потенциальные прогнозы, в случае если SpaceX / BlueOrigin - станут монополистами в сфере ИИ вычисления за счет :
2030 г. - общий рынок ~ 150 GW на ИИ-вычисления
Starlink V3 ~ 20 kW - общая мощность / Elon заявляет, что 100 kW не проблема, если делать спутник чисто под ии компьют [ 1 ] - но тогда не будет shared capex.
1 млн спутников, заявку на которые они подавали, как раз составляет примерно 100 GW, о которых он заявлял на WEF в течении 3 лет [ 1 ]
Возьмем, более приземленные цифры:
SpaceX - 2030 г. - 10 GW [ 100 000 спутников при 100 kW либо 1 млн спутников при 20 kW ] - > 6% ОБЩЕЙ доли рынка GPU вычислений => 100B$ выручка при маржинальности 50-70%
Потенциальная модель:
- edge процессинг спутниковых данных
-государственные контракты
-Личное использование для собственных ИИ - продуктов [ Пример: OpenAI / xAI ]
-Аренда GPU [ Пример: Crusoe + Starcloud ]
-Якорные клиенты под резервацию
Потенциальный TAM GPU вычислений
Согласно, прогнозам McKinsey - рынок ИИ вычислений к 2030 г. 150 GW [ ~ 22% GACR ].
Добавится в районе 100 GW к ИИ вычислениям.
Если считать revenue компаний, использующих модель Coreweave, на 1 MW / year выходит выручка оценочно в 10M$ / year - при маржинальности в 60-70%.
Добавленный TAM к 2030 = Installed AI GW(2030) × Revenue/MW(2030) × 1000
( учитывается только новый рынок, старый рынок в учет не берется - на данный момент он оценивается в 44 GW - большая часть рынка находится в руках hyperscalers - которые идут по бизнес модели через собственные ИИ продукты )
Консервативно: 70 GW × $8M/MW = $560B
Базовый: 100 GW × $10M/MW = $1T$
Агрессивно: 200 GW × $12M/MW = $2.4T
Факторы, потенциально влияющие динамику на revenue/ MW:
-Цена за GPU-час падает ( ↓ )
-Больше FLOPS/watt → больше GPU-eq на MW ( ↑ )
-Увеличение инференса -> 24/7 нагрузка ( ↑ )
-Конкуренция ( ↓ )
Потенциальные прогнозы, в случае если SpaceX / BlueOrigin - станут монополистами в сфере ИИ вычисления за счет :
2030 г. - общий рынок ~ 150 GW на ИИ-вычисления
Starlink V3 ~ 20 kW - общая мощность / Elon заявляет, что 100 kW не проблема, если делать спутник чисто под ии компьют [ 1 ] - но тогда не будет shared capex.
1 млн спутников, заявку на которые они подавали, как раз составляет примерно 100 GW, о которых он заявлял на WEF в течении 3 лет [ 1 ]
Возьмем, более приземленные цифры:
SpaceX - 2030 г. - 10 GW [ 100 000 спутников при 100 kW либо 1 млн спутников при 20 kW ] - > 6% ОБЩЕЙ доли рынка GPU вычислений => 100B$ выручка при маржинальности 50-70%