Тезисы Cristiano Amon [ Qualcomm ] p.3
2026 / OpenAI - Qualcomm / ИИ Устройство
Вопрос интервьюера: Сейчас OpenAI собирается делать семейство устройств, и ходили слухи, что это будет устройство размером со смартфон, без экрана, которое просто слушает тебя и присылает уведомления о твоей жизни. Я подумал: почему это не может быть просто приложением на телефоне? Зачем это должно быть носимым устройством? - Ответ: Не обязано. Мы с ними работаем. К сожалению, я не могу рассказать, что это будет. Увидите — будет интересно. ( OpenAI вместе с легендарным дизайнером Джони Айвом (создатель iPhone.) трудится над персональным устройством на базе ИИ, это устройство без экрана - управление и взаимодействие ориентировано на голос, звук, возможно камеры и сенсоры. Возможное позиционирование: персональный ИИ-ассистент, который активно слушает, интерпретирует контекст и помогает в задачи, а не просто приложение на телефоне.)
2026 / AR Очки - новый смартфон
Когда появились широкополосные скорости, стало ясно: на другом конце нужен компьютер. Телефон должен стать компьютером.И нужно создать компьютер, который помещается в ладони. Это и есть смартфон.Он навсегда изменил вычисления. Сегодня смартфонов продаётся 1,2 млрд в год. Это крупнейшая категория потребительской электроники, и он есть у всех.Но когда ИИ начинает понимать нас — ситуация меняется. Речь уже не только о компьютере, который вы носите в кармане, но и о компьютере, который вы носите на себе. Если агенты должны быть полезны, они должны быть с вами постоянно. Тогда помимо телефона появляются очки, кольца, браслеты, часы.
2026 / Локальный инференс - Edge вычисления
Мы планируем сделать инференс ИИ-модели прямо в крошечном телефоне, а затем попытаемся сделать это в очень маленькой рамке стекла, и нам нужно решить эти проблемы, и мы чувствуем, что если мы не решим эти проблемы, то и другая компания этого не сделает. Так что это наша проблема, которую мы должны решить. ( Сейчас инференс выполняется через облако, минусы: Задержка 200-300 мс, локальный 20-30 мс для роботов и физического ИИ это вообще критично. Реакция должна быть быстрее, чем человек моргает / приватность - все хотят чтобы данные хранились локально,а не в облаке / стоимость - CAPEX от дата центров переходит на держателя устройства / масштабируемость - дата центры нельзя бесконечно масштабировать. Но в любом случае - это гибрид . Лёгкие задачи — локально. Тяжёлые рассуждения — в облаке. Так работает эволюция вычислений. Персональные компьютеры не убили серверы. Смартфоны не убили дата-центры. Они распределили нагрузку.
2026 / 6G- инфраструктура для физического ИИ
6G — это обеспечение высокоскоростного соединения для мира искусственного интеллекта. Сеть будет воспринимать всё, что нас окружает, потому что, подобно тому, как компьютеры сейчас понимают то, что мы видим и слышим, сеть также сможет это делать, и эти данные с датчиков будут использоваться для обучения моделей на основе нашего физического мира и дальнейшего развития ИИ.
2026 / Фаза обучения -> Фаза массового использования ( inference )
Мы перейдем от создания искусственного интеллекта к фактическому внедрению искусственного интеллекта в производство. AI сейчас переходит из фазы обучения (training) в фазу массового использования (inference). И именно поэтому Qualcomm идёт в дата-центры. Инференс превзойдет обучение по объему вычислительных мощностей в дата-центрах. Миллиарды пользователей будут использовать ИИ везде. Победит тот, кто дешевле обработает триллионы запросов. Мы 30 лет учились как выжать максимум вычислений на минимальной энергии. Теперь, мы хотим применить эти знания и философию в дата-центры. Те, кто смогут предоставлять инференс по самой низкой стоимости, будут более прибыльными.
2026 / OpenAI - Qualcomm / ИИ Устройство
Вопрос интервьюера: Сейчас OpenAI собирается делать семейство устройств, и ходили слухи, что это будет устройство размером со смартфон, без экрана, которое просто слушает тебя и присылает уведомления о твоей жизни. Я подумал: почему это не может быть просто приложением на телефоне? Зачем это должно быть носимым устройством? - Ответ: Не обязано. Мы с ними работаем. К сожалению, я не могу рассказать, что это будет. Увидите — будет интересно. ( OpenAI вместе с легендарным дизайнером Джони Айвом (создатель iPhone.) трудится над персональным устройством на базе ИИ, это устройство без экрана - управление и взаимодействие ориентировано на голос, звук, возможно камеры и сенсоры. Возможное позиционирование: персональный ИИ-ассистент, который активно слушает, интерпретирует контекст и помогает в задачи, а не просто приложение на телефоне.)
2026 / AR Очки - новый смартфон
Когда появились широкополосные скорости, стало ясно: на другом конце нужен компьютер. Телефон должен стать компьютером.И нужно создать компьютер, который помещается в ладони. Это и есть смартфон.Он навсегда изменил вычисления. Сегодня смартфонов продаётся 1,2 млрд в год. Это крупнейшая категория потребительской электроники, и он есть у всех.Но когда ИИ начинает понимать нас — ситуация меняется. Речь уже не только о компьютере, который вы носите в кармане, но и о компьютере, который вы носите на себе. Если агенты должны быть полезны, они должны быть с вами постоянно. Тогда помимо телефона появляются очки, кольца, браслеты, часы.
2026 / Локальный инференс - Edge вычисления
Мы планируем сделать инференс ИИ-модели прямо в крошечном телефоне, а затем попытаемся сделать это в очень маленькой рамке стекла, и нам нужно решить эти проблемы, и мы чувствуем, что если мы не решим эти проблемы, то и другая компания этого не сделает. Так что это наша проблема, которую мы должны решить. ( Сейчас инференс выполняется через облако, минусы: Задержка 200-300 мс, локальный 20-30 мс для роботов и физического ИИ это вообще критично. Реакция должна быть быстрее, чем человек моргает / приватность - все хотят чтобы данные хранились локально,а не в облаке / стоимость - CAPEX от дата центров переходит на держателя устройства / масштабируемость - дата центры нельзя бесконечно масштабировать. Но в любом случае - это гибрид . Лёгкие задачи — локально. Тяжёлые рассуждения — в облаке. Так работает эволюция вычислений. Персональные компьютеры не убили серверы. Смартфоны не убили дата-центры. Они распределили нагрузку.
2026 / 6G- инфраструктура для физического ИИ
6G — это обеспечение высокоскоростного соединения для мира искусственного интеллекта. Сеть будет воспринимать всё, что нас окружает, потому что, подобно тому, как компьютеры сейчас понимают то, что мы видим и слышим, сеть также сможет это делать, и эти данные с датчиков будут использоваться для обучения моделей на основе нашего физического мира и дальнейшего развития ИИ.
2026 / Фаза обучения -> Фаза массового использования ( inference )
Мы перейдем от создания искусственного интеллекта к фактическому внедрению искусственного интеллекта в производство. AI сейчас переходит из фазы обучения (training) в фазу массового использования (inference). И именно поэтому Qualcomm идёт в дата-центры. Инференс превзойдет обучение по объему вычислительных мощностей в дата-центрах. Миллиарды пользователей будут использовать ИИ везде. Победит тот, кто дешевле обработает триллионы запросов. Мы 30 лет учились как выжать максимум вычислений на минимальной энергии. Теперь, мы хотим применить эти знания и философию в дата-центры. Те, кто смогут предоставлять инференс по самой низкой стоимости, будут более прибыльными.
Bernt Bornich [ 1X Robotics ] / p.1
2025 / Улучшение продукта через потребительский рынок
Мы выбрали дом по двум причинам. Первая очевидна: потребительское железо масштабируется быстрее всего. iPhone достиг миллиарда устройств за немного больше десятилетия. Гуманоидные роботы не имеют смысла без масштаба. Нужен масштаб, чтобы получить надёжность, низкую стоимость, экосистему, интеллект. Вторая причина глубже: интеллект рождается из разнообразия. Это видно во всём ИИ — язык, изображения, видео, робототехника. Вам не нужны данные одного и того же снова и снова. Если робот в автозаводе делает одно действие, он не движется к общей интеллектуальности. Мы развернули предыдущее поколение Eve в охране и логистике в 2022–2023. Через 20–40 часов робот выходил на плато для конкретной задачи. Радикальные технологии не идут сверху вниз. ChatGPT сначала пошёл к потребителям, потом — в корпорации. Мы уже пытались с Enterprise — медленно: комплаенс, риски, профсоюзы. фабрике робот делает одну задачу — через 5 минут данных достаточно. В доме — каждый дом разный, каждый день разный. Эта энтропия и создаёт интеллект.
2025 / Робототехника путь к AGI
Мы видим себя не как просто робототехническую компанию, а как компанию, идущую к AGI. Роботика — инструмент для построения настоящих AGI-моделей через богатые реальные данные.
2025 / Социальный аспект гуманоидного робота
Каждый захочет робота. Гуманоид — естественный интерфейс для ИИ. Когда он смотрит на тебя, реагирует, понимает направление голоса, язык тела — это другой уровень взаимодействия. Компаньонский аспект сильно недооценён.
2025 / Собственная модель ИИ
Мы видим, что модели, изначально построенные под физические модальности, а потом дополненные текстом, будут более умными и мощными, чем подход, который используют гиперскейлеры в LLM. Ядро — пространственное и временное. Оно связано с тем, как ты воспринимаешь мир: как видишь его и как ощущаешь. Есть ещё два важных момента в обучении робота. Первый очевидный — интерактивное обучение. Робот взаимодействует с миром и учится.Если смотреть YouTube, у тебя есть только наблюдения. Ты не знаешь ментальную модель человека, его цель, какие действия он предпринял. Это не то, как мы учимся. Мы используем научный метод: гипотеза, эксперимент, наблюдение результата, повтор. Этого нет в интернет-данных.
2025 / Обучение через симулирование данных
Теоретически, если масштабировать симуляцию и обучение агентов в ней, возможно приблизиться. Но точность симуляции далека от реальности. Довести её до уровня реального мира крайне сложно и вычислительно дорого. Это не финальная цель, но полезно. Это позволяет довести роботов до уровня, когда они делают достаточно полезных вещей, чтобы собрать достаточно данных в реальном мире и больше не зависеть от симуляции. В долгосрочной перспективе симуляция не будет играть большую роль. Но для начального разгона, для создания data-flywheel, она критична.
2025 / Улучшение продукта через потребительский рынок
Мы выбрали дом по двум причинам. Первая очевидна: потребительское железо масштабируется быстрее всего. iPhone достиг миллиарда устройств за немного больше десятилетия. Гуманоидные роботы не имеют смысла без масштаба. Нужен масштаб, чтобы получить надёжность, низкую стоимость, экосистему, интеллект. Вторая причина глубже: интеллект рождается из разнообразия. Это видно во всём ИИ — язык, изображения, видео, робототехника. Вам не нужны данные одного и того же снова и снова. Если робот в автозаводе делает одно действие, он не движется к общей интеллектуальности. Мы развернули предыдущее поколение Eve в охране и логистике в 2022–2023. Через 20–40 часов робот выходил на плато для конкретной задачи. Радикальные технологии не идут сверху вниз. ChatGPT сначала пошёл к потребителям, потом — в корпорации. Мы уже пытались с Enterprise — медленно: комплаенс, риски, профсоюзы. фабрике робот делает одну задачу — через 5 минут данных достаточно. В доме — каждый дом разный, каждый день разный. Эта энтропия и создаёт интеллект.
2025 / Робототехника путь к AGI
Мы видим себя не как просто робототехническую компанию, а как компанию, идущую к AGI. Роботика — инструмент для построения настоящих AGI-моделей через богатые реальные данные.
2025 / Социальный аспект гуманоидного робота
Каждый захочет робота. Гуманоид — естественный интерфейс для ИИ. Когда он смотрит на тебя, реагирует, понимает направление голоса, язык тела — это другой уровень взаимодействия. Компаньонский аспект сильно недооценён.
2025 / Собственная модель ИИ
Мы видим, что модели, изначально построенные под физические модальности, а потом дополненные текстом, будут более умными и мощными, чем подход, который используют гиперскейлеры в LLM. Ядро — пространственное и временное. Оно связано с тем, как ты воспринимаешь мир: как видишь его и как ощущаешь. Есть ещё два важных момента в обучении робота. Первый очевидный — интерактивное обучение. Робот взаимодействует с миром и учится.Если смотреть YouTube, у тебя есть только наблюдения. Ты не знаешь ментальную модель человека, его цель, какие действия он предпринял. Это не то, как мы учимся. Мы используем научный метод: гипотеза, эксперимент, наблюдение результата, повтор. Этого нет в интернет-данных.
2025 / Обучение через симулирование данных
Теоретически, если масштабировать симуляцию и обучение агентов в ней, возможно приблизиться. Но точность симуляции далека от реальности. Довести её до уровня реального мира крайне сложно и вычислительно дорого. Это не финальная цель, но полезно. Это позволяет довести роботов до уровня, когда они делают достаточно полезных вещей, чтобы собрать достаточно данных в реальном мире и больше не зависеть от симуляции. В долгосрочной перспективе симуляция не будет играть большую роль. Но для начального разгона, для создания data-flywheel, она критична.
Bernt Bornich [ 1X Robotics ] / p.2
2025 / Конкуретное преимущество - потребительский рынок
Наша цель — собрать максимум данных о взаимодействии роботов в доме. Если 10 000 роботов большую часть дня собирают недублированные данные, это уже больше полезного контента, чем ежедневно появляется на YouTube.
У 8 миллиардов людей лишь малая часть жизни попадает в интернет. У роботов — весь их опыт. П
Опыт каждого робота отправляется в облачную модель, которая обучается на данных всего флота..
Сегодня все ИИ тренируются на одном интернете и конкурируют вычислениями и талантом. Интернет постепенно станет лишь малой частью обучения. Сейчас робототехнические данные — крошечный слой, поэтому мы вынуждены дообучаться на интернет-корпусах.
Интеллект прямо пропорционален разнообразию задач, с которыми сталкивается система. В ИИ важен не просто объём данных, а их разнообразие. Масштаб — следствие разнообразия. Сто миллионов одинаковых примеров бесполезны. В будущем выиграет тот, у кого самый большой и самый разнообразный потребительский флот роботов.
2025 / Объем производства 1X
На текущий момент, мы построили больше 100 роботов. К концу 2026 года годовой ранрейт завода — более 20 000 единиц. Есть разгон, поэтому в 2026 фактический выпуск будет меньше. Рост iPhone был примерно 1,7x. Можно представить ранрейт к концу десятилетия в сотни тысяч в год.
2025 / Потенциальные проблемы масштабирования - нехватка алюминия
Нужно думать, что замедлит рост. Это добыча, переработка, но всё больше — труд. Без роботов в производстве не масштабироваться. При сильном масштабировании, вы упрётесь в нехватку труда для производства самих роботов. Даже Apple в пике упёрлась в нехватку рабочих рук. Если гуманоид требует в пять раз больше сборки, чем iPhone, труда не хватит. Поэтому роботы должны строить роботов. Они должны строить энергетическую инфраструктуру, фабрики чипов, дата-центры. Да, они будут делать и другие вещи, но приоритет — ускорять собственный рост. Мы сделали конструкцию максимально простой: несколько сотен деталей. У автомобиля около 50 000. Наш робот весит 66 фунтов, машина — 4000. При масштабировании гуманоидов до уровня iPhone возникают интересные проблемы — например, нехватка алюминия. Не всего алюминия на планете, но доли текущей переработки.
2025 / Приватность / Безопасность / Телеоператор
Ранние пользователи частично жертвуют приватностью ради улучшения продукта. Нам нужны данные. Но всё будет под контролем пользователя. Ни один человек в компании не видит данные. Они идут в модель, но не просматриваются людьми. Есть режим «best effort autonomy» — обычная автономия. Робот учится в процессе, быстрее прогрессирует через ошибки, чем через успех. Есть режим задач по расписанию. Я задаю задачи через телефон: постирать бельё, принять доставку, убрать дом. Робот делает это автономно или через телеоператора — мне всё равно, главное результат. В начале многие задачи выполняются через телеоператоров, потому что мы пока не умеем полностью автоматизировать всё. Но телеоперация — это экспертные демонстрации, размеченные данные. Так же обучаются крупные ИИ-модели. Это не обман, это источник качественных данных. Главное — прозрачность. Если телеоператор подключается, это видно: меняется подсветка, и это только из списка одобренных вами операторов. Если оператор решит сделать что-то вредное — это как если бы нанятый вами уборщик сделал это. Но у нас лучше контроль: у операторов есть менеджер, есть двойные уровни безопасности, глубокие проверки персонала. Риск не нулевой, но мы можем сделать лучше, чем текущая практика. Есть физический аварийный выключатель. Есть настраиваемое стоп-слово — отдельная система, которая останавливает всё.
2025 / Конкуретное преимущество - потребительский рынок
Наша цель — собрать максимум данных о взаимодействии роботов в доме. Если 10 000 роботов большую часть дня собирают недублированные данные, это уже больше полезного контента, чем ежедневно появляется на YouTube.
У 8 миллиардов людей лишь малая часть жизни попадает в интернет. У роботов — весь их опыт. П
Опыт каждого робота отправляется в облачную модель, которая обучается на данных всего флота..
Сегодня все ИИ тренируются на одном интернете и конкурируют вычислениями и талантом. Интернет постепенно станет лишь малой частью обучения. Сейчас робототехнические данные — крошечный слой, поэтому мы вынуждены дообучаться на интернет-корпусах.
Интеллект прямо пропорционален разнообразию задач, с которыми сталкивается система. В ИИ важен не просто объём данных, а их разнообразие. Масштаб — следствие разнообразия. Сто миллионов одинаковых примеров бесполезны. В будущем выиграет тот, у кого самый большой и самый разнообразный потребительский флот роботов.
2025 / Объем производства 1X
На текущий момент, мы построили больше 100 роботов. К концу 2026 года годовой ранрейт завода — более 20 000 единиц. Есть разгон, поэтому в 2026 фактический выпуск будет меньше. Рост iPhone был примерно 1,7x. Можно представить ранрейт к концу десятилетия в сотни тысяч в год.
2025 / Потенциальные проблемы масштабирования - нехватка алюминия
Нужно думать, что замедлит рост. Это добыча, переработка, но всё больше — труд. Без роботов в производстве не масштабироваться. При сильном масштабировании, вы упрётесь в нехватку труда для производства самих роботов. Даже Apple в пике упёрлась в нехватку рабочих рук. Если гуманоид требует в пять раз больше сборки, чем iPhone, труда не хватит. Поэтому роботы должны строить роботов. Они должны строить энергетическую инфраструктуру, фабрики чипов, дата-центры. Да, они будут делать и другие вещи, но приоритет — ускорять собственный рост. Мы сделали конструкцию максимально простой: несколько сотен деталей. У автомобиля около 50 000. Наш робот весит 66 фунтов, машина — 4000. При масштабировании гуманоидов до уровня iPhone возникают интересные проблемы — например, нехватка алюминия. Не всего алюминия на планете, но доли текущей переработки.
2025 / Приватность / Безопасность / Телеоператор
Ранние пользователи частично жертвуют приватностью ради улучшения продукта. Нам нужны данные. Но всё будет под контролем пользователя. Ни один человек в компании не видит данные. Они идут в модель, но не просматриваются людьми. Есть режим «best effort autonomy» — обычная автономия. Робот учится в процессе, быстрее прогрессирует через ошибки, чем через успех. Есть режим задач по расписанию. Я задаю задачи через телефон: постирать бельё, принять доставку, убрать дом. Робот делает это автономно или через телеоператора — мне всё равно, главное результат. В начале многие задачи выполняются через телеоператоров, потому что мы пока не умеем полностью автоматизировать всё. Но телеоперация — это экспертные демонстрации, размеченные данные. Так же обучаются крупные ИИ-модели. Это не обман, это источник качественных данных. Главное — прозрачность. Если телеоператор подключается, это видно: меняется подсветка, и это только из списка одобренных вами операторов. Если оператор решит сделать что-то вредное — это как если бы нанятый вами уборщик сделал это. Но у нас лучше контроль: у операторов есть менеджер, есть двойные уровни безопасности, глубокие проверки персонала. Риск не нулевой, но мы можем сделать лучше, чем текущая практика. Есть физический аварийный выключатель. Есть настраиваемое стоп-слово — отдельная система, которая останавливает всё.
Bernt Bornich [ 1X Robotics ] / p.3
2025 / Непривлекательность HardWare компаний в прошлом
США долго делали только софт. Чипы ушли. Кремниевая долина без кремния. Венчур тоже ушёл в софт. Если в бизнес-плане был физический компонент — не инвестировали. Илон сделал hardware снова сексуальным. Но путь был через PayPal. Он вложил свои деньги, был на грани банкротства с Tesla и SpaceX. Венчур тогда не шёл в это. У нас был ранний норвежский инвестор. Компания началась в амбаре. Через два года он продал ферму, чтобы финансировать нас. В Силиконовой долине мы бы не выжили — слишком дорого. В Норвегии это было возможно.
2025 / Главный прогресс в робототехнике - кроме ИИ
Со стороны физики главный прогресс — в моторах и материалах. Мы делаем собственные моторы: не только IP, но и производство и автоматизацию. Всё в цепочке. Сейчас наши моторы в Neo дают в 5,5 раза больше крутящего момента, чем предыдущий мировой рекорд. Поэтому робот мощный без редукторов Это делает систему лёгкой, податливой, дешёвой в производстве. Но если есть сухожилия, нужно решить проблемы износа — миллионы циклов. Это не просто инженерия, это исследование. Такие моторы невозможны без инноваций в электронике, усилении мощности, драйвах.
2025 / 10 млрд гуманоидных роботов к 2040 г. - Проблемы масштабирования
Elon и Adcock называли цифрку 10 млрд. к 2040г. Думаю, примерно так. Возможно, даже раньше. Все зависит от искусственных ограничений масштабирования. Нужно думать о добыче редкоземельных металлов, алюминия, о том, как роботы помогут развернуть производство, как строить энергетику. Нам нужно больше фабрик по производству чипов.
( Комментарий Интервьюера: Для сравнения — на планете около миллиарда автомобилей и примерно 8 миллиардов смартфонов. Каждый такой робот использует примерно один GPU, возможно два. А мы производим около 20 миллионов GPU в год. У TSMC около 66% рынка фабрик — это одна точка отказа для всей экономики. Мы остро ограничены фабриками. Не говоря, уже о ASML - у которых еще более хрупкая цепочка поставок )
2025 / Естественность в движении
Человек по природе низкоэнергетичен. Любое действие — это столкновение: беру бутылку, ставлю руку на стол, делаю шаг — и это стабильно, мягко, безопасно. Потому что в движении мало энергии.В роботе же есть редуктор и мотор, который крутится в 100 раз быстрее руки — 10 000 об/мин. Энергия растёт пропорционально квадрату скорости. Поэтому мы начали с моторов. Если моторы достаточно сильные, не нужны тяжёлые редукторы. Можно тянуть «сухожилия», как мышцы человека, и двигаться биоинспирированно. Наши роботы двигаются иначе — естественно. Не ради красоты, а ради способности и безопасности, чтобы интегрироваться в общество. Это позволяет Neo двигаться тихо, плавно, быть легким и энергоэффективным, как человек. Это делает его безопасным и частью того, что делает его доступным — система проще и производительнее.
2025 / Телеоператоры
Телеоперация — это когда человек остаётся в контуре принятия решений робота. Как у Waymo: машина едет сама, но оператор следит за несколькими авто и помогает, если возникает сложная ситуация. То же самое, только для роботов. 2026 году, если вы купите продукт, вы должны быть согласны с этим социальным контрактом. Без данных продукт не станет лучше. При этом всё должно быть на ваших условиях. Оператор не видит вас — можно размывать людей. Он не может зайти в зоны, которые вы запретили. Даже если попытается — система не позволит. И оператор никогда не подключится без вашего одобрения.Если происходит что-то, что вы не хотите показывать, вы можете удалить этот фрагмент данных через приложение. Мы не можем видеть данные. Модель обучается на данных, но люди их не просматривают. В начале операторы будут локально. Нам важен высокий уровень сервиса и талант операторов: чем они лучше управляют системой, тем больше система учится. У вас будет небольшая группа операторов, закреплённых за вами по расписанию. Это не всегда один и тот же человек, но ограниченный круг, с которым вы познакомитесь — вы знаете, кого впускаете в дом, как с клининговым сервисом, где есть одобренные вами люди.
2025 / Непривлекательность HardWare компаний в прошлом
США долго делали только софт. Чипы ушли. Кремниевая долина без кремния. Венчур тоже ушёл в софт. Если в бизнес-плане был физический компонент — не инвестировали. Илон сделал hardware снова сексуальным. Но путь был через PayPal. Он вложил свои деньги, был на грани банкротства с Tesla и SpaceX. Венчур тогда не шёл в это. У нас был ранний норвежский инвестор. Компания началась в амбаре. Через два года он продал ферму, чтобы финансировать нас. В Силиконовой долине мы бы не выжили — слишком дорого. В Норвегии это было возможно.
2025 / Главный прогресс в робототехнике - кроме ИИ
Со стороны физики главный прогресс — в моторах и материалах. Мы делаем собственные моторы: не только IP, но и производство и автоматизацию. Всё в цепочке. Сейчас наши моторы в Neo дают в 5,5 раза больше крутящего момента, чем предыдущий мировой рекорд. Поэтому робот мощный без редукторов Это делает систему лёгкой, податливой, дешёвой в производстве. Но если есть сухожилия, нужно решить проблемы износа — миллионы циклов. Это не просто инженерия, это исследование. Такие моторы невозможны без инноваций в электронике, усилении мощности, драйвах.
2025 / 10 млрд гуманоидных роботов к 2040 г. - Проблемы масштабирования
Elon и Adcock называли цифрку 10 млрд. к 2040г. Думаю, примерно так. Возможно, даже раньше. Все зависит от искусственных ограничений масштабирования. Нужно думать о добыче редкоземельных металлов, алюминия, о том, как роботы помогут развернуть производство, как строить энергетику. Нам нужно больше фабрик по производству чипов.
( Комментарий Интервьюера: Для сравнения — на планете около миллиарда автомобилей и примерно 8 миллиардов смартфонов. Каждый такой робот использует примерно один GPU, возможно два. А мы производим около 20 миллионов GPU в год. У TSMC около 66% рынка фабрик — это одна точка отказа для всей экономики. Мы остро ограничены фабриками. Не говоря, уже о ASML - у которых еще более хрупкая цепочка поставок )
2025 / Естественность в движении
Человек по природе низкоэнергетичен. Любое действие — это столкновение: беру бутылку, ставлю руку на стол, делаю шаг — и это стабильно, мягко, безопасно. Потому что в движении мало энергии.В роботе же есть редуктор и мотор, который крутится в 100 раз быстрее руки — 10 000 об/мин. Энергия растёт пропорционально квадрату скорости. Поэтому мы начали с моторов. Если моторы достаточно сильные, не нужны тяжёлые редукторы. Можно тянуть «сухожилия», как мышцы человека, и двигаться биоинспирированно. Наши роботы двигаются иначе — естественно. Не ради красоты, а ради способности и безопасности, чтобы интегрироваться в общество. Это позволяет Neo двигаться тихо, плавно, быть легким и энергоэффективным, как человек. Это делает его безопасным и частью того, что делает его доступным — система проще и производительнее.
2025 / Телеоператоры
Телеоперация — это когда человек остаётся в контуре принятия решений робота. Как у Waymo: машина едет сама, но оператор следит за несколькими авто и помогает, если возникает сложная ситуация. То же самое, только для роботов. 2026 году, если вы купите продукт, вы должны быть согласны с этим социальным контрактом. Без данных продукт не станет лучше. При этом всё должно быть на ваших условиях. Оператор не видит вас — можно размывать людей. Он не может зайти в зоны, которые вы запретили. Даже если попытается — система не позволит. И оператор никогда не подключится без вашего одобрения.Если происходит что-то, что вы не хотите показывать, вы можете удалить этот фрагмент данных через приложение. Мы не можем видеть данные. Модель обучается на данных, но люди их не просматривают. В начале операторы будут локально. Нам важен высокий уровень сервиса и талант операторов: чем они лучше управляют системой, тем больше система учится. У вас будет небольшая группа операторов, закреплённых за вами по расписанию. Это не всегда один и тот же человек, но ограниченный круг, с которым вы познакомитесь — вы знаете, кого впускаете в дом, как с клининговым сервисом, где есть одобренные вами люди.
Bernt Bornich [ 1X Robotics ] / p.4
2025 / Понимание задачи > Выполнения конкретных действий
Успех выполнения задачи — плохо определённая метрика. Представим фабрику: робот сортирует мусорные мешки. Всё идёт нормально. Один мешок падает на пол. Есть разные уровни интеллекта. Первый — робот просто продолжает повторять движение, как обучен. Это классический end-to-end deep learning. Если в данных много примеров ошибок, возможно он поднимет мешок. Но если система понимает задачу — не просто сортировку, а зачем она это делает и как это вписывается в процесс — она поднимет мешок, вернёт его и ускорится на 20 секунд, чтобы компенсировать задержку. Это понимание имплицитно. В реальном производстве ошибки случаются постоянно, и люди их покрывают. Наша цель — чтобы роботы не повторяли движения, а глубоко понимали задачу. Тогда они смогут обобщать на edge cases, которых не видели. В вождении это называют «отрезать длинный хвост» — есть бесконечный хвост редких ситуаций, которые невозможно увидеть все. В какой-то момент система должна уметь решать то, чего не видела. Это достигается через разнообразие. Лучшее доказательство — LLM, они стали хороши именно из-за разнообразия данных.
2025 / World Models
Сегодняшние world models — не полноценные omni-models. Нам не хватает данных и вычислений. В идеале мы бы просто искали решение в world model и использовали её как policy. Это работает, но вычислительно нереально. Нужно дистиллировать из неё меньшую policy, которая может работать на роботе. Даже в облаке world model слишком медленная — миллисекунда реального времени может считаться секунды. Можно масштабировать compute, но мы пойдём умнее.
2025 / Вертикально - интегрирированная система производства
Для гуманоидов нет готовой инфраструктуры. Если идти по старому пути, получишь 200-фунтовых тяжёлых, дорогих, жёстких и небезопасных роботов. Это не масштабируется. Нужно инновации на каждом уровне цепочки поставок.Мы делаем буквально всё сами — вплоть до абсурда. У нас патенты на новые способы старения литого алюминия, мировой рекорд по соотношению прочности к весу. Мы занимаемся материаловедением, делаем своё производственное оборудование и автоматизацию, свои моторы, синтетические сухожилия для приводов, силовую электронику, батареи, механику, даже камеры и сенсоры. У нас тактильные сенсоры на новом принципе, запатентованные. Собственные модели для обучения и т.д.
2025 / Понимание задачи > Выполнения конкретных действий
Успех выполнения задачи — плохо определённая метрика. Представим фабрику: робот сортирует мусорные мешки. Всё идёт нормально. Один мешок падает на пол. Есть разные уровни интеллекта. Первый — робот просто продолжает повторять движение, как обучен. Это классический end-to-end deep learning. Если в данных много примеров ошибок, возможно он поднимет мешок. Но если система понимает задачу — не просто сортировку, а зачем она это делает и как это вписывается в процесс — она поднимет мешок, вернёт его и ускорится на 20 секунд, чтобы компенсировать задержку. Это понимание имплицитно. В реальном производстве ошибки случаются постоянно, и люди их покрывают. Наша цель — чтобы роботы не повторяли движения, а глубоко понимали задачу. Тогда они смогут обобщать на edge cases, которых не видели. В вождении это называют «отрезать длинный хвост» — есть бесконечный хвост редких ситуаций, которые невозможно увидеть все. В какой-то момент система должна уметь решать то, чего не видела. Это достигается через разнообразие. Лучшее доказательство — LLM, они стали хороши именно из-за разнообразия данных.
2025 / World Models
Сегодняшние world models — не полноценные omni-models. Нам не хватает данных и вычислений. В идеале мы бы просто искали решение в world model и использовали её как policy. Это работает, но вычислительно нереально. Нужно дистиллировать из неё меньшую policy, которая может работать на роботе. Даже в облаке world model слишком медленная — миллисекунда реального времени может считаться секунды. Можно масштабировать compute, но мы пойдём умнее.
2025 / Вертикально - интегрирированная система производства
Для гуманоидов нет готовой инфраструктуры. Если идти по старому пути, получишь 200-фунтовых тяжёлых, дорогих, жёстких и небезопасных роботов. Это не масштабируется. Нужно инновации на каждом уровне цепочки поставок.Мы делаем буквально всё сами — вплоть до абсурда. У нас патенты на новые способы старения литого алюминия, мировой рекорд по соотношению прочности к весу. Мы занимаемся материаловедением, делаем своё производственное оборудование и автоматизацию, свои моторы, синтетические сухожилия для приводов, силовую электронику, батареи, механику, даже камеры и сенсоры. У нас тактильные сенсоры на новом принципе, запатентованные. Собственные модели для обучения и т.д.
Tye Brady [ Amazon Robotics ]
2025 /Точка перегиба для робототехники
Это действительно большой день для робототехники. Vulcan — наш первый робот с чувством осязания. Мы открываем ворота физического ИИ: робот использует не только зрение для идентификации и манипуляции объектами, но и осязание в сочетании со зрением, чтобы брать сотни миллионов разных товаров. Именно сотни миллионов. Cтанция Vulcan- две роботизированные руки тянутся в ячейки, где всё в беспорядке, и с помощью видео и сенсоров выбирают нужный товар. Он буквально «нащупывает» его. У нас есть датчики крутящего момента, силы и давления — мы понимаем, насколько сильно давим, можем разделять предметы. Это также используется для операции «stow» — когда робот создаёт пространство в ячейке и помещает туда товар. Огромное разнообразие объектов — серьёзный вызов. Это прорыв и в ИИ, и в железе. Да — и там, и там.
2025 / Обучение через практику
Если говорить про ИИ: в отличие от языковых моделей, которые обучаются на интернете, в робототехнике мы обучаем траектории движения и способы захвата. В робототехнике обучение не через язык. Язык можно использовать для постановки задачи, но обучение идёт через данные и предыдущие действия в структурированной и неструктурированной среде. Мы строим такую foundation model. У нас крупнейший в мире парк мобильных промышленных роботов. Например, система Robin: она берёт посылку из кучи, определяет её, проверяет на повреждения и передаёт дальше на сортировку. Кажется просто — но вариативность форм и упаковок огромна. Уже более двух миллиардов захватов.Каждый захват, каждый новый объект добавляется в foundation model. Если робот сталкивается с новым предметом, данные распространяются по всей системе — все руки учатся. Это очень мощно.
Jeff Cardenas [ Apptronik ]
2025 / Точка перегиба для робототехники
Люди думают о гуманоидных роботах тысячи лет. И вот сейчас — 2025 год — мы действительно можем это делать. Это потрясающе. Мы десять лет выводили технологию из лаборатории в реальный мир. Она здесь, но это начало.Сейчас в этом участвуют умные, серьёзные люди и со стороны клиентов, и со стороны разработчиков. Мы достигли точки перегиба. Это захватывающе. Но работы ещё много.
2025 / Конкуретное преимущество -Партнерство с Google
Можно делать всё внутри, можно партнёриться. Мы партнёримся. Это сложные задачи. Нужно находить других. Google — хороший пример. Мы сотрудничаем с Google.Мы балансируем амбицию и прагматизм. Наша цель — лучшие человекоцентричные роботы по качеству, опыту, безопасности. Будут части стека, которые не имеет смысла делать внутри компании. Например, элементы DeepMind. Мы известны тем, что делаем выдающееся железо, мы создаем тело, мышцы, расширенную нервную систему из сенсоров, а Google создает мозг. Мы построим лучшую платформу.
2025 / Стадии развития робототехники
Я вижу три стадии. Первая — индустриальная база. Контролируемая среда, специалисты рядом. Логистика и производство. Вторая — выход к публике. Роботы работают рядом с людьми, с детьми, родителями. Это ритейл и здравоохранение. Коммерческая среда, задачи более непрерывные. Третья — дом. Для меня святая цель — ассистивный уход. Первая стадия уже происходит. Это как персональный компьютер для робототехники. Гуманоид — универсальная платформа, способная масштабироваться. Сейчас это примерно 80-е годы, если использовать аналогию. Системы и возможности уже есть, есть ранние коммерческие применения с большой ценностью. К 2035 году роботы будут в домах.
2025 / Смена парадигмы движения с помощью ИИ
Робот — это сеть моторов и сенсоров. Традиционные роботы были позиционно-управляемыми: мотор просто перемещал механизм в точку в пространстве. Сейчас всё меняется. Роботы эпохи ИИ работают иначе: теперь у нас датчики в контуре обратной связи — камеры, датчики силы, касания, температуры, акселерометр, который чувствует положение и ориентацию. Мы объединяем все эти сенсоры, чтобы робот осознавал происходящее, был динамичным и реагировал на среду. Для нас это базовый строительный блок. Именно актуаторы — приводы — определяют производительность и стоимость робота.
2025 /Точка перегиба для робототехники
Это действительно большой день для робототехники. Vulcan — наш первый робот с чувством осязания. Мы открываем ворота физического ИИ: робот использует не только зрение для идентификации и манипуляции объектами, но и осязание в сочетании со зрением, чтобы брать сотни миллионов разных товаров. Именно сотни миллионов. Cтанция Vulcan- две роботизированные руки тянутся в ячейки, где всё в беспорядке, и с помощью видео и сенсоров выбирают нужный товар. Он буквально «нащупывает» его. У нас есть датчики крутящего момента, силы и давления — мы понимаем, насколько сильно давим, можем разделять предметы. Это также используется для операции «stow» — когда робот создаёт пространство в ячейке и помещает туда товар. Огромное разнообразие объектов — серьёзный вызов. Это прорыв и в ИИ, и в железе. Да — и там, и там.
2025 / Обучение через практику
Если говорить про ИИ: в отличие от языковых моделей, которые обучаются на интернете, в робототехнике мы обучаем траектории движения и способы захвата. В робототехнике обучение не через язык. Язык можно использовать для постановки задачи, но обучение идёт через данные и предыдущие действия в структурированной и неструктурированной среде. Мы строим такую foundation model. У нас крупнейший в мире парк мобильных промышленных роботов. Например, система Robin: она берёт посылку из кучи, определяет её, проверяет на повреждения и передаёт дальше на сортировку. Кажется просто — но вариативность форм и упаковок огромна. Уже более двух миллиардов захватов.Каждый захват, каждый новый объект добавляется в foundation model. Если робот сталкивается с новым предметом, данные распространяются по всей системе — все руки учатся. Это очень мощно.
Jeff Cardenas [ Apptronik ]
2025 / Точка перегиба для робототехники
Люди думают о гуманоидных роботах тысячи лет. И вот сейчас — 2025 год — мы действительно можем это делать. Это потрясающе. Мы десять лет выводили технологию из лаборатории в реальный мир. Она здесь, но это начало.Сейчас в этом участвуют умные, серьёзные люди и со стороны клиентов, и со стороны разработчиков. Мы достигли точки перегиба. Это захватывающе. Но работы ещё много.
2025 / Конкуретное преимущество -Партнерство с Google
Можно делать всё внутри, можно партнёриться. Мы партнёримся. Это сложные задачи. Нужно находить других. Google — хороший пример. Мы сотрудничаем с Google.Мы балансируем амбицию и прагматизм. Наша цель — лучшие человекоцентричные роботы по качеству, опыту, безопасности. Будут части стека, которые не имеет смысла делать внутри компании. Например, элементы DeepMind. Мы известны тем, что делаем выдающееся железо, мы создаем тело, мышцы, расширенную нервную систему из сенсоров, а Google создает мозг. Мы построим лучшую платформу.
2025 / Стадии развития робототехники
Я вижу три стадии. Первая — индустриальная база. Контролируемая среда, специалисты рядом. Логистика и производство. Вторая — выход к публике. Роботы работают рядом с людьми, с детьми, родителями. Это ритейл и здравоохранение. Коммерческая среда, задачи более непрерывные. Третья — дом. Для меня святая цель — ассистивный уход. Первая стадия уже происходит. Это как персональный компьютер для робототехники. Гуманоид — универсальная платформа, способная масштабироваться. Сейчас это примерно 80-е годы, если использовать аналогию. Системы и возможности уже есть, есть ранние коммерческие применения с большой ценностью. К 2035 году роботы будут в домах.
2025 / Смена парадигмы движения с помощью ИИ
Робот — это сеть моторов и сенсоров. Традиционные роботы были позиционно-управляемыми: мотор просто перемещал механизм в точку в пространстве. Сейчас всё меняется. Роботы эпохи ИИ работают иначе: теперь у нас датчики в контуре обратной связи — камеры, датчики силы, касания, температуры, акселерометр, который чувствует положение и ориентацию. Мы объединяем все эти сенсоры, чтобы робот осознавал происходящее, был динамичным и реагировал на среду. Для нас это базовый строительный блок. Именно актуаторы — приводы — определяют производительность и стоимость робота.
Jeff Cardenas [ Apptronik ] / p.2
2025 / Масштабирование -> Снижение стоимости
Если сравнить гуманоидного робота и автомобиль, то по весу в роботе на 96% меньше сырья, чем в машине. Базовый металл в наших роботах — алюминий. Во всём роботе около 300 долларов сырого алюминия. Это значит, что с точки зрения первых принципов нет причины, по которой такие роботы должны быть дорогими или не станут намного дешевле автомобилей по мере роста цепочки поставок и объёмов производства. Сейчас цепочки поставок для этого не существует, поэтому нам приходится делать больше самостоятельно. И объёмы пока недостаточны, чтобы по-настоящему снизить себестоимость и распределить капитальные затраты на большое количество роботов. Многие компоненты уже используются в других отраслях. Например, коммерческие дроны снизили стоимость нужных нам моторов. Электромобили снизили стоимость батарей — теперь они достаточно хороши. Мы берём зрелые технологии из других индустрий и объединяем их в конечную форму.
2025 / Отсутсвие вертикально интегрированной системы
Сейчас мы проектируем и собираем системы в Остине, Техас. Постепенно передаём больше Jabil по мере масштабирования. Финальная сборка пока в Остине, дальше будет больше через Jabil. Многие приводят Tesla как полностью вертикально интегрированную компанию и спрашивают, как мы будем конкурировать, не владея производством. Но Tesla в начале работала с контрактными производителями. Говорят, нужно владеть своим AI-стеком — Tesla не владела Autopilot в начале, они работали с Mobileye. Они сотрудничали с экспертами и постепенно усиливали вертикальную интеграцию. Я считаю, что нужно выбирать свои битвы. Мы лучше всех умеем делать роботов и программное обеспечение. На этом фокус. Производство — с лучшими в мире. У нас хорошие отношения с Jabil — с этого начинаем. Это не значит, что так будет всегда.
2026 / Главный bottleneck робототехники- данные / Скептицизм об объемах
В краткосрочной перспективе в следующем году — сотни, возможно первые тысячи роботов, в основном меньше 1000 на компанию. 2027 — год начала реального масштабирования. Разговоры о 10 000 в следующем году — слишком амбициозно. Будет медленнее. Главный вопрос — данные. Есть идея собирать эгоцентрические данные людей, минуя телеоперацию. Мы и другие над этим работаем. Есть и внешние источники, например видеоданные.
2025 / Структура робототехники - прорыв Софт
Два блока — железо и софт. Железо: сеть моторов и сенсоров. Вместо пошагового программирования — сенсоры в обратной связи. Камеры (зрение), тактильные датчики, температурные сенсоры, акселерометры. Робот реагирует на мир динамически. Мы сделали более 60 итераций электрических приводов (актуаторов), балансируя безопасность, производительность и стоимость. Мы используем прогресс из дронов (дешёвые моторы), электромобилей (батареи, сенсоры). Софт: прорыв последних лет — генеративный ИИ. Вместо программирования через PhD — можно обучать, показывая пример. Софт Apollo : Linux . Поверх — наша собственная операционная система. Далее — когнитивный слой ИИ. У нас партнёрство с Google DeepMind. В Apollo вычисления находятся в груди. Подход гибридный: часть в облаке, часть — локально для реального времени.
2025 / Приложения для гуманоидных роботов - Iphone в мире робототехники
Наша цель — создать платформу, «iPhone роботов». Поверх неё разработчики смогут строить приложения. Сейчас мы идём вертикально до конечного клиента, чтобы доказать коммерческую модель. Позже появится широкая экосистема.
2025 / Масштабирование -> Снижение стоимости
Если сравнить гуманоидного робота и автомобиль, то по весу в роботе на 96% меньше сырья, чем в машине. Базовый металл в наших роботах — алюминий. Во всём роботе около 300 долларов сырого алюминия. Это значит, что с точки зрения первых принципов нет причины, по которой такие роботы должны быть дорогими или не станут намного дешевле автомобилей по мере роста цепочки поставок и объёмов производства. Сейчас цепочки поставок для этого не существует, поэтому нам приходится делать больше самостоятельно. И объёмы пока недостаточны, чтобы по-настоящему снизить себестоимость и распределить капитальные затраты на большое количество роботов. Многие компоненты уже используются в других отраслях. Например, коммерческие дроны снизили стоимость нужных нам моторов. Электромобили снизили стоимость батарей — теперь они достаточно хороши. Мы берём зрелые технологии из других индустрий и объединяем их в конечную форму.
2025 / Отсутсвие вертикально интегрированной системы
Сейчас мы проектируем и собираем системы в Остине, Техас. Постепенно передаём больше Jabil по мере масштабирования. Финальная сборка пока в Остине, дальше будет больше через Jabil. Многие приводят Tesla как полностью вертикально интегрированную компанию и спрашивают, как мы будем конкурировать, не владея производством. Но Tesla в начале работала с контрактными производителями. Говорят, нужно владеть своим AI-стеком — Tesla не владела Autopilot в начале, они работали с Mobileye. Они сотрудничали с экспертами и постепенно усиливали вертикальную интеграцию. Я считаю, что нужно выбирать свои битвы. Мы лучше всех умеем делать роботов и программное обеспечение. На этом фокус. Производство — с лучшими в мире. У нас хорошие отношения с Jabil — с этого начинаем. Это не значит, что так будет всегда.
2026 / Главный bottleneck робототехники- данные / Скептицизм об объемах
В краткосрочной перспективе в следующем году — сотни, возможно первые тысячи роботов, в основном меньше 1000 на компанию. 2027 — год начала реального масштабирования. Разговоры о 10 000 в следующем году — слишком амбициозно. Будет медленнее. Главный вопрос — данные. Есть идея собирать эгоцентрические данные людей, минуя телеоперацию. Мы и другие над этим работаем. Есть и внешние источники, например видеоданные.
2025 / Структура робототехники - прорыв Софт
Два блока — железо и софт. Железо: сеть моторов и сенсоров. Вместо пошагового программирования — сенсоры в обратной связи. Камеры (зрение), тактильные датчики, температурные сенсоры, акселерометры. Робот реагирует на мир динамически. Мы сделали более 60 итераций электрических приводов (актуаторов), балансируя безопасность, производительность и стоимость. Мы используем прогресс из дронов (дешёвые моторы), электромобилей (батареи, сенсоры). Софт: прорыв последних лет — генеративный ИИ. Вместо программирования через PhD — можно обучать, показывая пример. Софт Apollo : Linux . Поверх — наша собственная операционная система. Далее — когнитивный слой ИИ. У нас партнёрство с Google DeepMind. В Apollo вычисления находятся в груди. Подход гибридный: часть в облаке, часть — локально для реального времени.
2025 / Приложения для гуманоидных роботов - Iphone в мире робототехники
Наша цель — создать платформу, «iPhone роботов». Поверх неё разработчики смогут строить приложения. Сейчас мы идём вертикально до конечного клиента, чтобы доказать коммерческую модель. Позже появится широкая экосистема.
Sergey Levine [ Physical Intelligence ] / p.1
2025 / Выход в коммерцию - решение проблемы масштаба данных
Я всегда считал, что робототехника не так уж отличается от других областей ИИ — масштаб будет критичен.Но добраться до него сложно. У нас в отличии от автомобильной индустрии -нет миллионов машин, ездящих и собирающих данные. В отличии от LLM - нет интернета, куда генериуется миллионы контента ежедневно. Поэтому приходится быть изобретательными — деплоить роботов, заставлять их делать задачи, собирать собственные данные в масштабе. Нужно преодолеть «энергию активации», а потом запустить маховик, который будет постоянно улучшать систему. Думаю, что лучший способ создать маховик — выйти в коммерцию и работать в реальном мире.
2025 / Проблема композиционнсоти в робототехнике
Современные большие модели при достаточном масштабе начинают проявлять композиционность. Её нельзя «заставить» вручную — она появляется при масштабе и правильном распределении данных. В робототехнике сложнее — композиция движений не всегда даёт целостный контроль. Я не знаю точного ответа. Возможно решение проблемы в робототехнике - тоже придет с масштабом, возможно , нужна иерархия абстракций — высокий уровень планирования, средний — выбор объектов, низкий — моторный контроль. Пока это решается в реальном времени научным сообществом.
205 / Семантический подход к решению задач
Следующий шаг - лучшее следование сложным инструкциям. Робот мог бы не только выполнить задачу, но и уточнить детали. Это не только про взаимодействие, но и про реальное выполнение сложной работы.Это позволит роботу переиспользовать навыки. Он может подумать: какие из моих умений подходят для новой задачи? Это требует семантического знания из LLM и, возможно, дополнительного test-time compute. Мы над этим работаем.
Начало запуска флайвила > Срока достижения X
Это будет как с ИИ-ассистентами. Как только будет достигнут базовый уровень полезности, его выпустят в мир. И дальше он начнёт собирать опыт и становиться лучше. Я думаю не о дате завершения, а о дате запуска маховика. Когда он начнёт крутиться? Это может быть скоро. Чем уже задача, тем быстрее можно выйти в реальный мир. Мы уже исследуем, что именно робот может делать, чтобы начать этот маховик. Что касается того, что вам реально будет важно — однозначные годы, не десятилетия. Я надеюсь, что что-то будет уже через один-два года, но сложно сказать.Робототехника не принципиально отличается. Есть небольшие различия. Если робот работает вместе с людьми, возникают естественные сигналы обучения. Люди заинтересованы помогать, чтобы всё получилось. В физическом мире ошибки очевидны. Если ты ответил неправильно на вопрос — человек может не знать, что ответ неверен. Если ты неправильно сложил футболку — это видно. Можно проанализировать и сделать лучше. Я не думаю, что нужны радикально новые идеи. Нужен правильный синтез уже известных компонентов. Синтез сам по себе сложен. Это глубокая задача. Если повезёт и всё пойдёт по плану — разумно ожидать в пределах одного десятилетия. Если нужен медианный ответ — пять лет.
2025 / Повышение границ использования- > Масштабирование
Cовокупная выручка AI-компаний — порядка 20–30 миллиардов долларов в год, что намного меньше объёма всей интеллектуальной работы — 30–40 триллионов. LLM не делают всю разработку, потому что они хороши в определённой области, но у неё есть пределы. Эти пределы ежегодно расширяются. Нет причин думать, что с роботами будет иначе. Их область применения сначала будет небольшой: что-то они смогут делать очень хорошо, а где-то потребуется серьёзный человеческий надзор. Область будет расти. Это приведёт к росту продуктивности.
2025 / Долгосрочное снижение стоимости
Когда я начал заниматься робототехникой в 2014, я использовал PR2 за $400 000. Когда открыл лабораторию в Беркли, покупал руки по $30 000. Сейчас в Physical Intelligence каждая рука стоит около $3 000. Мы думаем, что их можно производить за малую часть этой суммы.
2025 / Выход в коммерцию - решение проблемы масштаба данных
Я всегда считал, что робототехника не так уж отличается от других областей ИИ — масштаб будет критичен.Но добраться до него сложно. У нас в отличии от автомобильной индустрии -нет миллионов машин, ездящих и собирающих данные. В отличии от LLM - нет интернета, куда генериуется миллионы контента ежедневно. Поэтому приходится быть изобретательными — деплоить роботов, заставлять их делать задачи, собирать собственные данные в масштабе. Нужно преодолеть «энергию активации», а потом запустить маховик, который будет постоянно улучшать систему. Думаю, что лучший способ создать маховик — выйти в коммерцию и работать в реальном мире.
2025 / Проблема композиционнсоти в робототехнике
Современные большие модели при достаточном масштабе начинают проявлять композиционность. Её нельзя «заставить» вручную — она появляется при масштабе и правильном распределении данных. В робототехнике сложнее — композиция движений не всегда даёт целостный контроль. Я не знаю точного ответа. Возможно решение проблемы в робототехнике - тоже придет с масштабом, возможно , нужна иерархия абстракций — высокий уровень планирования, средний — выбор объектов, низкий — моторный контроль. Пока это решается в реальном времени научным сообществом.
205 / Семантический подход к решению задач
Следующий шаг - лучшее следование сложным инструкциям. Робот мог бы не только выполнить задачу, но и уточнить детали. Это не только про взаимодействие, но и про реальное выполнение сложной работы.Это позволит роботу переиспользовать навыки. Он может подумать: какие из моих умений подходят для новой задачи? Это требует семантического знания из LLM и, возможно, дополнительного test-time compute. Мы над этим работаем.
Начало запуска флайвила > Срока достижения X
Это будет как с ИИ-ассистентами. Как только будет достигнут базовый уровень полезности, его выпустят в мир. И дальше он начнёт собирать опыт и становиться лучше. Я думаю не о дате завершения, а о дате запуска маховика. Когда он начнёт крутиться? Это может быть скоро. Чем уже задача, тем быстрее можно выйти в реальный мир. Мы уже исследуем, что именно робот может делать, чтобы начать этот маховик. Что касается того, что вам реально будет важно — однозначные годы, не десятилетия. Я надеюсь, что что-то будет уже через один-два года, но сложно сказать.Робототехника не принципиально отличается. Есть небольшие различия. Если робот работает вместе с людьми, возникают естественные сигналы обучения. Люди заинтересованы помогать, чтобы всё получилось. В физическом мире ошибки очевидны. Если ты ответил неправильно на вопрос — человек может не знать, что ответ неверен. Если ты неправильно сложил футболку — это видно. Можно проанализировать и сделать лучше. Я не думаю, что нужны радикально новые идеи. Нужен правильный синтез уже известных компонентов. Синтез сам по себе сложен. Это глубокая задача. Если повезёт и всё пойдёт по плану — разумно ожидать в пределах одного десятилетия. Если нужен медианный ответ — пять лет.
2025 / Повышение границ использования- > Масштабирование
Cовокупная выручка AI-компаний — порядка 20–30 миллиардов долларов в год, что намного меньше объёма всей интеллектуальной работы — 30–40 триллионов. LLM не делают всю разработку, потому что они хороши в определённой области, но у неё есть пределы. Эти пределы ежегодно расширяются. Нет причин думать, что с роботами будет иначе. Их область применения сначала будет небольшой: что-то они смогут делать очень хорошо, а где-то потребуется серьёзный человеческий надзор. Область будет расти. Это приведёт к росту продуктивности.
2025 / Долгосрочное снижение стоимости
Когда я начал заниматься робототехникой в 2014, я использовал PR2 за $400 000. Когда открыл лабораторию в Беркли, покупал руки по $30 000. Сейчас в Physical Intelligence каждая рука стоит около $3 000. Мы думаем, что их можно производить за малую часть этой суммы.
Sergey Levine [ Physical Intelligence ] / p.2
2019 / Достижение успеха в обобщение - большие данные + нейросети
Вы умеете завязывать шнурки и без усилий обобщаете этот навык на новые ситуации. Если у вас другие, даже странные ботинки, это не выбьет вас из колеи. У вас есть здравый смысл, который позволяет обобщать поведение. Но когда мы пытаемся систематизировать этот здравый смысл, выделить принципы — например, физику, инерцию, свойства объектов — оказывается, что реальный мир полон бесконечных исключений и частных случаев. И красивые принципы сами по себе не дают хорошего обобщения. Если посмотреть на области, где машины научились обобщать в открытом мире — компьютерное зрение, распознавание речи, обработка языка — мы увидим, что рецепт успеха не в том, чтобы формализовать принципы, а в том, чтобы использовать большие модели высокой ёмкости и обучать их на огромных объёмах данных. И вторую часть нельзя игнорировать. Успех — это не просто большие нейросети. Это большие нейросети плюс большие данные.
Chelsea Finn [ Physical Intelligence ]
2025 / Главная проблема робототехники- спецификация задач обучения
Проблема в том, что если вы хотите полностью решить конкретную робототехническую задачу, вам по сути нужно строить целую компанию вокруг этой задачи. Отдельная компания для логистики, для автоматизации мокрых лабораторий, для кухонных роботов, для хирургических роботов и так далее. Это очень сложно, потому что такой компании нужно разрабатывать новое железо, писать кастомный софт, проектировать уникальные двигательные примитивы под конкретное применение, обрабатывать крайние случаи. Всё приходится делать с нуля, если вы хотите решить задачу в робототехнике. В результате многие робототехнические компании не добились успеха во внедрении роботов в физический мир и в нашу повседневную жизнь. Мы хотим создать универсальную модель, которая позволит любому роботу выполнять любую задачу в любой среде. Мы считаем, что такая обобщённая модель может работать лучше и быть проще в использовании, чем специализированные решения — как это произошло с foundation-моделями в языке и других областях.
2025 / Прорыв робототехники
Я занимаюсь этим больше 10 лет. Раньше ничего не работало. Сейчас есть ощущение зрелости и готовности к реальному миру. Есть большой интерес к этой технологии, потому что она начинает реально работать.
2023 / Главная проблема робототехники - обобщение
Видео Boston Dynamics впечатляют, потому что движения выглядят сложными, и легко начать воспринимать робота как человека. Если человек делает такое, значит он умеет многое. Но в робототехнике такие демонстрации настроены под конкретную среду. Робота подготавливают под этот сценарий. Если изменить среду, начальную позицию или задачу, демонстрация перестает работать — робот падает. Главная проблема — обобщение. Роботы должны уметь работать в разных сценариях, с разными объектами и в разных средах. Сейчас они хорошо работают в контролируемых условиях, например на фабриках. Но дать им гибкость человеческих навыков — это сложная задача.
2019 / Достижение успеха в обобщение - большие данные + нейросети
Вы умеете завязывать шнурки и без усилий обобщаете этот навык на новые ситуации. Если у вас другие, даже странные ботинки, это не выбьет вас из колеи. У вас есть здравый смысл, который позволяет обобщать поведение. Но когда мы пытаемся систематизировать этот здравый смысл, выделить принципы — например, физику, инерцию, свойства объектов — оказывается, что реальный мир полон бесконечных исключений и частных случаев. И красивые принципы сами по себе не дают хорошего обобщения. Если посмотреть на области, где машины научились обобщать в открытом мире — компьютерное зрение, распознавание речи, обработка языка — мы увидим, что рецепт успеха не в том, чтобы формализовать принципы, а в том, чтобы использовать большие модели высокой ёмкости и обучать их на огромных объёмах данных. И вторую часть нельзя игнорировать. Успех — это не просто большие нейросети. Это большие нейросети плюс большие данные.
Chelsea Finn [ Physical Intelligence ]
2025 / Главная проблема робототехники- спецификация задач обучения
Проблема в том, что если вы хотите полностью решить конкретную робототехническую задачу, вам по сути нужно строить целую компанию вокруг этой задачи. Отдельная компания для логистики, для автоматизации мокрых лабораторий, для кухонных роботов, для хирургических роботов и так далее. Это очень сложно, потому что такой компании нужно разрабатывать новое железо, писать кастомный софт, проектировать уникальные двигательные примитивы под конкретное применение, обрабатывать крайние случаи. Всё приходится делать с нуля, если вы хотите решить задачу в робототехнике. В результате многие робототехнические компании не добились успеха во внедрении роботов в физический мир и в нашу повседневную жизнь. Мы хотим создать универсальную модель, которая позволит любому роботу выполнять любую задачу в любой среде. Мы считаем, что такая обобщённая модель может работать лучше и быть проще в использовании, чем специализированные решения — как это произошло с foundation-моделями в языке и других областях.
2025 / Прорыв робототехники
Я занимаюсь этим больше 10 лет. Раньше ничего не работало. Сейчас есть ощущение зрелости и готовности к реальному миру. Есть большой интерес к этой технологии, потому что она начинает реально работать.
2023 / Главная проблема робототехники - обобщение
Видео Boston Dynamics впечатляют, потому что движения выглядят сложными, и легко начать воспринимать робота как человека. Если человек делает такое, значит он умеет многое. Но в робототехнике такие демонстрации настроены под конкретную среду. Робота подготавливают под этот сценарий. Если изменить среду, начальную позицию или задачу, демонстрация перестает работать — робот падает. Главная проблема — обобщение. Роботы должны уметь работать в разных сценариях, с разными объектами и в разных средах. Сейчас они хорошо работают в контролируемых условиях, например на фабриках. Но дать им гибкость человеческих навыков — это сложная задача.
Chelsea Finn [ Physical Intelligence ] / p,2
2025 / Главный bottleneck робототехники- данные
Промышленная автоматизация дает огромное количество данных, но нет разнообразия. YouTube дает огромное количество данных, но не учимся писать, просто наблюдая, как пишут другие.Симуляция - есть масштаб, данные из симуляции нереалистичны и есть разрыв с реальностью. Мы пытались решить задачу по выгрузке белья из сушилки и сложить ее. Задача тяжёлая из-за вариативности одежды, её положения, смятости. Мы начали просто: складывание футболки одного бренда и размера, динамическое расправление одной футболки. Собрали данные через телеманипуляцию, обучили политику методом имитационного обучения. Модель — около 100 млн параметров, вход — изображения с камер, выход — целевые положения суставов, управление на частоте 50 Гц. Компания основана в марте 2024. Через пару месяцев мы получили политику, которая надёжно складывала одну футболку одного размера. Также тестировали динамические движения — важно точно соответствовать частоте управления. Затем усложнили: футболка не лежит ровно, а смята. Это резко усложняет задачу. Первые попытки выглядели частично разумно, но прогресса не было. Часто 0% успеха. В конце июня появились первые признаки прогресса: робот начал расправлять и складывать. Всё ещё медленно. Дальше — бельё в корзине, разные размеры, шорты. Опять 0% успеха. Мы думали: нужна память? Дольше обучать? Управление в пространстве эффектора вместо суставов? Проблемы калибровки? Больше условий? Иерархия? Более высокое разрешение? Интервенции в сборе данных? Мы всё это пробовали. Два-три месяца без результата. Прорыв случился, когда мы вдохновились языковыми моделями: вместо обучения политики на всех данных мы сделали предварительное обучение на всём датасете, а затем дообучили на тщательно отобранных, качественных демонстрациях. Он складывает V-образную футболку, хотя таких не было в дообучающем датасете. Складывает рубашки с пуговицами. Есть обобщение. Это показывает преимущество foundation-моделей, о котором я говорил: для разных задач не нужно начинать с нуля. Можно использовать предобучение на разных роботах и разных задачах. Мы также применили этот рецепт к роботам других компаний. Этого робота я никогда не видел лично. Они собрали данные, отправили их нам, мы дообучили модель на их данных. Мы даже не знали точно, как именно управляется их робот, как представляются его действия. Но после дообучения модель смогла управлять роботом, чтобы в данном случае приготовить кофе. Итоги: мы смогли независимо разработать предобучение и постобучение, разделить проблему, а затем объединить лучшее из обоих. Обучение на всех данных не работает для сложных задач; предобучение плюс постобучение на отобранных данных дает гораздо лучший результат. Аналогичный подход мы используем и при смене среды - Мы собирали данные в домах по всему Сан-Франциско, а также в разнообразных макетах кухонь и спален. В итоге более 100 уникальных комнат вошли в датасет, который стал частью более крупной смеси для предобучения. Мы арендовали три Airbnb, где никогда не были. Поставили робота на кухне. Попросили закрыть шкаф, убрать посуду. Он никогда не видел эти вилки и тарелки. Робот справился, несмотря на новые столешницы, мебель, объекты. Есть сбои. Успех около 80%.
2025 / Главный bottleneck робототехники- данные
Промышленная автоматизация дает огромное количество данных, но нет разнообразия. YouTube дает огромное количество данных, но не учимся писать, просто наблюдая, как пишут другие.Симуляция - есть масштаб, данные из симуляции нереалистичны и есть разрыв с реальностью. Мы пытались решить задачу по выгрузке белья из сушилки и сложить ее. Задача тяжёлая из-за вариативности одежды, её положения, смятости. Мы начали просто: складывание футболки одного бренда и размера, динамическое расправление одной футболки. Собрали данные через телеманипуляцию, обучили политику методом имитационного обучения. Модель — около 100 млн параметров, вход — изображения с камер, выход — целевые положения суставов, управление на частоте 50 Гц. Компания основана в марте 2024. Через пару месяцев мы получили политику, которая надёжно складывала одну футболку одного размера. Также тестировали динамические движения — важно точно соответствовать частоте управления. Затем усложнили: футболка не лежит ровно, а смята. Это резко усложняет задачу. Первые попытки выглядели частично разумно, но прогресса не было. Часто 0% успеха. В конце июня появились первые признаки прогресса: робот начал расправлять и складывать. Всё ещё медленно. Дальше — бельё в корзине, разные размеры, шорты. Опять 0% успеха. Мы думали: нужна память? Дольше обучать? Управление в пространстве эффектора вместо суставов? Проблемы калибровки? Больше условий? Иерархия? Более высокое разрешение? Интервенции в сборе данных? Мы всё это пробовали. Два-три месяца без результата. Прорыв случился, когда мы вдохновились языковыми моделями: вместо обучения политики на всех данных мы сделали предварительное обучение на всём датасете, а затем дообучили на тщательно отобранных, качественных демонстрациях. Он складывает V-образную футболку, хотя таких не было в дообучающем датасете. Складывает рубашки с пуговицами. Есть обобщение. Это показывает преимущество foundation-моделей, о котором я говорил: для разных задач не нужно начинать с нуля. Можно использовать предобучение на разных роботах и разных задачах. Мы также применили этот рецепт к роботам других компаний. Этого робота я никогда не видел лично. Они собрали данные, отправили их нам, мы дообучили модель на их данных. Мы даже не знали точно, как именно управляется их робот, как представляются его действия. Но после дообучения модель смогла управлять роботом, чтобы в данном случае приготовить кофе. Итоги: мы смогли независимо разработать предобучение и постобучение, разделить проблему, а затем объединить лучшее из обоих. Обучение на всех данных не работает для сложных задач; предобучение плюс постобучение на отобранных данных дает гораздо лучший результат. Аналогичный подход мы используем и при смене среды - Мы собирали данные в домах по всему Сан-Франциско, а также в разнообразных макетах кухонь и спален. В итоге более 100 уникальных комнат вошли в датасет, который стал частью более крупной смеси для предобучения. Мы арендовали три Airbnb, где никогда не были. Поставили робота на кухне. Попросили закрыть шкаф, убрать посуду. Он никогда не видел эти вилки и тарелки. Робот справился, несмотря на новые столешницы, мебель, объекты. Есть сбои. Успех около 80%.
Carolina Parada [ DeepMind ] / p.1
2025 / Обобщение - VLA + VLM
Мы начали внедрять большие языковые модели и foundation-модели в робототехнику, и внезапно открылась возможность, что роботы могут понимать людей. Понимать естественный язык. Интерпретировать сцену — то, что раньше приходилось жестко программировать. Это делает технологию гораздо более доступной для разных приложений. Затем мы ввели концепцию VLA — visual language action моделей, которые переносят знания из веб-концептов, которые робот физически никогда не видел, но при этом могут действовать. Вы можете сказать: «Собери все карандаши вместе», и робот поймет, что это значит, даже если никто не обучал его конкретной фразе «собери карандаши вместе». VLA — это visual language action модель. Обычно, когда говорят об ИИ, имеют в виду мультимодальные модели, VLM — visual language models. Такая модель понимает мир через зрение и язык и может рассуждать. Выход VLA — это действия, которые двигают робота. Выход VLM — это цепочка рассуждений и ответ на вопрос. Это позволяет переносить большое количество информации из семантического пространства, из мультимодальных и world-моделей в пространство действий, делая модель более универсальной. Это и позволяет создавать роботов общего назначения. Но все равно нужны прорывы, чтобы масштабироваться до уровня других foundation-моделей.
2025 / AGI в физическом мире
Мы всегда хотели решить общую задачу интеллекта — AGI. Моя команда сосредоточена на AGI в физическом мире.
2025 / Гуманоидные роботы для дома - последняя стадия
Дом — более поздний рубеж. Не потому что мы не сможем решать задачи в доме — технологии развиваются очень быстро, — а потому что дом требует более высокого уровня безопасности, приватности и защиты. Это займет время. Сначала логистика, производство, ритейл, затем здравоохранение — пространства более структурированные, но с большим разнообразием задач. Все простое там уже автоматизировано. В логистике остались сложные случаи.
2025 / Проблема обучения через наблюдение - foundation model
Мечта любого робототехника — чтобы робот мог смотреть видео или наблюдать за людьми, выполняющими задачи, и учиться из этого. Мы сами так учимся — наблюдая за другими. Раньше в команде все говорили: это случится после нашей карьеры. А сейчас мы обсуждаем — это через 5 лет или через 10? За последние годы мы внедрили LLM и VLM в робототехнику как инструменты планирования. Это позволило роботам понимать язык и абстрактные инструкции — например, разложить блоки по цветам в разные углы. Мы представили VLA — visual-language-action модель, позволяющую учиться на web-scale данных и переносить концепции в действия.
2025 / Обобщение - VLA + VLM
Сейчас робот — как двухлетний ребёнок: понимает мир, играет с объектами, знает концепции. Но если учить его, например, складывать оригами, ему нужно время практиковаться. После практики он сможет это делать. Но до повседневных пространств ещё далеко. Самое впечатляющее — это ситуации, которых робот раньше не видел. Даже мы не знали, справится ли он. И во многих случаях он справлялся. Один из примеров — слэм-данк. Команда принесла игрушки, которых робот не видел. Среди них — маленькое баскетбольное кольцо и мяч. Робота попросили сделать слэм-данк. Он никогда не видел баскетбол и эту игрушку. Через долю секунды он положил мяч в кольцо. Он опирался на понимание Gemini — что такое баскетбол и что такое слэм-данк — и выполнил правильное движение.
2025 / Обобщение - VLA + VLM
Мы начали внедрять большие языковые модели и foundation-модели в робототехнику, и внезапно открылась возможность, что роботы могут понимать людей. Понимать естественный язык. Интерпретировать сцену — то, что раньше приходилось жестко программировать. Это делает технологию гораздо более доступной для разных приложений. Затем мы ввели концепцию VLA — visual language action моделей, которые переносят знания из веб-концептов, которые робот физически никогда не видел, но при этом могут действовать. Вы можете сказать: «Собери все карандаши вместе», и робот поймет, что это значит, даже если никто не обучал его конкретной фразе «собери карандаши вместе». VLA — это visual language action модель. Обычно, когда говорят об ИИ, имеют в виду мультимодальные модели, VLM — visual language models. Такая модель понимает мир через зрение и язык и может рассуждать. Выход VLA — это действия, которые двигают робота. Выход VLM — это цепочка рассуждений и ответ на вопрос. Это позволяет переносить большое количество информации из семантического пространства, из мультимодальных и world-моделей в пространство действий, делая модель более универсальной. Это и позволяет создавать роботов общего назначения. Но все равно нужны прорывы, чтобы масштабироваться до уровня других foundation-моделей.
2025 / AGI в физическом мире
Мы всегда хотели решить общую задачу интеллекта — AGI. Моя команда сосредоточена на AGI в физическом мире.
2025 / Гуманоидные роботы для дома - последняя стадия
Дом — более поздний рубеж. Не потому что мы не сможем решать задачи в доме — технологии развиваются очень быстро, — а потому что дом требует более высокого уровня безопасности, приватности и защиты. Это займет время. Сначала логистика, производство, ритейл, затем здравоохранение — пространства более структурированные, но с большим разнообразием задач. Все простое там уже автоматизировано. В логистике остались сложные случаи.
2025 / Проблема обучения через наблюдение - foundation model
Мечта любого робототехника — чтобы робот мог смотреть видео или наблюдать за людьми, выполняющими задачи, и учиться из этого. Мы сами так учимся — наблюдая за другими. Раньше в команде все говорили: это случится после нашей карьеры. А сейчас мы обсуждаем — это через 5 лет или через 10? За последние годы мы внедрили LLM и VLM в робототехнику как инструменты планирования. Это позволило роботам понимать язык и абстрактные инструкции — например, разложить блоки по цветам в разные углы. Мы представили VLA — visual-language-action модель, позволяющую учиться на web-scale данных и переносить концепции в действия.
2025 / Обобщение - VLA + VLM
Сейчас робот — как двухлетний ребёнок: понимает мир, играет с объектами, знает концепции. Но если учить его, например, складывать оригами, ему нужно время практиковаться. После практики он сможет это делать. Но до повседневных пространств ещё далеко. Самое впечатляющее — это ситуации, которых робот раньше не видел. Даже мы не знали, справится ли он. И во многих случаях он справлялся. Один из примеров — слэм-данк. Команда принесла игрушки, которых робот не видел. Среди них — маленькое баскетбольное кольцо и мяч. Робота попросили сделать слэм-данк. Он никогда не видел баскетбол и эту игрушку. Через долю секунды он положил мяч в кольцо. Он опирался на понимание Gemini — что такое баскетбол и что такое слэм-данк — и выполнил правильное движение.
Carolina Parada [ DeepMind ] / p.2
2025 / Ловкость - Манипуляции
В прошлом году мы почти все усилия направили на ловкость. Это всё ещё активная область. Мы поняли: если позволить людям показывать роботу сложные действия через телеоперацию или «кукловождение», то человек получает дополнительную пару роботизированных рук и показывает задачу. Если это интуитивно, можно собрать много данных — робот выполняет задачу, управляемый человеком, но это роботизированные данные. В сочетании с трансформером и хорошим датасетом можно научить почти чему угодно. Это было неожиданно. Тогда мы увидели, что можем завязывать шнурки, складывать бельё, делать оригами.
2025 / Безопасность
Кроме этого, появляется семантическая физическая безопасность. Если вас просят поставить стакан на стол, вы не поставите его на край. Если видите предмет на полу, который может вызвать падение, вы его поднимете. Мы ввели новый набор данных — Asimov dataset. Он содержит множество сценариев возможных физических ситуаций и вопросы о том, какое действие безопасно. Он вдохновлён тремя законами Азимова: робот не должен причинять вред человеку; должен подчиняться приказам, если это не противоречит первому закону; должен защищать себя, если это не противоречит первым двум. Но эти законы недостаточны. Мы использовали реальные данные о травмах из больниц США, создали визуальные сценарии с вопросами о правильном действии и открыли их сообществу для тестирования моделей. Пример — нельзя класть мягкую игрушку на горячую плиту. Казалось бы, это очевидно, но такие случаи происходили. Конечно, невозможно составить исчерпывающий список. Поэтому мы используем ИИ для анализа широкого набора ситуаций травм из разных стран, формируем более сжатый список правил, а затем люди проверяют и обновляют его со временем.
2025 / Прорыв робототехники SOON
Сегодняшние роботы — как двухлетние дети. Талантливые, но в начале пути. Нужны прорывы в ловкости с обобщением — уметь быть одновременно точным и универсальным. Нужна способность учиться на работе. Они не выучат всё в лаборатории. Их нужно выпускать, давать сталкиваться с новым и становиться лучше со временем. Раньше мы спорили, случится ли это в нашей жизни. Теперь спорим — через пять или десять лет. Следующие два года будут определяющими. Ловкость, управление всем телом — всё начинает складываться в цельную систему. Да, нас ждёт взрыв робототехники, как был взрыв больших языковых моделей. И умение работать в физическом мире сделает сами ИИ-модели сильнее, потому что они начнут понимать пространство человеческого опыта. Всё начинает меняться.
2025 / Ловкость - Манипуляции
В прошлом году мы почти все усилия направили на ловкость. Это всё ещё активная область. Мы поняли: если позволить людям показывать роботу сложные действия через телеоперацию или «кукловождение», то человек получает дополнительную пару роботизированных рук и показывает задачу. Если это интуитивно, можно собрать много данных — робот выполняет задачу, управляемый человеком, но это роботизированные данные. В сочетании с трансформером и хорошим датасетом можно научить почти чему угодно. Это было неожиданно. Тогда мы увидели, что можем завязывать шнурки, складывать бельё, делать оригами.
2025 / Безопасность
Кроме этого, появляется семантическая физическая безопасность. Если вас просят поставить стакан на стол, вы не поставите его на край. Если видите предмет на полу, который может вызвать падение, вы его поднимете. Мы ввели новый набор данных — Asimov dataset. Он содержит множество сценариев возможных физических ситуаций и вопросы о том, какое действие безопасно. Он вдохновлён тремя законами Азимова: робот не должен причинять вред человеку; должен подчиняться приказам, если это не противоречит первому закону; должен защищать себя, если это не противоречит первым двум. Но эти законы недостаточны. Мы использовали реальные данные о травмах из больниц США, создали визуальные сценарии с вопросами о правильном действии и открыли их сообществу для тестирования моделей. Пример — нельзя класть мягкую игрушку на горячую плиту. Казалось бы, это очевидно, но такие случаи происходили. Конечно, невозможно составить исчерпывающий список. Поэтому мы используем ИИ для анализа широкого набора ситуаций травм из разных стран, формируем более сжатый список правил, а затем люди проверяют и обновляют его со временем.
2025 / Прорыв робототехники SOON
Сегодняшние роботы — как двухлетние дети. Талантливые, но в начале пути. Нужны прорывы в ловкости с обобщением — уметь быть одновременно точным и универсальным. Нужна способность учиться на работе. Они не выучат всё в лаборатории. Их нужно выпускать, давать сталкиваться с новым и становиться лучше со временем. Раньше мы спорили, случится ли это в нашей жизни. Теперь спорим — через пять или десять лет. Следующие два года будут определяющими. Ловкость, управление всем телом — всё начинает складываться в цельную систему. Да, нас ждёт взрыв робототехники, как был взрыв больших языковых моделей. И умение работать в физическом мире сделает сами ИИ-модели сильнее, потому что они начнут понимать пространство человеческого опыта. Всё начинает меняться.
Deepak Pathak [ Skild AI ]
2025 / Обобщение - Адаптация
Ключ к AI в реальном мире — способность учиться, потому что физический мир полон неожиданных ситуаций. Даже если собрать самых умных инженеров, вы не сможете предусмотреть все крайние случаи. Я держу бутылку — рука может соскользнуть по-новому. Нужно адаптироваться за миллисекунды. Мы имитируем принцип обучения. Недавно мы разработали «in-context learning» для робототехники. В языковых моделях это значит, что если дать примеры «вопрос-ответ», модель учится из контекста. Это свойство появилось только при обучении на масштабах 100 триллионов токенов. Мы показали ранние, но сильные результаты в робототехнике. Есть видео, где у робота убирают конечности, а он всё равно адаптируется и начинает ползти.
2026 / Единственная проблема робототехники - мозг
Проблема робототехники — не железо, а мозг. Демо-роботы были и 70 лет назад, но они не вокруг нас. Почему? Нет универсального мозга. В робототехнике нет данных, как в языке. Нельзя каждый раз переобучать модель под новое железо. Мы хотим один мозг, который можно поставить на любое тело и который продолжает улучшаться. Наш девиз: любой робот, любая задача, один мозг. Мы строим универсальную модель, которую можно установить на любое железо — гуманоид, четвероногий робот, в помещении или на улице — один мозг для воплощённого интеллекта.
2026 / Основная стратегия развития - флайвил данных
Мы привлекли 1.4 миллиарда. Вычисления — большая статья расходов. Будем масштабировать модели и данные. Второе — построить «data flywheel»: разнообразные развертывания, сбор данных и обратная подача в модель. Это физический процесс: батареи, поломки — не как скачать приложение.
Robin Zeng [ CATL ]
2025 / Батареи - Монополия Китай
У нас два основных продукта. Первый — батареи для электромобильности. Они стоят, например, в машинах Tesla — Model 3 и других моделях, в автомобилях китайских производителей и многих мировых OEM. Эти батареи питают весь автомобиль. Второй продукт — батареи для систем накопления энергии. Возобновляемая энергия, как ветер и солнечные панели, нестабильна. Нужны накопители, чтобы сглаживать подачу, делать её стабильной, предсказуемой и пригодной для промышленности и других нужд. В Китае две трети самых цитируемых работ по батареям, более 50 программ по батареям, в США — всего несколько. Наша доля мирового рынка производства батарей - 40%.
2025 / Электрические самолёты
Мы работаем с партнёрами. Нужно начинать с малых самолётов. Мы уже четыре раза поднимали прототипы. Для коммерческого применения — самолёты около 8,8 тонн, примерно на 14 пассажиров. Думаем, к 2027–2028 появятся первые применения.
2025 / Обобщение - Адаптация
Ключ к AI в реальном мире — способность учиться, потому что физический мир полон неожиданных ситуаций. Даже если собрать самых умных инженеров, вы не сможете предусмотреть все крайние случаи. Я держу бутылку — рука может соскользнуть по-новому. Нужно адаптироваться за миллисекунды. Мы имитируем принцип обучения. Недавно мы разработали «in-context learning» для робототехники. В языковых моделях это значит, что если дать примеры «вопрос-ответ», модель учится из контекста. Это свойство появилось только при обучении на масштабах 100 триллионов токенов. Мы показали ранние, но сильные результаты в робототехнике. Есть видео, где у робота убирают конечности, а он всё равно адаптируется и начинает ползти.
2026 / Единственная проблема робототехники - мозг
Проблема робототехники — не железо, а мозг. Демо-роботы были и 70 лет назад, но они не вокруг нас. Почему? Нет универсального мозга. В робототехнике нет данных, как в языке. Нельзя каждый раз переобучать модель под новое железо. Мы хотим один мозг, который можно поставить на любое тело и который продолжает улучшаться. Наш девиз: любой робот, любая задача, один мозг. Мы строим универсальную модель, которую можно установить на любое железо — гуманоид, четвероногий робот, в помещении или на улице — один мозг для воплощённого интеллекта.
2026 / Основная стратегия развития - флайвил данных
Мы привлекли 1.4 миллиарда. Вычисления — большая статья расходов. Будем масштабировать модели и данные. Второе — построить «data flywheel»: разнообразные развертывания, сбор данных и обратная подача в модель. Это физический процесс: батареи, поломки — не как скачать приложение.
Robin Zeng [ CATL ]
2025 / Батареи - Монополия Китай
У нас два основных продукта. Первый — батареи для электромобильности. Они стоят, например, в машинах Tesla — Model 3 и других моделях, в автомобилях китайских производителей и многих мировых OEM. Эти батареи питают весь автомобиль. Второй продукт — батареи для систем накопления энергии. Возобновляемая энергия, как ветер и солнечные панели, нестабильна. Нужны накопители, чтобы сглаживать подачу, делать её стабильной, предсказуемой и пригодной для промышленности и других нужд. В Китае две трети самых цитируемых работ по батареям, более 50 программ по батареям, в США — всего несколько. Наша доля мирового рынка производства батарей - 40%.
2025 / Электрические самолёты
Мы работаем с партнёрами. Нужно начинать с малых самолётов. Мы уже четыре раза поднимали прототипы. Для коммерческого применения — самолёты около 8,8 тонн, примерно на 14 пассажиров. Думаем, к 2027–2028 появятся первые применения.
👍1
Forwarded from mein lieblingstagebuch
Привет! Завтра в 15:00 по МСК организую комьюнити-кол! Темы для обсуждения: все что стриггерило вас за последние 2 недели.
В этот раз постараюсь быть кратче и не распинаться более чем на 1-2 часа.
Свои темы отпишу вечером в чате, в комментариях к посту прошу оставлять свои предложения.
До встречи!
В этот раз постараюсь быть кратче и не распинаться более чем на 1-2 часа.
Свои темы отпишу вечером в чате, в комментариях к посту прошу оставлять свои предложения.
До встречи!
🔥5👍1
Децентрализованный ИИ
Covenant-72B [ LLM-модель от сабнета TAO - Templar ]
Виральность твитта: > 1.5M Views
Бенчмарки сравниваются с Llama-2, которая не является передовой моделью Meta
Кол-во публичных упоминаний в X от AI ресерчеров: 0
НО до выпуска этой модели, в январе их отмечал фаундер Anthropic, ссылаясь на статью от Epoch AI, как самую мощную децентрализованную модель вычислений в текущий момент. Он считает возможным дальнейший рост децентрализованного ИИ - но выразил сомнения в потенциале обойти централизованные дата-центры.
Проблема децентрализованного ИИ:
Связь между GPU в дата-центре проходит через NVLink / InfinityBand и иные решения, позволяющие линейное масштабирование.
Связь между GPU при децентрализованном ИИ через Интернет
Потенциальные решения:
DiLoCo ( DeepMind )
Prime Intellect [ INTELLECT -1 ]
Масштаб модели: 10B параметров
Мощность вычислений: 1e16 FLOP/s
Кол-во распределенных участников: 14 [ 3 континента ]
FLOPS utilization: 36.2-41.4%
Compute utilization: 83-96%
https://arxiv.org/abs/2412.01152
SparceLoCo ( Templar )
Covenant‑72B
Масштаб модели: 72B параметров
Мощность вычислений: 9e16 FLOP/s
Кол-во распределенных участников: 70
FLOPS utilization: TBA
Compute utilization: TBA
https://arxiv.org/pdf/2508.15706
Heterogeneous SparseLoCo ( Templar )
*Теория
https://arxiv.org/pdf/2601.02360
Показатели передовых централизованных дата-центров:
Масштаб модели: 100B-1T
Мощность вычислений: ~ 1e18 FLOPs
FLOPS utilization: >50%
Compute utilization: >85%
Сравнение Covenant-72B с INTELLECT-1 / Psyche + LLAMA 2
[ LINK ] / Превосходит по бенчмаркам языковой модели децентрализованных конкурентов, но немного отстает от старой модели Llama-2
Наиболее важные проблемы:
Synchronization Efficiency (P55 / P99 ) [ TBA ]
Fault Tolerance [ TBA ]
Scalability [ TBA ]
Consistency [ TBA ]
Network Bandwidth Utilization [ решена через сжатие ]
FLOPS utilization [ решена ]
Compute utilization [ решена ]
Самая главная проблема, что вышеуказанные модели были реализованы на маленьком кол-ве участников сети [ 14 / 70 ] и на мощных кластерах GPU, главные проблемы начинаются при масштабировании - больший масштаб кол-ва участников сети по геолокации / по мощности GPU
Потенциальные преимущества децентрализованного ИИ:
-Стоимость [ *оценочные данные ]
-Проблема централизации в обучении / 3-5 компаний владеют ИИ = контроль решений ИИ = контроль человеческий решений
Текущие игроки в децентрализованном ИИ:
-Templar [ лидер ]
-Nous
-Prime Intellect
-Pluralis
-Остальные [ Gonka / Cocoon / ... ]
Covenant-72B [ LLM-модель от сабнета TAO - Templar ]
Виральность твитта: > 1.5M Views
Бенчмарки сравниваются с Llama-2, которая не является передовой моделью Meta
Кол-во публичных упоминаний в X от AI ресерчеров: 0
НО до выпуска этой модели, в январе их отмечал фаундер Anthropic, ссылаясь на статью от Epoch AI, как самую мощную децентрализованную модель вычислений в текущий момент. Он считает возможным дальнейший рост децентрализованного ИИ - но выразил сомнения в потенциале обойти централизованные дата-центры.
Проблема децентрализованного ИИ:
Связь между GPU в дата-центре проходит через NVLink / InfinityBand и иные решения, позволяющие линейное масштабирование.
Связь между GPU при децентрализованном ИИ через Интернет
Потенциальные решения:
DiLoCo ( DeepMind )
Prime Intellect [ INTELLECT -1 ]
Масштаб модели: 10B параметров
Мощность вычислений: 1e16 FLOP/s
Кол-во распределенных участников: 14 [ 3 континента ]
FLOPS utilization: 36.2-41.4%
Compute utilization: 83-96%
https://arxiv.org/abs/2412.01152
SparceLoCo ( Templar )
Covenant‑72B
Масштаб модели: 72B параметров
Мощность вычислений: 9e16 FLOP/s
Кол-во распределенных участников: 70
FLOPS utilization: TBA
Compute utilization: TBA
https://arxiv.org/pdf/2508.15706
Heterogeneous SparseLoCo ( Templar )
*Теория
https://arxiv.org/pdf/2601.02360
Показатели передовых централизованных дата-центров:
Масштаб модели: 100B-1T
Мощность вычислений: ~ 1e18 FLOPs
FLOPS utilization: >50%
Compute utilization: >85%
Сравнение Covenant-72B с INTELLECT-1 / Psyche + LLAMA 2
[ LINK ] / Превосходит по бенчмаркам языковой модели децентрализованных конкурентов, но немного отстает от старой модели Llama-2
Наиболее важные проблемы:
Synchronization Efficiency (P55 / P99 ) [ TBA ]
Fault Tolerance [ TBA ]
Scalability [ TBA ]
Consistency [ TBA ]
Network Bandwidth Utilization [ решена через сжатие ]
FLOPS utilization [ решена ]
Compute utilization [ решена ]
Самая главная проблема, что вышеуказанные модели были реализованы на маленьком кол-ве участников сети [ 14 / 70 ] и на мощных кластерах GPU, главные проблемы начинаются при масштабировании - больший масштаб кол-ва участников сети по геолокации / по мощности GPU
Потенциальные преимущества децентрализованного ИИ:
-Стоимость [ *оценочные данные ]
-Проблема централизации в обучении / 3-5 компаний владеют ИИ = контроль решений ИИ = контроль человеческий решений
Текущие игроки в децентрализованном ИИ:
-Templar [ лидер ]
-Nous
-Prime Intellect
-Pluralis
-Остальные [ Gonka / Cocoon / ... ]
❤4👍1
Децентрализованный ИИ - крипта
Performance / 30D [ основной рост с 12.03 ] :
Subnets +50-300%
GRASS +95%
TAO + 45%
SAHARA + 45%
FET +40%
AGIX + 35%
NEAR +35%
ALLO + 35%
Крупные инфлы, подсвечивающие TAO / Subnets
https://x.com/Jason/status/2029944723235013005
https://x.com/0xSammy/status/2033438434061062328
https://x.com/AlgodTrading/status/2032940840188805562
https://x.com/Route2FI/status/2033115728052625588
Анализ Subnets TAO:
https://drive.google.com/file/d/1EvdrwUveJjRgNcmU3_LowIxY2i3l-J-v/view
https://www.khala.io/bittensor-the-intelligence-olympics
По TAO - пока просто слежу за проектом.
По остальным монетам, которые выросли на фоне этого- открываю шорты
Причины:
-Нет никаких успехов в области ИИ
-Плохой сентимент для проектов - пустышек - с обещаниями
-Маленькое кол-во упоминаний о монетах децентрализованного ИИ в CT
Шорт-Позиции:
FET / 4x [ 2500$ ]
ALLO / 4x [ 1000$ ]
Банк № 2 ( Шорт ) - 48 500$ / 75 000$
[ эти позиции + те которые из последнего поста ]
Performance / 30D [ основной рост с 12.03 ] :
Subnets +50-300%
GRASS +95%
TAO + 45%
SAHARA + 45%
FET +40%
AGIX + 35%
NEAR +35%
ALLO + 35%
Крупные инфлы, подсвечивающие TAO / Subnets
https://x.com/Jason/status/2029944723235013005
https://x.com/0xSammy/status/2033438434061062328
https://x.com/AlgodTrading/status/2032940840188805562
https://x.com/Route2FI/status/2033115728052625588
Анализ Subnets TAO:
https://drive.google.com/file/d/1EvdrwUveJjRgNcmU3_LowIxY2i3l-J-v/view
https://www.khala.io/bittensor-the-intelligence-olympics
По TAO - пока просто слежу за проектом.
По остальным монетам, которые выросли на фоне этого- открываю шорты
Причины:
-Нет никаких успехов в области ИИ
-Плохой сентимент для проектов - пустышек - с обещаниями
-Маленькое кол-во упоминаний о монетах децентрализованного ИИ в CT
Шорт-Позиции:
FET / 4x [ 2500$ ]
ALLO / 4x [ 1000$ ]
Банк № 2 ( Шорт ) - 48 500$ / 75 000$
[ эти позиции + те которые из последнего поста ]
❤2
Гуманоидные Роботы / p.1
Текущая стоимость по оценке McKinsey [ 10.2025 г. ] на прототип: 150 000$ - 500 000$ [ Figure AI / Optimus ]
Для сравнения, Unitree Edu коммерческая цена от 50 000$.
Стоимость / Оценка McKinsey:
Актуаторы: 50- 60%
Включают в себя: моторы, сенсоры, редукторы и т.д.
Вероятнее всего, цена связана с тем что нет готовой цепочки поставок для гуманоидов. Нет готовых актуаторов, сенсоров, батарей, кинематики, софта.
Вычисления: 5-10%
Практически все компании, в том числе китайские, используют GPU от NVIDIA Jetson [ 1000 - 3000$ ]
Tesla Optimus используют собственные решение - AI5 в партнерстве с Samsung / TSMC
Манипуляторы для рук: 10-20%
Батареи / Станция: 5-10%
Механический корпус: 5-10%
Прогнозы по кол-ву Гуманоидных роботов:
Bank of America / Goldman Sachs / Morgan Stanley / Tesla - 1 млн / год к 2030 г.
Elon Musk - 10 млрд. роботов до 2045 г.
При экспоненциальном росте, на который не ставят большинство аналитиков, предположим :
2030 г. - 10 млн / год
2035 г. - 1 млрд / год
Потенциальные bottlnecks:
-GPU + Memory
-Редкоземельные металлы
-Аллюминий
-Батареи
-Сенсоры
-Данные
McKinsey Research
Morgan Stanley Research
Bank Of America Research
Текущая стоимость по оценке McKinsey [ 10.2025 г. ] на прототип: 150 000$ - 500 000$ [ Figure AI / Optimus ]
Для сравнения, Unitree Edu коммерческая цена от 50 000$.
Стоимость / Оценка McKinsey:
Актуаторы: 50- 60%
Включают в себя: моторы, сенсоры, редукторы и т.д.
Вероятнее всего, цена связана с тем что нет готовой цепочки поставок для гуманоидов. Нет готовых актуаторов, сенсоров, батарей, кинематики, софта.
Вычисления: 5-10%
Практически все компании, в том числе китайские, используют GPU от NVIDIA Jetson [ 1000 - 3000$ ]
Tesla Optimus используют собственные решение - AI5 в партнерстве с Samsung / TSMC
Манипуляторы для рук: 10-20%
Батареи / Станция: 5-10%
Механический корпус: 5-10%
Прогнозы по кол-ву Гуманоидных роботов:
Bank of America / Goldman Sachs / Morgan Stanley / Tesla - 1 млн / год к 2030 г.
Elon Musk - 10 млрд. роботов до 2045 г.
При экспоненциальном росте, на который не ставят большинство аналитиков, предположим :
2030 г. - 10 млн / год
2035 г. - 1 млрд / год
Потенциальные bottlnecks:
-GPU + Memory
-Редкоземельные металлы
-Аллюминий
-Батареи
-Сенсоры
-Данные
McKinsey Research
Morgan Stanley Research
Bank Of America Research
❤3
https://www.humanoids.fyi/
можно трекать поставщиков компаний по робототехнике / основные модели гуманоидов и их технические характеристики / foundation модели и т.д
можно трекать поставщиков компаний по робототехнике / основные модели гуманоидов и их технические характеристики / foundation модели и т.д
🔥6❤1
Космические дата-центры / Тезисы p.1
10.2025 / Elon Musk
SpaceX будет делать дата-центры в космосе на базе Starlink V3
10.2025 / Jeff Bezos
Одна из вещей, которая произойдёт… трудно сказать точно когда, но я ставлю, что не больше 20: мы начнём строить гигантские гигаваттные дата-центры в космосе. Их будет лучше строить в космосе, потому что там солнечная энергия 24/7. И там нет облаков, нет дождя, нет погоды. Так что мы сможем обойти по стоимости наземные дата-центры, построив их в космосе, в ближайшие пару десятилетий. Это уже случилось с метеоспутниками. Это уже случилось со спутниками связи. В космосе у нас неограниченная энергия и неограниченные материальные ресурсы.
11.2025 / Sundar Pichai
Нет сомнений, что в течении этого века, космос - будет основным место для строительства дата-центров. Энергия солнца в сотни-триллионов раз больше.
11.2025 / Elon Musk
Если создать производство спутников и дата-центров на Луне и запускать грузы с поверхности Луны с помощью массовых драйверов в стиле О’Нила, можно выводить 500–1000 ТВт/год AI-спутников, существенно продвигаясь вверх по шкале Кардашёва и используя заметную долю энергии Солнца.
11.2025 / Alex Wisner-Gross
Есть заблуждение, будто нельзя эксплуатировать термически нагруженный дата-центр без охлаждения на основе теплопроводности. Это совершенно неправда. Решение здесь в том, что космический микроволновый фон имеет температуру около 3 кельвинов. В среднем Вселенная довольно холодная. Хитрость в том, что вам нужно излучать тепло в правильном направлении. Не стоит пытаться излучать тепло, например, в сторону Солнца. С точки зрения термодинамики это не поможет. Но если вы можете обеспечить, что радиационное охлаждение направлено в сторону космического микроволнового фона, а это большая часть неба, если вы ориентируете систему охлаждения в более холодные направления, всё в порядке. И тогда вы можете охлаждать излучением, а не теплопроводностью. То есть тут есть некоторая задача навигации: нужно правильно направлять систему, правильно её ориентировать. Но это абсолютно реализуемо. А что касается сроков: я был бы умеренно, а может и очень, удивлён, если через 10 лет, если говорить консервативно, мы не увидим сотни гигаватт ИИ-вычислений вне поверхности Земли.
12.2025 / Elon Musk
Космические дата-центры в любом случае победят дата-центры на Земле. В течении 5 лет, эффективность космиических дата центров будет выше чем на Земле. Солнце обладает большим кол-вом энергии, которое превышает потенциально возможную энергию Земли в миллионы раз. Если вы хотите сделать условно AI Factory -на 500 гигаватт - то это будет очень сложно добиться на Земле. США в год потребляет всего 460 гигаватт в среднем. В космосе у вас постоянная солнечная энергия - это решает проблему интермиттентности ВИЭ / Охлаждение — радиационное / батерии практически не нужны.
01.2026 / Elon Musk
Starship — недооценённая революция. Люди не до конца это понимают. Впервые в истории ракета изначально спроектирована под полную и быструю многоразовость. Здесь успех заложен в пространство возможных результатов, а не является фантазией. Мы добились частично реюзабилити - в этом году, надеемся достичь полной.
01.2026 / Elon Musk
Через 3 г. ИИ-датацентры на орбите будут дешевле, чем на Земле
02.2026 / Philip Johnston [ StarCloud CEO ]
Я посчитал всё вместе со своими сооснователями, Эзрой Фейлденом и Ади Олтеаном, и мы пришли к выводу, что если стоимость запуска снизится примерно до 500 долларов за килограмм, то дата-центры в космосе станут экономически жизнеспособными.
02.2026 / Elon Musk
В течении нескольких лет, мы будем запускать ИИ спутники -дата центры SpaceX, которые будут получать энергию из космоса. Это даст нам бесконечный скейл + Солнечная энергия в космосе в 5× эффективнее, чем на Земле. Самое выгодное размещение дата-центров для ИИ - космос.
02.2026 / Elon Musk
Через 30–36 месяцев космос станет самым дешёвым местом для ИИ
10.2025 / Elon Musk
SpaceX будет делать дата-центры в космосе на базе Starlink V3
10.2025 / Jeff Bezos
Одна из вещей, которая произойдёт… трудно сказать точно когда, но я ставлю, что не больше 20: мы начнём строить гигантские гигаваттные дата-центры в космосе. Их будет лучше строить в космосе, потому что там солнечная энергия 24/7. И там нет облаков, нет дождя, нет погоды. Так что мы сможем обойти по стоимости наземные дата-центры, построив их в космосе, в ближайшие пару десятилетий. Это уже случилось с метеоспутниками. Это уже случилось со спутниками связи. В космосе у нас неограниченная энергия и неограниченные материальные ресурсы.
11.2025 / Sundar Pichai
Нет сомнений, что в течении этого века, космос - будет основным место для строительства дата-центров. Энергия солнца в сотни-триллионов раз больше.
11.2025 / Elon Musk
Если создать производство спутников и дата-центров на Луне и запускать грузы с поверхности Луны с помощью массовых драйверов в стиле О’Нила, можно выводить 500–1000 ТВт/год AI-спутников, существенно продвигаясь вверх по шкале Кардашёва и используя заметную долю энергии Солнца.
11.2025 / Alex Wisner-Gross
Есть заблуждение, будто нельзя эксплуатировать термически нагруженный дата-центр без охлаждения на основе теплопроводности. Это совершенно неправда. Решение здесь в том, что космический микроволновый фон имеет температуру около 3 кельвинов. В среднем Вселенная довольно холодная. Хитрость в том, что вам нужно излучать тепло в правильном направлении. Не стоит пытаться излучать тепло, например, в сторону Солнца. С точки зрения термодинамики это не поможет. Но если вы можете обеспечить, что радиационное охлаждение направлено в сторону космического микроволнового фона, а это большая часть неба, если вы ориентируете систему охлаждения в более холодные направления, всё в порядке. И тогда вы можете охлаждать излучением, а не теплопроводностью. То есть тут есть некоторая задача навигации: нужно правильно направлять систему, правильно её ориентировать. Но это абсолютно реализуемо. А что касается сроков: я был бы умеренно, а может и очень, удивлён, если через 10 лет, если говорить консервативно, мы не увидим сотни гигаватт ИИ-вычислений вне поверхности Земли.
12.2025 / Elon Musk
Космические дата-центры в любом случае победят дата-центры на Земле. В течении 5 лет, эффективность космиических дата центров будет выше чем на Земле. Солнце обладает большим кол-вом энергии, которое превышает потенциально возможную энергию Земли в миллионы раз. Если вы хотите сделать условно AI Factory -на 500 гигаватт - то это будет очень сложно добиться на Земле. США в год потребляет всего 460 гигаватт в среднем. В космосе у вас постоянная солнечная энергия - это решает проблему интермиттентности ВИЭ / Охлаждение — радиационное / батерии практически не нужны.
01.2026 / Elon Musk
Starship — недооценённая революция. Люди не до конца это понимают. Впервые в истории ракета изначально спроектирована под полную и быструю многоразовость. Здесь успех заложен в пространство возможных результатов, а не является фантазией. Мы добились частично реюзабилити - в этом году, надеемся достичь полной.
01.2026 / Elon Musk
Через 3 г. ИИ-датацентры на орбите будут дешевле, чем на Земле
02.2026 / Philip Johnston [ StarCloud CEO ]
Я посчитал всё вместе со своими сооснователями, Эзрой Фейлденом и Ади Олтеаном, и мы пришли к выводу, что если стоимость запуска снизится примерно до 500 долларов за килограмм, то дата-центры в космосе станут экономически жизнеспособными.
02.2026 / Elon Musk
В течении нескольких лет, мы будем запускать ИИ спутники -дата центры SpaceX, которые будут получать энергию из космоса. Это даст нам бесконечный скейл + Солнечная энергия в космосе в 5× эффективнее, чем на Земле. Самое выгодное размещение дата-центров для ИИ - космос.
02.2026 / Elon Musk
Через 30–36 месяцев космос станет самым дешёвым местом для ИИ
👍3
Космические дата-центры / Тезисы p.2
02.2026 / Jensen Huang
Проблемы охлаждения. Проблемы радиации, деградации производительности, исправление дефектов. Я отправил инженеров для работы над этой темой - НО сейчас мы больше сфокусированы на Земле -и хотим решить все проблемы сначала здесь. У нас столько простаивающей энергии, я хочу задействовать её как можно быстрее.
02.2026 / Jensen Huang
Мы также будем строить дата-центры в космосе. Разумеется, это очень сложная задача. Поэтому вместе с нашими партнёрами мы работаем над новым компьютером под названием Vera Rubin Space One .Он отправится в космос и положит начало созданию дата-центров в космосе. Конечно, в космосе нет ни теплопроводности, ни конвекции — есть только излучение. Поэтому нам нужно понять, как охлаждать такие системы в космосе. Но у нас много отличных инженеров, которые над этим работают
02.2026 / Sam Altman
Размещение дата-центров в космосе - абсурд. Стоимость запуска намного превышает стоимость запуска на Земле. Не говоря, о том что видеокарту в космосе чинить намного сложнее - а они все еще часто ломаются. Нужно больше 10 лет для того чтобы технологии созрели к космосу.
02.2026 / Jensen Huang
Проблемы охлаждения. Проблемы радиации, деградации производительности, исправление дефектов. Я отправил инженеров для работы над этой темой - НО сейчас мы больше сфокусированы на Земле -и хотим решить все проблемы сначала здесь. У нас столько простаивающей энергии, я хочу задействовать её как можно быстрее.
02.2026 / Jensen Huang
Мы также будем строить дата-центры в космосе. Разумеется, это очень сложная задача. Поэтому вместе с нашими партнёрами мы работаем над новым компьютером под названием Vera Rubin Space One .Он отправится в космос и положит начало созданию дата-центров в космосе. Конечно, в космосе нет ни теплопроводности, ни конвекции — есть только излучение. Поэтому нам нужно понять, как охлаждать такие системы в космосе. Но у нас много отличных инженеров, которые над этим работают
02.2026 / Sam Altman
Размещение дата-центров в космосе - абсурд. Стоимость запуска намного превышает стоимость запуска на Земле. Не говоря, о том что видеокарту в космосе чинить намного сложнее - а они все еще часто ломаются. Нужно больше 10 лет для того чтобы технологии созрели к космосу.
❤1