Итак этот канал - прямое продолжение моего другого канала. К сожалению, Я понял что Я не могу позволить себе быть unhinged and crazy в канале и при этом параллельно писать там о своей профессиональной деятельности и сайд-активностях.
Так что здесь будет про мои интересы и деятельность , а старый канал останется для абсолютно первобытного нефильтрованного щитпостинга.
Так что здесь будет про мои интересы и деятельность , а старый канал останется для абсолютно первобытного нефильтрованного щитпостинга.
Рад поделиться тем, что у команды частью которой Я являюсь, на HuggingFace вышел ТехРепорт по VLA, которая работает на разных роботах в том числе и нашем антропоморфном роботе - Грине (не китайском!). Если вкратце: за последний год стало ясно, что просто «навалить данных» уже не помогает. Чтобы робот перестал тупить в реальных задачах, нужно копать в сторону качества, переносимости между воплощениями и адаптацией в реальном мире
Что в отчете:
Выстроили многоуровневый пайплайн обучения: VLM (L0) -> SFT VLM (L1) -> претрейн VLA (R0) → SFT VLA (R1) → RL finetune (R2), где каждая фаза последовательно адаптирует модель понимать и действовать в физическом мире.
Унифицировали действия (R64): Сделали единый интерфейс для разных роботов. Использовали маскированный loss, для того чтобы разнородные пространства действий у воплощений не путали модель
Выстроили жесткий пайплайн работы с данными: Выстроили пайплайны фильтрации данных, оценки качества и разнообразия датасетов, оценки и выравнивания скорости движений в данных.
RL, JPM и OOD-detector: Научили роботов не просто копировать движения, а восстанавливаться после ошибок + обобщаться на абсолютно новые предметы без переобучения. И главное — вовремя останавливаться, а не «суетиться» после того, как задача уже сделана.
В итоге — SOTA на бенчмарках и отличная работа вживую на том же ALOHA, и нашем антропоморфном роботе - Грине. Внутри много «скучной», но важной инженерки, благодаря которой всё это реально работает, а не просто красиво выглядит на видео.
📌 Почитать можно тут: https://huggingface.co/papers/2602.00919
Наш сайт: https://sber.ru/robocenter
Резюме и предложения: @alex_postnikov26
@pdemen
(Можно написать мне если ребята не доступны:@Alexander_Nutalapati)
Будем благодарны за апвоуты и поддержку! 🙏
Что в отчете:
Выстроили многоуровневый пайплайн обучения: VLM (L0) -> SFT VLM (L1) -> претрейн VLA (R0) → SFT VLA (R1) → RL finetune (R2), где каждая фаза последовательно адаптирует модель понимать и действовать в физическом мире.
Унифицировали действия (R64): Сделали единый интерфейс для разных роботов. Использовали маскированный loss, для того чтобы разнородные пространства действий у воплощений не путали модель
Выстроили жесткий пайплайн работы с данными: Выстроили пайплайны фильтрации данных, оценки качества и разнообразия датасетов, оценки и выравнивания скорости движений в данных.
RL, JPM и OOD-detector: Научили роботов не просто копировать движения, а восстанавливаться после ошибок + обобщаться на абсолютно новые предметы без переобучения. И главное — вовремя останавливаться, а не «суетиться» после того, как задача уже сделана.
В итоге — SOTA на бенчмарках и отличная работа вживую на том же ALOHA, и нашем антропоморфном роботе - Грине. Внутри много «скучной», но важной инженерки, благодаря которой всё это реально работает, а не просто красиво выглядит на видео.
📌 Почитать можно тут: https://huggingface.co/papers/2602.00919
Наш сайт: https://sber.ru/robocenter
Резюме и предложения: @alex_postnikov26
@pdemen
(Можно написать мне если ребята не доступны:@Alexander_Nutalapati)
Будем благодарны за апвоуты и поддержку! 🙏
huggingface.co
Paper page - Green-VLA: Staged Vision-Language-Action Model for Generalist Robots
Join the discussion on this paper page
👍8❤5🔥4
Президент Трамп прокомментировал наш техрепорт!!!
Вот это успех!
Вот это успех!
Donald J. Trump @realDonaldTrump
Я только что увидел, что Сбер Роботикс выложили свой «ГРИН ВЛА» на Хаггинг Фейс. Очень впечатляюще, очень умно! Но почему это в России? Это должно быть в АМЕРИКЕ! 🇺🇸 Мы заберем эти технологии, сделаем их ЛУЧШЕ, БЫСТРЕЕ и БОЛЬШЕ. Мы будем выигрывать в ИИ так, как никто раньше! Никто не разбирается в Роботах лучше меня, поверьте. Грин ВЛА будет работать на нас! СДЕЛАЕМ РОБОТОТЕХНИКУ СНОВА ВЕЛИКОЙ! 🤖🦾
🔥11
Сегодня в онлайне на datafest буду рассказывать про world models. Приходите послушать. https://ods.ai/events/df2026-30-may-online
🍌3
