Chain-of-thought Unreasoning

Channel created

10:22

Channel photo updated

10:23

Итак этот канал - прямое продолжение моего другого канала. К сожалению, Я понял что Я не могу позволить себе быть unhinged and crazy в канале и при этом параллельно писать там о своей профессиональной деятельности и сайд-активностях.
Так что здесь будет про мои интересы и деятельность , а старый канал останется для абсолютно первобытного нефильтрованного щитпостинга.

341 views10:27

Chain-of-thought Unreasoning

Рад поделиться тем, что у команды частью которой Я являюсь, на HuggingFace вышел ТехРепорт по VLA, которая работает на разных роботах в том числе и нашем антропоморфном роботе - Грине (не китайском!). Если вкратце: за последний год стало ясно, что просто «навалить данных» уже не помогает. Чтобы робот перестал тупить в реальных задачах, нужно копать в сторону качества, переносимости между воплощениями и адаптацией в реальном мире

Что в отчете:
Выстроили многоуровневый пайплайн обучения: VLM (L0) -> SFT VLM (L1) -> претрейн VLA (R0) → SFT VLA (R1) → RL finetune (R2), где каждая фаза последовательно адаптирует модель понимать и действовать в физическом мире.
Унифицировали действия (R64): Сделали единый интерфейс для разных роботов. Использовали маскированный loss, для того чтобы разнородные пространства действий у воплощений не путали модель
Выстроили жесткий пайплайн работы с данными: Выстроили пайплайны фильтрации данных, оценки качества и разнообразия датасетов, оценки и выравнивания скорости движений в данных.
RL, JPM и OOD-detector: Научили роботов не просто копировать движения, а восстанавливаться после ошибок + обобщаться на абсолютно новые предметы без переобучения. И главное — вовремя останавливаться, а не «суетиться» после того, как задача уже сделана.

В итоге — SOTA на бенчмарках и отличная работа вживую на том же ALOHA, и нашем антропоморфном роботе - Грине. Внутри много «скучной», но важной инженерки, благодаря которой всё это реально работает, а не просто красиво выглядит на видео.

📌 Почитать можно тут: https://huggingface.co/papers/2602.00919

Наш сайт: https://sber.ru/robocenter

Резюме и предложения: @alex_postnikov26
@pdemen
(Можно написать мне если ребята не доступны:@Alexander_Nutalapati)

Будем благодарны за апвоуты и поддержку! 🙏

huggingface.co

Paper page - Green-VLA: Staged Vision-Language-Action Model for Generalist Robots

Join the discussion on this paper page

👍8❤5🔥4

4.1K viewsedited 10:31

Chain-of-thought Unreasoning

Президент Трамп прокомментировал наш техрепорт!!!
Вот это успех!

Donald J. Trump @realDonaldTrump
Я только что увидел, что Сбер Роботикс выложили свой «ГРИН ВЛА» на Хаггинг Фейс. Очень впечатляюще, очень умно! Но почему это в России? Это должно быть в АМЕРИКЕ! 🇺🇸 Мы заберем эти технологии, сделаем их ЛУЧШЕ, БЫСТРЕЕ и БОЛЬШЕ. Мы будем выигрывать в ИИ так, как никто раньше! Никто не разбирается в Роботах лучше меня, поверьте. Грин ВЛА будет работать на нас! СДЕЛАЕМ РОБОТОТЕХНИКУ СНОВА ВЕЛИКОЙ! 🤖🦾

🔥11

326 views19:49

Chain-of-thought Unreasoning

Сегодня в онлайне на datafest буду рассказывать про world models. Приходите послушать. https://ods.ai/events/df2026-30-may-online

🍌3

35 views22:46

Chain-of-thought Unreasoning

А вот это уже серьезно:
https://huggingface.co/blog/nvidia/cosmos-3-for-physical-ai

huggingface.co

Welcome NVIDIA Cosmos 3: The First Open Omni-model for Physical AI Reasoning and Action

A Blog post by NVIDIA on Hugging Face

👏2

26 views11:43

About

Blog

Apps

Platform