Does RL work yet? – Telegram

Does RL work yet?

430 subscribers

53 photos

9 videos

1 file

65 links

rl research by @howuhh

howuhh.github.io | dunnolab.ai

Download Telegram

About

Blog

Apps

Platform

Does RL work yet?

430 subscribers

Does RL work yet?

Самое время подвести итоги сабмитов на ICLR 2025. Не все успели довести до фулл статей, но и воркшопы тоже хорошо!

Что-то уже есть на архиве (и еще будет обновлятся с новыми результатами), так что делюсь:
1. XLand-100B: A Large-Scale Multi-Task Dataset for In-Context Reinforcement Learning (Main, Poster), by @howuhh and @suessmann and @zzmtsvv
2. Latent Action Learning Requires Supervision in the Presence of Distractors (Workshop, World Models), by @howuhh
3. Object-Centric Latent Action Learning (Workshop, World Models), by @cinemere
4. N-Gram Induction Heads for In-Context RL: Improving Stability and Reducing Data Needs (Workshop, SCOPE), by @suessmann
5. Yes, Q-learning Helps Offline In-Context RL (Workshop, SSI-FM), by @adagrad

🔥22👍3

7.05K viewsedited 08:17

Does RL work yet?

Рисует и правда хорошо.

❤17

924 views08:44

Does RL work yet?

Interpreting Emergent Planning in Model-Free Reinforcement Learning [blogpost][code]

На мой взгляд самая интересная статья по RL с ICLR 2025 (ну или точно в топ 10). К сожалению сейчас нет времени разобрать подробно (привет ICML ребуталлы!), так что просто поделюсь тут. Работа во всех смыслах монументальная, чего стоит только аппендикс в 30+ страниц.

Отличная иллюстрация, что даже с помощью крайне простых инструментов (линейного пробинга) можно накопать кучу интересного если умеешь задавать правильные вопросы. Наверное для меня эта статья в целом ориентир качества в эмпирическом рисерче.

Interpreting Emergent Planning in Model-Free Reinforcement Learning

We present the first mechanistic evidence that model-free reinforcement learning agents can learn to plan. This is achieved by applying a methodology based on concept-based interpretability to a...

🔥11

886 views09:25

Does RL work yet?

This media is not supported in your browser

VIEW IN TELEGRAM

804 views09:25

Does RL work yet?

с большой вероятностью летом меня можно будет найти тут (как ментора и может быть лектора, но это не точно):

https://t.me/airi_research_institute/825

Институт AIRI

⚡️Открываем прием заявок на Лето с AIRI 2025!

В этом году мы запускаем Школу совместно с ТГУ. Программа пройдет в Томске с 30 июня по 10 июля. Это отличная возможность поработать с экспертами в области ИИ, прокачать навыки и погрузиться в исследовательскую…

🔥10❤3👍2

936 viewsedited 18:30

Does RL work yet?

Does RL work yet? pinned «с большой вероятностью летом меня можно будет найти тут (как ментора и может быть лектора, но это не точно): https://t.me/airi_research_institute/825»

18:30

Does RL work yet?

🔥18👏6🤝6✍1

883 views16:16

Does RL work yet?

Только вернулся с ICLR 2025 в Сингапуре, вcтречают радостными новостями. Две статьи приняли на ICML 2025!

В скором времени расскажу о них чуть больше (в целом я выше уже их упоминал как воркшопные). Выложу постеры с ICRL и небольшое (но более подробное) описание каждого.

🔥29

759 viewsedited 12:40

Does RL work yet?

This media is not supported in your browser

VIEW IN TELEGRAM

808 views12:41

Does RL work yet?

https://agentic.substack.com/p/whats-missing-for-robot-foundation

What’s Missing for Robot Foundation Models?

Progress and Missing Pieces on the Frontier of Robotics + AI

👍4

776 views07:09

Does RL work yet?

Не совсем по теме канала, да и сложно судить о достоверности, не читал пока оригинальные публикации. Но если это так, то это просто вау

https://www.wired.com/story/intelligence-evolved-at-least-twice-in-vertebrate-animals/

Intelligence on Earth Evolved Independently at Least Twice

Complex neural circuits likely arose independently in birds and mammals, suggesting that vertebrates evolved intelligence multiple times.

🔥5🤯4❤2

1.02K views07:51

Does RL work yet?

🤔🤔🤔

🤔18✍2👍2👎1👏1

815 views21:17

Does RL work yet?

Forwarded from causality links

https://t.me/complete_ai/684

хорошая коллаба получилась, затащили рль для реверс инжиниринга деталей, топ работа как обычно от @adagrad @suessmann и @Howuhh

⚡️⚡️⚡️На прошлой неделе мы в AIRI зарелизили очень крутую работу в рамках трека «Генеративное проектирование» — cadrille: Multi-modal CAD Reconstruction with Online Reinforcement Learning

Архитектура представляет собой мультимодальную LLM, которая на вход…

🔥14

578 views11:12

Does RL work yet?

Знаю, что обещал рассказать в канале про каждую, но сил пока не нашлось. Как нибудь доберусь, а пока вот, небольшие итоги нашей совместной работы в лабе.

If there is no wind, row.

https://t.me/dunnolab/35

📘 Годовой отчет за период июнь 2024–июнь 2025

-> Девиз года: «Сохраняя исследовательские традиции»

В соответствии с научными традициями и вызовами времени, наша команда в 2024 году продолжила уверенное движение по вектору фундаментальных и прикладных исследований…

🔥5❤3

767 viewsedited 19:38

Does RL work yet?

Forwarded from ду́но

This media is not supported in your browser

VIEW IN TELEGRAM

Сейчас суперактивно развивается сегмент бюджетной домашней робототехники на коленке — LeRobot от HuggingFace.

Можно на 3д принтере распечатать детали, за дешево купить приводы и дома на коленке собрать мини-робота.

Например, собрать SO-100 в домашних условиях стоит около 20k рублей, крутяк?

На прошлых выходных @suessmann поучаствовал в хакатоне от HuggingFace: нужно было сделать демо по использованию таких роботов. Илья в домашних условиях собрал робота и заимплементил крутейшее демо для телеоператоров с помощью телефона!

Результат на видосе, если хотите что-то такое же дома провернуть, то вот код: https://github.com/suessmann/daxie

Если вам интересно поработать с нами в направлении RL/VLA и около — скоро откроем набор тут.
А если уже горит и есть оформленные рисерч пропозалы, не ждите — пишите сразу @howuhh.

- - —
@dunnolab

🔥24❤2

592 views11:00

Does RL work yet?

Недавно @YulianaShakhvalievaa и @spirin_egor позвали меня прочитать небольшую лекцию о том, почему стоит заниматься RL-ем, да еще и именно рисерчем, в магистратуру по мл и анализу данных в вшэ (а я сам ее заканчивал!) Глобально курс был обзорный, чтобы ребята смогли познакомится с разными областями deep learning, поэтому приглашали разных экспертов из индустрии и около.

Лекцию я прочитал и вроде даже всем понравилось. Решил выложить слайды, вдруг кому-то будет еще интересно. Не стоит относится к некоторым (спорным!) тейкам серьезно. Основной целью было увлечь рлем, а тут все средства хороши! В конце подборка статей с интересными результатами.

Слайды лежат тут.

🔥9❤2👍2

811 viewsedited 11:25

Does RL work yet?

🥴11🤝7✍3👏1

820 views11:27

Does RL work yet?

Прилетел в Томск на летнюю школу AIRI. Будут тут на протяжении всей школы, так что если вам по какой-то причине хочется со мной встретиться и поболтать об рле/рисерче и в целом, пишите!

Лето с AIRI

Ежегодная Школа для молодых ученых — это глубокое погружение в работу с широким спектром современных методов искусственного интеллекта и машинного обучения.

✍11❤3

783 views10:50

Does RL work yet?

Сегодня последний день школы. Был очень рад со всеми познакомиться, внезапно Томск понравился гораздо больше, чем я того ожидал.

Я на школе как раз прочитал небольшую лекцию о том, чем сейчас занят и о своей последней статье, принятой на ICML 2025. Все не дошли руки ее описать здесть отдельно (во всем прошу винить диссер)... Запись я надеюсь потом выложат, а пока опять же делюсь слайдами. Тема крайне интересная и перспективная, так что всем смотреть!

Слайды тут.

Latent Actions, Final, Nikulin, AIRI Summer 2025

Обучение по данным без действий Александр Никулин Научный сотрудник AIRI, Адаптивные агенты

👍9🔥4❤3

665 views10:46

Does RL work yet?

🔥12

771 views10:46

Does RL work yet?

laom-icml-poster.pdf

Постер тоже могу показать, чего уж..

❤11

825 views10:52