Does RL work yet? – Telegram

Does RL work yet?

430 subscribers

53 photos

9 videos

1 file

65 links

rl research by @howuhh

howuhh.github.io | dunnolab.ai

Download Telegram

About

Blog

Apps

Platform

Does RL work yet?

430 subscribers

Does RL work yet?

Рисует и правда хорошо.

❤17

924 views08:44

Does RL work yet?

Interpreting Emergent Planning in Model-Free Reinforcement Learning [blogpost][code]

На мой взгляд самая интересная статья по RL с ICLR 2025 (ну или точно в топ 10). К сожалению сейчас нет времени разобрать подробно (привет ICML ребуталлы!), так что просто поделюсь тут. Работа во всех смыслах монументальная, чего стоит только аппендикс в 30+ страниц.

Отличная иллюстрация, что даже с помощью крайне простых инструментов (линейного пробинга) можно накопать кучу интересного если умеешь задавать правильные вопросы. Наверное для меня эта статья в целом ориентир качества в эмпирическом рисерче.

Interpreting Emergent Planning in Model-Free Reinforcement Learning

We present the first mechanistic evidence that model-free reinforcement learning agents can learn to plan. This is achieved by applying a methodology based on concept-based interpretability to a...

🔥11

886 views09:25

Does RL work yet?

This media is not supported in your browser

VIEW IN TELEGRAM

804 views09:25

Does RL work yet?

с большой вероятностью летом меня можно будет найти тут (как ментора и может быть лектора, но это не точно):

https://t.me/airi_research_institute/825

Институт AIRI

⚡️Открываем прием заявок на Лето с AIRI 2025!

В этом году мы запускаем Школу совместно с ТГУ. Программа пройдет в Томске с 30 июня по 10 июля. Это отличная возможность поработать с экспертами в области ИИ, прокачать навыки и погрузиться в исследовательскую…

🔥10❤3👍2

936 viewsedited 18:30

Does RL work yet?

Does RL work yet? pinned «с большой вероятностью летом меня можно будет найти тут (как ментора и может быть лектора, но это не точно): https://t.me/airi_research_institute/825»

18:30

Does RL work yet?

🔥18👏6🤝6✍1

883 views16:16

Does RL work yet?

Только вернулся с ICLR 2025 в Сингапуре, вcтречают радостными новостями. Две статьи приняли на ICML 2025!

В скором времени расскажу о них чуть больше (в целом я выше уже их упоминал как воркшопные). Выложу постеры с ICRL и небольшое (но более подробное) описание каждого.

🔥29

759 viewsedited 12:40

Does RL work yet?

This media is not supported in your browser

VIEW IN TELEGRAM

808 views12:41

Does RL work yet?

https://agentic.substack.com/p/whats-missing-for-robot-foundation

What’s Missing for Robot Foundation Models?

Progress and Missing Pieces on the Frontier of Robotics + AI

👍4

776 views07:09

Does RL work yet?

Не совсем по теме канала, да и сложно судить о достоверности, не читал пока оригинальные публикации. Но если это так, то это просто вау

https://www.wired.com/story/intelligence-evolved-at-least-twice-in-vertebrate-animals/

Intelligence on Earth Evolved Independently at Least Twice

Complex neural circuits likely arose independently in birds and mammals, suggesting that vertebrates evolved intelligence multiple times.

🔥5🤯4❤2

1.02K views07:51

Does RL work yet?

🤔🤔🤔

🤔18✍2👍2👎1👏1

815 views21:17

Does RL work yet?

Forwarded from causality links

https://t.me/complete_ai/684

хорошая коллаба получилась, затащили рль для реверс инжиниринга деталей, топ работа как обычно от @adagrad @suessmann и @Howuhh

⚡️⚡️⚡️На прошлой неделе мы в AIRI зарелизили очень крутую работу в рамках трека «Генеративное проектирование» — cadrille: Multi-modal CAD Reconstruction with Online Reinforcement Learning

Архитектура представляет собой мультимодальную LLM, которая на вход…

🔥14

578 views11:12

Does RL work yet?

Знаю, что обещал рассказать в канале про каждую, но сил пока не нашлось. Как нибудь доберусь, а пока вот, небольшие итоги нашей совместной работы в лабе.

If there is no wind, row.

https://t.me/dunnolab/35

📘 Годовой отчет за период июнь 2024–июнь 2025

-> Девиз года: «Сохраняя исследовательские традиции»

В соответствии с научными традициями и вызовами времени, наша команда в 2024 году продолжила уверенное движение по вектору фундаментальных и прикладных исследований…

🔥5❤3

767 viewsedited 19:38

Does RL work yet?

Forwarded from ду́но

This media is not supported in your browser

VIEW IN TELEGRAM

Сейчас суперактивно развивается сегмент бюджетной домашней робототехники на коленке — LeRobot от HuggingFace.

Можно на 3д принтере распечатать детали, за дешево купить приводы и дома на коленке собрать мини-робота.

Например, собрать SO-100 в домашних условиях стоит около 20k рублей, крутяк?

На прошлых выходных @suessmann поучаствовал в хакатоне от HuggingFace: нужно было сделать демо по использованию таких роботов. Илья в домашних условиях собрал робота и заимплементил крутейшее демо для телеоператоров с помощью телефона!

Результат на видосе, если хотите что-то такое же дома провернуть, то вот код: https://github.com/suessmann/daxie

Если вам интересно поработать с нами в направлении RL/VLA и около — скоро откроем набор тут.
А если уже горит и есть оформленные рисерч пропозалы, не ждите — пишите сразу @howuhh.

- - —
@dunnolab

🔥24❤2

592 views11:00

Does RL work yet?

Недавно @YulianaShakhvalievaa и @spirin_egor позвали меня прочитать небольшую лекцию о том, почему стоит заниматься RL-ем, да еще и именно рисерчем, в магистратуру по мл и анализу данных в вшэ (а я сам ее заканчивал!) Глобально курс был обзорный, чтобы ребята смогли познакомится с разными областями deep learning, поэтому приглашали разных экспертов из индустрии и около.

Лекцию я прочитал и вроде даже всем понравилось. Решил выложить слайды, вдруг кому-то будет еще интересно. Не стоит относится к некоторым (спорным!) тейкам серьезно. Основной целью было увлечь рлем, а тут все средства хороши! В конце подборка статей с интересными результатами.

Слайды лежат тут.

🔥9❤2👍2

811 viewsedited 11:25

Does RL work yet?

🥴11🤝7✍3👏1

820 views11:27

Does RL work yet?

Прилетел в Томск на летнюю школу AIRI. Будут тут на протяжении всей школы, так что если вам по какой-то причине хочется со мной встретиться и поболтать об рле/рисерче и в целом, пишите!

Лето с AIRI

Ежегодная Школа для молодых ученых — это глубокое погружение в работу с широким спектром современных методов искусственного интеллекта и машинного обучения.

✍11❤3

783 views10:50

Does RL work yet?

Сегодня последний день школы. Был очень рад со всеми познакомиться, внезапно Томск понравился гораздо больше, чем я того ожидал.

Я на школе как раз прочитал небольшую лекцию о том, чем сейчас занят и о своей последней статье, принятой на ICML 2025. Все не дошли руки ее описать здесть отдельно (во всем прошу винить диссер)... Запись я надеюсь потом выложат, а пока опять же делюсь слайдами. Тема крайне интересная и перспективная, так что всем смотреть!

Слайды тут.

Latent Actions, Final, Nikulin, AIRI Summer 2025

Обучение по данным без действий Александр Никулин Научный сотрудник AIRI, Адаптивные агенты

👍9🔥4❤3

665 views10:46

Does RL work yet?

🔥12

771 views10:46

Does RL work yet?

laom-icml-poster.pdf

Постер тоже могу показать, чего уж..

❤11

825 views10:52

Does RL work yet?

Чей это там постер?

К сожалению, сам в этом году не добрался, но Никита всех спас!

https://t.me/airi_research_institute/931

Институт AIRI

Прямо сейчас в Канаде проходит ICML 2025⤵️

13 июля в Ванкувере стартовала международная конференция по машинному обучению ICML 2025, в этом году на ней выступает инженер-исследователь группы «Адаптивные агенты» AIRI Никита Любайкин.

Исследователи AIRI…

🔥19❤3

804 views16:52