Does RL work yet?

https://t.me/complete_ai/684

хорошая коллаба получилась, затащили рль для реверс инжиниринга деталей, топ работа как обычно от @adagrad @suessmann и @Howuhh

Complete AI

⚡️⚡️⚡️На прошлой неделе мы в AIRI зарелизили очень крутую работу в рамках трека «Генеративное проектирование» — cadrille: Multi-modal CAD Reconstruction with Online Reinforcement Learning

Архитектура представляет собой мультимодальную LLM, которая на вход…

🔥14

578 views11:12

Does RL work yet?

Знаю, что обещал рассказать в канале про каждую, но сил пока не нашлось. Как нибудь доберусь, а пока вот, небольшие итоги нашей совместной работы в лабе.

If there is no wind, row.

https://t.me/dunnolab/35

ду́но

📘 Годовой отчет за период июнь 2024–июнь 2025

-> Девиз года: «Сохраняя исследовательские традиции»

В соответствии с научными традициями и вызовами времени, наша команда в 2024 году продолжила уверенное движение по вектору фундаментальных и прикладных исследований…

🔥5❤3

767 viewsedited 19:38

Does RL work yet?

Forwarded from ду́но

0:43

This media is not supported in your browser

VIEW IN TELEGRAM

Сейчас суперактивно развивается сегмент бюджетной домашней робототехники на коленке — LeRobot от HuggingFace.

Можно на 3д принтере распечатать детали, за дешево купить приводы и дома на коленке собрать мини-робота.

Например, собрать SO-100 в домашних условиях стоит около 20k рублей, крутяк?

На прошлых выходных @suessmann поучаствовал в хакатоне от HuggingFace: нужно было сделать демо по использованию таких роботов. Илья в домашних условиях собрал робота и заимплементил крутейшее демо для телеоператоров с помощью телефона!

Результат на видосе, если хотите что-то такое же дома провернуть, то вот код: https://github.com/suessmann/daxie

Если вам интересно поработать с нами в направлении RL/VLA и около — скоро откроем набор тут.
А если уже горит и есть оформленные рисерч пропозалы, не ждите — пишите сразу @howuhh.

- - —
@dunnolab

🔥24❤2

592 views11:00

Does RL work yet?

Недавно @YulianaShakhvalievaa и @spirin_egor позвали меня прочитать небольшую лекцию о том, почему стоит заниматься RL-ем, да еще и именно рисерчем, в магистратуру по мл и анализу данных в вшэ (а я сам ее заканчивал!) Глобально курс был обзорный, чтобы ребята смогли познакомится с разными областями deep learning, поэтому приглашали разных экспертов из индустрии и около.

Лекцию я прочитал и вроде даже всем понравилось. Решил выложить слайды, вдруг кому-то будет еще интересно. Не стоит относится к некоторым (спорным!) тейкам серьезно. Основной целью было увлечь рлем, а тут все средства хороши! В конце подборка статей с интересными результатами.

Слайды лежат тут.

🔥9❤2👍2

811 viewsedited 11:25

Does RL work yet?

🥴11🤝7✍3👏1

820 views11:27

Does RL work yet?

Прилетел в Томск на летнюю школу AIRI. Будут тут на протяжении всей школы, так что если вам по какой-то причине хочется со мной встретиться и поболтать об рле/рисерче и в целом, пишите!

airi.net

Лето с AIRI

Ежегодная Школа для молодых ученых — это глубокое погружение в работу с широким спектром современных методов искусственного интеллекта и машинного обучения.

✍11❤3

783 views10:50

Does RL work yet?

Сегодня последний день школы. Был очень рад со всеми познакомиться, внезапно Томск понравился гораздо больше, чем я того ожидал.

Я на школе как раз прочитал небольшую лекцию о том, чем сейчас занят и о своей последней статье, принятой на ICML 2025. Все не дошли руки ее описать здесть отдельно (во всем прошу винить диссер)... Запись я надеюсь потом выложат, а пока опять же делюсь слайдами. Тема крайне интересная и перспективная, так что всем смотреть!

Слайды тут.

Google Docs

Latent Actions, Final, Nikulin, AIRI Summer 2025

Обучение по данным без действий Александр Никулин Научный сотрудник AIRI, Адаптивные агенты

👍9🔥4❤3

665 views10:46

Does RL work yet?

🔥12

771 views10:46

Does RL work yet?

laom-icml-poster.pdf

3.7 MB

Постер тоже могу показать, чего уж..

❤11

825 views10:52

Does RL work yet?

Чей это там постер?

К сожалению, сам в этом году не добрался, но Никита всех спас!

https://t.me/airi_research_institute/931

Институт AIRI

Прямо сейчас в Канаде проходит ICML 2025⤵️

13 июля в Ванкувере стартовала международная конференция по машинному обучению ICML 2025, в этом году на ней выступает инженер-исследователь группы «Адаптивные агенты» AIRI Никита Любайкин.

Исследователи AIRI…

🔥19❤3

804 views16:52

Does RL work yet?

Forwarded from ду́но

1:48

This media is not supported in your browser

VIEW IN TELEGRAM

на ICML это вместо постера показывали

✍7🔥3👏3🥴2

676 views16:09

Does RL work yet?

Долгое время (даже годы) в среде RL ценителей имел популярность сайт под названием How RL works. Он давал краткий и отрезвляющий ответ на все жалобы, советы, предложения и тому подобное: а именно там была одна простая строчка badly. И сразу становилось как-то проще, что не у тебя одного ничего не работает, алгоритмы не заводятся, в прод ничего не катится, да и вообще кто тебя на работу рльщика такого возьмет, в моде другие вещи совсем, лучше ллмку иди обучи.

Кажется, ушла эпоха! Надпись там поменялась (хоть превью и осталось прежним). Теперь там гордое well. Как думаете, заслуженно ли?

Выходит надо менять название канала...

how.rl.works

How RL works

Badly

🔥19❤8

1.2K viewsedited 19:16

Does RL work yet?

NeurIPS rebuttal be like...

🤝27🥴5❤4

1.44K views14:54

Does RL work yet?

https://arxiv.org/abs/2507.07101

🤔19❤6🥴3👏2👍1

1.23K views17:03

Does RL work yet?

based rebuttal

🔥10🤔6

689 views18:57

Does RL work yet?

https://worksinprogress.co/issue/why-science-needs-outsiders/

worksinprogress.co

Why science needs outsiders - Works in Progress Magazine

Science has forgotten that the greatest breakthroughs often come from outsiders who are able to take a fresh perspective.

🔥4

741 views09:19

Does RL work yet?

Forwarded from ду́но

Делимся небольшим проектом: завели Normalizing Flows для VLA-шек.

Работает на уровне диффузий и не требует придумывать трюков с ускорением + вероятности/моды/семплирование для действий за почти бесплатно.

code _ alphaXiv

- - —
@dunnolab

❤10👏2🥴1

714 views18:20

Does RL work yet?

Советую. Как никак PPO его работа. Гений.

http://joschu.net/blog/opinionated-guide-ml-research.html

❤18

1K views21:07

Does RL work yet?

by @suessmann

я выбираю бесконечное (3 тонны) счастье.

❤18

616 views21:57

Does RL work yet?

Forwarded from ду́но

Открыли набор на практику по направлениям RL / VLA / IL.

У нашей группы большой опыт в области RL: имеем публикации на самых топовых конференциях [см. Наши статьи]. Если вы хотите писать научные статьи, сдвигать соты, и развиваться как исследователь в области Reinforcement Learning (RL) и вокруг — то вам к нам!

Resident Research Scientist — RL / VLA / IL

Вы будете заниматься написанием статей на top-tier конференции (NeurIPS, ICLR, ICML), проводить эксперименты и предлагать новые исследовательские идеи.

Требования:
- Наличие исследовательских идей.
- Начитанность, знание и умение рассказать о последних заинтересовавших статьях с A* конференций.
- Cамостоятельный опыт с чем-то из RL, Imitation Learning, Vision-Language-Action models и всем вокруг.

Подробное описание позиции и тестовое задание можно найти по ссылке выше, дедлайн подачи заявки — 10-го ноября.

- - —
@dunnolab

dunnolab on Notion

Resident Research Scientist — RL / VLA / IL | Notion

Про практику

🔥5

315 views13:37

Does RL work yet?

Понравилась аналогия:

Since most of the success of large language models arise from making the underlying transformer model bigger, and training it on more text (trillions of tokens), and training it using more compute for longer duration, transformer-based language model offers an intriguing possibility just like the balloons did in early 1900’s: Without having to figure out the principles behind human intelligence, we could build machines that solve more cognitive and human-like tasks simply by building them bigger, and training them with more data, compute, and human feedback.

….

Once the basic principles behind dirigibles were figured out, they had a favorable scaling law going for them — to go further distances, and to carry heavier payloads you simply had to make them bigger, and give them more powerful engines. This was purely an engineering task.

https://blog.dileeplearning.com/p/welcome-to-the-exciting-dirigibles-500

Dileeplearning

Welcome to the exciting dirigibles era of AI

Notes for navigating large language models and beyond...

❤6🤔1

683 views12:59

About

Blog

Apps

Platform