Forwarded from Жёлтый AI
Долго ждать записей RL-ивента не пришлось! Если вы не смогли прийти, то теперь можно посмотреть рассказ про:
– Новый метод сбора данных для In-Context RL
– Простой способ делать In-Context RL с генерализацией на новые действия
– Как сделать 1 триллион действий за 2 дня с XLand-MiniGrid
В записях таятся секретные знания о RL будущего, так что они обязательны к просмотру!
– Новый метод сбора данных для In-Context RL
– Простой способ делать In-Context RL с генерализацией на новые действия
– Как сделать 1 триллион действий за 2 дня с XLand-MiniGrid
В записях таятся секретные знания о RL будущего, так что они обязательны к просмотру!
❤3🔥1
Forwarded from Жёлтый AI
Мы в Минске, а значит начался наш мировой тур Research 4 Kids – завтра полетим в СПб, а вы все еще можете зарегистрироваться, чтобы не пропустить ивенты 🐊
Энтузиаст 🤙 дал небольшое интервью Forbes после победы в Yandex ML Prize.
Если интересно послушать про то как пришел в науку, в какую сторону копаем и каких принципов придерживаемся -- включайте👨💻
Если интересно послушать про то как пришел в науку, в какую сторону копаем и каких принципов придерживаемся -- включайте
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Кто обучает нейросети: энтузиаст RL и открытой науки
Герой четвертого интервью из цикла материалов про машинное обучение — Владислав Куренков, лауреат премии Yandex ML Prize в номинации «Молодые научные руководители». Он рассказал, какую выгоду получают IT-компании от работы со студентами, чем отличается и…
🔥10❤5
Please open Telegram to view this post
VIEW IN TELEGRAM
🙏7❤4🔥2🥰1
Forwarded from [31/100] Витя Тарнавский
Смотрите какая потрясающая красивая статья вышла про наш ML Research ❤️
https://tinkoff-research.tass.ru/
https://tinkoff-research.tass.ru/
🔥11❤2
causality links
Энтузиаст 🤙 дал небольшое интервью Forbes после победы в Yandex ML Prize. Если интересно послушать про то как пришел в науку, в какую сторону копаем и каких принципов придерживаемся -- включайте 👨💻
единственный комментарий
видимо про ламбу не понравилось
видимо про ламбу не понравилось
🌚10😁5🍌3❤1👍1
causality links
something’s cooking
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥21🔥5❤1
Transformers Learn Temporal Difference Methods for In-Context Reinforcement Learning
https://arxiv.org/pdf/2405.13861
https://arxiv.org/pdf/2405.13861
⚡4🔥2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Alumni!
В Университете Иннополис есть клевое коммьюнити выпускников. Каждый год ребята собираются отметить выдающихся алюмней и просто поговорить, что происходит в университете сегодня и как дела у самих выпускников.
💖 Спустя 5 лет (жесть!) после выпуска наконец-то смог добраться до этой встречи: было оч круто оказаться в кругу знакомых лиц, с которыми связано много приятных воспоминаний и узнать как мы все дошли до жизни такой🌚
💕 В добавок ко всему, выпускники отметили меня как outstanding alumni (залутал худи) и отдельно подсветили наши потуги с @lua_b над стипендией.
В очередной раз для себя сделал пометку насколько повезло с университетом и людьми, которые собрались вокруг него. Community building круто, всем желаю такого🏡
В Университете Иннополис есть клевое коммьюнити выпускников. Каждый год ребята собираются отметить выдающихся алюмней и просто поговорить, что происходит в университете сегодня и как дела у самих выпускников.
💖 Спустя 5 лет (жесть!) после выпуска наконец-то смог добраться до этой встречи: было оч круто оказаться в кругу знакомых лиц, с которыми связано много приятных воспоминаний и узнать как мы все дошли до жизни такой
В очередной раз для себя сделал пометку насколько повезло с университетом и людьми, которые собрались вокруг него. Community building круто, всем желаю такого
Please open Telegram to view this post
VIEW IN TELEGRAM
💯18❤9🍓6😁1
Зарелизили первый публичный и огромный (100 миллиардов таплов!) датасет для In-Context Reinforcement Learning'a. Ждем ваших апвоутов ❤️
https://huggingface.co/papers/2406.08973
https://huggingface.co/papers/2406.08973
Please open Telegram to view this post
VIEW IN TELEGRAM
huggingface.co
Paper page - XLand-100B: A Large-Scale Multi-Task Dataset for In-Context
Reinforcement Learning
Reinforcement Learning
Join the discussion on this paper page
🔥31🥰1
Forwarded from ду́но
Привет! Это ду́но.
Мы группа исследователей на базе AIRI. Нас можно знать как экс-команду из Tinkoff Research, которая делала заметный движ с Reinforcement Learning: 7 статей на NeurIPS / ICML за последние три года.
Этот канал — точка сборки, где мы будем рассказывать про наши новые статьи, технологии, проекты, эвенты и возможности поработать с нами. Мы строим свою работу на нескольких принципах:
— Technology-first. Построение frontier-технологий и движение научного дискурса рука об руку. Мы не занимаемся публикациями ради публикаций, наша работа направлена на поиск и разработку новых технологий.
— No new science, no new technology. Мы понимаем, что построение новых технологий невозможно без поиска и влёта с ноги в новые (иногда неочевидные и рисковые) научные области. Мы постоянно ищем их и размышляем, за какими из них будущее.
— Deep connections. Мы взращиваем студентов, стараясь образовывать стабильные и долгосрочные связи с ними за счет активного менторства. Мы не даём 50 идей для рисерча🥴и не бросаем студентов на волю судьбы, мы занимаемся наукой и технологиями вместе.
Построить ASI не обещаем, но интересные вещи сделаем и поделимся ими здесь с вами.
Stay tuned.
- - —
Влад К., Саша Н., Никита Л., Илья З., Андрей П.
Мы группа исследователей на базе AIRI. Нас можно знать как экс-команду из Tinkoff Research, которая делала заметный движ с Reinforcement Learning: 7 статей на NeurIPS / ICML за последние три года.
Этот канал — точка сборки, где мы будем рассказывать про наши новые статьи, технологии, проекты, эвенты и возможности поработать с нами. Мы строим свою работу на нескольких принципах:
— Technology-first. Построение frontier-технологий и движение научного дискурса рука об руку. Мы не занимаемся публикациями ради публикаций, наша работа направлена на поиск и разработку новых технологий.
— No new science, no new technology. Мы понимаем, что построение новых технологий невозможно без поиска и влёта с ноги в новые (иногда неочевидные и рисковые) научные области. Мы постоянно ищем их и размышляем, за какими из них будущее.
— Deep connections. Мы взращиваем студентов, стараясь образовывать стабильные и долгосрочные связи с ними за счет активного менторства. Мы не даём 50 идей для рисерча🥴и не бросаем студентов на волю судьбы, мы занимаемся наукой и технологиями вместе.
Построить ASI не обещаем, но интересные вещи сделаем и поделимся ими здесь с вами.
Stay tuned.
- - —
Влад К., Саша Н., Никита Л., Илья З., Андрей П.
🔥17❤4👍4🥰1
https://h-frac.org/
Есть ощущение, что индекс хирша всегда был с нами, но на самом деле он был предложен только в 2005 году. Обосновывался не последним образом как число которое коррелирует ((кендалл в районе 0.3 - 0.4)) с научными наградами вроде нобелевки.
Спустя 15 лет внезапно выяснилось, что ученые заоптимизировали его в край и теперь корреляция в районе нуля (справедливо как минимум для физиков).
Решение оказалось простым — аллоцировать хирш фракционно среди соавторов. Этой прекрасной статье уже три (!!!) года, но системного перехода на эту метрику замечено не было🤭
Есть ощущение, что индекс хирша всегда был с нами, но на самом деле он был предложен только в 2005 году. Обосновывался не последним образом как число которое коррелирует ((кендалл в районе 0.3 - 0.4)) с научными наградами вроде нобелевки.
Спустя 15 лет внезапно выяснилось, что ученые заоптимизировали его в край и теперь корреляция в районе нуля (справедливо как минимум для физиков).
Решение оказалось простым — аллоцировать хирш фракционно среди соавторов. Этой прекрасной статье уже три (!!!) года, но системного перехода на эту метрику замечено не было
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🥰1😁1
Forwarded from ду́но
Мы ищем стажеров!
👩🌾
Тестовые задания и подробные описания позиций можно найти по ссылкам выше, дедлайн подачи заявки — 15 августа.
- - —
@dunnolab
👩🌾
shorties — это персональная программа, в которой мы выращиваем таланты до полноценных Research Engineer’ов или Research Scientist’ов в зависимости от ваших интересов.🔭 Intern Research Scientist
Вы будете заниматься написанием статей на top-tier ИИ конференции (NeurIPS, ICLR, ICML) и участием в научном дискурсе: проведение экспериментов, проверка и генерация исследовательских идей, которые направлены на развитие научного знания.
🧪 Intern Research Engineer
Вы будете заниматься созданием новых frontier-технологий и применением Reinforcement Learning в реальных задачах.
Тестовые задания и подробные описания позиций можно найти по ссылкам выше, дедлайн подачи заявки — 15 августа.
- - —
@dunnolab
🔥10👏7👍5🥰1
Клевая и простая идея, с которой дальше будет гораздо легче скейлить in-context rl.
https://t.me/dunnolab/20
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
ду́но
Рассказываем о нашей работе принятой на ICML 2024. В деталях.
🌻Контекст🌻
In-Context RL позволяет обучать агентов способных на адаптацию к новым задачам прямо во время инференеса, то есть zero-shot. При этом не происходит обновлений весов модели или обучения…
🌻Контекст🌻
In-Context RL позволяет обучать агентов способных на адаптацию к новым задачам прямо во время инференеса, то есть zero-shot. При этом не происходит обновлений весов модели или обучения…
🔥17👍6💯6❤2🥰1