causality links – Telegram

causality links

@causality_links

607 subscribers

45 photos

5 videos

109 links

people say (hope) we're invariant

personal channel of @vkurenkov

Download Telegram

About

Blog

Apps

Platform

causality links

607 subscribers

causality links

Forwarded from Жёлтый AI

Долго ждать записей RL-ивента не пришлось! Если вы не смогли прийти, то теперь можно посмотреть рассказ про:
– Новый метод сбора данных для In-Context RL
– Простой способ делать In-Context RL с генерализацией на новые действия
– Как сделать 1 триллион действий за 2 дня с XLand-MiniGrid

В записях таятся секретные знания о RL будущего, так что они обязательны к просмотру!

❤3🔥1

1.4K views11:06

causality links

Forwarded from Жёлтый AI

Мы в Минске, а значит начался наш мировой тур Research 4 Kids – завтра полетим в СПб, а вы все еще можете зарегистрироваться, чтобы не пропустить ивенты 🐊

1.45K views16:03

causality links

Learning in POMDPs is Sample-Efficient with Hindsight Observability

https://arxiv.org/abs/2301.13857

Learning in POMDPs is Sample-Efficient with Hindsight Observability

POMDPs capture a broad class of decision making problems, but hardness results suggest that learning is intractable even in simple settings due to the inherent partial observability. However, in...

1.86K views10:44

causality links

Энтузиаст 🤙 дал небольшое интервью Forbes после победы в Yandex ML Prize.

Если интересно послушать про то как пришел в науку, в какую сторону копаем и каких принципов придерживаемся -- включайте 👨‍💻

Please open Telegram to view this post

VIEW IN TELEGRAM

Кто обучает нейросети: энтузиаст RL и открытой науки

Герой четвертого интервью из цикла материалов про машинное обучение — Владислав Куренков, лауреат премии Yandex ML Prize в номинации «Молодые научные руководители». Он рассказал, какую выгоду получают IT-компании от работы со студентами, чем отличается и…

🔥10❤5

2.24K views10:07

causality links

бизнес джет до астаны 🙏

🙏

🙏

Please open Telegram to view this post

VIEW IN TELEGRAM

🙏7❤4🔥2🥰1

2.35K views14:26

causality links

Forwarded from [31/100] Витя Тарнавский

Смотрите какая потрясающая красивая статья вышла про наш ML Research ❤️
https://tinkoff-research.tass.ru/

🔥11❤2

2.02K views10:03

causality links

тем временем

https://patents.google.com/patent/US20240104379A1/en

US20240104379A1 - Agent control through in-context reinforcement learning
- Google Patents

Methods, systems, and apparatus, including computer programs encoded on a computer storage medium, for controlling agents. In particular, an agent can be controlled using an action selection neural network that performs in-context reinforcement learning when…

🤯4❤2

2.17K views20:12

causality links

causality links

Энтузиаст 🤙 дал небольшое интервью Forbes после победы в Yandex ML Prize. Если интересно послушать про то как пришел в науку, в какую сторону копаем и каких принципов придерживаемся -- включайте 👨‍💻

единственный комментарий

видимо про ламбу не понравилось

🌚10😁5🍌3❤1👍1

2.45K views20:00

causality links

causality links

something’s cooking

cooked 🥳

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥21🔥5❤1

3.13K views12:01

causality links

Transformers Learn Temporal Difference Methods for In-Context Reinforcement Learning

https://arxiv.org/pdf/2405.13861

⚡4🔥2❤1

2.55K viewsedited 09:33

causality links

This media is not supported in your browser

VIEW IN TELEGRAM

Alumni!

В Университете Иннополис есть клевое коммьюнити выпускников. Каждый год ребята собираются отметить выдающихся алюмней и просто поговорить, что происходит в университете сегодня и как дела у самих выпускников.

💖 Спустя 5 лет (жесть!) после выпуска наконец-то смог добраться до этой встречи: было оч круто оказаться в кругу знакомых лиц, с которыми связано много приятных воспоминаний и узнать как мы все дошли до жизни такой 🌚

💕 В добавок ко всему, выпускники отметили меня как outstanding alumni (залутал худи) и отдельно подсветили наши потуги с @lua_b над стипендией.

В очередной раз для себя сделал пометку насколько повезло с университетом и людьми, которые собрались вокруг него. Community building круто, всем желаю такого 🏡

Please open Telegram to view this post

VIEW IN TELEGRAM

💯18❤9🍓6😁1

4.09K views11:47

causality links

Зарелизили первый публичный и огромный (100 миллиардов таплов!) датасет для In-Context Reinforcement Learning'a. Ждем ваших апвоутов ❤️

https://huggingface.co/papers/2406.08973

Please open Telegram to view this post

VIEW IN TELEGRAM

Paper page - XLand-100B: A Large-Scale Multi-Task Dataset for In-Context
Reinforcement Learning

Join the discussion on this paper page

🔥31🥰1

2.94K views12:55

causality links

Forwarded from ду́но

Привет! Это ду́но.

Мы группа исследователей на базе AIRI. Нас можно знать как экс-команду из Tinkoff Research, которая делала заметный движ с Reinforcement Learning: 7 статей на NeurIPS / ICML за последние три года.

Этот канал — точка сборки, где мы будем рассказывать про наши новые статьи, технологии, проекты, эвенты и возможности поработать с нами. Мы строим свою работу на нескольких принципах:

— Technology-first. Построение frontier-технологий и движение научного дискурса рука об руку. Мы не занимаемся публикациями ради публикаций, наша работа направлена на поиск и разработку новых технологий.

— No new science, no new technology. Мы понимаем, что построение новых технологий невозможно без поиска и влёта с ноги в новые (иногда неочевидные и рисковые) научные области. Мы постоянно ищем их и размышляем, за какими из них будущее.

— Deep connections. Мы взращиваем студентов, стараясь образовывать стабильные и долгосрочные связи с ними за счет активного менторства. Мы не даём 50 идей для рисерча🥴и не бросаем студентов на волю судьбы, мы занимаемся наукой и технологиями вместе.

Построить ASI не обещаем, но интересные вещи сделаем и поделимся ими здесь с вами.

Stay tuned.

- - —
Влад К., Саша Н., Никита Л., Илья З., Андрей П.

🔥17❤4👍4🥰1

2.53K views14:55

causality links

https://h-frac.org/

Есть ощущение, что индекс хирша всегда был с нами, но на самом деле он был предложен только в 2005 году. Обосновывался не последним образом как число которое коррелирует ((кендалл в районе 0.3 - 0.4)) с научными наградами вроде нобелевки.

Спустя 15 лет внезапно выяснилось, что ученые заоптимизировали его в край и теперь корреляция в районе нуля (справедливо как минимум для физиков).

Решение оказалось простым — аллоцировать хирш фракционно среди соавторов. Этой прекрасной статье уже три (!!!) года, но системного перехода на эту метрику замечено не было 🤭

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11🥰1😁1

4.3K views22:31

causality links

Forwarded from ду́но

Мы ищем стажеров!

👩‍🌾 shorties — это персональная программа, в которой мы выращиваем таланты до полноценных Research Engineer’ов или Research Scientist’ов в зависимости от ваших интересов.

🔭 Intern Research Scientist

Вы будете заниматься написанием статей на top-tier ИИ конференции (NeurIPS, ICLR, ICML) и участием в научном дискурсе: проведение экспериментов, проверка и генерация исследовательских идей, которые направлены на развитие научного знания.

🧪 Intern Research Engineer

Вы будете заниматься созданием новых frontier-технологий и применением Reinforcement Learning в реальных задачах.

Тестовые задания и подробные описания позиций можно найти по ссылкам выше, дедлайн подачи заявки — 15 августа.

- - —
@dunnolab

🔥10👏7👍5🥰1

4.44K views09:31

causality links

😘 Первая публикация дорогого брата Ильи Зисмана (@suessmann) на ICML'e первым автором, проделал кучу работы и прошел через несколько кругов ада с Watermaze'ом.

Клевая и простая идея, с которой дальше будет гораздо легче скейлить in-context rl.

https://t.me/dunnolab/20

Please open Telegram to view this post

VIEW IN TELEGRAM

Рассказываем о нашей работе принятой на ICML 2024. В деталях.

🌻Контекст🌻

In-Context RL позволяет обучать агентов способных на адаптацию к новым задачам прямо во время инференеса, то есть zero-shot. При этом не происходит обновлений весов модели или обучения…

🔥17👍6💯6❤2🥰1

7.6K viewsedited 12:45