causality links – Telegram

causality links

@causality_links

607 subscribers

45 photos

5 videos

109 links

people say (hope) we're invariant

personal channel of @vkurenkov

Download Telegram

About

Blog

Apps

Platform

causality links

607 subscribers

causality links

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️

⚡️

⚡️

_NEW PAPERS ALERT_

⚡️

⚡️

⚡️

Мы сейчас много занимаемся Meta-RL, и в частности In-Context Reinforcement Learning (ICRL) — это такая подобласть Offline Meta-RL, где обычный next-action prediction в совокупности с правильными данными позволяет адаптироваться к новым задачам без дообучения. Как-нибудь расскажу подробнее.

Все наши последние работы так или иначе направлены в эту сторону, и мы наконец довели их до полноценных full papers. Вот они, слева-направо:

In-Context Reinforcement Learning for Variable Action Spaces [X, arXiv] — о том как заставить Algorithm Distillation работать с меняющимися пространствами действий. Рандомные проекции угар.

Emergence of In-Context Reinforcement Learning from Noise Distillation [X, arXiv] — о том что нам на самом деле не нужна разметка оптимальными действиями или траектории RL алгоритмов и можно обойтись простым “добавьте немного (а потом много) шума к вашему демонстратору”. Тут в целом можно заметить связь с диффузиями по касательной, туда не копали, но кажется может быть интересно.

XLand-MiniGrid: Scalable Meta-Reinforcement Learning Environments in JAX [arXiv, src] — ну тут понятно, про триллион шагов рассказывал сверху. Сейчас довезли полноценных бенчмарков, порефакторили все это дело и обильно рассказали про устройство библиотеки в самой статье. Если вы все еще не умеете в Jax, то уже опаздываете (no jokes).

As usual, все лавры и похвала прекрасным работягам запускающим по тыще экспериментов в неделю — @suessmann @ummagumm_a @howuhh. Для некоторых из них это первая полноценная статья, оч круто справились !

@causality_links

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥7👍2💯1

1.22K viewsedited 11:24

causality links

causality links

продолжаем следить за ситуацией 🧠

Please open Telegram to view this post

VIEW IN TELEGRAM

😁4

815 views12:27

causality links

https://x.com/allen_a_n/status/1757592671722553817?s=46

🔥1

982 views12:11

causality links

деды ругаются про causal inference, классика

https://x.com/yudapearl/status/1759344902029394125?s=46

X (formerly Twitter)

Judea Pearl (@yudapearl) on X

@ylecun @hannes_ullrich @eliasbareinboim I agree with not making assumptions about what one knows or doesn't know, but I couldn't find where the deficiency is in causal inference; please guide us.

😁2

912 views22:33

causality links

https://twitter.com/fly51fly/status/1759520523334341108

хорошее

🔥1

1.28K views18:07

causality links

causality links

продолжаем следить за ситуацией 🧠

произошел ребрендинг

🙏6👍1

864 views14:08

causality links

💥 Запустили именную стипендию для студентов Университета Иннополис!

В августе вместе с @lua_b после очередных посиделок в District'e задались вопросом -- а почему нет стипендии для студентов УИ от выпускников? Решили, что нужно взять в свои руки и организовали — https://1519.innopolis.university

Long story short: зафиксировали список меценатов, собрали лендос, оформили нужные документы, провели отбор, поплакали с мотивационных писем и историй студентов о том как не хватило 1 процента до повышенных стипендий.

В итоге, мы получили около 100 заявок, из которых отобрали 17 человек, которые будут получать по 12к рублей в месяц на протяжении следующего полугода. Да, немного, но хороший старт!

Надеюсь, что у нас получилось заложить фундамент для будущих наборов, и в следующий раз расширить список меценатов не только выпускниками нашего курса.

❤14

1.15K views19:09

causality links

Forwarded from viacheslav sinii

a surprising emergent property of sac training - audio generation

🍓7🤯2

933 views17:28

causality links

умер создатель реинфорса 😢

https://www.currentobituary.com/member/obit/282438

Currentobituary

RONALD J. WILLIAMS - Obituary - Framingham, MA - Casper Funeral Services | CurrentObituary.com

Obituary, funeral and service information for RONALD J. WILLIAMS by Casper Funeral Services, Framingham, MA

💔16

983 views20:07

causality links

Stop Regressing: Training Value Functions via Classification for Scalable Deep RL

https://arxiv.org/abs/2403.03950

Stop Regressing: Training Value Functions via Classification for...

Value functions are a central component of deep reinforcement learning (RL). These functions, parameterized by neural networks, are trained using a mean squared error regression objective to match...

👍4

990 viewsedited 09:19

causality links

https://x.com/mefatemi/status/1763309110806650976?s=46

🔥1

1.45K views18:58

causality links

https://covariant.ai/insights/introducing-rfm-1-giving-robots-human-like-reasoning-capabilities/

Introducing RFM-1: Giving robots human-like reasoning capabilities

RFM-1 — a Robotics Foundation Model trained on both general internet data as well as data that is rich in physical real-world interactions — represents a remarkable leap forward toward building generalized AI models that can accurately simulate and operate…

🔥2

963 views18:32

causality links

Forwarded from Жёлтый AI

Мы давно не рассказывали о наших успехах в RL Research, а рассказать есть что 🏂

25 марта в 19:00 в нашем офисе на Белорусской расскажем про методы, которые сделают In-Context RL реальнее, а именно:

- Как сделать агентов, которые способны адаптироваться под новые действия в незнакомых средах
- Как легко собирать данные для In-Context RL
- А так же о том, как все-таки сделать 1 ТРИЛЛИОН ДЕЙСТВИЙ ЗА ДВА ДНЯ?

Регистрируйтесь, и будем всех ждать!

👏3❤2🔥1

1.04K views08:30

causality links

https://aditya.bhatts.org/CrossQ/

👍2

1.07K views16:23

causality links

https://github.com/xai-org/grok

> jax
> haiku

🙏

Please open Telegram to view this post

VIEW IN TELEGRAM

GitHub - xai-org/grok-1: Grok open release

Grok open release. Contribute to xai-org/grok-1 development by creating an account on GitHub.

🔥3

1.09K views19:58

causality links

Forwarded from Жёлтый AI

Мы переносим RL-ивент на неопределенный срок. Как только появится конкретика по новым датам, мы сообщим вам. Stay tuned.

Жёлтый AI

Мы давно не рассказывали о наших успехах в RL Research, а рассказать есть что 🏂

25 марта в 19:00 в нашем офисе на Белорусской расскажем про методы, которые сделают In-Context RL реальнее, а именно:

- Как сделать агентов, которые способны адаптироваться…

1.08K views07:38

causality links

https://macropolo.org/digital-projects/the-global-ai-talent-tracker/

только нипс tbh

The Global AI Talent Tracker 2.0 - MacroPolo

Since launching our talent tracker in 2020, artificial intelligence (AI) has taken the world by storm. Ostensible breakthroughs in large language models and machine learning methods, as well as staggering improvements in compute capabilities, have made the…

1.26K viewsedited 21:39

causality links

https://l.tinkoff.ru/tlab_research4kids2024

будем там вместе с @suessmann, так что если вы из [минск, спб, казань, мск, екатеринбург, новосибирск, астана] -- приходите пообщаться 🙂

Т‑Образование

Бесплатные образовательные программы для школьников, студентов и учителей

Присоединяйтесь к комьюнити Т-Образования. Мы готовим к олимпиадам, запускаем стажировки, сотрудничаем с вузами, проводим курсы и образовательные мероприятия.

🔥5

1.39K views12:34

causality links

something’s cooking

🍓4👍2🔥1

1.23K views15:44

causality links

> готовишься у ребутталу, ставишь кучу экспериментов допом

> да с кайфом ребята, так уж и быть оставлю weak accept

😜

😜

😜

Please open Telegram to view this post

VIEW IN TELEGRAM

😁6😢4🤬2

1.3K views18:41

causality links

Forwarded from Жёлтый AI

Долго ждать записей RL-ивента не пришлось! Если вы не смогли прийти, то теперь можно посмотреть рассказ про:
– Новый метод сбора данных для In-Context RL
– Простой способ делать In-Context RL с генерализацией на новые действия
– Как сделать 1 триллион действий за 2 дня с XLand-MiniGrid

В записях таятся секретные знания о RL будущего, так что они обязательны к просмотру!

❤3🔥1

1.4K views11:06