causality links
607 subscribers
45 photos
5 videos
109 links
people say (hope) we're invariant

personal channel of @vkurenkov
Download Telegram
https://hai.stanford.edu/news/introducing-foundation-model-transparency-index

> transparency index
> openai = 47% vs llama = 57%



The indicators are designed to circumvent some of the traditional tradeoffs between transparency and other values, such as privacy, security, competitive advantage, or concerns about misuse by bad actors, Bommasani says.

okay, transparency then
1
👍41
🔥4👍1🤔1
мы с @kefirski под ред черри
💯5
привет, ваша группа недавно мою статью процитировала) хочешь сходить куда-нибудь? может заколабимся)
6
😎😎😎
Please open Telegram to view this post
VIEW IN TELEGRAM
😁6
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️⚡️⚡️_NEW PAPERS ALERT_⚡️⚡️⚡️

Мы сейчас много занимаемся Meta-RL, и в частности In-Context Reinforcement Learning (ICRL) — это такая подобласть Offline Meta-RL, где обычный next-action prediction в совокупности с правильными данными позволяет адаптироваться к новым задачам без дообучения. Как-нибудь расскажу подробнее.

Все наши последние работы так или иначе направлены в эту сторону, и мы наконец довели их до полноценных full papers. Вот они, слева-направо:

In-Context Reinforcement Learning for Variable Action Spaces [X, arXiv] — о том как заставить Algorithm Distillation работать с меняющимися пространствами действий. Рандомные проекции угар.

Emergence of In-Context Reinforcement Learning from Noise Distillation [X, arXiv] — о том что нам на самом деле не нужна разметка оптимальными действиями или траектории RL алгоритмов и можно обойтись простым “добавьте немного (а потом много) шума к вашему демонстратору”. Тут в целом можно заметить связь с диффузиями по касательной, туда не копали, но кажется может быть интересно.

XLand-MiniGrid: Scalable Meta-Reinforcement Learning Environments in JAX [arXiv, src] — ну тут понятно, про триллион шагов рассказывал сверху. Сейчас довезли полноценных бенчмарков, порефакторили все это дело и обильно рассказали про устройство библиотеки в самой статье. Если вы все еще не умеете в Jax, то уже опаздываете (no jokes).

As usual, все лавры и похвала прекрасным работягам запускающим по тыще экспериментов в неделю — @suessmann @ummagumm_a @howuhh. Для некоторых из них это первая полноценная статья, оч круто справились !


@causality_links
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7👍2💯1
causality links
😎😎😎
продолжаем следить за ситуацией 🧠
Please open Telegram to view this post
VIEW IN TELEGRAM
😁4
💥 Запустили именную стипендию для студентов Университета Иннополис!

В августе вместе с @lua_b после очередных посиделок в District'e задались вопросом -- а почему нет стипендии для студентов УИ от выпускников? Решили, что нужно взять в свои руки и организовали — https://1519.innopolis.university

Long story short: зафиксировали список меценатов, собрали лендос, оформили нужные документы, провели отбор, поплакали с мотивационных писем и историй студентов о том как не хватило 1 процента до повышенных стипендий.

В итоге, мы получили около 100 заявок, из которых отобрали 17 человек, которые будут получать по 12к рублей в месяц на протяжении следующего полугода. Да, немного, но хороший старт!

Надеюсь, что у нас получилось заложить фундамент для будущих наборов, и в следующий раз расширить список меценатов не только выпускниками нашего курса.
14
Forwarded from viacheslav sinii
a surprising emergent property of sac training - audio generation
🍓7🤯2