gonzo-обзоры ML статей

Forwarded from gonzo_ML_podcasts

2.38K views12:52

Forwarded from gonzo_ML_podcasts

2.49K views12:52

gonzo-обзоры ML статей

Forwarded from gonzo_ML_podcasts

2.62K views12:53

gonzo-обзоры ML статей

Forwarded from gonzo_ML_podcasts

🔥3

2.83K views12:53

gonzo-обзоры ML статей

Для разнообразия что-нибудь воскресное и не про ML. Вы первые, кто это видит :)

Завтра новая неделя, и для тех, кому после тяжёлого трудового дня хочется всех замочить, мы вместе с Клод кодом сделали простую браузерную игру, где можно делать это безопасно:

https://cloud-heavy-industries.com/grumbulus/

Мочите на здоровье!

🔥9😁9❤1

3.25K views15:13

gonzo-обзоры ML статей

👾1

3.19K views15:14

gonzo-обзоры ML статей

Чтение на неделю:

https://www.robonaissance.com/t/language-is-poison

Robonaissance

Robonaissance | Hugo | Substack

A new renaissance in AI and robotics. Independent research and analysis to make sense of the intelligence revolution. Click to read Robonaissance, by Hugo, a Substack publication. Launched 3 months ago.

❤5👍3🔥1

11.7K views18:08

gonzo-обзоры ML статей

Бомбическая работа просто! Не понимаю, почему про неё никто вокруг не говорит, почему-то принесло только в мои личные сети.

Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights
Yulu Gan, Phillip Isola
Paper: https://arxiv.org/abs/2603.12228
Code: https://github.com/sunrainyg/RandOpt
Review: https://arxiviq.substack.com/p/neural-thickets-diverse-task-experts

# TL;DR

ЧТО сделали: Авторы предложили полностью параллельный безградиентный алгоритм RandOpt для post-training. Он улучшает предобученные большие языковые модели (LLM) путём простого сэмплирования случайного гауссовского шума поверх весов, оценки этих зашумлённых моделей и ансамблирования предсказаний лучших из них.

ПОЧЕМУ это важно: Работа ставит под сомнение устоявшееся мнение, что выравнивание (alignment) языковых моделей строго требует сложной последовательной оптимизации вроде обучения с подкреплением. Исследование раскрывает структурный феномен «нейронных дебрей» (neural thickets). Оказывается, при достаточном масштабе предобученная модель работает как распределение, в непосредственной окрестности весов которого плотно упакованы разнообразные эксперты под конкретные задачи.

Погружаться в дебри тут: https://t.me/gonzo_ML_podcasts/2879

arXiv.org

Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights

Pretraining produces a learned parameter vector that is typically treated as a starting point for further iterative adaptation. In this work, we instead view the outcome of pretraining as a...

👍15🔥8❤6

2.81K views17:22

gonzo-обзоры ML статей

Forwarded from gonzo_ML_podcasts

2.03K views17:22

gonzo-обзоры ML статей

Forwarded from gonzo_ML_podcasts

2K views17:22

gonzo-обзоры ML статей

Forwarded from gonzo_ML_podcasts

1.97K views17:23

gonzo-обзоры ML статей

Forwarded from gonzo_ML_podcasts

2.04K views17:23

gonzo-обзоры ML статей

Forwarded from gonzo_ML_podcasts

2.13K views17:23

gonzo-обзоры ML статей

Forwarded from gonzo_ML_podcasts

2.1K views17:23

gonzo-обзоры ML статей

Forwarded from gonzo_ML_podcasts

2.24K views17:23

gonzo-обзоры ML статей

Forwarded from gonzo_ML_podcasts

2.36K views17:23

gonzo-обзоры ML статей

Forwarded from gonzo_ML_podcasts

👍12

2.41K views17:23

gonzo-обзоры ML статей

На LeJEPA построили модель мира LeWM.

LeWorldModel: Stable End-to-End Joint-Embedding Predictive Architecture from Pixels
Lucas Maes, Quentin Le Lidec, Damien Scieur, Yann LeCun, Randall Balestriero
Paper: https://arxiv.org/abs/2603.19312
Review: https://arxiviq.substack.com/p/leworldmodel-stable-end-to-end-joint
Code: https://github.com/lucas-maes/le-wm
Model: https://drive.google.com/drive/folders/1r31os0d4-rR0mdHc7OlY_e5nh3XT4r4e
Website: https://le-wm.github.io

# TL;DR

ЧТО сделали: Авторы представляют LeWorldModel (LeWM) — end-to-end архитектуру JEPA, которая выучивает модель мира напрямую из сырых пикселей. Метод решает известную проблему коллапса репрезентаций с помощью лаконичного лосса (функции потерь) из двух слагаемых: стандартной среднеквадратичной ошибки для предсказания во времени и легко масштабируемой регуляризации, принуждающей латентные эмбеддинги распределяться по изотропному гауссиану.

ПОЧЕМУ это важно: Подход избавляет от хрупких архитектурных эвристик — таких как stop-gradients, экспоненциальные скользящие средние или многокомпонентные лоссы, — которые обычно нужны для стабилизации моделей мира в парадигме self-supervised learning. Сводя всю регуляризацию к одному гиперпараметру, фреймворк добивается стабильного обучения на одном GPU за несколько часов. Полученная модель способна планировать до 48 раз быстрее альтернатив на базе фундаментальных моделей, демонстрируя при этом zero-shot понимание интуитивной физики.

Для практиков: Для инженеров и исследователей, создающих масштабируемых агентов для робототехники или систем планирования, статья доказывает: стабильные модели мира не обязательно требуют предобученных визуальных энкодеров или сложной балансировки оптимизатора. Заставив распределения эмбеддингов математически соответствовать гауссовской топологии, модели могут органично выучивать структурированные, полезные для действий репрезентации прямо из офлайн-данных. Это снижает порог по вычислительным ресурсам для задач на физическое рассуждение.

Моделировать мир тут: https://t.me/gonzo_ML_podcasts/2895

arXiv.org

LeWorldModel: Stable End-to-End Joint-Embedding Predictive...

Joint Embedding Predictive Architectures (JEPAs) offer a compelling framework for learning world models in compact latent spaces, yet existing methods remain fragile, relying on complex multi-term...

😁11👍10🤝1

2.41K views12:15

gonzo-обзоры ML статей

Forwarded from gonzo_ML_podcasts

2.06K views12:15

gonzo-обзоры ML статей

Forwarded from gonzo_ML_podcasts

1.95K views12:15

gonzo-обзоры ML статей