Love. Death. Transformers. – Telegram

Love. Death. Transformers.

@lovedeathtransformers

22.5K subscribers

4.24K photos

498 videos

76 files

2.78K links

❤️☠️🤗

Указанные действия не являются ресерчем, поскольку:
а) Мы не ученые;
б) Оно работает.
@transformerslovedeatch по всем вопросам
Все ситуации вымышлены, любые совпадения с реальности плот вашей фантазии.

Download Telegram

About

Blog

Apps

Platform

Love. Death. Transformers.

22.5K subscribers

Love. Death. Transformers.

набор олимпиадников в Яндекс в целом каноничное событие.

Все ещё лучше чем решать задачу оптимального транспорта

❤144😁73😢16👏6🤡3

9.55K viewsedited 20:03

Love. Death. Transformers.

Forwarded from Vikhr models

Хабр релиз статьи про Шлепа - большой русский бенчмарк

Рассказали про то как оно работает наш бенчмарк + пиаримся на хабре))

Авторы: Cергей, Константин , Артем, Илья, Коля, Саша следил чтобы все не развалилось

habr

52😁44❤‍🔥148🤡4👍2

6.57K views07:06

Love. Death. Transformers.

Forwarded from Старший Авгур

ПингПонг V2

Ссылка: https://ilyagusev.github.io/ping_pong_bench/ru_v2

Все последние недели готовил новую версию ПингПонга.
Основные отличия от V1:
1) 3 роли вместо 2: игрок (player), опрашивающий (interrogator), судья (judge). Терминология, аналогичная сами знаете чему. Раньше опрашивающий и судья были одним промптом, теперь их несколько. Основные преимущества:
a) Их теперь могут отыгрывать разные модели, с разной ценой и параметрами.
b) Одну и ту же переписку можно оценивать разными моделями.
2) Опрашивающий = gpt-4o-mini вместо claude-3-5-sonnet. Так дешевле, а оправшивающему всё равно не обязательно быть очень хорошим.
3) Судья = ансамбль gpt-4o и claude-3-5-sonnet вместо только claude-3-5-sonnet. Это помогает избежать ситуаций, когда модели слишком высоко оценивают похожих на себя.
4) База в виде ручной разметки и 0.67 корреляции Спирмена с ней (по примерам, не по моделям).

Ну и пачка мелких интерфейсных улучшений, теперь можно читать вообще все диалоги, в том числе отказы.

Кидайте модели для оценки в комменты, добавлю в лидерборд.

👍37👎13

5.86K views12:42

Love. Death. Transformers.

Forwarded from РИСЕРЧОШНАЯ

Приходят как-то на синк разработчик, тестировщик и time.sleep(1), а он им и говорит: ребята, мы что, в анекдоте?

➡️ Ну почти: они в подводке к статье про то, как тестировать мл системы, что бы не потерять $100k.

#HABR

Please open Telegram to view this post

VIEW IN TELEGRAM

515🤔13👍4😁1💋1

5.93K views10:24

Love. Death. Transformers.

админ не в этом списке

😁60❤37❤‍🔥5💩3👍2😢2🥴2

6.62K viewsedited 10:52

Love. Death. Transformers.

Мне так нравится что логарифмический график достраивают как экспоненциальный

график развития аи по любому из бенчмарков вел себя примерно как линия-логарифм

😁121😍7🤪6🤓5🔥2❤1💯1

6.85K viewsedited 11:51

Love. Death. Transformers.

китайцы релизнули 4оmni дома, аудио на вход и выход, одной моделью генерят аудио и парсят аудио в текст. Завели на qwen500m, звучит хорошо
github

1🔥38❤7👍1

7.88K viewsedited 21:11

Love. Death. Transformers.

Love. Death. Transformers.

Мне так нравится что логарифмический график достраивают как экспоненциальный график развития аи по любому из бенчмарков вел себя примерно как линия-логарифм

лучше всего сигмоиду развития нейронок описывает разница между sd1.5-sdxl-flux

ес чо генерации идут: 1 - flux, 2 sd1.5, 3 sdxl
промпт: cat eating kebabs on stambul street

👍26🤔1

6.42K views21:28

Love. Death. Transformers.

Love. Death. Transformers.

лучше всего сигмоиду развития нейронок описывает разница между sd1.5-sdxl-flux ес чо генерации идут: 1 - flux, 2 sd1.5, 3 sdxl промпт: cat eating kebabs on stambul street

ну и на закуску dalle2 вышедшая первой из современных моделей

👏2610

7.17K viewsedited 21:36

Love. Death. Transformers.

Магические коды эль дэбагии

23😁1

5.85K viewsedited 23:13

Love. Death. Transformers.

Forwarded from Derp Learning

https://fxtwitter.com/ArdaGoreci/status/1830744265007480934

FxTwitter / FixupX

Arda Göreci (@ArdaGoreci)

🚀Excited to announce: Open-source AlphaFold3 implementation! 🚀

I am thrilled to announce one of the models we have been building for the last 8-weeks at Ligo - an open-source implementation of DeepMind’s frontier model, AlphaFold3! Here’s what we have learned…

🔥223

5.79K views23:27

Love. Death. Transformers.

Forwarded from ML Underhood

This media is not supported in your browser

VIEW IN TELEGRAM

Генерация видео в Шедевруме

Яндекс запустил новую диффузионную end-to-end-модель преобразования текста в видео в приложении Шедеврум. Расскажем, как она работает и чем отличается от прошлого подхода.

Как было раньше и как стало сейчас

Шедеврум и прежде умел создавать видео по текстовому запросу. Для этого использовалась технология Deforum. Она работает по принципу создания видео из отдельных изображений кадр за кадром. Каждый следующий получается из предыдущего с помощью эвристик — они добавляют движение камеры. При таком подходе согласованность кадров недостаточная.

В новом подходе используется end-to-end-text2video-модель. На вход она получает текст, в котором могут быть указаны субъект, объект и описание действия. Модель сама учитывает связь между кадрами, из-за чего получается более согласованный результат.

Этапы генерации видео

Генерация базовых кадров. На этом этапе создаётся видео с низкой частотой кадров и разрешением. Из нормального распределения сэмплируются зашумлённые кадры, которые впоследствии постепенно преобразуются в связное видео.

Интерполяция кадров. После создания базовых кадров модель увеличивает их частоту, делая видео более плавным. Интерполяция проводится с использованием диффузионной модели, которая добавляет новые кадры между уже существующими.

Повышение разрешения. Модель работает в латентном пространстве, поэтому для повышения разрешения сгенерированные латенты подаются в декодер VAE. В него для большей согласованности фреймов добавили motion-блоки.

Обучение

Процесс обучения модели text2video начинается с адаптации уже существующей text2image-модели. Чтобы не обучать её с нуля, что требует большого количества разнообразных данных, разработчики решили дообучить проверенную модель для генерации изображений, добавив в неё временные блоки (motion-блоки) для работы с видео. Чтобы снизить нагрузку на память и ускорить обучение, использовались техники mixed precision и torch.FSDP.

Обучение модели происходило поэтапно: сначала с низким разрешением и малым количеством кадров, а затем с постепенным увеличением этих параметров. Так мы смогли ускорить процесс обучения и валидировать больше гипотез за то же время. Однако в ходе обучения возникали проблемы, связанные с нестабильностью модели, вызванной бесконтрольным ростом значений активации. Это решили простой регуляризацией.

Более подробно об устройстве и модели и её создании — читайте в статье на Хабре. А здесь в комментариях делитесь своими впечатлениями!

ML Underhood

👍47💩16🔥7❤4🤓1

6.35K views10:02

Love. Death. Transformers.

Forwarded from epsilon correct

Почему собаки такие разные на вид?

В сравнении с другими видами собаки максимально разнообразны в формах, размерах и окрасах: от лысых немного тсясущихся крыс до статных спокойных коров весом в центнер 🥁. Поведенчески – тоже огромное разнообразние: лабрадоры добрые, колли пасут всё, что движется, а в чихуа-хуа живёт инкарнация дьявола. 😈

На этот вопрос отвечает исследование группы учёных, которые изучили ДНК 900+ псов. Оказывается, семью генетическими регионами можно объяснить примерно 80% всего разнообразия в формах и размерах наших любимцев. Это случилось из-за того, как эффективно начинающие Дарвины занимались искусственным отбором желаемых черт у наших домашних любимцев.

На картинке выше (интерпретация исследования от National Geographic) породы разделены на четыре кластера: волкоподобные собаки, пастушьи, охотничьи, и мастифоподобные. Интересно, что некоторые собаки, прикидывающиеся древними породами, например фараоновы собаки, по результатам генетического анализа на поверку оказались современной породой. 😮‍💨

C более подробное интервью с авторами можно ознакомиться вот тут. Интересно, как результаты подобных исследований переносят на людей?

Please open Telegram to view this post

VIEW IN TELEGRAM

👍12❤8🤓1

6.08K views16:39

Love. Death. Transformers.

Forwarded from epsilon correct

А сегодня на том же самом KDD представили Test of Time award за самый значительный вклад статьи десятилетней давности – её получил по совместительству мой менеджер Брайан за первую работу по нейросетевым графовым эмбеддингам DeepWalk: Online Learning of Social Representations.

🤴

Треть моей Ph.D. диссертации посвящена как раз эмбеддингам графов, так что эта награда – некоторая легитимизация нашего общего направления исследований. За всё время с Брайаном у нас написано ~15 статей и несколько патентов, многие из них – про эмбеддинги графов. Кстати, у меня не было кодинг-интервью в гугл как раз из-за того, что в моём гитхабе была довольно популярная имплементация этого метода на C++.

Самое удивительное, что за 10 лет метод по качеству не был побит. 👌

Please open Telegram to view this post

VIEW IN TELEGRAM

👍22❤4

6.3K views16:39

Love. Death. Transformers.

Forwarded from epsilon correct

Почему почти у всех полезных матриц маленький ранг?

В нашей с вами жизни матрицы малого ранга встречаются на каждом шагу, например, в моделировании физических свойств физических систем (анализ теплопроводности или модальный анализ вибраций), в рекомендательных системах, сжатие изображений – везде, если поискать , можно найти матрицы с небольшим рангом. 🧐

Это невероятно удобно: с матрицами малого ранга можно делать абсолютно неприличные вещи – например, для матрицы n × n ранга d можно восстановить все её элементы из случайно выбрав C*n^{1.2}*r*log n значений. Понятное дело, все операции – матвеки, подсчёт нормы и всяких разложений тоже существенно ускоряются. В наших любимых LLMках матрицы малого ранга используются для тюнинга и создания адаптеров для решения разнообразных задач.

При этом, случайные Гауссовские матрицы имеют (с огромной вероятностью) полный ранг. Каким-то образом получается, что для матриц "из жизни" ранг оказывается небольшим. 🤪

Самое, наверное, известное – наш мир образуют гладкие функции (скалярные и векторные), а они порождают матрицы маленького ранга. На днях я набрёл на альтернативное объяснение (откуда украл картинку для поста): матрицы в реальном мире похожи на результат матричных уравнений Сильвестра. У таких матриц будет маленький displacement rank – он свойственен системам, где можно выбрать разные точки отсчёта. Оценки у ребят получаются довольно некрасивые (кому нравится считать числа Золотарёва?), но зато точные. Кстати, в этом нашем диплёрнинге low displacement rank matrices уже успели поприменять. Широко известные в узких кругах Albert Gu и Tri Dao тоже отметились.

Всем подписчикам желаем низкого ранга по жизни – ну, чтобы гладко всё было, да. 👍

Please open Telegram to view this post

VIEW IN TELEGRAM

🥴37👍14❤9🔥6🤓1

7.61K views16:39

Love. Death. Transformers.

Не знал что у физтеха новый корпус

95😁7116👍6🤔6⚡2❤1🔥1😢1

8.33K views20:27

Love. Death. Transformers.

вот би бил егэ по бенчмаркам....

очередная модель, типа соннет бьет на оффлайн бенчах

👍28😁22

8.84K viewsedited 21:39

Love. Death. Transformers.

This media is not supported in your browser

VIEW IN TELEGRAM

Подписчик сделал мерч для канала, прикольно....

6🔥153👍26❤8🤮7🤔1😨1

9.14K views10:49

Love. Death. Transformers.

😁144😢18👾4🤔1

9.81K views18:29