Love. Death. Transformers.
22.5K subscribers
4.22K photos
495 videos
76 files
2.77K links
❤️☠️🤗

Указанные действия не являются ресерчем, поскольку:
а) Мы не ученые;
б) Оно работает.
@transformerslovedeatch по всем вопросам
Все ситуации вымышлены, любые совпадения с реальности плот вашей фантазии.
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
World model говорили они
Будущее игр говорили они
Не мешай лёгкие наркотики с тяжёлым алкоголем говорю я


Собственно есть работа diamond - тут учат видео диффузию на действиях из игр. Ребята из <стартап> собрали примерно тоже самое но в Майнкрафте, рассказывают что будут гонять в 4k 100b диффузию.

Почитать diamond
46😁27🥴11👍3🔥1💩1
Работает примерно так: есть 3d dit, подаём на вход onehot вектор действия, unet смотрит на прошлые кадры и двигает картинку.
🔥25💩1
что блять
😁280🌭21🥴7🍌4
Forwarded from Vikhr models
Мы дочинили arenahard, сабмиты снова работают как и раньше (спасибо gradio за обновления)

А также добавился gigachat max censored и uncensored. Подозреваю что цензор это мелкая модель сверху которая помимо прочего сильно режет качество генераций.


Версия с цензором где то между mistral nemo и gemma 27b. Версия без цензора на простой корзине(без особого кода, ризонинга и прочего) на уровне 4о.

Крутой рост за полгода, посмотрим что будет дальше.
🔥44🤡8👍7🥴2🗿1
Вот они слева направо:

float8_e3m4
float8_e4m3
float8_e4m3b11fnuz
float8_e4m3fn
float8_e4m3fnuz
float8_e5m2
float8_e5m2fnuz
float8_e8m0fnu
😁67❤‍🔥11👍2🍓2💊2🔥1
Ура, релиз Сайги Немо!

Модель: https://huggingface.co/IlyaGusev/saiga_nemo_12b
Уже доступна в боте.
GGUF завтра подвезу.

По метрикам: 85 на РуАрене, что чуть хуже 87 у Вихря. И 3 место на ПингПонге.

Пайплайн абсолютно классический: SFT + SimPO. Датасеты, конфиги обучения, W&B логи лежат в карточке модели.

Уникальная фича модели — расцензурированность и ориентация на role-play. Обучал я её поверх abliterated версии Немо, и из и SFT, и SimPO датасетов агрессивно вычищал отказы. В оба датасета доливал role-play промпты, но не с теми персонажами, которые есть в ПингПонге.

Я поштырил и в RP диалоги, и в ответы на арене, и увидел несколько проблем:
1) Модель не умеет рисовать ASCII.
2) В 2 примерах я наблюдал повторы. Это было там, где нужно было написать пример кода, а в нём был какой-нибудь токен. И вот этот токен генерировался бесконечно. Эта проблема специфична для нулевой температуры.
3) Длина. Хоть я и пытался бороться с слишком длинными ответами, по бенчам видно, что ответы всё равно длиннее среднего.
4) Очень изредка попадются выдуманные слова. Причём они вполне разумны, просто их не существует.
🔥3515👍10🥴83🗿2
Статья от ребят из DIT Moscow RESEARCH - присядь на штраф если не регаешь канал в РКН!
👍20💊9
Безумно люблю blin queen, лучшие драники в городе, обязательно сходите!
🤡80👍33🔥17💩9🍓6❤‍🔥5🗿4🤔2👎1
Резерчеры из z банка заменили relu на gelu в трансформере, тем самым ускорив обучение на 4%!!

Респект и уважуха нашим ребятам, удачи им на А конференции Диалог 2025!!
👎87🥴71🤡40🔥27💩1512😁11👍5🗿3😐1
Forwarded from Vikhr models
💨👁 Vikhr-2-VL-2b-Instruct-experimental

это компактная VLM модель, обученная на переведенном датасете LLAVA-150K, специально доученная для обработки на русском языке. Дообученная модель является эксперементальной и не всегда будет работать ожидаемо (особенно OCR).

Ждем вашего фидбека от использования модели)

HuggingFace
Colab

Коллектив авторов: @LakoMoorDev @mlunderground @nlpwanderer
1👍3716💩74🔥2😁1
😁37🥱15🎉1
Forwarded from Русский research
Критическое мышление для начинающих и для профессионалов
10425🔥10😁6🍓6👍5💯3🥴1🐳1
phd level intelegence achived internally(он выкурил два джоинта и сьел все брауни)
👍106😁95🔥115👏3🍓3🐳1
АЛЛО МЫ ИЩЕМ ГОЛОСА3

https://llmarena.ru/ заходите в анонимно и бежим размечать голосами свежее поколение ллм, я с утра разметил несколько десятков сэмплов и вам советую!


Интервалы.
должны.
Сойтись.
1🤡4421👍7🤮5😡2👎1💩1
Forwarded from whargarbl
Ура. Наконец зарелизил:
recoilme-sdxl

файнтюн, над которым я работал последние три месяца.

За это время правда вышло 100500 новых архитектур моделей, но не бросать же..

telegram bot (20/day free): @charsaibot

hf: https://huggingface.co/recoilme/recoilme-sdxl-v11

civit: https://civitai.com/models/920626?modelVersionId=1030470

reddit: https://www.reddit.com/r/StableDiffusion/comments/1gk8cbw/recoilmesdxl/
🌭10132👍8🔥3🍌3🤡1
Forwarded from Vikhr models
Обновилась llmarena.ru

TLDR
Vikhr Nemo - лучшая opensource модель в своем классе!
🔥38184👍1
😁2482315👍5🎉2😢1🥴1🌭11