Love. Death. Transformers.

Forwarded from Vikhr models

Обновилась llmarena.ru

TLDR
Vikhr Nemo - лучшая opensource модель в своем классе!

🔥38184👍1

6.85K views08:33

Love. Death. Transformers.

😁2482315👍5🎉2😢1🥴1🌭11

10K views09:02

Love. Death. Transformers.

Forwarded from Leo レオ

Русские фаундеры спешат на новую когорту YC после победы Трампа на выборах. Картина в цвете 2025.

💯66😁40🔥2

7.88K views10:51

Love. Death. Transformers.

OpenDiLoCo: An Open-Source Framework for Globally Distributed Low-Communication Training

Обучение multidatacenter сеток все еще большая и сложная штука, для начала стоит понимать что
- скорость интернета не однородна
- на больших расстояниях могут копится ошибки
- пропускная способность сети может быть недостаточной

собственно большой папир и репа про то как учить в ОЧЕНЬ распределенном сетапе
блогпост от авторов имплементации

👍32🔥14🐳5😁3

8.83K viewsedited 14:33

Love. Death. Transformers.

OpenDiLoCo: An Open-Source Framework for Globally Distributed Low-Communication Training Обучение multidatacenter сеток все еще большая и сложная штука, для начала стоит понимать что - скорость интернета не однородна - на больших расстояниях могут копится…

бонус: эта штука поддерживает разные железки!

🔥34👍2

7.34K views14:34

Love. Death. Transformers.

А у вас тоже твитер забит такой хуйней:

Какой accelerate, кто данные ковырять будет...

🍓36😁9🤡5💯3🗿1

8.12K views17:17

Love. Death. Transformers.

Forwarded from GigaDev — разработка GigaChat

Релиз GigaChat MAX! (ссылка на Хабр)

Салют! Мы открываем доступ к модели GigaChat MAX. Модель доступна в @gigachat_bot, в веб-версии и через публичное API (в режиме раннего доступа).

- GigaChat MAX занимает 3 место в бенчмарке MERA. Сразу за gpt-4o и Llama-405B.
- GigaChat-Max достигает 92% правильных ответов на GSM-8k, 80% на MMLU и 75% на MMLU-RU.
- По результатам SBS, где учитывается красота ответов, мы выигрываем в 61% случаев у GPT-4 turbo и в 67% случаев у YaGPT-4 Pro.
- В Arena-Hard мы достигаем 51% скора против GPT-4-0314
- В Vkhr Arena-General-RU мы достигаем 90%, в то время как YaGPT-4 Pro достигает 59%.

Чтобы узнать про то, как мы делали модель, переходите на статью в хабре.

Предыдущие посты:
— GigaChat Pro. Технические детали, сдача ЕГЭ и сравнение с конкурентами
— GigaChat обогнал по качеству ChatGPT и расширил контекст до 32 тысяч токенов

giga.chat

ГигаЧат — русскоязычная нейросеть от Сбера

ГигаЧат — диалоговая AI-модель, которая отвечает на вопросы, сочиняет тексты, пишет код и рисует картинки. Говорит на русском и понимает английский

🤡38🔥15🤔8👍7🎉5🍓4🍌1🗿1

7.28K views10:30

Love. Death. Transformers.

чет проебался, думал сегодня день рекламы яндекса, а оказалось что сбера...

блять а мне же не платят даже за это, мы же просто орков гоняем в балде...

ладно, челы шарят как учить llm с качеством отличным от рандома, а это сложно

😁87🥴11👍8🤔6🤡2👎1

7.43K viewsedited 10:30

Love. Death. Transformers.

все ваши диффзуии будут хуже хорошей llm и вот почему

1) Диффузии не нативно работают с текстом и промптами, а через эмбед. Те при работе с промптом вам в начале надо пролить его через ллм которая увеличит его до 256 токенов для т5, и только потом сунуть через cross-attn в диффузии. Suck какой то...

Что делать?
Совать мультимодалку в LLM что еще делать то...
Это очень сложно, потому что neural codec это всегда сложно, есть всякие LWM-Dalle1 и прочее на vqtokenizer, но везде картинки-видео старались пихнуть в сколько то осмысленный контекст(до 32к) и изза этого плотность информации страдала. Бонусом это хуевый картинко генератор и хуевая vlm и хуевая LM. Примеры: chamelion1-2

Nvidia вчера дропнули Cosmos Tokenizer - vqvae который еще и может быть темпоральным, еще и может стримится, SOTA по их собственным замерам и 1024 картинку можно кодировать в 2048 токенов!

Статьи нормальной нет, но блогпост интересный

🔥27💋4🎅4🤔3🐳2👍1

8.26K viewsedited 13:02

Love. Death. Transformers.

сколько C level_ов заменит крыса с гигачатом?

😁174👍9🥴84

9.53K viewsedited 14:50

Love. Death. Transformers.

китай удар!

🍓83😁34👎2👍1

11.4K views09:10

Love. Death. Transformers.

китай удар!

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

143

7.66K views09:41

Love. Death. Transformers.

понимание контента

Anonymous Poll

40%

я понимаю мемы и обзоры тут

я не понимаю мемы, но понимаю обзоры тут

16%

я понимаю мемы, не понимаю обзоры

34%

очень интересно, ничего не понимаю

33👍4🥴3💋3💊3🤔1🤡1🍓11

1.51K voters7.98K views12:11

Love. Death. Transformers.

вообще репорт интересный, медианный участник опроса прямо кричит "я унылая посредственность из богом забытой команды в глубине сбера"

🥴64😁2015🔥75😢3👍1👏1

8.28K views12:18

Love. Death. Transformers.

саундтрек

16🤮54❤‍🔥2🤡2👍1😁1

7.32K views15:07

Love. Death. Transformers.

Forwarded from Старший Авгур

Выложил v2 версию Сайги Немо. Основных изменений 3:
- Я убрал 80+ примеров из SFT, в которых использовались системные промпты персонажей из ПингПонга. Они появились там до ПингПонга из логов бота, собственно сам лидерборд я собирал на их основе. Это может считаться утечкой, поэтому они убраны из обучения.
- В SimPO датасете я агрессивнее порезал длину и увеличил вес SFT лосса, чтобы укоротить ответы и уменьшить количество выдуманных слов.
- Дотюнил на Достоевском и смёржил ровно так, как я делал для Вихря.

На ПингПонге стало лучше, на арене пока нет результатов.

Если кому-то захочется остаться на v1, везде можно указать ревизию, они есть в карточке модели.

GGUF'ы будут завтра.

🤡28👍17💊3🤮22

7.09K views15:27

Love. Death. Transformers.

Forwarded from ебãные идеи для трейдинга

использовать отклонение уровня тестостерона фаундера от нормы как мультипликатор при оценке

>for testosterone, we observe that founders at the pre-seed and acquired stages had median levels below the healthy range. Seed and Series A founders were within the healthy range but below optimal levels. Only at the Series B stage did the median testosterone level enter the optimal range, although statistical significance could not be established due to the small sample size <..>

https://arxiv.org/pdf/2411.03361

9222🥴7🍌5🔥4💊4👍3😁3🤔1

8.73K views16:31

Love. Death. Transformers.

Forwarded from Разработки Теры

Я опубликовал простой аудио AE. По сути, это адаптированный SoundStream, из которого я убрал дискретные токены, оставив только латентные представления.

🔥19👍11

7.79K views12:14

Love. Death. Transformers.

Довольно ценная штука, полезно посмотреть как учить audio ae. Хотелось бы большой блогпост, надеюсь Терра напишет.

👍21

7.74K viewsedited 12:14

About

Blog

Apps

Platform