Love. Death. Transformers.

Ежемесячные слухи о том, что "AGI достигнут внутри OpenAI", похожи на историю про мальчика, который кричал "волки" — за исключением того, что деревенские жители продолжают приходить без исключения 30 раз подряд, несмотря на то что в этом районе никогда не было волков.

50😁136🔥16💯7🥴6👍3🤡1

8.51K viewsedited 19:24

Вот би бил ЕГЭ по мержингу

Вот би бил ЕГЭ по наебу инвесторов на деньги, а стоп....

😁74🔥10❤6👍3

7.45K views08:06

Love. Death. Transformers.

Forwarded from Denis Sexy IT 🤖

Давно порываюсь вам написать про ТГ-сетки которые про ML-пишут и что им не стоит верить, вот пример ⬆︎

Что на самом деле происходит с этой новой моделью Reflection-70B:

1. Пару дней твиттерский показал свою новую языковую 70B-модель которая с рекордами прошла все бенчмарки (по его утверждению это был файнтюн Llama 3.1 70b ) и что такая же 400b будет вот-вот

2. Модель начала вируситься, ее начали качать и оказалось, что она толком не работает потому что там внутри немного битый конфиг ее запуска (это если простыми словами)

3. Автор перезалил модель, сказал что все починил и все работает — но теперь оказалось что нужно использовать только специальный системный промпт чтобы она работала

4. Сообщество начало тестировать, разобрало модель по кусочкам и оказалось, что это файнтюн Llama 70b 3.0, а не 3.1. И причем не файнтюн модели целиком, а просто Lora-адаптер вмерженного в модель (тренируют кусочек модели который замещает часть модели)

5. Автор сказал, я вообще не помню что я там использовал — толи 3.0 толи 3.1, что такое Lora я не знаю, это не важно все — мы тут сейчас все заново поставим тренироваться, уже поставили точнее (зачем перетренивать модель которая по метрикам побила все бенчмарки пару дней назад мы не узнаем)

6. Параллельно с этим, появилась веб-версия этой модели о которой пишет Бекдор — и ее API дали сегодня протестировать сторонней организации, она неплохо справилась и подтвердила что результаты высокие (но модель доступна только по API)

7. Пару часов назад автор публикует новую версию модели Reflection 70b e3 и сразу пишет, что с ней что-то не так: «Веса залились, но мы все еще проверяем, чтобы убедиться, что они правильные, прежде чем мы собираемся закончить день» – зачем заливать модель до тестов? Ответа нет

8. Люди тестирующие веб версию Reflection 70b, обратили внимание, что она очень похожа на Sonnet 3.5 — буквально токен в токен отдает ответы такие же ответы

<играет цирковая музыка, вы находитесь здесь>

Буду держать вас в курсе нашей высокотехнологичной драмы – возможно, чел правда что-то натренил, но пока мы не знаем что.

Ну и для нейронок лучше читать проверенные ML-каналы, сейчас такое время, что все экспертами в АИ стали (я даже не про свой, я их часто сюда репощу)

602915👍7❤6😁5🤡2👎1🤮1💩1

5.27K views08:07

Love. Death. Transformers.

погодите это реально

🗿129🤮67😁32🔥25💩13🤡7🥴7❤3🍓2💊2

10.8K viewsedited 15:56

Love. Death. Transformers.

- А можно нам больше серверов? У нас стрим видео забивает поток
- Есть одна идейка

😁74🥴11🔥3

7.64K views22:09

Love. Death. Transformers.

0:14

This media is not supported in your browser

VIEW IN TELEGRAM

🔥126😁34❤‍🔥9💯5🗿4👍1

12.9K views08:21

Love. Death. Transformers.

если вы сми и хотите написать статью про лучшую ллм ресерч лабу в россии - вас ждут в личку @transformerslovedeatch

🤡65😁3618👍6💩5🍌5🗿2✍1❤1🍓1

7.32K viewsedited 10:44

Love. Death. Transformers.

1:15

This media is not supported in your browser

VIEW IN TELEGRAM

слухи перед каждой презентацией openai все больше напоминают "реальный мамой клянусь" прототип айфона 6 перед презентациями apple лет 10 назад

😁96🤡117❤3👍2🦄1

7.37K views15:33

Love. Death. Transformers.

Emergent abilitys ожидание: ну мы сделали sota на всех языках
Emergent abilitys реальность:

👏259😐4🤔3🍓2🤡1💋1

6.95K views06:37

Love. Death. Transformers.

Я изучил программу самых известных программ по DataScience и составил собственный бесплатный курс подготовки senior ресерчеров:

⁃ Начинаем курс с пайки и микроэлетроники - 6 месяцев
⁃ Учимся программировать под arduino - 4 месесяца
- Пишем папиру на диалог/любую русскую конфу - 1 неделя
⁃ Идем в нму дрочить листочки на первый семестр 4 месяца
⁃ Идем работать в макдак, паралельно учим python и torch – 6 мес
⁃ Дальше репетитором по математике, паралельно контрибьютим в любой опенсурс по вкусу – 6 мес
⁃ Завершаем курс написанием статьи на а* – 9 мес

На выходе всего за 3 года получаем закаленного резерчера, который всем нужен.

😁163🤡42🍌22✍4👍4🔥4🤮2👎1

7.88K views09:56

Love. Death. Transformers.

Forwarded from AbstractDL

Attention Heads of LLM — A survey

Трансформеры это всё ещё чёрный ящик или уже нет? За последние несколько лет мы сильно приблизились к пониманию функций отдельных компонент языковых моделей, лучше понимаем, как они приходят к тому или иному выводу, и главное — как можно влиять на процес их "размышений", редактировать отдельные факты в памяти и многое другое.

В этой статье собрали в кучку всё, что известно о функциях голов внимания в LLM с очень красивыми схемами и таблицами. Вот только небольшая часть:
- Associative Memories Head
- Truthfulness Head
- Semantic Induction Head
- Global Retrieval Head
- Subword Merge Head

Поэтому, если хотите погрузиться в интерпретируемость трансформеров — очень рекомендую полистать этот обзор.

Статья

🔥31👍15💯2🆒2

7.08K views21:15

Love. Death. Transformers.

https://songcreator.github.io/

Думаю скоро выйдет udio, а потом и sora дома.

🔥27👍4

8.26K viewsedited 22:48

Love. Death. Transformers.

1.wav

1.3 MB

Прям звучит тбх. Папира, а кода пока нет.

👍11👎7

8.22K viewsedited 22:49