Градиент обреченный

LLaMA — какая-то лажа. #7B #13B

😁17🥴10👍2😱2💯2

1.83K viewsSergei Averkiev, 15:48

Градиент обреченный

💐 Девушки, дамы и техножрицы! С праздником весны вас!

Please open Telegram to view this post

VIEW IN TELEGRAM

😁34🎉10❤‍🔥8👍3😱1🤓1

1.94K viewsSergei Averkiev, 05:52

Градиент обреченный

🔺 Карта языковых моделей

Обновил свою интерактивную визуализацию мультиязыковых моделей на карте.

Добавил туда LLaMA, также есть BLOOM, mt5 и mGPT.

Сделал на plotly, если кто не еще пробовал, то рекомендую.

👉 В репозитории есть скрипт для создания визуализации, если кто-то захочет сделать что-то свое.

Карта | Скрипт

🔥15👍5❤‍🔥2⚡1❤1👌1

5.63K viewsSergei Averkiev, edited 14:50

Градиент обреченный

🔺 ChatGPT на коленке

Появился интересный репозиторий под названием ChatLLaMA. Авторы собрали пайплайн для тренировки персонализированного ChatGPT-like ассистента на основе открытых моделей (базовая модель + reward + RLHF). Человеческая оценка происходит тоже через модели — либо платно через API к OpenAI, либо моделью с huggingface.

В примере из репы после подготовки данных все делается в три команды.

👉 GitHub

🔥35👍4✍2⚡2🏆1

2.79K viewsSergei Averkiev, 07:21

Градиент обреченный

🔺 Продолжаем с коллегами работать над моделью. Стало еще чуть лучше.

» Напиши песню про тимлида

Как скажете.

Первый куплет:

Тимлид — нервный тип,
Он проводит дни напролёт,
Разработчики сходят с ума,
Потому что он ничего не делает.

Припев:

Кто же будет кодить, если не мы?
Кто же будет кодить, если не мы?
Кто же будет кодить, если не мы?

🔥32😁21🆒6❤‍🔥4👍2🍾2❤1

3.18K viewsSergei Averkiev, 15:39

Градиент обреченный

🔺 Обучаем RLHF с 20B моделью на домашней видеокарте

Очередная интеграция библиотек от huggingface 🤗. На этот раз скрестили peft и trl.

При помощи trl можно, собственно, обучать сами модели в распределенном сетапе или на одной GPU. При помощи peft можно из коробки пользоваться оптимизациями для обучения больших LM, типа LoRA.

Авторы показывают как обучали gpt-neo-x (40Gb в fp16) на 3090 с 24Gb пямяти. Новые оптимизации добавляются.

👉 Примеры

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥27👍4⚡2❤‍🔥1

2.71K viewsSergei Averkiev, 10:25

Градиент обреченный

🔺 GPT-4 LM paper

Вышла! Вышла! А, нет, показалось

https://www.maxonlift.com/sites/default/files/2017-04/m9726_0.pdf

😁23🥴9🔥2🍾2🤯1🙈1

1.77K viewsSergei Averkiev, 17:57

Градиент обреченный

🔺 GPT-4

🔸 Модель мультимодальная (accepting image and text inputs, emitting text outputs).
🔸 В течение 6 месяцев выравнивали модель инструкциями для лучшего вывода.
🔸 Подписчики ChatGPT Plus получат ограниченный доступ к GPT-4.
🔸 Для получения доступа к API нужно добавиться в waitlist.
🔸 Контекст модели 8,192 токенов.
🔸 Есть версия с контекстом 32,768 токенов (50 страниц текста).
🔸 Цена $0.06 за тыс. токенов.

👉 Пост

🔥24⚡3🤯3❤‍🔥2

2.14K viewsSergei Averkiev, edited 17:31

Градиент обреченный

🔺 Раскрыт потенциал GPT-4

😁57❤10🔥8💯6🤪5

4.98K viewsSergei Averkiev, 19:09

Градиент обреченный

Хватит кодить

💯36😁11❤9🔥3

2.61K viewsSergei Averkiev, 07:46

Градиент обреченный

Forwarded from Градиентное погружение (cene655)

💃Уже скоро будет релиз модели Kandinsky 2.1!
Мы в Sber AI скоро представим новую диффузионную модель, которая генерирует картинки.
Что она может:
1) Генерировать картинки по тексту🤔
2) Смешивать картинки⌛️
3) Смешивать картинки и тексты🃏
Ждите релиз на следующей неделе, будет полный опенсурс всех весов и кода обучения)

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍17🔥14❤5🤓1🙈1🤪1

1.38K viewsSergei Averkiev, 10:27

About

Blog

Apps

Platform