Forwarded from Lingtrain
🔺 Обновление книжки-трансформера
👉 Смотреть тут
1️⃣ Поработал над книжкой, добавил в UI названия глав содержания на выбранном языке.
2️⃣ Сделал механизм подгрузки картинок, если их просто класть в папку с сайтом и называть <номер_абзаца>.png
3️⃣ Номер абзаца теперь всплывает при наведении на абзац.
4️⃣ Нарисовал несколько картинок нейросетями (stable diffusion 1.5). Понравилось, нарисую еще.
5️⃣ Долго ковырялся с рамкой для картинок, вроде получилось неплохо.
〰️ Напоминаю, что все это делается на примере Мастера и Маргариты Булгакова, а в конечном итоге можно будет делать такие книжки для себя из своих текстов на любых языках. Сначала делаем выравнивание Lingtrain'ом для пар книг, затем выравниваем совместно, и потом оборачиваем все это в сайт и кладем на github pages.
✔️ Пишите, если увидите баг или появятся идеи. Хочу попробовать сделать подстрочный режим и добавить закладки.
👉 Книжка | Habr | GitHub
👉 Смотреть тут
1️⃣ Поработал над книжкой, добавил в UI названия глав содержания на выбранном языке.
2️⃣ Сделал механизм подгрузки картинок, если их просто класть в папку с сайтом и называть <номер_абзаца>.png
3️⃣ Номер абзаца теперь всплывает при наведении на абзац.
4️⃣ Нарисовал несколько картинок нейросетями (stable diffusion 1.5). Понравилось, нарисую еще.
5️⃣ Долго ковырялся с рамкой для картинок, вроде получилось неплохо.
〰️ Напоминаю, что все это делается на примере Мастера и Маргариты Булгакова, а в конечном итоге можно будет делать такие книжки для себя из своих текстов на любых языках. Сначала делаем выравнивание Lingtrain'ом для пар книг, затем выравниваем совместно, и потом оборачиваем все это в сайт и кладем на github pages.
✔️ Пишите, если увидите баг или появятся идеи. Хочу попробовать сделать подстрочный режим и добавить закладки.
👉 Книжка | Habr | GitHub
🔥10👍6❤🔥3🤗1
🔥22✍3❤🔥2
📚 Что почитать про AGI?
Хотел почитать что-нибудь про общий искусственный интеллект (AGI), — тот самый, который отберет работу у людей, а, может, и мир уничтожит (соревноваться в этом с нами будет непросто).
Нашел и прочитал три книжки, первые две очень понравились:
1️⃣ ИИ-2041. Кай-Фу Ли и Чэнь Цюфань. Каждая из 10 глав посвящена кульминации в развитии одного из аспектов ИИ и культуры.
NLP и персональные ассистенты, CV и дипфейки, квантовый прорыв, дополненная реальность, ИИ в медицине и вооружении, AI для максимизации счастья и т.д.
Изюминка книги в том, что каждая глава поделена на две части: сначала писатель-фантаст (Цюфань) представляет рассказ, действие которого разворачивается в 2041 году. Затем Кай-Фу (бывший президент Google China) освещает технические детали и дает оценку, насколько реально достичь такого прогресса на горизонте 20-30 лет.
2️⃣ Искусственный ты. Сьюзан Шнайдер. По мере развития AI вычислительно приближается к человеку (а где-то уже обгоняет). Но может ли он дойти до такой сложности, что у него возникнет сознание?
Если же мы начнем модернизировать мозг, сливаясь с машиной, то сможем ли мы сохранить свое собственное сознание?
Обсуждается множество других интересных вопросов и реальных случаев, — про заморозку мозга, про перенос сознания на внешний носитель, про трансгуманизм и другие точки зрения на будущее человека и ИИ.
3️⃣ Власть роботов. Мартин Форд. Более приземленная книжка про наше ближайшее будущее. ИИ как новое электричество, — автор рассказывает про последние прорывы типа AlphaFold и всеобщее распространение автоматизации уже в ближайшее десятилетие.
Упоминаются столпы глубокого обучения, — Ле Кун, Шмидхубер, Хинтон и другие. Дается оценка наступления эпохи сильного ИИ от 18-ти ведущих экспертов по шкале Курцвейл (2029 г.) - Брукс (2200 г.). Разброс большой, ждем с нетерпением
👉 Что сейчас читаете?
Хотел почитать что-нибудь про общий искусственный интеллект (AGI), — тот самый, который отберет работу у людей, а, может, и мир уничтожит (соревноваться в этом с нами будет непросто).
Нашел и прочитал три книжки, первые две очень понравились:
1️⃣ ИИ-2041. Кай-Фу Ли и Чэнь Цюфань. Каждая из 10 глав посвящена кульминации в развитии одного из аспектов ИИ и культуры.
NLP и персональные ассистенты, CV и дипфейки, квантовый прорыв, дополненная реальность, ИИ в медицине и вооружении, AI для максимизации счастья и т.д.
Изюминка книги в том, что каждая глава поделена на две части: сначала писатель-фантаст (Цюфань) представляет рассказ, действие которого разворачивается в 2041 году. Затем Кай-Фу (бывший президент Google China) освещает технические детали и дает оценку, насколько реально достичь такого прогресса на горизонте 20-30 лет.
2️⃣ Искусственный ты. Сьюзан Шнайдер. По мере развития AI вычислительно приближается к человеку (а где-то уже обгоняет). Но может ли он дойти до такой сложности, что у него возникнет сознание?
Если же мы начнем модернизировать мозг, сливаясь с машиной, то сможем ли мы сохранить свое собственное сознание?
Обсуждается множество других интересных вопросов и реальных случаев, — про заморозку мозга, про перенос сознания на внешний носитель, про трансгуманизм и другие точки зрения на будущее человека и ИИ.
3️⃣ Власть роботов. Мартин Форд. Более приземленная книжка про наше ближайшее будущее. ИИ как новое электричество, — автор рассказывает про последние прорывы типа AlphaFold и всеобщее распространение автоматизации уже в ближайшее десятилетие.
Упоминаются столпы глубокого обучения, — Ле Кун, Шмидхубер, Хинтон и другие. Дается оценка наступления эпохи сильного ИИ от 18-ти ведущих экспертов по шкале Курцвейл (2029 г.) - Брукс (2200 г.). Разброс большой, ждем с нетерпением
👉 Что сейчас читаете?
❤🔥15👍6🤩4🔥3⚡1🤓1
Нарисовал еще пару иллюстраций к книжке-трансформеру.
На этот раз в #midjourney, красивые ведьмы в нем получаются гораздо лучше.
👉 Книжка здесь
На этот раз в #midjourney, красивые ведьмы в нем получаются гораздо лучше.
👉 Книжка здесь
🔥12❤🔥3👍2🥴2
🧨 Diffusion is all we need
На hf появились новые модели для генерации изображений на основе stable diffusion 1.5 (там, где еще не пропали стили художников) и эти модели прекрасны.
1️⃣ vintedois-diffusion-v0-1
Была натренирована двумя товарищами на датасете из качественных картинок, хорошо рисует арт с лицами. Благодаря библиотеке diffusers все это легко поднимается парой команд (либо можете использовать демо).
2️⃣ Protogen Diffusion
Тут целое семейство моделей, дообученных под аниме, фантастику и фотореализм. Вот тут подробнее.
〰️ Картинка нарисована при помощи protogen 3.8. А вот промпт.
На hf появились новые модели для генерации изображений на основе stable diffusion 1.5 (там, где еще не пропали стили художников) и эти модели прекрасны.
1️⃣ vintedois-diffusion-v0-1
Была натренирована двумя товарищами на датасете из качественных картинок, хорошо рисует арт с лицами. Благодаря библиотеке diffusers все это легко поднимается парой команд (либо можете использовать демо).
from diffusers import DiffusionPipeline👉 Карта модели | Демо
pipeline = DiffusionPipeline.from_pretrained("22h/vintedois-diffusion-v0-1")
2️⃣ Protogen Diffusion
Тут целое семейство моделей, дообученных под аниме, фантастику и фотореализм. Вот тут подробнее.
from diffusers import DiffusionPipeline👉 Карта модели | Демо со всеми вариантами
pipeline = DiffusionPipeline.from_pretrained("darkstorm2150/Protogen_x5.8_Official_Release")
〰️ Картинка нарисована при помощи protogen 3.8. А вот промпт.
🔥10❤🔥3⚡2🤗1
🔺 Let's build (chat)GPT
Новое видео от Андрея Карпати. На этот раз с нуля собираем GPT (генеративную языковую модель) в colab'е. Также на пальцах рассказывается, что такое ChatGPT.
Как обычно, все объясняется с самых основ. Причем, если что-то непонятно, то Андрей уже записал и выложил ряд крутых лекций под общим названием "Neural Nets. From zero to hero". Очень полезный образовательный контент.
👉 Видео | nanoGPT | Код из занятия
Новое видео от Андрея Карпати. На этот раз с нуля собираем GPT (генеративную языковую модель) в colab'е. Также на пальцах рассказывается, что такое ChatGPT.
Как обычно, все объясняется с самых основ. Причем, если что-то непонятно, то Андрей уже записал и выложил ряд крутых лекций под общим названием "Neural Nets. From zero to hero". Очень полезный образовательный контент.
👉 Видео | nanoGPT | Код из занятия
🔥47👍6❤🔥3❤1⚡1🎉1
🔺 ChatGPT и языки
Поспрашивал сеть в контексте знания разных языков. Крайне любопытным показалось то, что при ответе на вопрос
Поспрашивал сеть в контексте знания разных языков. Крайне любопытным показалось то, что при ответе на вопрос
"как транскрибировать имя Сергей китайскими иероглифами?"она дала правильный (общеупотребительный) вариант "谢尔盖" (Xiè ěr gài) плюс придумала какой-то новый "塞尔吉" (Sài ěr jí), но который также похож на правду.
🔥19😁8🤓4❤🔥2👍1🥴1
This media is not supported in your browser
VIEW IN TELEGRAM
В Nvidia Broadcast (программу для записи стримов и видеоконференций) добавили новую фичу — eye contact. Теперь можно бесконечно смотреть в глаза коллегам на созвонах.
🔥45😁12👍3❤🔥2🤯1
🔺 Is ChatGPT A Good Translator?
В Tencent провели исследование ChatGPT в области машинного перевода. Проверяли три аспекта:
1️⃣ Влияние промпта
Посчитали метрики (BLEU и ChrF++) на подсказках, предложенных самой же сетью. Проверяли на паре китайский-английский. Выбрали лучший (BLEU 24.73):
Взяли 4 языка из FLORES 101 — немецкий, английский, румынский, китайский, как-будто бы покрывая несколько языковых семей и две письменности. На каждой паре из 12-ти посчитали BLEU и показали разницу +/- с Google Translate в процентах, а также результат DeepL 🚀(см. картинку).
В итоге на популярных языках разница небольшая (-2.9% и -5.5% для de-en и en-de). И может быть очень большой в случае малоресурсного языка (тут это румынский) -21% для ro-zh. Интересно, что есть и выигрыш — +0.2% для de-ro.
3️⃣ Надежность перевода
Так как перевод может сильно отличаться для разных доменов, важно понимать насколько универсальной может быть система.
Взяли три сета — WMT19 Bio (много специфической медицинской терминологии), WMT20 Rob2 (комменты с Reddit с грамматическими ошибками)
и Rob3 (ASR транскрипции).
Опять-таки, на специализированном корпусе результат оказался значительно хуже чем у коммерческих решений. Но на расшифровках аудио (что-то похожее на диалоги), ChatGPT оказалась значительно лучше (см. картинку). Исследователи связывают это с первичной задачей сети вести себя как вопросно-ответный агент.
👉 Статья
В Tencent провели исследование ChatGPT в области машинного перевода. Проверяли три аспекта:
1️⃣ Влияние промпта
Посчитали метрики (BLEU и ChrF++) на подсказках, предложенных самой же сетью. Проверяли на паре китайский-английский. Выбрали лучший (BLEU 24.73):
Please provide the [TGT] translation for these sentences:2️⃣ Мультиязычность
Взяли 4 языка из FLORES 101 — немецкий, английский, румынский, китайский, как-будто бы покрывая несколько языковых семей и две письменности. На каждой паре из 12-ти посчитали BLEU и показали разницу +/- с Google Translate в процентах, а также результат DeepL 🚀(см. картинку).
В итоге на популярных языках разница небольшая (-2.9% и -5.5% для de-en и en-de). И может быть очень большой в случае малоресурсного языка (тут это румынский) -21% для ro-zh. Интересно, что есть и выигрыш — +0.2% для de-ro.
3️⃣ Надежность перевода
Так как перевод может сильно отличаться для разных доменов, важно понимать насколько универсальной может быть система.
Взяли три сета — WMT19 Bio (много специфической медицинской терминологии), WMT20 Rob2 (комменты с Reddit с грамматическими ошибками)
и Rob3 (ASR транскрипции).
Опять-таки, на специализированном корпусе результат оказался значительно хуже чем у коммерческих решений. Но на расшифровках аудио (что-то похожее на диалоги), ChatGPT оказалась значительно лучше (см. картинку). Исследователи связывают это с первичной задачей сети вести себя как вопросно-ответный агент.
👉 Статья
🔥13👍4🆒2✍1
Forwarded from AbstractDL
🤗Illustrated Reinforcement Learning from Human Feedback (RLHF)
Отличный блог-пост от HuggingFace с разбором RL для файнтюна языковых моделей (webGPT, instructGPT, chatGPT).
А ещё, RLHF теперь официально поддерживается в
P.S. Сейчас все побегут учить свою mini-chatGPT в колабе)
Блог, GitHub
Отличный блог-пост от HuggingFace с разбором RL для файнтюна языковых моделей (webGPT, instructGPT, chatGPT).
А ещё, RLHF теперь официально поддерживается в
transformers через библиотеку trl!P.S. Сейчас все побегут учить свою mini-chatGPT в колабе)
Блог, GitHub
👍21🔥4⚡2❤🔥2❤1
🚀 Подъехал мерч от ODS. Мерч клёвый, но надеть пока не дают...
Подарили за статью DIY. Книги для всех, даром про создание мультиязычных параллельных книг. Спасибокиноакадемии тому, кто номинировал статью, и всем, кто поддержал! Проект развивается, скоро будут новости.
Подарили за статью DIY. Книги для всех, даром про создание мультиязычных параллельных книг. Спасибо
🔥38👍6❤5😁3🍾3🎉1
🔺 Скрипт для массового обращения к ChatGPT
Ребят, тут узнали имя модели ChatGPT и оно работает через официальное API OpenAI! Написал скрипт для массового обращения.
🔸 Имя модели в запросе text-chat-davinci-002-20221122.
🔸 Иногда сервер шлёт 500 и 503, просто обращаемся снова.
🔸 В какой-то момент в ошибке вылезло сообщение про RateLimit 150k/min, что странно, потому что упереться в него трудновато.
@doomgrad
Upd. 9.02.2023. Скрипт сейчас не работает. Карпати пришел в OpenAI и пофиксил.
👉 Теперь нужно так
-------------
👉 GitHub
Ребят, тут узнали имя модели ChatGPT и оно работает через официальное API OpenAI! Написал скрипт для массового обращения.
🔸 Имя модели в запросе text-chat-davinci-002-20221122.
🔸 Иногда сервер шлёт 500 и 503, просто обращаемся снова.
🔸 В какой-то момент в ошибке вылезло сообщение про RateLimit 150k/min, что странно, потому что упереться в него трудновато.
@doomgrad
Upd. 9.02.2023. Скрипт сейчас не работает. Карпати пришел в OpenAI и пофиксил.
👉 Теперь нужно так
-------------
👉 GitHub
🔥21⚡4🤯2❤🔥1🆒1
🔸 Год назад я ставил на ночь скрипты для генерации картинок типа
🔸 Теперь я ставлю ChatGPT генерировать мне рэп и факты про языки мира (вот скрипт для запуска).
🔸 Уверен, через год будем делать такое
картина [Будапешта, Праги, Милана, ...] [летом, зимой] в стиле [акварели, скетча, ...]чтобы утром посмотреть на результат. Очень это нравилось и в течение года качество становилось лучше, а сейчас уже есть куча классных моделей для этого.
🔸 Теперь я ставлю ChatGPT генерировать мне рэп и факты про языки мира (вот скрипт для запуска).
🔸 Уверен, через год будем делать такое
сделай видеоклип в стиле Раммштайн про кабачок на чувашском языке, trending on youtube
👍22🔥8💯4😁3