Градиент обреченный
7.98K subscribers
837 photos
20 videos
8 files
457 links
Download Telegram
akutagawa.pdf
653.2 KB
#lingtrain #books #pet

DIY. Делаем книги

🌗 Продолжаю экспериментировать с созданием параллельных книг на иностранных языках. Повозился на майских праздниках с библиотекой weasyprint, чтобы сверстать выровненную при помощи моего хобби-проекта книгу в PDF.

Очень кропотливое занятие, которое, однако можно автоматизировать. На выходе получается вот такая замечательная книга.

🌗 Выравнивание идет при помощи LaBSE, которая обучалась на 100+ языках, можно дообучать и на другие, более редкие языки (про это можно почитать тут). Пока что можно сделать себе книжку в html.

Github
🔥9👍31
#news #tools

Python в браузере, теперь ты можешь. Но зачем?

🔮 Наткнулся на свежую библиотеку py-script, которая позволяет писать код на python в браузере. Для этого нужна только одна зависимость, и вуаля.

🚲 Сначала я подумал, что это какая-то очередная фигня, транслирующая код в JS. Но после беглого просмотра оказалось, что код выполняется при помощи pyodide, порта CPython в WebAssembly. Это значит, что будет работать функционал из стандартной библиотеки. Плюс пишут, что работает numpy, pandas, sklearn и т.д.

🤷‍♂️ Я все равно не до конца понимаю зачем это надо, кроме, может, поворочать какие-то клиентские данные сразу в браузере и сделать визуализацию. Может у вас есть какие-то идеи.

PyScript
😱2
#articles #nlp

Gato — взгляд в сторону сильного ИИ

🧿 Вышла статья от DeepMind о том как они тренировали сеть решать мультимодальные задачи — играть в компьютерные игры, управлять роботом, а кроме этого расставлять подписи к картинкам и чатиться.

Вроде бы ничего особенного относительно SOTA результатов в каждой конкретной задаче, но суть на самом деле в следующем:

• Большая часть тренировочного датасета (85%) — это сценарии от игровых агентов.
• Остальная часть (15%) — это текстовые и графические данные, т.е данные другого типа нежели первые.
• В статье описываются эксперименты как претрейн на данных другой модальности влияет на обучение основного агента.

И вот это очень интересно, — во-первых, обучение на новых задачах может влечь Negative transfer (ухудшение качества в общем). Во-торых, возможен ли Positive transfer?

🧿 Если да, то значит сети можно обобщать (хорошо уметь делать все) и где-то вдалеке маячит возможность обучения того самого сильного ИИ, он же AGI (artificial general intelligence).

Статья
🤔2
🔥 Мы сделали DALLE2

Ну или почти.

👉 Месяц работы, море потраченных нервов и арендованный сервер - совместно с автором Love. Death. Transformers. у нас получилось сделать dalle2-decoder, способный декодировать эмбеддинги клипа.

Как обычно, всё опен сурс на гитхабе.

Лайк, репост, звездочка ⚡️
👍12
#news #cv

IMAGEN. Google наносит ответный удар.

🌗 Пока OpenAI продолжает не делиться своими моделями по генерации изображений, а энтузиасты делают свой велосипед из подручных средств, в компании Google сделали аналог DALL-E2 и назвали его IMAGEN. Модель эта, судя по представленным рендерам, не уступает первой, картинки действительно очень прикольные.

Немного деталей:

Внутри модели генератор изображений 64x64 на 2B параметров.
Затем идёт upscale (улучшение качества) до размера 1024x1024 еще одной моделью на 1B параметров.
Языковой моделью (LM), кодирующей текстовые подсказки, служит T5 на 4.6B параметров. По словам исследователей, именно увеличение объема LM дало больший прирост качества финальной картинки.

🌗 Пока что попробовать ничего нельзя. Зато у нас есть уже две крутые модели, на которые можно пускать слюнки в ожидании чуда.

Обзор | Статья
👍4
door_into_summer.pdf
1.4 MB
#lingtrain #books #pet

Lingtrain. Делаем клёвые книги

🔮 Автоматизирую процесс создания вот таких параллельных книг. Скоро выложу наработки и статью.

Языки будут поддерживаться в зависимости от языковой модели (там будет модель на 100+ языков). Плюс для японского и китайского будет возможность добавить надстрочные подсказки для чтения. Для всех языков можно будет подсвечивать соответствия между предложениями.

🔅 Любите книги.
14🔥8👍3
#books #gpt #news

🌶🗿 🤖 = 🔥

На днях вышла любопытная книга под названием "Пытаясь проснуться", написанная человеком и ИИ. Со стороны людей выступил Павел Пепперштейн (деятель современного искусства), со стороны роботов — сберовская ruGPT-3. На русском языке такая книга выходит впервые.

🌗 Почитал несколько первых рассказов, — вот, что могу сказать:

• За идею и за честность авторам можно поставить пять, тексты действительно оставляли как есть.
• Про сюжетные линии ничего говорить не буду, чтобы не спойлерить. Скажу только, что сами тексты довольно связные, хотя нейросетевые явно короче.
• А так как авторство намеренно не указано, то довольно любопытно искать момент, который выдаст создателя.

🌗 В общем, гику в подарок — самое оно.

"И соткалась Эктоплазма в колоссальную, необозримую, неистребимую, никому не ведомую Репку. И репка эта стала тем миром, где теперь ты, детка, внимаешь с ужасом и ликованием этой обратной сказке."
🔥5👍4
Когда пустили в Midjourney

🔥 Пустили поиграться в дискорд беты Midjourney AI! В нем можно генерировать картинки по текстовому описанию, зашел туда, а там... Генерации на уровне Dalle 2 и Imagen'a, сразу генерят тебе четыре картинки, можно выбирать, какую увеличить.

Чуть-чуть поигрался, оказалось, что бесконечно нагружать сервер не дают (внезапно). Осталась еще пара попыток, так что если есть идеи, то пишите.

👉 Оставить заявку на доступ к бете можно тут. Мою рассматривали около недели, так что вперед.
🔥6
🌕 Иллюстрация к роману "Пикник на обочине" Стругацких.

"Нарисовал" в midjourney.
🔥15👍1
🌹 Иллюстрация к "Маленькому принцу" Экзюпери. Принц держит розу. Акварель.
👍91
🔥 IMAGEN получил обновление

👉 Добавил динамический порог, кеширование (ускорил генерацию) и T5 на 3B параметров (как часть архитектуры)

💪 Прикрепил немного примеров IMAGEN:

1. A photo of funny cat
2. A red cube on top of blue cube
3. A face
4. A teddy bear in times square
5. A photo of teddy bear

Потыкать код
Сгенерировать

@gradientdip
🔥4👍1
#habr #lingtrain #nlp #pet

Lingtrain. Книги для всех, даром

🎈 Написал приложение для создания параллельных книг и рассказал про него в этой небольшой статье на Хабре. Под капотом у него мультиязыковые нейросетевые модели для понимания смысла предложений на разных языках (всего более ста языков) и алгоритмы для создания выравнивнаия.

https://habr.com/ru/company/ods/blog/669990/
👍13🔥5
#colab #gen #cv

🚀 Делаем картинки из текста в стиле Pixel art

Пост для тех, кто заинтересовался возможностями нейросетей генерировать красивые, граничащие с искусством, картинки.

🌗 Внизу ссылка на Colab (среда для интерактивного запуска кода) с моделью, которая была дообучена рисовать пиксельные изображения в стиле старых игр.

Просто открывайте по ссылке и запускайте ячейки как есть, параметры по-умолчанию подобраны хорошо. Ближе к концу блокнота будет место, куда надо будет ввести подсказку, по которой будет происходить генерация.

Colab
🔥10
#gen #cv #colab

🚀 Нейроарт

Предыдущий Colab годится не только для pixelart картинок, но и в целом делает классные иллюстрации (надо убрать из подсказки слово #pixelart).

🌗 Совет, добавляйте в конец подсказки фразу ", trending on artstation" и делайте более развернутые описания. Подсказка "watercolor drawing of ..." будет рисовать акварель и так далее.

Примеры подсказок:

- illustration of other planet and futuristic gun lying on the ground, trending on artstation
- watercolor illustration, budapest on the moon, trending on artstation
- saint petersburg street cyberpunk, trending on artstation
🔥8