akutagawa.pdf
653.2 KB
#lingtrain #books #pet
DIY. Делаем книги
🌗 Продолжаю экспериментировать с созданием параллельных книг на иностранных языках. Повозился на майских праздниках с библиотекой weasyprint, чтобы сверстать выровненную при помощи моего хобби-проекта книгу в PDF.
Очень кропотливое занятие, которое, однако можно автоматизировать. На выходе получается вот такая замечательная книга.
🌗 Выравнивание идет при помощи LaBSE, которая обучалась на 100+ языках, можно дообучать и на другие, более редкие языки (про это можно почитать тут). Пока что можно сделать себе книжку в html.
Github
DIY. Делаем книги
🌗 Продолжаю экспериментировать с созданием параллельных книг на иностранных языках. Повозился на майских праздниках с библиотекой weasyprint, чтобы сверстать выровненную при помощи моего хобби-проекта книгу в PDF.
Очень кропотливое занятие, которое, однако можно автоматизировать. На выходе получается вот такая замечательная книга.
🌗 Выравнивание идет при помощи LaBSE, которая обучалась на 100+ языках, можно дообучать и на другие, более редкие языки (про это можно почитать тут). Пока что можно сделать себе книжку в html.
Github
🔥9👍3❤1
#news #tools
Python в браузере, теперь ты можешь. Но зачем?
🔮 Наткнулся на свежую библиотеку py-script, которая позволяет писать код на python в браузере. Для этого нужна только одна зависимость, и вуаля.
🚲 Сначала я подумал, что это какая-то очередная фигня, транслирующая код в JS. Но после беглого просмотра оказалось, что код выполняется при помощи pyodide, порта CPython в WebAssembly. Это значит, что будет работать функционал из стандартной библиотеки. Плюс пишут, что работает numpy, pandas, sklearn и т.д.
🤷♂️ Я все равно не до конца понимаю зачем это надо, кроме, может, поворочать какие-то клиентские данные сразу в браузере и сделать визуализацию. Может у вас есть какие-то идеи.
PyScript
Python в браузере, теперь ты можешь. Но зачем?
🔮 Наткнулся на свежую библиотеку py-script, которая позволяет писать код на python в браузере. Для этого нужна только одна зависимость, и вуаля.
🚲 Сначала я подумал, что это какая-то очередная фигня, транслирующая код в JS. Но после беглого просмотра оказалось, что код выполняется при помощи pyodide, порта CPython в WebAssembly. Это значит, что будет работать функционал из стандартной библиотеки. Плюс пишут, что работает numpy, pandas, sklearn и т.д.
🤷♂️ Я все равно не до конца понимаю зачем это надо, кроме, может, поворочать какие-то клиентские данные сразу в браузере и сделать визуализацию. Может у вас есть какие-то идеи.
PyScript
😱2
#articles #nlp
Gato — взгляд в сторону сильного ИИ
🧿 Вышла статья от DeepMind о том как они тренировали сеть решать мультимодальные задачи — играть в компьютерные игры, управлять роботом, а кроме этого расставлять подписи к картинкам и чатиться.
Вроде бы ничего особенного относительно SOTA результатов в каждой конкретной задаче, но суть на самом деле в следующем:
• Большая часть тренировочного датасета (85%) — это сценарии от игровых агентов.
• Остальная часть (15%) — это текстовые и графические данные, т.е данные другого типа нежели первые.
• В статье описываются эксперименты как претрейн на данных другой модальности влияет на обучение основного агента.
И вот это очень интересно, — во-первых, обучение на новых задачах может влечь Negative transfer (ухудшение качества в общем). Во-торых, возможен ли Positive transfer?
🧿 Если да, то значит сети можно обобщать (хорошо уметь делать все) и где-то вдалеке маячит возможность обучения того самого сильного ИИ, он же AGI (artificial general intelligence).
Статья
Gato — взгляд в сторону сильного ИИ
🧿 Вышла статья от DeepMind о том как они тренировали сеть решать мультимодальные задачи — играть в компьютерные игры, управлять роботом, а кроме этого расставлять подписи к картинкам и чатиться.
Вроде бы ничего особенного относительно SOTA результатов в каждой конкретной задаче, но суть на самом деле в следующем:
• Большая часть тренировочного датасета (85%) — это сценарии от игровых агентов.
• Остальная часть (15%) — это текстовые и графические данные, т.е данные другого типа нежели первые.
• В статье описываются эксперименты как претрейн на данных другой модальности влияет на обучение основного агента.
И вот это очень интересно, — во-первых, обучение на новых задачах может влечь Negative transfer (ухудшение качества в общем). Во-торых, возможен ли Positive transfer?
🧿 Если да, то значит сети можно обобщать (хорошо уметь делать все) и где-то вдалеке маячит возможность обучения того самого сильного ИИ, он же AGI (artificial general intelligence).
Статья
🤔2
Forwarded from Градиентное погружение
🔥 Мы сделали DALLE2
Ну или почти.
👉 Месяц работы, море потраченных нервов и арендованный сервер - совместно с автором Love. Death. Transformers. у нас получилось сделать dalle2-decoder, способный декодировать эмбеддинги клипа.
Как обычно, всё опен сурс на гитхабе.
Лайк, репост, звездочка ⚡️
Ну или почти.
👉 Месяц работы, море потраченных нервов и арендованный сервер - совместно с автором Love. Death. Transformers. у нас получилось сделать dalle2-decoder, способный декодировать эмбеддинги клипа.
Как обычно, всё опен сурс на гитхабе.
Лайк, репост, звездочка ⚡️
👍12
#news #cv
IMAGEN. Google наносит ответный удар.
🌗 Пока OpenAI продолжает не делиться своими моделями по генерации изображений, а энтузиасты делают свой велосипед из подручных средств, в компании Google сделали аналог DALL-E2 и назвали его IMAGEN. Модель эта, судя по представленным рендерам, не уступает первой, картинки действительно очень прикольные.
Немного деталей:
• Внутри модели генератор изображений 64x64 на 2B параметров.
• Затем идёт upscale (улучшение качества) до размера 1024x1024 еще одной моделью на 1B параметров.
• Языковой моделью (LM), кодирующей текстовые подсказки, служит T5 на 4.6B параметров. По словам исследователей, именно увеличение объема LM дало больший прирост качества финальной картинки.
🌗 Пока что попробовать ничего нельзя. Зато у нас есть уже две крутые модели, на которые можно пускать слюнки в ожидании чуда.
Обзор | Статья
IMAGEN. Google наносит ответный удар.
🌗 Пока OpenAI продолжает не делиться своими моделями по генерации изображений, а энтузиасты делают свой велосипед из подручных средств, в компании Google сделали аналог DALL-E2 и назвали его IMAGEN. Модель эта, судя по представленным рендерам, не уступает первой, картинки действительно очень прикольные.
Немного деталей:
• Внутри модели генератор изображений 64x64 на 2B параметров.
• Затем идёт upscale (улучшение качества) до размера 1024x1024 еще одной моделью на 1B параметров.
• Языковой моделью (LM), кодирующей текстовые подсказки, служит T5 на 4.6B параметров. По словам исследователей, именно увеличение объема LM дало больший прирост качества финальной картинки.
🌗 Пока что попробовать ничего нельзя. Зато у нас есть уже две крутые модели, на которые можно пускать слюнки в ожидании чуда.
Обзор | Статья
👍4
door_into_summer.pdf
1.4 MB
#lingtrain #books #pet
Lingtrain. Делаем клёвые книги
🔮 Автоматизирую процесс создания вот таких параллельных книг. Скоро выложу наработки и статью.
Языки будут поддерживаться в зависимости от языковой модели (там будет модель на 100+ языков). Плюс для японского и китайского будет возможность добавить надстрочные подсказки для чтения. Для всех языков можно будет подсвечивать соответствия между предложениями.
🔅 Любите книги.
Lingtrain. Делаем клёвые книги
🔮 Автоматизирую процесс создания вот таких параллельных книг. Скоро выложу наработки и статью.
Языки будут поддерживаться в зависимости от языковой модели (там будет модель на 100+ языков). Плюс для японского и китайского будет возможность добавить надстрочные подсказки для чтения. Для всех языков можно будет подсвечивать соответствия между предложениями.
🔅 Любите книги.
❤14🔥8👍3
#books #gpt #news
🌶🗿 ➕ 🤖 = 🔥
На днях вышла любопытная книга под названием "Пытаясь проснуться", написанная человеком и ИИ. Со стороны людей выступил Павел Пепперштейн (деятель современного искусства), со стороны роботов — сберовская ruGPT-3. На русском языке такая книга выходит впервые.
🌗 Почитал несколько первых рассказов, — вот, что могу сказать:
• За идею и за честность авторам можно поставить пять, тексты действительно оставляли как есть.
• Про сюжетные линии ничего говорить не буду, чтобы не спойлерить. Скажу только, что сами тексты довольно связные, хотя нейросетевые явно короче.
• А так как авторство намеренно не указано, то довольно любопытно искать момент, который выдаст создателя.
🌗 В общем, гику в подарок — самое оно.
"И соткалась Эктоплазма в колоссальную, необозримую, неистребимую, никому не ведомую Репку. И репка эта стала тем миром, где теперь ты, детка, внимаешь с ужасом и ликованием этой обратной сказке."
🌶🗿 ➕ 🤖 = 🔥
На днях вышла любопытная книга под названием "Пытаясь проснуться", написанная человеком и ИИ. Со стороны людей выступил Павел Пепперштейн (деятель современного искусства), со стороны роботов — сберовская ruGPT-3. На русском языке такая книга выходит впервые.
🌗 Почитал несколько первых рассказов, — вот, что могу сказать:
• За идею и за честность авторам можно поставить пять, тексты действительно оставляли как есть.
• Про сюжетные линии ничего говорить не буду, чтобы не спойлерить. Скажу только, что сами тексты довольно связные, хотя нейросетевые явно короче.
• А так как авторство намеренно не указано, то довольно любопытно искать момент, который выдаст создателя.
🌗 В общем, гику в подарок — самое оно.
"И соткалась Эктоплазма в колоссальную, необозримую, неистребимую, никому не ведомую Репку. И репка эта стала тем миром, где теперь ты, детка, внимаешь с ужасом и ликованием этой обратной сказке."
🔥5👍4
Когда пустили в Midjourney
🔥 Пустили поиграться в дискорд беты Midjourney AI! В нем можно генерировать картинки по текстовому описанию, зашел туда, а там... Генерации на уровне Dalle 2 и Imagen'a, сразу генерят тебе четыре картинки, можно выбирать, какую увеличить.
Чуть-чуть поигрался, оказалось, что бесконечно нагружать сервер не дают (внезапно). Осталась еще пара попыток, так что если есть идеи, то пишите.
👉 Оставить заявку на доступ к бете можно тут. Мою рассматривали около недели, так что вперед.
🔥 Пустили поиграться в дискорд беты Midjourney AI! В нем можно генерировать картинки по текстовому описанию, зашел туда, а там... Генерации на уровне Dalle 2 и Imagen'a, сразу генерят тебе четыре картинки, можно выбирать, какую увеличить.
Чуть-чуть поигрался, оказалось, что бесконечно нагружать сервер не дают (внезапно). Осталась еще пара попыток, так что если есть идеи, то пишите.
👉 Оставить заявку на доступ к бете можно тут. Мою рассматривали около недели, так что вперед.
🔥6
Forwarded from Градиентное погружение
🔥 IMAGEN получил обновление
👉 Добавил динамический порог, кеширование (ускорил генерацию) и T5 на 3B параметров (как часть архитектуры)
💪 Прикрепил немного примеров IMAGEN:
1. A photo of funny cat
2. A red cube on top of blue cube
3. A face
4. A teddy bear in times square
5. A photo of teddy bear
Потыкать код
Сгенерировать
@gradientdip
👉 Добавил динамический порог, кеширование (ускорил генерацию) и T5 на 3B параметров (как часть архитектуры)
💪 Прикрепил немного примеров IMAGEN:
1. A photo of funny cat
2. A red cube on top of blue cube
3. A face
4. A teddy bear in times square
5. A photo of teddy bear
Потыкать код
Сгенерировать
@gradientdip
🔥4👍1
#habr #lingtrain #nlp #pet
Lingtrain. Книги для всех, даром
🎈 Написал приложение для создания параллельных книг и рассказал про него в этой небольшой статье на Хабре. Под капотом у него мультиязыковые нейросетевые модели для понимания смысла предложений на разных языках (всего более ста языков) и алгоритмы для создания выравнивнаия.
https://habr.com/ru/company/ods/blog/669990/
Lingtrain. Книги для всех, даром
🎈 Написал приложение для создания параллельных книг и рассказал про него в этой небольшой статье на Хабре. Под капотом у него мультиязыковые нейросетевые модели для понимания смысла предложений на разных языках (всего более ста языков) и алгоритмы для создания выравнивнаия.
https://habr.com/ru/company/ods/blog/669990/
Хабр
DIY. Книги для всех, даром
⚡ Градиент обреченный Upd. 11.06.2022 Многие заинтересовались генерацией изображений нейросетями. Вот Colab (интерактивная среда для запуска кода) для рисования картинок в стиле pixel art по...
👍13🔥5
#colab #gen #cv
🚀 Делаем картинки из текста в стиле Pixel art
Пост для тех, кто заинтересовался возможностями нейросетей генерировать красивые, граничащие с искусством, картинки.
🌗 Внизу ссылка на Colab (среда для интерактивного запуска кода) с моделью, которая была дообучена рисовать пиксельные изображения в стиле старых игр.
Просто открывайте по ссылке и запускайте ячейки как есть, параметры по-умолчанию подобраны хорошо. Ближе к концу блокнота будет место, куда надо будет ввести подсказку, по которой будет происходить генерация.
Colab
🚀 Делаем картинки из текста в стиле Pixel art
Пост для тех, кто заинтересовался возможностями нейросетей генерировать красивые, граничащие с искусством, картинки.
🌗 Внизу ссылка на Colab (среда для интерактивного запуска кода) с моделью, которая была дообучена рисовать пиксельные изображения в стиле старых игр.
Просто открывайте по ссылке и запускайте ячейки как есть, параметры по-умолчанию подобраны хорошо. Ближе к концу блокнота будет место, куда надо будет ввести подсказку, по которой будет происходить генерация.
Colab
🔥10
#gen #cv #colab
🚀 Нейроарт
Предыдущий Colab годится не только для pixelart картинок, но и в целом делает классные иллюстрации (надо убрать из подсказки слово #pixelart).
🌗 Совет, добавляйте в конец подсказки фразу ", trending on artstation" и делайте более развернутые описания. Подсказка "watercolor drawing of ..." будет рисовать акварель и так далее.
Примеры подсказок:
- illustration of other planet and futuristic gun lying on the ground, trending on artstation
- watercolor illustration, budapest on the moon, trending on artstation
- saint petersburg street cyberpunk, trending on artstation
🚀 Нейроарт
Предыдущий Colab годится не только для pixelart картинок, но и в целом делает классные иллюстрации (надо убрать из подсказки слово #pixelart).
🌗 Совет, добавляйте в конец подсказки фразу ", trending on artstation" и делайте более развернутые описания. Подсказка "watercolor drawing of ..." будет рисовать акварель и так далее.
Примеры подсказок:
- illustration of other planet and futuristic gun lying on the ground, trending on artstation
- watercolor illustration, budapest on the moon, trending on artstation
- saint petersburg street cyberpunk, trending on artstation
🔥8