эйай ньюз

Классный эксперимент. Серое изображение раскрашивается в цвета таким образом, чтобы с точки зрения эмбеддинга CLIP раскраска была наиболее близка к стилю известных художников. Лосс итеративо уменьшается обновлением цветов. Спектакулярно!

Все-таки мощная штука этот ваш CLIP.

11.4K views10:51

эйай ньюз

Forwarded from Мишин Лернинг 🇺🇦🇮🇱

👾🎨 Denis Sexy IT 🤖+ Мишин Лернинг🤖🎓= Text2PixelArt + Zero-Shot PixelArt Style Transfer

◾️ Пару дней назад я выложил колаб по Text2PixelArt Мишин Лернинг 🤖🎓 Resolution Mod, который расширял функционал: давал возможность выбирать разрешение + улучшал качество картинки.

◾️ Сегодня Denis Sexy IT 🤖 собрал крутой колаб, основная идея которого: Zero-Shot PixelArt Style Transfer. Просто представьте, Style Transfer для которого не нужно ни одного примера (0-shot)! Этот мод дает возможность выбирать изображение, с которого начнется оптимизация. Такой подход дает невероятные возможности! Не зря говорят: Good Init Is All You Need!

Встречайте симбиоз этих двух лучших версий!

p.s.: Дополнительные благодарности: mlart, ViktorAlm, dribnet

🔮Text2PixelArt + Zero-Shot PixelArt Style Transfer = Mishin Learning + Denis Sexy IT

10.0K views16:07

Наткнулся на интересный стартап allseated, который помогает организовывать виртуальные ивенты. Стартапчик поднял в сумме $8.4 млн. Вот бы кто-то догадался во время этой пандемии сделать что-то похожее для CVPR, ICCV, NeurIPS. Было бы гораздо веселее. Согласны?

10.3K views05:59

эйай ньюз

Тут коллаб для улучшения качества фоток лица. Очень любопытно. Думаю, что-то такое под капотом у китайских телефонов типа Сяоми и Хуавея (эксперты могут меня поправить в комментах).

Собираюсь потыкать коллаб.
GPEN выглядит хорошо, но можно сказать "переигрывает". Илонка там сам на себя не очень похож.

Заметки

10.2K viewsedited 23:38

эйай ньюз

Чёт проорал. Вы знали, L'Oreal теперь не только косметику делает но и дип лернинг ресерч?

Например, в этой работе с воркшопа ECCV2020 они улучшили генерацию постаревших людей. Трюк в том, чтобы добавить SPADE-нормализацию в декодер, которая обусловлена маской старости. То есть там можно явно подстроить как сильно какой регион лица нужно состарить. Смотрим как это выглядит на видео.

Довольно неплохо. Для Лореаля.

https://despoisj.github.io/AgingMapGAN/

10.1K views18:47

эйай ньюз

0:40

This media is not supported in your browser

VIEW IN TELEGRAM

0:40

This media is not supported in your browser

VIEW IN TELEGRAM

Вот пример, как меняется результат в зависимости от входной маски.

10.1K views18:47

эйай ньюз

Robust High-Resolution Video Matting with Temporal Guidance

Чуваки из TitkTok (ByteDance) и университета Вашингтона придумали новый SOTA метод для маттинга и сегментации людей на видео. Выдаёт 76 FPS в разрешении 4K! Сеть выглядит как U-Net, но интересно, что они засунули конволюционные GRU-слои перед каждым апскейлингом в декодере. Таким образом сеть может использовать временной контекст и лучше отделять статический фон от подвижных людей. Внизу смотрим видео с результатами.

Сайт проекта.

11.3K views21:21

10.9K views21:21

Ответ на вопрос в комменты😅.
Есть тут ещё адепты Vim-а (кроме меня)?

11.0K views14:52

эйай ньюз

Так так. Руки на стол!
Да, эти красавицы сгенерированы с помощью StyleGAN2 (слегка модифицированным). Я в шоке от качества. И зубы и глаза, все как натуральное.

Сделано by l4rz из твиттера. Автор обещает написать пост о техических деталях, когда закончит с экспериментами.

13.9K views21:51

эйай ньюз

Forwarded from Мишин Лернинг 🇺🇦🇮🇱

🤖🏆 SimVLM — Новый CLIP

Представьте себе одну модель, которая может:
- Классифицировать фото
- Отвечать на вопросы по фото
- Дополнять текстовые описания
- Решать задачу «визуального обоснования»
- Выполнять мультимодальный перевод

А самое главное, делать все это в режиме zero-shot (обучение без обучения)!

Встречайте: SimVLM, который по факту является мультимодальной сетью Text + Image (как CLIP), с классической трансформер архитектурой. ViT+Bert энкодер + декодер GPT (см картинку поста).

Такой текстовый-визуальный претрейн сравнили с современными (SOTA) методами, включая LXMERT, VL-T5, UNITER, OSCAR, Villa, SOHO, UNIMO и VinVL.

SimVLM превосходит все существующие модели и бьет SOTA по всем рассматриваемым задачам, часто со значительным отрывом.

Скоро сделаю подробный обзор архитектуры.

📄 paper

#sota #paper #multimodal #zeroshot #сохраненки

9.4K views19:11

эйай ньюз

Немного ликбеза об эффективных сетках. Pt.1

Все слышали о MobileNetV1. Это одна из первых нейронок от Google из линейки быстрых и эффективных, предназначенных для запуска на мобильных устройствах с ограниченными ресурсами.

Главная идея там была по сравнению с обычными сетками, такими как VGG, - это depthwise separable convolutions. То есть обычную конволюцию k × k × C_in × C_out, где С_in - это число входных каналов, заменяют на две более лёгких: а) depthwise convolution, k × k × 1 × 1, которую применяют к каждому из C_in входных каналов независимо, и б) pointwise convolution 1 × 1 × C_in × C_out, которая комбинирует сигналы из C_in входных каналов и преобразует в C_out выходных.

Таким образом значительно уменьшается количество обучаемых параметров (k² + C_in×C_out против k²×C_in×C_out), и увеличивется скорость вычисления при очень небольших потерях точности.

Подробный разбор MobileNetV1 можно глянуть тут. В следующем посте напишу про MobileNetV2.

#ликбез
#efficient_nets

11.2K viewsedited 12:58

эйай ньюз

Появился НейроПутин. Бот на основе GPT-2 думает,что он Володя Путин, и можно ему позадавать каверзные вопросы.

Кстати, В.В. говорит, что Илону Маску верить не стоит.

Поговорить с ним можно тут: @neural_chat_bot.

16.0K viewsedited 22:41

эйай ньюз

В дополнение к предыдущему посту, где генерились ралистичные девушки. Есть собрание трюков о том, как автор увеличивал мощность стандартного StyleGAN2, раздувая количества параметров, меняя архитектуру, и по-особому подготавливая датасет.

Все трюки и подробности здесь.

11.7K viewsedited 21:33

эйай ньюз

Скажу вам по секрету, что монорепа - это такая боль. Особенно когда вам в проект коммитит тысяча человек. Естественно, что не всё, что работало неделю назад, будет работа сегодня. Тут я бы вставил лицо Гарольда, который улыбается через боль.

Atlassian

Monorepos in Git | Atlassian Git Tutorial

A monorepo is a repository that contains more than one logical project. Read here to learn about conceptual challenges, performance issues and more.

10.1K views14:13

эйай ньюз

Еще представьте себе ситуацию, что каждое утро, когда вы делаете git/hg pull и запускаете тренить свой "искусственный интеллект", то у вас попутно компилируется и собирается bleeding-edge pytorch со всеми сопутствующими.

10.1K views14:19

эйай ньюз

C 1 Октября наш любимчик Юрген Шмидхубер возглавит AI исследования в King Abdullah University of Science and Technology (KAUS) в Саудовской Аравии.

Интересный шаг. Видимо, ему насыпали очень приличную гору кэша, от которой он не смог отказаться.

Для тех, кто не знает Шмидхубера. Это тот мужик, который придумал любую вашу научную идею до вас, и опубликовал её еще в 90-х. Например, те же Ганы, LSTM и т.д.

Если кроме шуток, то в KAUST-е очень топово делать PhD, при условии, что можете жить в жаре, любите домашнее вино и не боитесь быть забитыми камнями. Профессоров покупают со всего мира. Аспиранту там платят около $4500 в месяц, нет никаких налогов. Вот тут можно податься к Юргену.

12.3K viewsedited 18:22

эйай ньюз

0:14

This media is not supported in your browser

VIEW IN TELEGRAM

Интересное приложении для AR примерки шмоток: DressX. Видно, это сейчас в тренде.

Есть в апсторе.

11.1K views20:55

эйай ньюз

В элитном интерактивном онлайн-журнале distill.pub вышла статья: "Нежное Введение в Графовые Нейронные Сети"

Мой рекомендасион.
https://distill.pub/2021/gnn-intro/

Ктати, это одна из последних статей в этом журнале. К сожалению, редакторы жёстко выгорели за пять лет поддержания такой высокой планки качества.

14.0K views11:57

About

Blog

Apps

Platform