Derp Learning
13.1K subscribers
3.18K photos
916 videos
9 files
1.32K links
Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Download Telegram
Потыкал тут denigma.app
Эдакий copilot-наоборот - пишет развернутое объяснение на основе кода.

Если в мелочах, бывает, ошибается (особенно часто его сбивают с толку названия переменных), то в целом довольно неплохо описывает то, что делает код.
Forwarded from AbstractDL
YOLaT: image recognition для векторных картинок (by Microsoft)

Похоже, это первая нейронка, которая может классифицировать и детектировать объекты в векторной графике без растеризации.

В отличие от пиксельных картинок, векторные состоят из аналитически выраженных геометрических фигур и, поэтому, их эквивалентное разрешение может быть бесконечным. Это делает невозможным использование стандартных методов image recognition.

Что предлагают авторы:
1. Преобразовать векторный файл в набор кривых Безье.
2. Кривые Безье превратить в ненаправленный мультиграф.
3. Запихнуть этот граф в графовую нейросеть.

Их метод демонстрирует state-of-the-art результат, работает в 100 раз быстрее, чем растеризация+CNN и требует в 25 раз меньше параметров.

Статья
В ламповый двухголовый колаб VQGAN+ CLIP (ViT/RN50) добавили фрактальный шум в качестве стартовой картинки.

На картинке запрос "sheep on the grass land by greg rutkowski #8bit #pixelart" CLIP\ViT-B32 и все три вида инициализации. Вот же они, слева направо: pyramid noise, perlin noise, vqgan z-rand, чингачгук
С perlin noise получился забавный тилт-шифт эффект.
Там это, Microsoft решили подвинуть DALL-E на пьедестале text2image и еще в 7 задачах.

Встречайте: NUWAще
Говорят, что их детище превзошло DALL-E в задаче текст->изображение, а еще может в скетч->изображение, удаление объектов, дополнение картинки.
Причем не только восстанавливать нижнюю часть, как DALL-E, но и правую, и картинку из нескольких патчей (на эту тему совсем недавно была публикация)
Также может делать все это, но для видео, в том числе предсказывать следующие кадры.

Все благодаря новому attention-механизму - 3D Nearby Attention (3DNA)

Кода нет, поэтому пока верим на слово.
Гит
Публикация
👍1
В какое отделение Сбера обращаться, чтобы они обучили ruNUWA?
Forwarded from AR/VR Engineer
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️Редактирование 2D текстур 3D моделей в Procreate

Возможно вы уже слышали про апдейт Procreate'a, который дает возможность работать с 3D моделями, а также изменять 2D текстуры и просматривать модели в дополненной реальности.

freya.arts сделала наглядный пример работы этой фичи, и это действительно супер юзабельно.

Подробнее о фиче в хэндбуке Procreate.

AR/VR Designer
Sensortower #датасет

Как-то парсил сайт с аналитикой мобильных приложений. Теперь он ваш:

🔺 downloads, purchases, rating, rating_count, price
🔺 publisher, category, supported countries, description
🔺 in app purchases + price
🔺 "похожие" приложения

Данные (80к приложений) 👇
ruDalle
"Пиратский корабль сражается с волнами во время бури - Иван Айвазовский и Росс Тран"
ruDalle "логотип билайн"
Лебедев, подвинься!
Крутой колаб на kaggle по тюну ruDALL-e на эмодзи. Датасет для тюна в комплекте.

К тому, кто первый соберет все яй сгенерит стикерпак из взрывающихся баклажанов, приедет Дуров и покажет мультфильм!
"a mysterious orb in a field of beautiful orchid flowers, matte painting trending on artstation" (CLIP guided diffusion) by nshepperd

Колаб