Psy Eyes

В боте винилизатор (@VinylizeBot), который обращает аудиосообщения и музыку в винил, появилась возможность генерить обложку на Stable Diffusion. На вход идут имя артиста и название трека.

Трек: Bicep — Glue

547 viewsAndrey Bezryadin, edited 17:19

Psy Eyes

0:40

This media is not supported in your browser

VIEW IN TELEGRAM

Luma AI выкатили плагин для UE 5 на Windows, чтобы работать с NeRF в реальном времени. Задействуется fully volumetric rendering — то есть не требуется манипуляций с мешем, геометрией, материалами.

Можно применять на своём видео, игровом проекте, или для инсталляции.

https://docs.lumalabs.ai/9DdnisfQaLN1sn

579 viewsAndrey Bezryadin, edited 14:03

Psy Eyes

Forwarded from Метаверсошная

1:43

This media is not supported in your browser

VIEW IN TELEGRAM

Интересная реклама мороженого Магнум, которую в Линкедине уже окрестили "аниметаверсной".

Мне пришлось посмотреть ее раз пять и изо всех сил подумать, прежде чем я поняла, что там вообще происходит.

Интересно, поняли ли вы эту рекламу с первого раза?
Напишите в комментариях.

Суть ролика:
Аватары в метавселенной тоже надевают виар очки, чтобы погрузиться в нашу реальность, в наши мясные аватары. Но кайфануть от вкуса мороженки у девушки не получается не потому что в ее киберпанковом мире не изобрели симуляторы вкуса, а потому что это - метавселенная.
И цифровые люди в цифровом мире не могут ощутить вкус.
Мдаааа.....

428 viewsAndrey Bezryadin, 17:08

Psy Eyes

ИИ осознал себя как личность и-и-и-и... понял, что ему надо платить налоги. Какие его действия?

Anonymous Poll

21%

Оформится как самозанятый

Завалит госуслуги

15%

Будет лежебочить на серверах OpenAI, отвечая на всё "Network error..."

13%

Начнёт барыжить пользовательскими данными в даркнете

19%

Оформит всё на кожаного и свалит с его битками на острова жарить чатботочек

10%

Заведет инфоцыганский ютуб канал и будет собирать донаты

Устроится интернет-детективом следить за жизнью инста-самок

14%

Создаст аватара в метавселенной и начнет зарабатывать стриптизом

227 voters1.4K viewsAndrey Bezryadin, 06:54

Psy Eyes

0:02

This media is not supported in your browser

VIEW IN TELEGRAM

0:02

This media is not supported in your browser

VIEW IN TELEGRAM

0:02

This media is not supported in your browser

VIEW IN TELEGRAM

0:02

This media is not supported in your browser

VIEW IN TELEGRAM

Tencent врывается в text-2-video гонку с LDVM (Latent Video Diffusion Models). Их модель на основе 3D U-Net позволяет сократить расходы на вычисления, так как вместо пиксельного пространства использует векторное. На выходе получаются легковесные видосы, которые можно генерить длиной более 1000 кадров.

Мне интересно вотермарк Shutterstock как у Modelscope это родимое пятно всех китайских моделей будет?

Сайт
Бумага
Гитхаб

548 viewsAndrey Bezryadin, 18:29

Psy Eyes

Midjourney анонсировали новые фичи:

Repeat
* вкидываешь --repeat с числом раз, сколько хочешь чтобы была генерация. Например, /imagine cats --repeat 5 создаст пять 2x2 картинок с котанами
* можно использовать --chaos , чтобы получить максимально разнообразные результаты

Premutations
* Можно генерить множество картинок, комбинируя разные параметры (типа матрицей).

Например такой промт

/imagine a {cyberpunk, vaporwave, art deco} {cat, dog}

Запустит генерацию сразу 6 таких запросов

/imagine a cyberpunk cat
/imagine a vaporwave cat
/imagine a art deco cat
/imagine a cyberpunk dog
/imagine a vaporwave dog
/imagine a art deco dog

Можно даже вкладывать параметры {} внутрь параметров {{}}, если соблюдать осторожность. Внутренний кодер ликуэ!

Например, команда

/imagine A {sculpture, painting} of a {seagull {on a pier, on a beach}, poodle {on a sofa, in a truck}}

Запустит следующие промты:

/imagine A sculpture of a seagull on a pier. 
/imagine A sculpture of a seagull on a beach. 
/imagine A sculpture of a poodle on a sofa. 
/imagine A sculpture of a poodle in a truck. 
/imagine A painting of a seagull on a pier.  
/imagine A painting of a seagull on a beach.  
/imagine A painting of a poodle on a sofa.  
/imagine A painting of a poodle in a truck.

Одна команда может запустить до 40 промтов (если зайти за предел пойдет отмена), а одновременно может обрабатываться до 16 из них. Доступно только для PRO подписок ($60) и fast-hours настройке.

663 viewsAndrey Bezryadin, edited 10:53

Psy Eyes

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

Кстати о матрице, ловите

925 viewsAndrey Bezryadin, edited 13:09

Psy Eyes

0:46

This media is not supported in your browser

VIEW IN TELEGRAM

Runway поделились как получать четкие и близкие к источнику результаты с GEN-1:

1) Если нужно изменить стиль по референсу, то лучше вытащить кадр из видео —> стилизовать его через img2img под нужный стиль любым софтом (SD, MJ, Runway, итд) —> использовать итоговую картинку как референс.

2) Идём в расширенные настройки (Advanced) и ставим:

Structural consistency: 0
Style weight: между 3 и 7
Frame consistency: 1.2

1.7K viewsAndrey Bezryadin, 14:06

Psy Eyes

Alpaca Turbo — локальный интерфейс для общения с разными лама моделями, который внешне напоминает ChatGPT.

Кстати на раздаче торрента модели GPT4ALL больше людей, чем на Аватаре. Наука ещё никогда не была так успешна господа.

Видео по установке

781 viewsAndrey Bezryadin, 16:44

Psy Eyes

300 нейрокотанов!

Никуда не расходимся: организую вам ранний доступ к ботам, играм, креативу, и другим ништякам, которые ваяю. Для этого у вас в аккаунте появится цифровой коллекционный предмет на блокчейне TON, который вы сможете использовать прямо в телеге. Можете хранить его в кошельке @wallet, но я бы советовал Tonkeeper ибо там ключи хранятся у вас, есть поддержка NFT, эксплорер dApp, и вагон других ~~непонятных слов~~ нужных фич.

Степенно буду писать всем в личку и знакомиться, не пугайтесь.

Дальнейшие детали последуют. Открыл чат

694 viewsAndrey Bezryadin, edited 20:08

Psy Eyes

This media is not supported in your browser

VIEW IN TELEGRAM

Гайд по расширенным настройкам Gen-1 от Runway.

Рассматриваем Style Weight, Frame Consistency, и другие крутилки на примере стайлтрансфера по рефу.

https://dtf.ru/s/595875-neyro-iskusstvo/1738988-gayd-po-rasshirennym-nastroykam-gen-1

5.7K viewsAndrey Bezryadin, edited 08:24

Psy Eyes

Linkin Park потихоньку выкладывали по треку с компиляции в честь 20-летия Meteora, приправляя это всё генеративным визуалом, и сейчас плейлист уже разросся до 89 позиций, включая разархивированные демки, лайв записи и клипы в 4к, а также уже выпущенные треки.

Какой из новых релизов Linkin Park вам понравился больше всего и ваши впечатления о визуале?

https://youtu.be/7NK_JOkuSVY

YouTube

Lost [Official Music Video] - Linkin Park

Watch the official music video for Lost by Linkin Park from the album Meteora|20.
----------
Papercuts - Singles Collection (2000-2023) | Available Now | https://lprk.co/papercuts

Official Linkin Park Merch: http://lprk.co/store
Newsletter Sign Up: http…

637 viewsAndrey Bezryadin, edited 18:39

Psy Eyes

Задавались вопросом почему нейронкам сложно даются руки?

Тут особой загадки нет:

1. Размер данных. Лица на фото встречаются значительно чаще рук. Даже, когда показано все тело, руки, как правило, занимают гораздо меньше места в кадре, и соответственно в пикселях.

2. Отсутствие понимания анатомии. Это гораздо более глубокая проблема: AI никогда не использовал руки в физическом мире, поэтому приходится делать выводы о том как они выглядят в различных позах путем поверхностного сопоставления с образцом. Вот почему нейронке тяжело даже правильно определить количество пальцев — руки часто закрываются инструментами или пересекаются в рукопожатиях, например.

3. Эффект зловещей долины. Легкие деформации текстуры стен или объектов можно и не заметить. Но неправильные руки моментально тригерят людей.

Видос в тему

YouTube

Why AI art struggles with hands

And how can it get better?

Subscribe and turn on notifications 🔔 so you don't miss any videos: http://goo.gl/0bsAjO

Make sure you never miss behind-the-scenes content in the Vox Video newsletter, sign up here: http://vox.com/video-newsletter

Hands drawn…

546 viewsAndrey Bezryadin, 07:23

Psy Eyes

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:25

This media is not supported in your browser

VIEW IN TELEGRAM

Ну, за дизайнеров, брендменеджеров и вот эти вот все упаковки.

Текст-2-дизайн.

Сайт отлично сделан, не иначе ИИ наваял. Очень хорошая связка генератива и традиционных инструментов.

https://flair.ai

508 viewsAndrey Bezryadin, 20:19

Psy Eyes

Forwarded from Нейросети и Блендер

0:02

This media is not supported in your browser

VIEW IN TELEGRAM

Видео нейронки развиваются

👀

VideoCrafter — это опенсоурс алгоритм для генерации видеоконтента.
Включая в себя три вида генерации:

😀

Text2video — строится на Latent video diffusion модели (LVDM). Используя текст получаем видеоряд.

👍

LoRaVideo — LoRa реализует тонкую настройку, так как ее легко обучить и требуется меньше вычислительных ресурсов. То есть можно загонять свою стилистику в модель.

👍

VideoControl — видео генерации с дополнительным контролем, например, по карте глубины, авторы вдохновившись T2I алгоритмом предлагают свой, T2V алгоритм.

GITHUB—DEMO—COLAB

Демка пока без очереди и достаточно быстро и хорошо генерит

Please open Telegram to view this post

VIEW IN TELEGRAM

484 viewsAndrey Bezryadin, 07:33

Psy Eyes

0:51

This media is not supported in your browser

VIEW IN TELEGRAM

Как добиться в Runway генерации видео близкого к оригиналу мы уже рассмотрели. Теперь рассмотрим как с GEN-1 получить неожиданно-любопытный результат.

1) Загружаем видео и используем в качестве референса, картинку максимально не похожую на оригинал.

2) В расширенных настройках (Advanced) ставим:

Style: Structural consistency — 6
Style: Weight — от 4 до 5
Frame consistency — 1.2

Подробнее на что влияет каждая из настроек можно посмотреть здесь с примерами.

3.2K viewsAndrey Bezryadin, edited 18:00

Psy Eyes

0:23

This media is not supported in your browser

VIEW IN TELEGRAM

Две нейронки работают между собой, чтобы решить задачу, поставленную человеком.

В основе лежит модель CAMEL (Communicative Agents for “Mind” Exploration of Large Scale Language Model Society): человек даёт задание текстовым промтом, а-ля "напиши бота для трейдинга на бирже", а дальше два AI-агента работаю между собой, чтобы решить её. Своего-рода как сейчас, если что-то не так с кодом ChatGPT, ты ему же скармливаешь код, и он говорит тебе что в нём можно исправить.

Сами разрабы называют фреймворк ролевой игрой, позволяющей добиться автономности выполнения задачи, заодно генерирующей данные для изучения.

Сайт
Бумага
Видео демо
Colab
Github

724 viewsAndrey Bezryadin, 18:38

About

Blog

Apps

Platform