Psy Eyes
4.01K subscribers
886 photos
651 videos
5 files
958 links
Креатив + AI + Web3... и мемы

Личная страница @andrey_bezryadin
Download Telegram
В боте винилизатор (@VinylizeBot), который обращает аудиосообщения и музыку в винил, появилась возможность генерить обложку на Stable Diffusion. На вход идут имя артиста и название трека.

Трек: Bicep — Glue
This media is not supported in your browser
VIEW IN TELEGRAM
Luma AI выкатили плагин для UE 5 на Windows, чтобы работать с NeRF в реальном времени. Задействуется fully volumetric rendering — то есть не требуется манипуляций с мешем, геометрией, материалами.

Можно применять на своём видео, игровом проекте, или для инсталляции.

https://docs.lumalabs.ai/9DdnisfQaLN1sn
This media is not supported in your browser
VIEW IN TELEGRAM
Интересная реклама мороженого Магнум, которую в Линкедине уже окрестили "аниметаверсной".

Мне пришлось посмотреть ее раз пять и изо всех сил подумать, прежде чем я поняла, что там вообще происходит.

Интересно, поняли ли вы эту рекламу с первого раза?
Напишите в комментариях.

Суть ролика:
Аватары в метавселенной тоже надевают виар очки, чтобы погрузиться в нашу реальность, в наши мясные аватары. Но кайфануть от вкуса мороженки у девушки не получается не потому что в ее киберпанковом мире не изобрели симуляторы вкуса, а потому что это - метавселенная.
И цифровые люди в цифровом мире не могут ощутить вкус.
Мдаааа.....
Tencent врывается в text-2-video гонку с LDVM (Latent Video Diffusion Models). Их модель на основе 3D U-Net позволяет сократить расходы на вычисления, так как вместо пиксельного пространства использует векторное. На выходе получаются легковесные видосы, которые можно генерить длиной более 1000 кадров.

Мне интересно вотермарк Shutterstock как у Modelscope это родимое пятно всех китайских моделей будет?

Сайт
Бумага
Гитхаб
Midjourney анонсировали новые фичи:

Repeat
* вкидываешь --repeat с числом раз, сколько хочешь чтобы была генерация. Например, /imagine cats --repeat 5 создаст пять 2x2 картинок с котанами
* можно использовать --chaos , чтобы получить максимально разнообразные результаты

Premutations
* Можно генерить множество картинок, комбинируя разные параметры (типа матрицей).

Например такой промт
/imagine a {cyberpunk, vaporwave, art deco} {cat, dog}

Запустит генерацию сразу 6 таких запросов
/imagine a cyberpunk cat
/imagine a vaporwave cat
/imagine a art deco cat
/imagine a cyberpunk dog
/imagine a vaporwave dog
/imagine a art deco dog

Можно даже вкладывать параметры {} внутрь параметров {{}}, если соблюдать осторожность. Внутренний кодер ликуэ!

Например, команда
/imagine A {sculpture, painting} of a {seagull {on a pier, on a beach}, poodle {on a sofa, in a truck}}

Запустит следующие промты:
/imagine A sculpture of a seagull on a pier. 
/imagine A sculpture of a seagull on a beach.
/imagine A sculpture of a poodle on a sofa.
/imagine A sculpture of a poodle in a truck.
/imagine A painting of a seagull on a pier.
/imagine A painting of a seagull on a beach.
/imagine A painting of a poodle on a sofa.
/imagine A painting of a poodle in a truck.

Одна команда может запустить до 40 промтов (если зайти за предел пойдет отмена), а одновременно может обрабатываться до 16 из них. Доступно только для PRO подписок ($60) и fast-hours настройке.
This media is not supported in your browser
VIEW IN TELEGRAM
Кстати о матрице, ловите
This media is not supported in your browser
VIEW IN TELEGRAM
Runway поделились как получать четкие и близкие к источнику результаты с GEN-1:

1) Если нужно изменить стиль по референсу, то лучше вытащить кадр из видео —> стилизовать его через img2img под нужный стиль любым софтом (SD, MJ, Runway, итд) —> использовать итоговую картинку как референс.

2) Идём в расширенные настройки (Advanced) и ставим:

Structural consistency: 0
Style weight: между 3 и 7
Frame consistency: 1.2
Alpaca Turbo — локальный интерфейс для общения с разными лама моделями, который внешне напоминает ChatGPT.

Кстати на раздаче торрента модели GPT4ALL больше людей, чем на Аватаре. Наука ещё никогда не была так успешна господа.

Видео по установке
300 нейрокотанов!

Никуда не расходимся: организую вам ранний доступ к ботам, играм, креативу, и другим ништякам, которые ваяю. Для этого у вас в аккаунте появится цифровой коллекционный предмет на блокчейне TON, который вы сможете использовать прямо в телеге. Можете хранить его в кошельке @wallet, но я бы советовал Tonkeeper ибо там ключи хранятся у вас, есть поддержка NFT, эксплорер dApp, и вагон других непонятных слов нужных фич.

Степенно буду писать всем в личку и знакомиться, не пугайтесь.

Дальнейшие детали последуют. Открыл чат
This media is not supported in your browser
VIEW IN TELEGRAM
Гайд по расширенным настройкам Gen-1 от Runway.

Рассматриваем Style Weight, Frame Consistency, и другие крутилки на примере стайлтрансфера по рефу.

https://dtf.ru/s/595875-neyro-iskusstvo/1738988-gayd-po-rasshirennym-nastroykam-gen-1
Linkin Park потихоньку выкладывали по треку с компиляции в честь 20-летия Meteora, приправляя это всё генеративным визуалом, и сейчас плейлист уже разросся до 89 позиций, включая разархивированные демки, лайв записи и клипы в 4к, а также уже выпущенные треки.

Какой из новых релизов Linkin Park вам понравился больше всего и ваши впечатления о визуале?

https://youtu.be/7NK_JOkuSVY
Задавались вопросом почему нейронкам сложно даются руки?

Тут особой загадки нет:

1. Размер данных. Лица на фото встречаются значительно чаще рук. Даже, когда показано все тело, руки, как правило, занимают гораздо меньше места в кадре, и соответственно в пикселях.

2. Отсутствие понимания анатомии. Это гораздо более глубокая проблема: AI никогда не использовал руки в физическом мире, поэтому приходится делать выводы о том как они выглядят в различных позах путем поверхностного сопоставления с образцом. Вот почему нейронке тяжело даже правильно определить количество пальцев — руки часто закрываются инструментами или пересекаются в рукопожатиях, например.

3. Эффект зловещей долины. Легкие деформации текстуры стен или объектов можно и не заметить. Но неправильные руки моментально тригерят людей.

Видос в тему
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Ну, за дизайнеров, брендменеджеров и вот эти вот все упаковки.

Текст-2-дизайн.

Сайт отлично сделан, не иначе ИИ наваял. Очень хорошая связка генератива и традиционных инструментов.

https://flair.ai
This media is not supported in your browser
VIEW IN TELEGRAM
Видео нейронки развиваются

👀 VideoCrafter — это опенсоурс алгоритм для генерации видеоконтента.
Включая в себя три вида генерации:

😀 Text2video — строится на Latent video diffusion модели (LVDM). Используя текст получаем видеоряд.

👍 LoRaVideoLoRa реализует тонкую настройку, так как ее легко обучить и требуется меньше вычислительных ресурсов. То есть можно загонять свою стилистику в модель.

👍 VideoControl — видео генерации с дополнительным контролем, например, по карте глубины, авторы вдохновившись T2I алгоритмом предлагают свой, T2V алгоритм.

GITHUBDEMOCOLAB

Демка пока без очереди и достаточно быстро и хорошо генерит
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Как добиться в Runway генерации видео близкого к оригиналу мы уже рассмотрели. Теперь рассмотрим как с GEN-1 получить неожиданно-любопытный результат.

1) Загружаем видео и используем в качестве референса, картинку максимально не похожую на оригинал.

2) В расширенных настройках (Advanced) ставим:

Style: Structural consistency — 6
Style: Weight — от 4 до 5
Frame consistency — 1.2

Подробнее на что влияет каждая из настроек можно посмотреть здесь с примерами.
Две нейронки работают между собой, чтобы решить задачу, поставленную человеком.

В основе лежит модель CAMEL (Communicative Agents for “Mind” Exploration of Large Scale Language Model Society): человек даёт задание текстовым промтом, а-ля "напиши бота для трейдинга на бирже", а дальше два AI-агента работаю между собой, чтобы решить её. Своего-рода как сейчас, если что-то не так с кодом ChatGPT, ты ему же скармливаешь код, и он говорит тебе что в нём можно исправить.

Сами разрабы называют фреймворк ролевой игрой, позволяющей добиться автономности выполнения задачи, заодно генерирующей данные для изучения.

Сайт
Бумага
Видео демо
Colab
Github