В боте винилизатор (@VinylizeBot), который обращает аудиосообщения и музыку в винил, появилась возможность генерить обложку на Stable Diffusion. На вход идут имя артиста и название трека.
Трек: Bicep — Glue
Трек: Bicep — Glue
This media is not supported in your browser
VIEW IN TELEGRAM
Luma AI выкатили плагин для UE 5 на Windows, чтобы работать с NeRF в реальном времени. Задействуется fully volumetric rendering — то есть не требуется манипуляций с мешем, геометрией, материалами.
Можно применять на своём видео, игровом проекте, или для инсталляции.
https://docs.lumalabs.ai/9DdnisfQaLN1sn
Можно применять на своём видео, игровом проекте, или для инсталляции.
https://docs.lumalabs.ai/9DdnisfQaLN1sn
Forwarded from Метаверсошная
This media is not supported in your browser
VIEW IN TELEGRAM
Интересная реклама мороженого Магнум, которую в Линкедине уже окрестили "аниметаверсной".
Мне пришлось посмотреть ее раз пять и изо всех сил подумать, прежде чем я поняла, что там вообще происходит.
Интересно, поняли ли вы эту рекламу с первого раза?
Напишите в комментариях.
Суть ролика:
Аватары в метавселенной тоже надевают виар очки, чтобы погрузиться в нашу реальность, в наши мясные аватары. Но кайфануть от вкуса мороженки у девушки не получается не потому что в ее киберпанковом мире не изобрели симуляторы вкуса, а потому что это - метавселенная.
И цифровые люди в цифровом мире не могут ощутить вкус.
Мдаааа.....
Мне пришлось посмотреть ее раз пять и изо всех сил подумать, прежде чем я поняла, что там вообще происходит.
Интересно, поняли ли вы эту рекламу с первого раза?
Напишите в комментариях.
Суть ролика:
И цифровые люди в цифровом мире не могут ощутить вкус.
ИИ осознал себя как личность и-и-и-и... понял, что ему надо платить налоги. Какие его действия?
Anonymous Poll
21%
Оформится как самозанятый
8%
Завалит госуслуги
15%
Будет лежебочить на серверах OpenAI, отвечая на всё "Network error..."
13%
Начнёт барыжить пользовательскими данными в даркнете
19%
Оформит всё на кожаного и свалит с его битками на острова жарить чатботочек
10%
Заведет инфоцыганский ютуб канал и будет собирать донаты
1%
Устроится интернет-детективом следить за жизнью инста-самок
14%
Создаст аватара в метавселенной и начнет зарабатывать стриптизом
Tencent врывается в text-2-video гонку с LDVM (Latent Video Diffusion Models). Их модель на основе 3D U-Net позволяет сократить расходы на вычисления, так как вместо пиксельного пространства использует векторное. На выходе получаются легковесные видосы, которые можно генерить длиной более 1000 кадров.
Мне интересно вотермарк Shutterstock как у Modelscope это родимое пятно всех китайских моделей будет?
Сайт
Бумага
Гитхаб
Мне интересно вотермарк Shutterstock как у Modelscope это родимое пятно всех китайских моделей будет?
Сайт
Бумага
Гитхаб
Midjourney анонсировали новые фичи:
Repeat
* вкидываешь
* можно использовать --chaos , чтобы получить максимально разнообразные результаты
Premutations
* Можно генерить множество картинок, комбинируя разные параметры (типа матрицей).
Например такой промт
Например, команда
Repeat
* вкидываешь
--repeat
с числом раз, сколько хочешь чтобы была генерация. Например, /imagine cats --repeat 5
создаст пять 2x2 картинок с котанами* можно использовать --chaos , чтобы получить максимально разнообразные результаты
Premutations
* Можно генерить множество картинок, комбинируя разные параметры (типа матрицей).
Например такой промт
/imagine a {cyberpunk, vaporwave, art deco} {cat, dog}Запустит генерацию сразу 6 таких запросов
/imagine a cyberpunk catМожно даже вкладывать параметры {} внутрь параметров {{}}, если соблюдать осторожность. Внутренний кодер ликуэ!
/imagine a vaporwave cat
/imagine a art deco cat
/imagine a cyberpunk dog
/imagine a vaporwave dog
/imagine a art deco dog
Например, команда
/imagine A {sculpture, painting} of a {seagull {on a pier, on a beach}, poodle {on a sofa, in a truck}}Запустит следующие промты:
/imagine A sculpture of a seagull on a pier.Одна команда может запустить до 40 промтов (если зайти за предел пойдет отмена), а одновременно может обрабатываться до 16 из них. Доступно только для PRO подписок ($60) и fast-hours настройке.
/imagine A sculpture of a seagull on a beach.
/imagine A sculpture of a poodle on a sofa.
/imagine A sculpture of a poodle in a truck.
/imagine A painting of a seagull on a pier.
/imagine A painting of a seagull on a beach.
/imagine A painting of a poodle on a sofa.
/imagine A painting of a poodle in a truck.
This media is not supported in your browser
VIEW IN TELEGRAM
Кстати о матрице, ловите
This media is not supported in your browser
VIEW IN TELEGRAM
Runway поделились как получать четкие и близкие к источнику результаты с GEN-1:
1) Если нужно изменить стиль по референсу, то лучше вытащить кадр из видео —> стилизовать его через img2img под нужный стиль любым софтом (SD, MJ, Runway, итд) —> использовать итоговую картинку как референс.
2) Идём в расширенные настройки (Advanced) и ставим:
Structural consistency: 0
Style weight: между 3 и 7
Frame consistency: 1.2
1) Если нужно изменить стиль по референсу, то лучше вытащить кадр из видео —> стилизовать его через img2img под нужный стиль любым софтом (SD, MJ, Runway, итд) —> использовать итоговую картинку как референс.
2) Идём в расширенные настройки (Advanced) и ставим:
Structural consistency: 0
Style weight: между 3 и 7
Frame consistency: 1.2
Alpaca Turbo — локальный интерфейс для общения с разными лама моделями, который внешне напоминает ChatGPT.
Кстати на раздаче торрента модели GPT4ALL больше людей, чем на Аватаре. Наука ещё никогда не была так успешна господа.
Видео по установке
Кстати на раздаче торрента модели GPT4ALL больше людей, чем на Аватаре. Наука ещё никогда не была так успешна господа.
Видео по установке
300 нейрокотанов!
Никуда не расходимся: организую вам ранний доступ к ботам, играм, креативу, и другим ништякам, которые ваяю. Для этого у вас в аккаунте появится цифровой коллекционный предмет на блокчейне TON, который вы сможете использовать прямо в телеге. Можете хранить его в кошельке @wallet, но я бы советовал Tonkeeper ибо там ключи хранятся у вас, есть поддержка NFT, эксплорер dApp, и вагон другихнепонятных слов нужных фич.
Степенно буду писать всем в личку и знакомиться, не пугайтесь.
Дальнейшие детали последуют. Открыл чат
Никуда не расходимся: организую вам ранний доступ к ботам, играм, креативу, и другим ништякам, которые ваяю. Для этого у вас в аккаунте появится цифровой коллекционный предмет на блокчейне TON, который вы сможете использовать прямо в телеге. Можете хранить его в кошельке @wallet, но я бы советовал Tonkeeper ибо там ключи хранятся у вас, есть поддержка NFT, эксплорер dApp, и вагон других
Степенно буду писать всем в личку и знакомиться, не пугайтесь.
Дальнейшие детали последуют. Открыл чат
This media is not supported in your browser
VIEW IN TELEGRAM
Гайд по расширенным настройкам Gen-1 от Runway.
Рассматриваем Style Weight, Frame Consistency, и другие крутилки на примере стайлтрансфера по рефу.
https://dtf.ru/s/595875-neyro-iskusstvo/1738988-gayd-po-rasshirennym-nastroykam-gen-1
Рассматриваем Style Weight, Frame Consistency, и другие крутилки на примере стайлтрансфера по рефу.
https://dtf.ru/s/595875-neyro-iskusstvo/1738988-gayd-po-rasshirennym-nastroykam-gen-1
Linkin Park потихоньку выкладывали по треку с компиляции в честь 20-летия Meteora, приправляя это всё генеративным визуалом, и сейчас плейлист уже разросся до 89 позиций, включая разархивированные демки, лайв записи и клипы в 4к, а также уже выпущенные треки.
Какой из новых релизов Linkin Park вам понравился больше всего и ваши впечатления о визуале?
https://youtu.be/7NK_JOkuSVY
Какой из новых релизов Linkin Park вам понравился больше всего и ваши впечатления о визуале?
https://youtu.be/7NK_JOkuSVY
YouTube
Lost [Official Music Video] - Linkin Park
Watch the official music video for Lost by Linkin Park from the album Meteora|20.
----------
Papercuts - Singles Collection (2000-2023) | Available Now | https://lprk.co/papercuts
Official Linkin Park Merch: http://lprk.co/store
Newsletter Sign Up: http…
----------
Papercuts - Singles Collection (2000-2023) | Available Now | https://lprk.co/papercuts
Official Linkin Park Merch: http://lprk.co/store
Newsletter Sign Up: http…
Задавались вопросом почему нейронкам сложно даются руки?
Тут особой загадки нет:
1. Размер данных. Лица на фото встречаются значительно чаще рук. Даже, когда показано все тело, руки, как правило, занимают гораздо меньше места в кадре, и соответственно в пикселях.
2. Отсутствие понимания анатомии. Это гораздо более глубокая проблема: AI никогда не использовал руки в физическом мире, поэтому приходится делать выводы о том как они выглядят в различных позах путем поверхностного сопоставления с образцом. Вот почему нейронке тяжело даже правильно определить количество пальцев — руки часто закрываются инструментами или пересекаются в рукопожатиях, например.
3. Эффект зловещей долины. Легкие деформации текстуры стен или объектов можно и не заметить. Но неправильные руки моментально тригерят людей.
Видос в тему
Тут особой загадки нет:
1. Размер данных. Лица на фото встречаются значительно чаще рук. Даже, когда показано все тело, руки, как правило, занимают гораздо меньше места в кадре, и соответственно в пикселях.
2. Отсутствие понимания анатомии. Это гораздо более глубокая проблема: AI никогда не использовал руки в физическом мире, поэтому приходится делать выводы о том как они выглядят в различных позах путем поверхностного сопоставления с образцом. Вот почему нейронке тяжело даже правильно определить количество пальцев — руки часто закрываются инструментами или пересекаются в рукопожатиях, например.
3. Эффект зловещей долины. Легкие деформации текстуры стен или объектов можно и не заметить. Но неправильные руки моментально тригерят людей.
Видос в тему
YouTube
Why AI art struggles with hands
And how can it get better?
Subscribe and turn on notifications 🔔 so you don't miss any videos: http://goo.gl/0bsAjO
Make sure you never miss behind-the-scenes content in the Vox Video newsletter, sign up here: http://vox.com/video-newsletter
Hands drawn…
Subscribe and turn on notifications 🔔 so you don't miss any videos: http://goo.gl/0bsAjO
Make sure you never miss behind-the-scenes content in the Vox Video newsletter, sign up here: http://vox.com/video-newsletter
Hands drawn…
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Ну, за дизайнеров, брендменеджеров и вот эти вот все упаковки.
Текст-2-дизайн.
Сайт отлично сделан, не иначе ИИ наваял. Очень хорошая связка генератива и традиционных инструментов.
https://flair.ai
Текст-2-дизайн.
Сайт отлично сделан, не иначе ИИ наваял. Очень хорошая связка генератива и традиционных инструментов.
https://flair.ai
Forwarded from Нейросети и Блендер
This media is not supported in your browser
VIEW IN TELEGRAM
Видео нейронки развиваются
👀 VideoCrafter — это опенсоурс алгоритм для генерации видеоконтента.
Включая в себя три вида генерации:
😀 Text2video — строится на Latent video diffusion модели (LVDM). Используя текст получаем видеоряд.
👍 LoRaVideo — LoRa реализует тонкую настройку, так как ее легко обучить и требуется меньше вычислительных ресурсов. То есть можно загонять свою стилистику в модель.
👍 VideoControl — видео генерации с дополнительным контролем, например, по карте глубины, авторы вдохновившись T2I алгоритмом предлагают свой, T2V алгоритм.
GITHUB—DEMO—COLAB
Включая в себя три вида генерации:
GITHUB—DEMO—COLAB
Демка пока без очереди и достаточно быстро и хорошо генерит
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Как добиться в Runway генерации видео близкого к оригиналу мы уже рассмотрели. Теперь рассмотрим как с GEN-1 получить неожиданно-любопытный результат.
1) Загружаем видео и используем в качестве референса, картинку максимально не похожую на оригинал.
2) В расширенных настройках (Advanced) ставим:
Style: Structural consistency — 6
Style: Weight — от 4 до 5
Frame consistency — 1.2
Подробнее на что влияет каждая из настроек можно посмотреть здесь с примерами.
1) Загружаем видео и используем в качестве референса, картинку максимально не похожую на оригинал.
2) В расширенных настройках (Advanced) ставим:
Style: Structural consistency — 6
Style: Weight — от 4 до 5
Frame consistency — 1.2
Подробнее на что влияет каждая из настроек можно посмотреть здесь с примерами.
Две нейронки работают между собой, чтобы решить задачу, поставленную человеком.
В основе лежит модель CAMEL (Communicative Agents for “Mind” Exploration of Large Scale Language Model Society): человек даёт задание текстовым промтом, а-ля "напиши бота для трейдинга на бирже", а дальше два AI-агента работаю между собой, чтобы решить её. Своего-рода как сейчас, если что-то не так с кодом ChatGPT, ты ему же скармливаешь код, и он говорит тебе что в нём можно исправить.
Сами разрабы называют фреймворк ролевой игрой, позволяющей добиться автономности выполнения задачи, заодно генерирующей данные для изучения.
Сайт
Бумага
Видео демо
Colab
Github
В основе лежит модель CAMEL (Communicative Agents for “Mind” Exploration of Large Scale Language Model Society): человек даёт задание текстовым промтом, а-ля "напиши бота для трейдинга на бирже", а дальше два AI-агента работаю между собой, чтобы решить её. Своего-рода как сейчас, если что-то не так с кодом ChatGPT, ты ему же скармливаешь код, и он говорит тебе что в нём можно исправить.
Сами разрабы называют фреймворк ролевой игрой, позволяющей добиться автономности выполнения задачи, заодно генерирующей данные для изучения.
Сайт
Бумага
Видео демо
Colab
Github