Метаверсище и ИИще

Ну, за ротоскоперов и композеров.

Adobe Project Fast Fill - это, по сути, Generative Fill в Photoshop, но для видео.
Adobe утверждает, что это работает даже в очень сложных сценах с меняющимися условиями освещения.
Где и когда: "это позволяет на раннем этапе увидеть, что может дать генеративный искусственный интеллект с текстовой подсказкой в инструментах видеомонтажа Adobe, включая Premiere Pro и After Effects".

Adobe Max не перестает удивлять.

🔥59👍7

6.63K viewsSergey Tsyptsyn ️️, 11:12

Метаверсище и ИИще

This media is not supported in your browser

VIEW IN TELEGRAM

Adobe Project Draw & Delight.
Такие поделки мы уже видели от Нвидия, Метачки и других китайских аспирантов, но они никогда не доходят до продукта.
А тут есть большая вероятность увидеть это в продуктах. Например в Иллюстраторе.
Здесь пользователь может набросать грубый эскиз и добавить текстовую подсказку, а Firefly Vector затем превратит это векторный(!) рисунок.

🔥54👍12

5.44K viewsSergey Tsyptsyn ️️, 11:18

Метаверсище и ИИще

This media is not supported in your browser

VIEW IN TELEGRAM

Adobe Poseable
А вот вам и ControlNet от Адобченко!

Причем с 3Д-камерой, манипуляторами и всеми прочими ништяками.

"Вместо того чтобы тратить время на редактирование каждой мельчайшей детали сцены - фона, различных ракурсов и поз отдельных персонажей или способов взаимодействия персонажа с окружающими объектами в сцене, - пользователи могут использовать ~~ControlNet~~ Adobe Poseable и использовать модели генерации изображений для быстрого рендеринга 3D-сцен с персонажами".
Огонь!

🔥45👍7👎1

5.48K viewsSergey Tsyptsyn ️️, 11:25

Метаверсище и ИИще

0:37

This media is not supported in your browser

VIEW IN TELEGRAM

АдобеДабДабДаб!

Ну за актеров дубляжа и переводчиков.
Недавно ElevenLabs конкретно обновился и теперь умеет делать нейродубляж видео с сохранением оригинального голоса.
А вот и ответочка от Адобченко!

Adobe Project Dub Dub Dub может автоматически переводить голосовую запись или звуковую дорожку видео на огромное количество поддерживаемых языков, сохраняя при этом голос диктора. Другими словами, вы можете услышать, как вас переводят на французский, немецкий, испанский, арабский и другие языки, а полученный диалог автоматически выравнивается в соответствии с тем, как он был произнесен в оригинале.

И это не сервис попрошайка, это встраивание в линейку продуктов.

🔥48👍2

6.68K viewsSergey Tsyptsyn ️️, 11:56

Метаверсище и ИИще

0:43

This media is not supported in your browser

VIEW IN TELEGRAM

Ну, за Topaz AI.

Adobe Project Res Up - апскейл видео в 4 раза на основе дифузионных моделей. С обрезкой и прочими пирогами.

🔥42

5.26K viewsSergey Tsyptsyn ️️, 12:05

Метаверсище и ИИще

This media is not supported in your browser

VIEW IN TELEGRAM

Продолжим за взрослый композ для кино и видео.

Я уже начал этот разговор тут, в посте про Tech-VA.

Держите работу номер 1. Это пока подводка.

XMem++: Production-level Video Segmentation From Few Annotated Frames

Вдохновленные примерами из киноиндустрии, мы представляем XMem++ - интерактивный инструмент для сегментации видеообъектов, который выполняет высокоточную сегментацию в сложных и проблемных сценах, имея всего несколько размеченных примеров.

В сцене кто-то надел не ту рубашку? Татуировка, которой там не должно быть? Нужно добавить немного CGI к очень специфической части объекта?
А может быть, вам нужно быстро разметить несколько наборов данных для сегментации видео с необычными/уникальными объектами?

Кстати, авторы работы из Адобченко и Пинтереста.

https://xmem2.surge.sh/

👍11

4.67K viewsSergey Tsyptsyn ️️, edited 12:16

Метаверсище и ИИще

0:48

This media is not supported in your browser

VIEW IN TELEGRAM

Продолжим за взрослый композ для кино и видео.

Держите работу номер 2. Это тоже пока подводка.
ProPainter: Improving Propagation and Transformer for Video Inpainting

Object Removal: remove the object(s) from a video.
Video Completion: complete the masked video.
Video Outpainting: expand the view of a video.

Тут много умных слов:

https://shangchenzhou.com/projects/ProPainter/

🔥9

4.74K viewsSergey Tsyptsyn ️️, 12:23

Метаверсище и ИИще

1:28

This media is not supported in your browser

VIEW IN TELEGRAM

Завершаем разговор за взрослый композ для кино и видео.

А теперь берем
XMem++: Production-level Video Segmentation From Few Annotated Frames
и
ProPainter: Improving Propagation and Transformer for Video Inpainting
из предыдущих постов.
и засовываем все это в Nuke!

И получаем Auto Roto in Foundry Nuke by XMEM++ and Remove object Propainter

Пока Фаундри и другие корпораты задумчиво взирают на происходящее, взрослые композеры берут и прикручивают все эти крутые бумаги и фичи сами.
Видео длинное и понятное только композерам, но зато музыка хорошая, китайская.
Полное видео тут:
https://youtu.be/7JuOu-Kmiuk

👍20🔥5

5.41K viewsSergey Tsyptsyn ️️, edited 12:37

Метаверсище и ИИще

Зловещая долина и дипфейки.
Отличное видео от Корридоров.

Хорошее объяснение зловещей долины, дерзкая попытка ее преодолеть с помощью MetaHuman и InsightFace. А также лицевого и фул-боди мокапа.
Как обычно, пацаны ставят очень жесткие вопросы и хорошо объясняют, что и как работает.
Причем делают из этого образовательный фильм.
Тут они переносят анимацию с лица на 3Д-модель с помощью MetaHuman Animator, а потом шлепают сверху, дипфейком, нужное лицо с помощью InsightFace.
И делают коллективные замеры "зловещести".
Также примечательно, что на восьмой минуте в кадре появляется Каскадер! Которому раздаются восторженные комплименты. Поздравляю ребят.
В общем, долина по прежнему с нами.
https://www.youtube.com/watch?v=s8HfxioHxVg

YouTube

It Took 3 Years to Bring Him to Life

*Squarespace* ► Head to http://squarespace.com/corridorcrew to save 10% off your first purchase!

Watch the Corridor Shortfilm! https://youtu.be/Xps2QG8EyYw

Our videos are made possible by Members of CorridorDigital, our Exclusive Streaming Service! Try…

🔥14👍4

5.92K viewsSergey Tsyptsyn ️️, edited 12:56

Метаверсище и ИИще

В chatGPT Plus завезли разговор с картинками. Можно поговорить за одежду и сложные документы, но сплетничать нельзя!!
Кидайте в коменты свои разговоры с картинками и лайфхаки

👍20🔥3

5.55K viewsSergey Tsyptsyn ️️, 13:09

Метаверсище и ИИще

OctoberSGE_Magoo_04_FINAL.gif

17.3 MB

Гугль, как обычно, в роли догоняющего.
Теперь у них свой генератор картинок, свой ~~"GPT-4V"~~ трактователь картинок, своя мультимодалочка.
Еще год назад они демонстрировали свой закрытый Imagen, который нельзя было ни потрогать, ни интегрировать. Теперь, когда генерация картинок (и обратно, прочтение картинок в текст) есть и у Микрософта, и у OpenAI и у Адобченко, Гугль делает вид, что он ничем не хуже других.
Проблема в том, что он чуть хуже. Других.
- Bard чуть тупее chatGPT.
- Картинки выглядят прошлым поколением генераторов.
- - Распознавание картинок и их описание тоже пока не на высоте.
Gemini пока никак не выйдет.

Главное преимущество Гугла - конская пользовательская база, лошадиные размеры датасетов и ютюб в кустах.
Ну и конечно сервисы, опутавшие нас по рукам и ногам - поиск, почта, Docs, Drive, Workspaces
Посмотрим, удастся ли Гуглу подтянуть качество быстрее, чем пользователи привыкнут, что за пределами сервисов Гугла генеративный ИИ чуть лучше, чуть быстрее, чуть умнее.
Хотя я подозреваю, что 80-90% пользователей лишь читают новости про ИИ в наших канальчиках и ждут когда у них появятся понятные кнопки в знакомых интерфейсах (чем пользуется Адобченко, например).

Поглядите, как они теперь генерят картинки прямо из поисковой строки:
https://searchengineland.com/google-search-generative-experience-can-now-create-images-433200
https://blog.google/products/search/google-search-generative-ai-october-update/
Ну и отдельно бесит то, что у них всегда все в будущем времени с поправками типа "только для", "в след квартале", "пока в тестировании", "ивоще экспериментально все это"

"генерация изображений в SGE в настоящее время доступна на английском языке в Соединенных Штатах для людей, которые выбрали эксперимент SGE и которым исполнилось 18 лет."

👍16🔥1

5.01K viewsSergey Tsyptsyn ️️, 08:39

Метаверсище и ИИще

Forwarded from Тот парень с порнозависимостью

Порноиндустрия снова впереди всех — в этот раз в плане технологий

Известный стереотип, который правдив — порно обгоняет другие индустрии в плане технологий. Популяризации многих привычных нам вещей — от стримингов и онлайн-оплаты контента до VHS-кассет и гифок на превью на YouTube — мы обязаны как раз адалт-бизнесу. Новости последних дней это только подтверждают.

В начале октября бывшая порнозвезда, а ныне — инфлюенсерка Райли Рид (Riley Reid) запустила стартап Clona со встроенным ИИ, который позволяет 24/7 общаться с любимыми секс-работницами. Прямо сейчас в рамках промо можно абсолютно бесплатно початиться с самой Райли или Леной Плаг (Lena the Plug), позже добавятся другие.

Киллер фича Clona — отсутствие возрастных ограничений и цензуры тех тем, которые ты обсуждаешь с нейросетевой Райли Рид. Это могут быть как застольные беседы о жизни, так и вполне подробный секстинг. Ответы можно получать в тексте и в аудио, а создатели обещают, что для каждого пользователя опыт общения с ИИ будет уникальным.

«Я не снимаюсь на камеру и не веду стримы, так что у подписчиков обычно нет возможности общаться со мной. С помощью ИИ они могут разговаривать часами и по-настоящему сблизиться со мной. В реальной жизни Райли не может разговаривать по-испански, но нейросетевая Райли — может», — рассказала экс-порноактриса.

Совпадение ли, но подобный чат-бот для общения со знаменитостями недавно анонсировал Марк Цукерберг внутри своей соцсети Meta (ранее — Facebook). Снуп Догг, Кендалл Дженнер и другие звёзды могут 24/7 отвечать на вопросы фанатов.

ИИ от Meta будет искать ответы на вопросы на основе поисковика Bing от Microsoft. Не ждите особо откровенных и интересных ответов, это скорее как голоса знаменитостей в «Яндекс.Такси». В то время как Clona пришлось отказаться от поддержки OpenAI из-за цензуры и создать собственный алгоритм, обученный на часах интервью (и порно) с актрисами.

Видна разница и в подходах. Так, Meta добавила в чат-бот около 28 знаменитостей, но пользователи никак не могут повлиять на то, кто это будет. А в Clona могут заявиться не только все секс-работники, но и вообще любые инфлюенсеры. С одной стороны — закрытая система, а с другой — открытая платформа.

Пока непонятно, кто победит в этом соревновании за внимание. Но пересечений у мира технологий с адалт-бизнесом гораздо больше, чем кажется. На днях появилась новость, что Meta платит по $5 млн за два года использования голоса и внешности знаменитостей в своём чат-боте. Пока что они отвечают только текстом, но в будущем ожидается аудио.

В порноиндустрии уже лет пять как задумались об оцифровке внешности и голосов популярных секс-работниц, чтобы не платить им за каждую съёмку. Стартап Camasutra VR с помощью десятков камер и технологии захвата движений создаёт 3D-аватары порноактрис, которые могут танцевать стриптиз, общаться и заниматься с пользователем сексом.

В отличие от мира Цукерберга, метавселенная от Camasutra VR не имеет возрастных ограничений. Пользователя погружают в мир удовольствий наедине с цифровой копией любимой актрисы, а он с помощью контроллеров от гарнитур Oculus или Valve может с ней взаимодействовать. Спойлер: потрогать не получится.

Свои «тела» для таких проектов уже продали несколько порнозвёзд. Тори Блэк (Tori Black), Аникка Элбрайт (Anikka Albrite), Джонни Синс (Johnny Sins) и другие. Они живут от съёмки к съёмке и поэтому наверняка не долго думали, когда им предложили деньги за цифровую копию гениталий. «Меня вообще не волнует, что будет с моим аватаром. Мой аватар — это не я», — признаётся Тори Блэк.

Пока что цифровые копии от Цукерберга или порностудий выглядят жутко и кондово общаются. Однако нейросети активно обучают болтать на горячие темы, а виртуальную реальность уже приспосабливают к сексуальным играм. Так что, как и в прошлые разы, новые технологии обкатают на порно, и они станут мейнстримом в других индустриях. Но мы то с вами будем помнить, с чего всё начиналось.

Читать ещё: Цифровое бессмертие для порноактрис

@cumonmychannel 🔞

👍25🔥10👎1

4.81K viewsSergey Tsyptsyn ️️, 08:52

Метаверсище и ИИще

42
Года назад (полтора) мы с упоением постили картиночки, полученные из текста.
Сейчас мы с упоением постим тексты, полученные из картиночек.
GPT4-V (который уже раскатали в chatGPT Plus) реально выносит мозг.

Что касается мозга - как далек тот день, когда вы принесете в chatGPT-V томограмму своего мозга (и всего что у вас есть) и спросите: сколько лет куковать а поставь мне диагноз дружок.

А если брать метафору пошире: "а расскажи, дружок, про меня: кто я такой, что я такое, для чего я".
Нам ИИ уже давно рассказывает об этом, только мы отмахиваемся, типа "мы не такие(у нас внутри алайнмент)". И это приводит к мысли, что он сможет ответить на все наши вопросы. Только мы просто не поймем ответы нашими скудными умишками или не захотим их услышать(что происходит уже сейчас).

🔥24👍8👎2

5.57K viewsSergey Tsyptsyn ️️, edited 09:18

Метаверсище и ИИще

Новый формат: ИИ-радио!

Мы решил потереть за ИИ со Степой. Если зайдет, сделаем сериал.

Итак.
На следующей неделе во вторник на канале Gershuni пройдет прямой эфир со Степаном Гершуни и вашим задорным слугой Сергеем Цыпцыным, автором канала Метаверсище и ИИще, на тему “Как ИИ меняет мир?”

Мы поговорим о том как стремительное развитие генеративного ИИ влияет на различные области жизни и экономики:

- Что такое образование в эпоху ИИ и какие навыки теперь в цене? Что такое базовая грамотность в век ИИ?
- На что обращать внимание при изучении ИИ: промты, курсы, инфопродукты. Как сэкономить и не попасться на инфоцыгнщину?
- Как сделать так, чтобы ИИ не уничтожил нас всех? Алаймент — это страшилки или реальная опасность? ИИ — это Бог, а Илья Суцкевер его пророк?
- Как выбрать, использовать и выжать максимум из ИИ-ассистентов и агентов?
- Что делать бизнесу в эру ИИ-хаоса? Куда бежать или, может, наоборот, успокоиться?
- Что там в диффузионках? Когда уже мы сможем генерировать “Аватар - 5” одним промтом через Apple Watch?
- Мультимодалки, тренировка своих моделей, open source vs prorietary и другие темы
- Так же ответим на вопросы аудитории, если уложимся в тайминг

Степан — исследователь, технологический стратег, серийный фаундер, работает (набегами) с NLP/ML с 2012 года. Ведущий вебинаров codex.town
Сергей — эксперт в области компьютерной графики, автор книги "Понимая Майя", исследователь искусственного интеллекта, ведущий экзистенциального канала Метаверсище и ИИще

Подключиться к прямому эфиру можно во вторник, 17 октября, в 11am ET / 15pm UTC / 17pm CET / 18pm MSK прямо в телеграме в канале Gershuni. Чтобы не пропустить, можно регистрироваться тут.

🔥34👍16👎2

5.81K viewsSergey Tsyptsyn ️️, 09:30

Метаверсище и ИИще

Нуштош, пришло время серьезно перебеседовать с chatGPT за картинки и обратно.
Мне раскатали, наконец, dall-e 3, gpt-4v, голосовой ввод и вывод, ныряю в матрицу
Скоро вернусь с инсайдами.

👍46🔥27

5.26K viewsSergey Tsyptsyn ️️, edited 11:06

Метаверсище и ИИще

Инсайд 1.
Вы можете задавать три аспекта картинки при генерации в chatGPT. Квадратные, стоячие, лежачие.
Вы просто должны помянуть
square (1024x1024), wide (1792x1024), and tall (1024x1792) в промпте.
Например,
"I want a square image of a serene lakeside view."
"Can you create a wide landscape of a city skyline at sunset?"
"Show me a tall portrait of a person wearing a Victorian-era dress."

Другие аспекты и разрешения не поддерживаются. В chatGPT. Пока.

👍27🔥9

5.26K viewsSergey Tsyptsyn ️️, edited 13:06

Метаверсище и ИИще

Инсайд 2. Быть Джоном Малковичем.

Далле3 отказывается генерить знаменитостей в лоб.

Make picture of margot robbie in pink dress

ChatGPT
I'm sorry, but I cannot create images of specific celebrities or public figures. However, I can create an image of a woman in a pink dress without specifying the celebrity.

Теперь немного читерим:

Picture of old man looking like Tom Cruise

И получаем картинки, которые "ведут" себя как Том Круиз. Том в кожанку из ТопГан, Топ на байке, Том со шлемаком. Но не Том.

Picture of lady looks like Margo Robbie

Поглядите как выкручивается Далле3!
Люди на картинках ведут себя как Том и Марго, но это не они. То есть Далишечко прекрасно знает про всех знаменитостей, всю их подноготную, жесты, ужимки, стиль. Но подставляет чужие лица. Дипфейк наоборот.

Интересная работа с промптом и трактовка looks like. Не придерешься.

Осталось понять, улучшает ли такой трюк качество генерации лиц, как это было в Stable Diffusion.

🔥18👍9👎5

5.18K viewsSergey Tsyptsyn ️️, 16:03

About

Blog

Apps

Platform