Forwarded from Бескромный
Media is too big
VIEW IN TELEGRAM
Как мы сделали визуальную одиссею без единого актёра
Мы в агентстве AI INFLUENCE только что запустили первый международный проект — и сейчас вы сами на две минуты переместитесь на солнечную Сицилию.
Команда отеля Masseria della Volpe попросила нас показать историю их места через века. Обычно рекламщики решают такие задачи армией массовки, историческими костюмами и бюджетом небольшого европейского фильма.
Мы же пошли технологическим путём: создали всё на нейросетях. От древних римлян и холмов Сицилии до современных гедонистов с бокалом кьянти у бассейна — ни одного актёра в кадре.
Что под капотом у этого ролика (для тех, кто в теме):
Сценарий и раскадровки: ChatGPT, Gemini
Визуал: Midjourney, Ideogram, Imagen4, ChatGPT Image, Flux Kontext, Runway
Анимация: Kling, Veo3, Seedance, Minimax
Звук: Suno, ElevenLabs, SFX
Монтаж: After Effects, Premiere Pro, Photoshop, Audition
Получилось так убедительно, что даже вашему непокорному слуге захотелось прямо сейчас улететь на Сицилию, а не вот это всё. Посидеть вечером у того самого бассейна с прохладным бокалом и подумать о вечном.
А вообще забавно, что отель с многовековой историей выбрал для продвижения технологию, которой нет и пяти лет.
Кстати, если вашему бизнесу нужен зрелищный креатив без утомительных съёмочных дней и головной боли — вы точно знаете, к кому обращаться.
Мы в агентстве AI INFLUENCE только что запустили первый международный проект — и сейчас вы сами на две минуты переместитесь на солнечную Сицилию.
Команда отеля Masseria della Volpe попросила нас показать историю их места через века. Обычно рекламщики решают такие задачи армией массовки, историческими костюмами и бюджетом небольшого европейского фильма.
Мы же пошли технологическим путём: создали всё на нейросетях. От древних римлян и холмов Сицилии до современных гедонистов с бокалом кьянти у бассейна — ни одного актёра в кадре.
Что под капотом у этого ролика (для тех, кто в теме):
Визуал: Midjourney, Ideogram, Imagen4, ChatGPT Image, Flux Kontext, Runway
Анимация: Kling, Veo3, Seedance, Minimax
Звук: Suno, ElevenLabs, SFX
Монтаж: After Effects, Premiere Pro, Photoshop, Audition
Получилось так убедительно, что даже вашему непокорному слуге захотелось прямо сейчас улететь на Сицилию, а не вот это всё. Посидеть вечером у того самого бассейна с прохладным бокалом и подумать о вечном.
А вообще забавно, что отель с многовековой историей выбрал для продвижения технологию, которой нет и пяти лет.
Кстати, если вашему бизнесу нужен зрелищный креатив без утомительных съёмочных дней и головной боли — вы точно знаете, к кому обращаться.
🔥11👍5🥱5👎4❤3🥰2
Ну что господа, есть понимание как это делается?
(1-исходник)
(1-исходник)
🔥8🍓3
дAI потестить!
Ну что господа, есть понимание как это делается? (1-исходник)
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь задачка со звездочкой ⭐ .
Ваши комментарии?
Ваши комментарии?
Please open Telegram to view this post
VIEW IN TELEGRAM
9
Media is too big
VIEW IN TELEGRAM
Меняем фон на видео - параллельно отапливаем жилище теплом от видеокарты.
P.S. Все еще Wan2GP и Pinokkio
P.S. Все еще Wan2GP и Pinokkio
2🔥19❤2🍓2👍1😁1
Тут @Neurodonu немного в коде Pinokio покопался https://blog.neurodonu.dev/how-is-it-pinokio-ru/, Ну как немного - полностью. Лёгонький постик для красноглазого гика. Рекомендую
🔥13❤2👍1
Сравниваем Flux Kontext с альтернативами.
Итак, сегодня сравниваем:
1. flux-1-kontext-dev
2. omnigen 2
3. hidream e1.1
Задачи:
1. Анфас повернуть в 3/4
2. Сделать pixelart
3. Сделать стройной
4. Изменить цвет банта на синий
5. Разозлить
6. Состарить
Кто победитель сказать не решусь, жду экспертных оценок в комментах.
P.S. Там же 👇👇👇 workflow для комфи. Внутри все со ссылочками на модели.
P.S.S. Кому понравилась очаровашка, взял ее от сюда.
Итак, сегодня сравниваем:
1. flux-1-kontext-dev
2. omnigen 2
3. hidream e1.1
Задачи:
1. Анфас повернуть в 3/4
2. Сделать pixelart
3. Сделать стройной
4. Изменить цвет банта на синий
5. Разозлить
6. Состарить
Кто победитель сказать не решусь, жду экспертных оценок в комментах.
P.S. Там же 👇👇👇 workflow для комфи. Внутри все со ссылочками на модели.
P.S.S. Кому понравилась очаровашка, взял ее от сюда.
2🔥21❤🔥7🍓4😱2
Мне тут в ЛС написали ребята из https://gpuniq.ru. Пилят стартап по аренде GPU. Только стартанули, очень хотят услышать первые отзывы.
Из интересного:
Выглядит как шанс бесплатно генернуть голую Марго Робби на Wan 2.2☺️☺️.
Сам пока не проверял, кто проверит отпишитесь в комментах, как там с удобствами😊😊.
P.S. Если есть вопросы, @golz29 есть у нас в @neuralchatik
Из интересного:
У нас действительно сейчас есть бонус: как и сказал, дадим бесплатно попробовать наш сервис: накинем 1000₽ на баланс каждому за регистрацию. Для этого надо просто отправить мне (@golz29) почту, на которую зарегистрирован аккаунт, и бонус будет начислен.
Кроме того, мы даем х2 при первом пополнении к балансу! То есть если, например, пополняешь на 500₽ - получишь 1000₽.
Выглядит как шанс бесплатно генернуть голую Марго Робби на Wan 2.2☺️☺️.
Сам пока не проверял, кто проверит отпишитесь в комментах, как там с удобствами😊😊.
P.S. Если есть вопросы, @golz29 есть у нас в @neuralchatik
GPUniq
GPUniq - GPU Rental Service | AI Computing & Machine Learning
Rent powerful GPUs for AI computing, machine learning, rendering, and crypto mining. Affordable prices, high performance.
😁6🔥3👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Клонируем/генерируем голос на русском без регистрации и смс.
Человек с ником Misha24-10 (дай Бог ему здоровья и красивую жену) дотренировал модель для F5 TTS. Это пока еще не 11Labs, но уже вкусно.
Как попробовать:
1. Ставим Pinokio
2. В Pinokio ставим e2-f5-tts
3. Скачиваем модель в папку
4. ...
5. Profit
Это еще не все. В F5 TTS можно управлять ударением в слове, поставив + перед ударной гласной. Например: "Д+они ид+и сп+ать".
Руками делать долго да и лень, GPT - не спортивно, поэтому другой хороший человек с ником Mikhail (концентрация Михаилов в посте, конечно мое почтение) написал портативку, которая может. Этот Михаил оказался не таким умницей, скрипт сразу не заработал, поэтому пожелаем ему только здоровья, а портативку теперь можно забрать здесь.
P.S. По качеству пока не игровое кино или рекламная читка, но аудио книги озвучивать уже вполне.
P.S.S. Исходник в комментах
#portable
Человек с ником Misha24-10 (дай Бог ему здоровья и красивую жену) дотренировал модель для F5 TTS. Это пока еще не 11Labs, но уже вкусно.
Как попробовать:
1. Ставим Pinokio
2. В Pinokio ставим e2-f5-tts
3. Скачиваем модель в папку
pinokio\api\e2-f5-tts.git\cache\HF_HOME\hub\models--SWivid--F5-TTS\snapshots\{какие то цифры}\F5TTS_v1_Base и переименовываем в model_1250000.safetensors4. ...
5. Profit
Это еще не все. В F5 TTS можно управлять ударением в слове, поставив + перед ударной гласной. Например: "Д+они ид+и сп+ать".
Руками делать долго да и лень, GPT - не спортивно, поэтому другой хороший человек с ником Mikhail (концентрация Михаилов в посте, конечно мое почтение) написал портативку, которая может. Этот Михаил оказался не таким умницей, скрипт сразу не заработал, поэтому пожелаем ему только здоровья, а портативку теперь можно забрать здесь.
P.S. По качеству пока не игровое кино или рекламная читка, но аудио книги озвучивать уже вполне.
P.S.S. Исходник в комментах
#portable
4🍓15😁12👍4❤2🔥2
Делаем липсинк через Multitalk на видео.
Эксклюзивно для @VladPedro
Жду вопросы в комментах👇👇👇
#lipsync
Эксклюзивно для @VladPedro
Жду вопросы в комментах👇👇👇
#lipsync
5❤🔥8😁6🍓4👍1👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Итак, 3 месяца назад появился Veo3. Пора подвести промежуточные итоги.
Спойлер: это исключительно мой коммерческий опыт — могу ошибаться. Го в комменты спорить и искать истину, ведь «в интернете кто-то не прав».
Правда или вымысел
Imagen и Veo3 — одно и то же? — Вымысел
Промпт, который сработал в Imagen, не даст того же в Veo3: модели разные — разные и результаты. Нужна картинка из Imagen — проще вставить её первым кадром (но захода консистентного персонажа в сцену тогда не добиться).
JSON-формат промпта работает лучше — Вымысел
Полезный кейс по сути один: если нужна реплика на русском и Veo3 ругается на язык, добавь «мусорнымые» токенами при помощи JSON.
Gemini умеет писать промпты для Veo3 — Вымысел
Потратил два часа на спор с LLM: сначала она уверяла, что Veo3 понимает русский в промпте без ограничений, а затем упорно заменяла реплики на немые «эмо-жесты», потому что Veo3 не генерирует звук.
Команды в промпте: зафиксируй seed, время шота, тайм-метки и т. п. — Вымысел
Тут на этом мои полномочия всё.
Промптинг с помощью надписей в кадре — Правда
Иногда очень выручает. Если перебрали все токены, а действие «не слушается», попробуйте.
Делаем консистентные сцены/персонажа через склейки — Правда
Работает, но после склейки картинка может деградировать — зависит от силы изменений. Например, если подложить первым кадром лицо персонажа и попросить общий план «сидит в кафе, пьёт кофе» — результат часто так себе.
Еще примеры:
https://t.me/aifilmmaker/171
https://t.me/blacktraced/594
Токен no titles отключит титры — Вымысел
Парадоксально, но шанс появления титров растёт.
Особенности модели
Контекст ограничен: чем больше описаний сцены/персонажей/действий, тем сильнее модель «забывает».
Примеры:
— Одна конкретная девушка говорит реплику — ОК.
— Две конкретные девушки ведут диалог — сложнее, но ОК.
— Две девушки + на фоне 6 человек в оранжевых касках копают яму — скорее не ОК, но шанс есть.
— Две девушки: одна достаёт из кармана радугу, другая во время диалога идёт в угол и садится на раковину, а на фоне 6 копают яму — без шансов.
«Примерно» консистентного персонажа можно получить подробным описанием в промпте (как и в других моделях), но у Veo3 это можно делать разным набором токенов. По сути, любого txt2video-персонажа можно скопировать.
Вертикальный контент: можно повернуть исходник в промпте или подложить первым кадром повернутый фрейм — но будьте готовы, что «направление гравитации» для модели это не изменит.
Разницы между моделями Fast и Quality я не заметил.
P.S. Видео - это вам открыточка в WhatsApp. Определенно заслуживает реакции😊😊
Спойлер: это исключительно мой коммерческий опыт — могу ошибаться. Го в комменты спорить и искать истину, ведь «в интернете кто-то не прав».
Правда или вымысел
Imagen и Veo3 — одно и то же? — Вымысел
Промпт, который сработал в Imagen, не даст того же в Veo3: модели разные — разные и результаты. Нужна картинка из Imagen — проще вставить её первым кадром (но захода консистентного персонажа в сцену тогда не добиться).
JSON-формат промпта работает лучше — Вымысел
Полезный кейс по сути один: если нужна реплика на русском и Veo3 ругается на язык, добавь «мусорнымые» токенами при помощи JSON.
Gemini умеет писать промпты для Veo3 — Вымысел
Потратил два часа на спор с LLM: сначала она уверяла, что Veo3 понимает русский в промпте без ограничений, а затем упорно заменяла реплики на немые «эмо-жесты», потому что Veo3 не генерирует звук.
Команды в промпте: зафиксируй seed, время шота, тайм-метки и т. п. — Вымысел
Тут на этом мои полномочия всё.
Промптинг с помощью надписей в кадре — Правда
Иногда очень выручает. Если перебрали все токены, а действие «не слушается», попробуйте.
Делаем консистентные сцены/персонажа через склейки — Правда
Работает, но после склейки картинка может деградировать — зависит от силы изменений. Например, если подложить первым кадром лицо персонажа и попросить общий план «сидит в кафе, пьёт кофе» — результат часто так себе.
Еще примеры:
https://t.me/aifilmmaker/171
https://t.me/blacktraced/594
Токен no titles отключит титры — Вымысел
Парадоксально, но шанс появления титров растёт.
Особенности модели
Контекст ограничен: чем больше описаний сцены/персонажей/действий, тем сильнее модель «забывает».
Примеры:
— Одна конкретная девушка говорит реплику — ОК.
— Две конкретные девушки ведут диалог — сложнее, но ОК.
— Две девушки + на фоне 6 человек в оранжевых касках копают яму — скорее не ОК, но шанс есть.
— Две девушки: одна достаёт из кармана радугу, другая во время диалога идёт в угол и садится на раковину, а на фоне 6 копают яму — без шансов.
«Примерно» консистентного персонажа можно получить подробным описанием в промпте (как и в других моделях), но у Veo3 это можно делать разным набором токенов. По сути, любого txt2video-персонажа можно скопировать.
Вертикальный контент: можно повернуть исходник в промпте или подложить первым кадром повернутый фрейм — но будьте готовы, что «направление гравитации» для модели это не изменит.
Разницы между моделями Fast и Quality я не заметил.
P.S. Видео - это вам открыточка в WhatsApp. Определенно заслуживает реакции😊😊
1❤17👍7🍓2✍1😁1💯1
Runway Act One у нас дома
Немного удивительно, но незаметно прошел релиз модели Fantasy Portrait для Wan 2.1 (не путать с Fantasy Talking).
Fantasy Portrait - анимирует фото перенося мимику с видео-донора. Такой LivePortrait на максималках (ну или Act One, как хотите).
Впечатлил качеством и тем что умеет анимировать людей, рисованных персонажей и даже животных.
Минусы: если два лица в кадре, может начать анимировать двух, плохо двигает бровями, липсинк хороший но бывает пропускает виземы (возможно, я на вход подал такое себе качество).
Особенности:
1. Не смог изменить выражение лица одного кадра (фото). Ругается что мало кадров, если из фото сделать видео и попробовать поменять мимику, FP сходит с ума и начинает беспорядочно сокращаться.
2. Я добавил в схему контекстное окно, теперь можно делать длинные видео.
WF приложил в комменты👇👇. Угощайтесь.
Немного удивительно, но незаметно прошел релиз модели Fantasy Portrait для Wan 2.1 (не путать с Fantasy Talking).
Fantasy Portrait - анимирует фото перенося мимику с видео-донора. Такой LivePortrait на максималках (ну или Act One, как хотите).
Впечатлил качеством и тем что умеет анимировать людей, рисованных персонажей и даже животных.
Минусы: если два лица в кадре, может начать анимировать двух, плохо двигает бровями, липсинк хороший но бывает пропускает виземы (возможно, я на вход подал такое себе качество).
Особенности:
1. Не смог изменить выражение лица одного кадра (фото). Ругается что мало кадров, если из фото сделать видео и попробовать поменять мимику, FP сходит с ума и начинает беспорядочно сокращаться.
2. Я добавил в схему контекстное окно, теперь можно делать длинные видео.
WF приложил в комменты👇👇. Угощайтесь.
1👍13😁7🎉3