дAI потестить!
2.65K subscribers
246 photos
168 videos
4 files
159 links
Ленивые AI инструменты для создания контента
👉 Тут помогут и подскажут @neuralchatik
Download Telegram
Media is too big
VIEW IN TELEGRAM
Меняем фон на видео - параллельно отапливаем жилище теплом от видеокарты.
P.S. Все еще Wan2GP и Pinokkio
2🔥192🍓2👍1😁1
Тут @Neurodonu немного в коде Pinokio покопался https://blog.neurodonu.dev/how-is-it-pinokio-ru/, Ну как немного - полностью. Лёгонький постик для красноглазого гика. Рекомендую
🔥132👍1
Сравниваем Flux Kontext с альтернативами.

Итак, сегодня сравниваем:
1. flux-1-kontext-dev
2. omnigen 2
3. hidream e1.1

Задачи:
1. Анфас повернуть в 3/4
2. Сделать pixelart
3. Сделать стройной
4. Изменить цвет банта на синий
5. Разозлить
6. Состарить

Кто победитель сказать не решусь, жду экспертных оценок в комментах.

P.S. Там же 👇👇👇 workflow для комфи. Внутри все со ссылочками на модели.
P.S.S. Кому понравилась очаровашка, взял ее от сюда.
2🔥21❤‍🔥7🍓4😱2
Мне тут в ЛС написали ребята из https://gpuniq.ru. Пилят стартап по аренде GPU. Только стартанули, очень хотят услышать первые отзывы.
Из интересного:
У нас действительно сейчас есть бонус: как и сказал, дадим бесплатно попробовать наш сервис: накинем 1000₽ на баланс каждому за регистрацию. Для этого надо просто отправить мне (@golz29) почту, на которую зарегистрирован аккаунт, и бонус будет начислен.
Кроме того, мы даем х2 при первом пополнении к балансу! То есть если, например, пополняешь на 500₽ - получишь 1000₽.

Выглядит как шанс бесплатно генернуть голую Марго Робби на Wan 2.2☺️☺️.
Сам пока не проверял, кто проверит отпишитесь в комментах, как там с удобствами😊😊.

P.S. Если есть вопросы, @golz29 есть у нас в @neuralchatik
😁6🔥3👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Клонируем/генерируем голос на русском без регистрации и смс.

Человек с ником Misha24-10 (дай Бог ему здоровья и красивую жену) дотренировал модель для F5 TTS. Это пока еще не 11Labs, но уже вкусно.

Как попробовать:

1. Ставим Pinokio
2. В Pinokio ставим e2-f5-tts
3. Скачиваем модель в папку pinokio\api\e2-f5-tts.git\cache\HF_HOME\hub\models--SWivid--F5-TTS\snapshots\{какие то цифры}\F5TTS_v1_Base и переименовываем в model_1250000.safetensors
4. ...
5. Profit

Это еще не все. В F5 TTS можно управлять ударением в слове, поставив + перед ударной гласной. Например: "Д+они ид+и сп+ать".
Руками делать долго да и лень, GPT - не спортивно, поэтому другой хороший человек с ником Mikhail (концентрация Михаилов в посте, конечно мое почтение) написал портативку, которая может. Этот Михаил оказался не таким умницей, скрипт сразу не заработал, поэтому пожелаем ему только здоровья, а портативку теперь можно забрать здесь.

P.S. По качеству пока не игровое кино или рекламная читка, но аудио книги озвучивать уже вполне.

P.S.S. Исходник в комментах

#portable
4🍓15😁12👍42🔥2
Делаем липсинк через Multitalk на видео.

Эксклюзивно для @VladPedro

Жду вопросы в комментах👇👇👇

#lipsync
5❤‍🔥8😁6🍓4👍1👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Итак, 3 месяца назад появился Veo3. Пора подвести промежуточные итоги.
Спойлер: это исключительно мой коммерческий опыт — могу ошибаться. Го в комменты спорить и искать истину, ведь «в интернете кто-то не прав».

Правда или вымысел

Imagen и Veo3 — одно и то же? — Вымысел
Промпт, который сработал в Imagen, не даст того же в Veo3: модели разные — разные и результаты. Нужна картинка из Imagen — проще вставить её первым кадром (но захода консистентного персонажа в сцену тогда не добиться).

JSON-формат промпта работает лучшеВымысел
Полезный кейс по сути один: если нужна реплика на русском и Veo3 ругается на язык, добавь «мусорнымые» токенами при помощи JSON.

Gemini умеет писать промпты для Veo3 — Вымысел
Потратил два часа на спор с LLM: сначала она уверяла, что Veo3 понимает русский в промпте без ограничений, а затем упорно заменяла реплики на немые «эмо-жесты», потому что Veo3 не генерирует звук.

Команды в промпте: зафиксируй seed, время шота, тайм-метки и т. п. — Вымысел
Тут на этом мои полномочия всё.

Промптинг с помощью надписей в кадреПравда
Иногда очень выручает. Если перебрали все токены, а действие «не слушается», попробуйте.

Делаем консистентные сцены/персонажа через склейкиПравда
Работает, но после склейки картинка может деградировать — зависит от силы изменений. Например, если подложить первым кадром лицо персонажа и попросить общий план «сидит в кафе, пьёт кофе» — результат часто так себе.
Еще примеры:
https://t.me/aifilmmaker/171
https://t.me/blacktraced/594

Токен no titles отключит титры — Вымысел
Парадоксально, но шанс появления титров растёт.

Особенности модели

Контекст ограничен: чем больше описаний сцены/персонажей/действий, тем сильнее модель «забывает».

Примеры:
— Одна конкретная девушка говорит реплику — ОК.
— Две конкретные девушки ведут диалог — сложнее, но ОК.
— Две девушки + на фоне 6 человек в оранжевых касках копают яму — скорее не ОК, но шанс есть.
— Две девушки: одна достаёт из кармана радугу, другая во время диалога идёт в угол и садится на раковину, а на фоне 6 копают яму — без шансов.

«Примерно» консистентного персонажа можно получить подробным описанием в промпте (как и в других моделях), но у Veo3 это можно делать разным набором токенов. По сути, любого txt2video-персонажа можно скопировать.

Вертикальный контент: можно повернуть исходник в промпте или подложить первым кадром повернутый фрейм — но будьте готовы, что «направление гравитации» для модели это не изменит.

Разницы между моделями Fast и Quality я не заметил.

P.S. Видео - это вам открыточка в WhatsApp. Определенно заслуживает реакции😊😊
117👍7🍓21😁1💯1
Runway Act One у нас дома

Немного удивительно, но незаметно прошел релиз модели Fantasy Portrait для Wan 2.1 (не путать с Fantasy Talking).

Fantasy Portrait - анимирует фото перенося мимику с видео-донора. Такой LivePortrait на максималках (ну или Act One, как хотите).

Впечатлил качеством и тем что умеет анимировать людей, рисованных персонажей и даже животных.

Минусы: если два лица в кадре, может начать анимировать двух, плохо двигает бровями, липсинк хороший но бывает пропускает виземы (возможно, я на вход подал такое себе качество).

Особенности:
1. Не смог изменить выражение лица одного кадра (фото). Ругается что мало кадров, если из фото сделать видео и попробовать поменять мимику, FP сходит с ума и начинает беспорядочно сокращаться.
2. Я добавил в схему контекстное окно, теперь можно делать длинные видео.

WF приложил в комменты👇👇. Угощайтесь.
1👍13😁7🎉3