дAI потестить!
2.65K subscribers
246 photos
168 videos
4 files
159 links
Ленивые AI инструменты для создания контента
👉 Тут помогут и подскажут @neuralchatik
Download Telegram
Media is too big
VIEW IN TELEGRAM
Как изменить лицо на фото без регистрации и смс
Ссылки на сервисы:
https://faceswapper.ai/swapper
https://www.deepswapper.com
https://clipdrop.co/swap
#faceswap #pipeline
🙏1
Media is too big
VIEW IN TELEGRAM
Очень странный способ сделать похожее фото
1. Переходим в ChatGPT (нужен VPN)
2. Загружаем картинку и пишем промпт:
Очень подробно опиши эту картину. Опиши каждую деталь, укажи расположение каждой детали, цвета, композицию, все остальное. Это должно быть самое подробное описание, из всех возможных
Перепиши сообщение в виде промпта для генерации картинки (знаю, знаю можно и лучше)
3. Копируем получившийся текст и идем в Omost (для гиков репо)
4. Вставляем текст, жмем Submit потом Render the Image!
5. Profit!
#reference #pipeline
This media is not supported in your browser
VIEW IN TELEGRAM
Добрался до V-Express. В Kaggle на P100 ждал час. Качество очень посредственное. Где использовать - не знаю.
Для тек кто хочет потыкать сам:
Git: https://github.com/tencent-ailab/V-Express
Comfyui: https://github.com/AIFSH/ComfyUI_V-Express
Kaggle: в первом комментарии. Исходники там же
#lipsync
👍3
дAI потестить!
Описание тут👇 #TTS
1. Лучшее

ElevenLabs
- Отлично знает русский язык, хорошо справляется с ударениями.
- Можно управлять ударениями, сервис в помощь
- Много тембров, минимум электронных призвуков, отличная интонация.
https://elevenlabs.io/
Демо https://huggingface.co/spaces/elevenlabs/tts
Коллаб https://github.com/camenduru/elevenlabs-colab
- Минусы: Нельзя управлять интонациями. Решение: перегенерация текста.

2. Есть недостатки

XTTS
- Поддерживает русский язык, реалистичное звучание.
- Проблемы с ударениями и интонацией, роботизированный голос.
- Есть претрейн, который немного улучшает ситуацию.
- Возможность самостоятельной тренировки модели.
https://github.com/coqui-ai/TTS
https://github.com/daswer123/xtts-webui
Демо https://huggingface.co/spaces/coqui/xtts
Colab https://colab.research.google.com/drive/1MrzAYgANm6u79rCCQQqBSoelYGiJ1qYL#scrollTo=fem9Pw-MrgxQ
Pretrained Model https://huggingface.co/Ftfyhh/xttsv2_banana

Silero
- Поддерживает русский язык, много голосов.
- Управляемые ударения и паузы, немного роботизированный голос.
- Возможно, используется в "Русы против ящеров".
https://github.com/snakers4/silero-models
Colab https://colab.research.google.com/github/snakers4/silero-models/blob/master/examples_tts.ipynb
Демо https://huggingface.co/spaces/NeuroSenko/tts-silero

TeraTTS
- Простая модель, поддерживает русский язык, мало голосов, роботизированное звучание.
https://github.com/Tera2Space/TeraTTS
Демо https://huggingface.co/spaces/TeraTTS/TTS

Bark
- Поддерживает русский язык, включает смех, кашель, песенки.
- Иногда "галлюцинирует" на русском.
https://github.com/suno-ai/bark
Демо https://huggingface.co/spaces/suno/bark
Colab https://colab.research.google.com/drive/1eJfA2XUa-mXwdMy7DoYKVYHI1iTd9Vkt?usp=sharing#scrollTo=t9Vlr3RRt6B9

3. Нет русского языка

OpenVoice
- Поддерживает эмоции, нет русского языка.
https://github.com/myshell-ai/OpenVoice/tree/main

StyleTTS
- Русского языка нет. Мультиязычная модель, возможно поддерживает азиатские и европейские языки.
https://github.com/camenduru/styletts-colab
Демо https://huggingface.co/papercup-ai/multilingual-pl-bert/tree/main

Metavoice
- Пока без поддержки русского языка.
https://github.com/metavoiceio/metavoice-src

Продолжение - https://t.me/dAIpotestit/124
#TTS
5🔥3👏1
Потестил Synctalk. Хорошо но пока криво.
Особенности:
- Требуется минимум 4 минуты видео для входа.
- Лицо на видео должно быть крупным планом. Разрешение около 512x512 px.
- В Colab на T4 предпроцесс+ трэйн занимает 4-5 часов.
- Это не классический липсинк, а скорее создание цифрового двойника, похожего на Heygen Instant Avatar.
Фэйлы и наблюдения в комментах👇
#lipsync
🤔3
This media is not supported in your browser
VIEW IN TELEGRAM
Попытался восстановить зубы после липсикна этой приблудой HDTR-Net.
Особенности:
+ потребляет мало Vram
- плохо работает
- маленькое разрешение модели
P.S. Возможно нужно пробовать на шоте, где во рту зубов нет, но мне лень
P.S.S То что получилось - справа
#lipsync
Ну что братюни, пора менять аватарки. Топ сервисов для генерации портретов без обучения модели. Исключительно ИМХО.
Исходники и промпты в комментах к посту
Плюсы и минусы в посте ниже👇
#StyleFace
🔥3👍1