Media is too big
VIEW IN TELEGRAM
Как изменить лицо на фото без регистрации и смс
Ссылки на сервисы:
#faceswap #pipeline
Ссылки на сервисы:
https://faceswapper.ai/swapperhttps://www.deepswapper.comhttps://clipdrop.co/swap#faceswap #pipeline
🙏1
Media is too big
VIEW IN TELEGRAM
Очень странный способ сделать похожее фото
1. Переходим в ChatGPT (нужен VPN)
2. Загружаем картинку и пишем промпт:
╚
╚
3. Копируем получившийся текст и идем в Omost (для гиков репо)
4. Вставляем текст, жмем Submit потом Render the Image!
5. Profit!
#reference #pipeline
1. Переходим в ChatGPT (нужен VPN)
2. Загружаем картинку и пишем промпт:
╚
Очень подробно опиши эту картину. Опиши каждую деталь, укажи расположение каждой детали, цвета, композицию, все остальное. Это должно быть самое подробное описание, из всех возможных ╚
Перепиши сообщение в виде промпта для генерации картинки (знаю, знаю можно и лучше) 3. Копируем получившийся текст и идем в Omost (для гиков репо)
4. Вставляем текст, жмем Submit потом Render the Image!
5. Profit!
#reference #pipeline
This media is not supported in your browser
VIEW IN TELEGRAM
Добрался до V-Express. В Kaggle на P100 ждал час. Качество очень посредственное. Где использовать - не знаю.
Для тек кто хочет потыкать сам:
Git:
Comfyui:
Kaggle: в первом комментарии. Исходники там же
#lipsync
Для тек кто хочет потыкать сам:
Git:
https://github.com/tencent-ailab/V-ExpressComfyui:
https://github.com/AIFSH/ComfyUI_V-ExpressKaggle: в первом комментарии. Исходники там же
#lipsync
👍3
дAI потестить!
Описание тут👇 #TTS
1. Лучшее
ElevenLabs
- Отлично знает русский язык, хорошо справляется с ударениями.
- Можно управлять ударениями, сервис в помощь
- Много тембров, минимум электронных призвуков, отличная интонация.
https://elevenlabs.io/
Демо https://huggingface.co/spaces/elevenlabs/tts
Коллаб https://github.com/camenduru/elevenlabs-colab
- Минусы: Нельзя управлять интонациями. Решение: перегенерация текста.
2. Есть недостатки
XTTS
- Поддерживает русский язык, реалистичное звучание.
- Проблемы с ударениями и интонацией, роботизированный голос.
- Есть претрейн, который немного улучшает ситуацию.
- Возможность самостоятельной тренировки модели.
https://github.com/coqui-ai/TTS
https://github.com/daswer123/xtts-webui
Демо https://huggingface.co/spaces/coqui/xtts
Colab https://colab.research.google.com/drive/1MrzAYgANm6u79rCCQQqBSoelYGiJ1qYL#scrollTo=fem9Pw-MrgxQ
Pretrained Model https://huggingface.co/Ftfyhh/xttsv2_banana
Silero
- Поддерживает русский язык, много голосов.
- Управляемые ударения и паузы, немного роботизированный голос.
- Возможно, используется в "Русы против ящеров".
https://github.com/snakers4/silero-models
Colab https://colab.research.google.com/github/snakers4/silero-models/blob/master/examples_tts.ipynb
Демо https://huggingface.co/spaces/NeuroSenko/tts-silero
TeraTTS
- Простая модель, поддерживает русский язык, мало голосов, роботизированное звучание.
https://github.com/Tera2Space/TeraTTS
Демо https://huggingface.co/spaces/TeraTTS/TTS
Bark
- Поддерживает русский язык, включает смех, кашель, песенки.
- Иногда "галлюцинирует" на русском.
https://github.com/suno-ai/bark
Демо https://huggingface.co/spaces/suno/bark
Colab https://colab.research.google.com/drive/1eJfA2XUa-mXwdMy7DoYKVYHI1iTd9Vkt?usp=sharing#scrollTo=t9Vlr3RRt6B9
3. Нет русского языка
OpenVoice
- Поддерживает эмоции, нет русского языка.
https://github.com/myshell-ai/OpenVoice/tree/main
StyleTTS
- Русского языка нет. Мультиязычная модель, возможно поддерживает азиатские и европейские языки.
https://github.com/camenduru/styletts-colab
Демо https://huggingface.co/papercup-ai/multilingual-pl-bert/tree/main
Metavoice
- Пока без поддержки русского языка.
https://github.com/metavoiceio/metavoice-src
Продолжение - https://t.me/dAIpotestit/124
#TTS
ElevenLabs
- Отлично знает русский язык, хорошо справляется с ударениями.
- Можно управлять ударениями, сервис в помощь
- Много тембров, минимум электронных призвуков, отличная интонация.
https://elevenlabs.io/
Демо https://huggingface.co/spaces/elevenlabs/tts
Коллаб https://github.com/camenduru/elevenlabs-colab
- Минусы: Нельзя управлять интонациями. Решение: перегенерация текста.
2. Есть недостатки
XTTS
- Поддерживает русский язык, реалистичное звучание.
- Проблемы с ударениями и интонацией, роботизированный голос.
- Есть претрейн, который немного улучшает ситуацию.
- Возможность самостоятельной тренировки модели.
https://github.com/coqui-ai/TTS
https://github.com/daswer123/xtts-webui
Демо https://huggingface.co/spaces/coqui/xtts
Colab https://colab.research.google.com/drive/1MrzAYgANm6u79rCCQQqBSoelYGiJ1qYL#scrollTo=fem9Pw-MrgxQ
Pretrained Model https://huggingface.co/Ftfyhh/xttsv2_banana
Silero
- Поддерживает русский язык, много голосов.
- Управляемые ударения и паузы, немного роботизированный голос.
- Возможно, используется в "Русы против ящеров".
https://github.com/snakers4/silero-models
Colab https://colab.research.google.com/github/snakers4/silero-models/blob/master/examples_tts.ipynb
Демо https://huggingface.co/spaces/NeuroSenko/tts-silero
TeraTTS
- Простая модель, поддерживает русский язык, мало голосов, роботизированное звучание.
https://github.com/Tera2Space/TeraTTS
Демо https://huggingface.co/spaces/TeraTTS/TTS
Bark
- Поддерживает русский язык, включает смех, кашель, песенки.
- Иногда "галлюцинирует" на русском.
https://github.com/suno-ai/bark
Демо https://huggingface.co/spaces/suno/bark
Colab https://colab.research.google.com/drive/1eJfA2XUa-mXwdMy7DoYKVYHI1iTd9Vkt?usp=sharing#scrollTo=t9Vlr3RRt6B9
3. Нет русского языка
OpenVoice
- Поддерживает эмоции, нет русского языка.
https://github.com/myshell-ai/OpenVoice/tree/main
StyleTTS
- Русского языка нет. Мультиязычная модель, возможно поддерживает азиатские и европейские языки.
https://github.com/camenduru/styletts-colab
Демо https://huggingface.co/papercup-ai/multilingual-pl-bert/tree/main
Metavoice
- Пока без поддержки русского языка.
https://github.com/metavoiceio/metavoice-src
Продолжение - https://t.me/dAIpotestit/124
#TTS
ElevenLabs
Free AI Voice Generator & Voice Agents Platform | ElevenLabs
Create lifelike speech with our AI voice generator and voice agents platform. Access 5,000+ voices in 70+ languages with secure APIs and SDKs.
❤5🔥3👏1
Потестил Synctalk. Хорошо но пока криво.
Особенности:
- Требуется минимум 4 минуты видео для входа.
- Лицо на видео должно быть крупным планом. Разрешение около 512x512 px.
- В Colab на T4 предпроцесс+ трэйн занимает 4-5 часов.
- Это не классический липсинк, а скорее создание цифрового двойника, похожего на Heygen Instant Avatar.
Фэйлы и наблюдения в комментах👇
#lipsync
Особенности:
- Требуется минимум 4 минуты видео для входа.
- Лицо на видео должно быть крупным планом. Разрешение около 512x512 px.
- В Colab на T4 предпроцесс+ трэйн занимает 4-5 часов.
- Это не классический липсинк, а скорее создание цифрового двойника, похожего на Heygen Instant Avatar.
Фэйлы и наблюдения в комментах👇
#lipsync
🤔3
This media is not supported in your browser
VIEW IN TELEGRAM
Ну что братюни, пора менять аватарки. Топ сервисов для генерации портретов без обучения модели. Исключительно ИМХО.
Исходники и промпты в комментах к посту
Плюсы и минусы в посте ниже👇
#StyleFace
Исходники и промпты в комментах к посту
Плюсы и минусы в посте ниже👇
#StyleFace
🔥3👍1