дAI потестить!

Channel created

09:50

Как изменить лицо на фото без регистрации и смс
Ссылки на сервисы:
https://faceswapper.ai/swapper
https://www.deepswapper.com
https://clipdrop.co/swap
#faceswap #pipeline

🙏1

725 viewsedited 18:08

Очень странный способ сделать похожее фото
1. Переходим в ChatGPT (нужен VPN)
2. Загружаем картинку и пишем промпт:
╚

Очень подробно опиши эту картину. Опиши каждую деталь, укажи расположение каждой детали, цвета, композицию, все остальное. Это должно быть самое подробное описание, из всех возможных

╚ Перепиши сообщение в виде промпта для генерации картинки (знаю, знаю можно и лучше)
3. Копируем получившийся текст и идем в Omost (для гиков репо)
4. Вставляем текст, жмем Submit потом Render the Image!
5. Profit!
#reference #pipeline

1.26K viewsedited 13:42

дAI потестить!

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

Добрался до V-Express. В Kaggle на P100 ждал час. Качество очень посредственное. Где использовать - не знаю.
Для тек кто хочет потыкать сам:
Git: https://github.com/tencent-ailab/V-Express
Comfyui: https://github.com/AIFSH/ComfyUI_V-Express
Kaggle: в первом комментарии. Исходники там же
#lipsync

👍3

917 viewsedited 21:46

дAI потестить!

0:34

This media is not supported in your browser

VIEW IN TELEGRAM

Описание тут👇
#TTS

😁2

1.4K viewsedited 21:18

дAI потестить!

Описание тут👇 #TTS

1. Лучшее

ElevenLabs
- Отлично знает русский язык, хорошо справляется с ударениями.
- Можно управлять ударениями, сервис в помощь
- Много тембров, минимум электронных призвуков, отличная интонация.
https://elevenlabs.io/
Демо https://huggingface.co/spaces/elevenlabs/tts
Коллаб https://github.com/camenduru/elevenlabs-colab
- Минусы: Нельзя управлять интонациями. Решение: перегенерация текста.

2. Есть недостатки

XTTS
- Поддерживает русский язык, реалистичное звучание.
- Проблемы с ударениями и интонацией, роботизированный голос.
- Есть претрейн, который немного улучшает ситуацию.
- Возможность самостоятельной тренировки модели.
https://github.com/coqui-ai/TTS
https://github.com/daswer123/xtts-webui
Демо https://huggingface.co/spaces/coqui/xtts
Colab https://colab.research.google.com/drive/1MrzAYgANm6u79rCCQQqBSoelYGiJ1qYL#scrollTo=fem9Pw-MrgxQ
Pretrained Model https://huggingface.co/Ftfyhh/xttsv2_banana

Silero
- Поддерживает русский язык, много голосов.
- Управляемые ударения и паузы, немного роботизированный голос.
- Возможно, используется в "Русы против ящеров".
https://github.com/snakers4/silero-models
Colab https://colab.research.google.com/github/snakers4/silero-models/blob/master/examples_tts.ipynb
Демо https://huggingface.co/spaces/NeuroSenko/tts-silero

TeraTTS
- Простая модель, поддерживает русский язык, мало голосов, роботизированное звучание.
https://github.com/Tera2Space/TeraTTS
Демо https://huggingface.co/spaces/TeraTTS/TTS

Bark
- Поддерживает русский язык, включает смех, кашель, песенки.
- Иногда "галлюцинирует" на русском.
https://github.com/suno-ai/bark
Демо https://huggingface.co/spaces/suno/bark
Colab https://colab.research.google.com/drive/1eJfA2XUa-mXwdMy7DoYKVYHI1iTd9Vkt?usp=sharing#scrollTo=t9Vlr3RRt6B9

3. Нет русского языка

OpenVoice
- Поддерживает эмоции, нет русского языка.
https://github.com/myshell-ai/OpenVoice/tree/main

StyleTTS
- Русского языка нет. Мультиязычная модель, возможно поддерживает азиатские и европейские языки.
https://github.com/camenduru/styletts-colab
Демо https://huggingface.co/papercup-ai/multilingual-pl-bert/tree/main

Metavoice
- Пока без поддержки русского языка.
https://github.com/metavoiceio/metavoice-src

Продолжение - https://t.me/dAIpotestit/124
#TTS

ElevenLabs

Free AI Voice Generator & Voice Agents Platform | ElevenLabs

Create lifelike speech with our AI voice generator and voice agents platform. Access 5,000+ voices in 70+ languages with secure APIs and SDKs.

❤5🔥3👏1

2.22K viewsedited 21:18

дAI потестить!

0:08

This media is not supported in your browser

Потестил Synctalk. Хорошо но пока криво.
Особенности:
- Требуется минимум 4 минуты видео для входа.
- Лицо на видео должно быть крупным планом. Разрешение около 512x512 px.
- В Colab на T4 предпроцесс+ трэйн занимает 4-5 часов.
- Это не классический липсинк, а скорее создание цифрового двойника, похожего на Heygen Instant Avatar.
Фэйлы и наблюдения в комментах👇
#lipsync

🤔3

1.2K views19:54

дAI потестить!

0:34

This media is not supported in your browser

VIEW IN TELEGRAM

Попытался восстановить зубы после липсикна этой приблудой HDTR-Net.
Особенности:
+ потребляет мало Vram
- плохо работает
- маленькое разрешение модели
P.S. Возможно нужно пробовать на шоте, где во рту зубов нет, но мне лень
P.S.S То что получилось - справа
#lipsync

1.02K viewsedited 13:21

дAI потестить!

Ну что братюни, пора менять аватарки. Топ сервисов для генерации портретов без обучения модели. Исключительно ИМХО.
Исходники и промпты в комментах к посту
Плюсы и минусы в посте ниже👇
#StyleFace

🔥3👍1

1.07K views09:56

About

Blog

Apps

Platform