Нейросеть LuxTTS делает то, от чего немного не по себе…
(минуту речи делает за доли секунды).
И да, это не какая-то серверная магия:
Установка:
git clone https://github.com/ysharma3501/LuxTTS.git
cd LuxTTS
pip install -r requirements.txt
Загрузка модели:
from zipvoice.luxvoice import LuxTTS
# load model on GPU
lux_tts = LuxTTS('YatharthS/LuxTTS', device='cuda')
# load model on CPU
# lux_tts = LuxTTS('YatharthS/LuxTTS', device='cpu', threads=2)
# load model on MPS for macs
# lux_tts = LuxTTS('YatharthS/LuxTTS', device='mps')
import soundfile as sf
from IPython.display import Audio
text = "Hey, what's up? I'm feeling really great if you ask me honestly!"
## change this to your reference file path, can be wav/mp3
prompt_audio = 'audio_file.wav'
## encode audio(takes 10s to init because of librosa first time)
encoded_prompt = lux_tts.encode_prompt(prompt_audio, rms=0.01)
## generate speech
final_wav = lux_tts.generate_speech(text, encoded_prompt, num_steps=4)
## save audio
final_wav = final_wav.numpy().squeeze()
sf.write('output.wav', final_wav, 48000)
## display speech
if display is not None:
display(Audio(final_wav, rate=48000))
#python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥40❤11👍9🤯5😱3
Копирует голос, переводит речь и вставляет всё это прямо в видео.
Умеет:
#python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35🔥17❤8🤯2
Что умеет:
# git clone this repository
git clone https://github.com/sczhou/CodeFormer
cd CodeFormer
# create new anaconda env
conda create -n codeformer python=3.8 -y
conda activate codeformer
# install python dependencies
pip3 install -r requirements.txt
python basicsr/setup.py develop
conda install -c conda-forge dlib (only for face detection or cropping with dlib)
#python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍37🔥10❤8
Как превратить тупое распознавание текста в умную систему, которая сама вытаскивает номера отслеживания, адреса, перевозчика и собирает всё в чистый JSON.
Python, нейросети, автоматизация складов и реальная экономия миллионов на ручной обработке.
#python #article #code
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22❤7🔥7
Если вам нужно анализировать спутниковые снимки, карты или данные о местности, GeoDeep — это must-have инструмент!
pip install -U geodeep
from geodeep import detect
bboxes, scores, classes = detect('orthophoto.tif', 'cars')
print(bboxes) # <-- [[x_min, y_min, x_max, y_max], [...]]
print(scores) # <-- [score, ...]
print(classes) # <-- [(id: int, label: str), ...]
geojson = detect('orthophoto.tif', 'cars', output_type="geojson")
#python #soft #github #osint
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28🔥16❤11🫡2
#doc #python
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43🔥14❤11🫡1
Для работы не требуется создание датасета или обучение модели.
Установка и пример использования:
1. Клонирование репозитория:
git clone https://github.com/s0md3v/roop.git
cd roop
2. Установка зависимостей:
pip install -r requirements.txt
3. Запуск программы с указанием исходного изображения и целевого видео:
python run.py --source path/to/source/image.jpg --target path/to/target/video.mp4
#python #github #soft
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32❤8🔥4🫡3🤯1
По сути, можно собрать у себя мини-Сити-17: система умеет детектить
Хотели нормальное видеонаблюдение без облачной зависимости и платных подписок — забираем.
#python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥43👍23❤8
Забудьте километры кода для Selenium. Helium — это та же мощь, но с вменяемым, коротким и человеческим API, который сокращает скрипты в два раза и позволяет работать с элементами страницы без танцев с бубном.
Chrome, Firefox? Да хоть весь зоопарк браузеров — библиотека разбирается сама.
iFrames, новые окна, ожидания загрузки, поломанные кнопки? Helium делает всё автоматически.
$ python -m pip install helium
# A Helium function:
driver = start_chrome()
# A Selenium API:
driver.execute_script("alert('Hi!');")
#python #soft #web #github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43🔥11❤8😱3
Десктопное приложение, которое умеет расшифровывать и переводить записи офлайн прямо на компьютере, используя модель OpenAI Whisper.
Внутрь можно загружать:
Простая установка:
pip install buzz-captions
python -m buzz
#python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20👍11❤3