НейроProfit | Соня Pro Ai
10.6K subscribers
416 photos
490 videos
4 files
582 links
Авторский канал про полезные нейросети для бизнеса, учебы и работы ⚛️

Получай Профит с помощью нейросетей уже сейчас ⚛️ 🤝

Реклама: https://telega.in/c/NeuralProfit

Сотрудничество: @sony_yar
Обучение Midjourney https://neuralprofit.ru
Download Telegram
Создание синтезированного голоса нейросетью. Обзор и сравнение сервисов для озвучки NaturalReader, Еlevenlabs и Resemble

Искусственный интеллект для озвучки текста позволяет создавать подкасты, озвучивать героев игр и фильмов, создавать дубляж и редактировать аудиофайлы. Если вы по какой-то причине не хотите сами озвучивать видео, эти сервисы очень выручат. С воссозданным голосом можно озвучить текст, выбрать язык, на котором он будет воспроизведён, подобрать эмоции для голоса и скорость воспроизведения отдельных слов и другие параметры. Также синтезированный нейросетью голос можно привязать к телефонии для ответов на звонки клиентов или другим облачным сервисам по API.

Сервисы, которые я рассмотрела могут спокойно озвучивать книги - можно настроить озвучку, неотличимую от человеческой. АЕlevenlabs и Resemble могут клонировать голос знаменитости или ваш голос, так что можно сделать озвучку вашим голосом без вашего участия, что очень удобно. Но обо всем по порядку.

NaturalReader

Из русской озвучки есть только Максим и Татьяна, скачать в mp3 можно только по подписке Plus за 20 $ в месяц. Как настроить ударение, я так и не поняла

Крутой инструмент для тех, у кого англоязычный контент. Голоса Plus обеспечивают плавное и естественное звучание текста в речь, которое соответствует шаблонам и интонациям человеческого голоса. Тогда можно подобрать даже интонации от веселого тона повествования до тревожного, правда не в русской озвучке. Отлично подойдет для озвучки книг.

подходит больше для английской озвучки, для русского языка подписка Plus не целесообразна

Еlevenlabs

Очень крутой инструмент! Но опять-таки нет русского языка. Скачивать голос можно бесплатно до 10 000 знаков в месяц.
Есть расширенные настройки - можно выбрать возраст голоса, акцент и степень интенсивности акцента.
Так же есть библиотека голосов, сгенерированных другими пользователями. Их можно использовать и скачивать. Попадаются и голоса знаменитостей вроде Тома Хидлстона.

Но и это еще не главное! За 5 $/мес можно создать 10 голосов - достаточно просто загрузить голос в аудиоформате (более 1 минуты) без посторонних шумов! И можно сгенерировать озвучку голосом знакомого или знаменитости 🤯

Но и это еще не все! В июле открывается доступ в Voice Cloning - где можно создать идентичную ИИ-версию вашего голоса.

крутой профессиональный инструмент
доступная цена
хорошие бесплатные возможности
маркетплейс с голосами
нет русского языка

Одним из возможных применений Еlevenlabs является создание синтезированных голосовых помощников для различных устройств и приложений. Например, вы можете использовать эту технологию для создания голосового помощника для своего мобильного приложения или устройства умного дома.
Также Еlevenlabs может быть полезна в музыкальной индустрии, например, для создания синтезированных голосовых эффектов или имитации голосов знаменитых певцов или актеров.
В целом, Еlevenlabs представляет собой мощный инструмент для создания реалистичных голосовых имитаций на основе коротких отрезков аудио. 

Resemble

Бесплатно дается 300 секунд.
Функция Clone my voice на бесплатном пробном периоде
С Resemble маркетологи, контент-менеджеры, специалисты по рекламе и SMM могут создавать аудиролики, озвученные нейросетью, но звучащие как люди.

Нейросеть поддерживает 62 языка в том числе и русский, но в платной версии. Для создания шаблона персонажа озвучки нужно загрузить образец голоса или прочитать отрывок текста, если хотите использовать свой голос. Нейросеть проанализирует образец и воссоздаст синтезированный голос, похожий на оригинальный.

управление эмоциями при создании записи
перевод голоса на 62 доступных языка
маркетплейс с голосами
есть русский язык в платной версии
в пробном периоде можно бесплатно клонировать свой голос
цена 0,006 $ за секунду 😬

Итоги: Я намеренно не включила в итоги NaturalReader - он дорогой и все функции есть в Resemble и Еlevenlabs. Их и сравним.

#elevenlabs
Сравнение Resemble и Еlevenlabs

У обоих сервисов есть маркетплейсы, где можно скачать уже готовые голоса и бесплатно их использовать. Оба профессиональные инструменты и умеют клонировать голоса. В клонировании голосов лучшим считается Еlevenlabs, но в Resemble можно клонировать свой голос бесплатно, а в Еlevenlabs функция Voice Cloning будет доступна в июле платно. В Resemble в платной версии есть русский язык. Кроме того, в Resemble можно бесплатно поменять интонацию в тексте. А вЕlevenlabs больше выбора акцентов голосов, зато в Resemble есть озвучка шепотом). Кроме того, в Resemble есть возможность локализации языка - можно выбрать голос на одном языке и этот же голос перевести на другой язык.

Итог:
Одним словом, в Resemble больше бесплатных возможностей для старта, аЕlevenlabs лучше клонирует голоса знаменитостей и более доступен по цене.
Если вам хватит функционала попроще, для озвучки вполне подойдет Cybervoice за 100 рублей в месяц, о нем здесь или сервис Speechki, как им бесплатно озвучить я рассказывала здесь

#elevenlabs
Media is too big
VIEW IN TELEGRAM
Друзья, обзор получился объемный, но без воды. Хотелось дать вам годную инфу и разложить ее по полочкам. Вот подробный обзор и сравнение сервисов для озвучки и создания синтезированных голосов NaturalReader, ElevenLabs и Resemble

#elevenlabs
This media is not supported in your browser
VIEW IN TELEGRAM
В обновленном ElevenLabs появился русский язык

В ElevenLabs можно настроить интонацию, сделать голос более или менее эмоциональным и выбрать готовые пресеты. В обновлении 2.0 значительно лучше качество озвучки и появилось более 30 языков, включая русский.

Самое приятное в этом, чтобы протестировать ElevenLabs, не нужно регистрироваться 🔥

#elevenlabs
Please open Telegram to view this post
VIEW IN TELEGRAM
Дубляж видео на русский с сохранением голоса. Сравнение HeyGen с ElevenLabs.

Я уже рассказывала про перевод от HeyGen - он обалденно переводит видео, сохраняя интонации голоса. Единственный минус, переводит видео с русского, на русский пока нет.

Зато одним игроком на рынке дубляжа видео стало больше! ElevenLabs прекрасно переводит на русский. Для примера я скачала интервью Илона Маска на английском языке и перевела его на русский в ElevenLabs .
Сервис переводит на 29 языков, сохраняя оригинальный голос 🔥

Процесс тоже интуитивно понятен, все как и здесь, загружаем видеоролик (можно без лица) - выбираем язык ввода (на каком языке ролик), выбираем язык вывода (на какой язык хотели бы перевести), ждем около минуты и можно скачивать результат

Сравнение ElevenLabs и HeyGen

ElevenLabs, как и HeyGen ,анализирует речь, переводит и синтезирует её в новую звуковую дорожку, так что получается естественная озвучка.

В чем отличия?
Перевод видео в ElevenLabs пока бесплатен, но ограничен 2000 символами, а в HeyGen ролик просто ограничен 500мб, и он платный.
Резюмируя, оба они переводят отлично и очень похоже на оригинальный голос, но HeyGen подстраивает еще и движение губ

UPD: Elevenlabs сейчас стоит от 5$ долларов в месяц

#elevenlabs
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Инновационный прорыв ElevenLabs: заработок в сфере ИИ-дубляжа

Сегодня технологию ElevenLabs используют сотрудники 41% компаний из списка Fortune 500. Компания уже привлекла $80M инвестиций 

Что нового?
Нейродубляж:

ИИ-стартап, который недавно оценили в $1,1 млрд (подробнее в Bloomberg), запустил студию нейродубляжа.

Теперь можно перевести видео на один из 29 языков (в т.ч. русский) с учетом тона голоса говорящего, акцента, фонового шума, сохраняя голос и эмоции оригинального говорящего.
В предыдущей версии, ролик наверху перевелся бы с кучей искажений, голосовых артефактов.Язык вывода я указала Английский, хотя в видео присутствует несколько языков. Не смотря на это, сервис без проблем перевел мне видос на русский, не теряя смысл.

Новые продукты

Dubbing Studio: можно дублировать фильмы целиком, создавать и редактировать их расшифровки, переводы и тайм-коды. 

Voice Library (голосовая библиотека): безопасная платформа для заработка на версиях собственных голосов, созданных ии. Пользователи могут создать свою профессиональную реплику голоса, проверить ее и поделиться ею через голосовую библиотеку. Когда другие используют эти проверенные голоса, создатели получают компенсацию. Пользователи всегда сохраняют контроль над доступностью своего голоса и условиями компенсации. Маркетплейс уже приносит доход небольшой группе альфа-пользователей.

Кстати, у сервиса есть классификатор речи с использованием ии, который может проверить, содержит ли аудиосэмпл контент, созданный ElevenLabs.  Его они тоже улучшат - включат и другие голосовые модели в свой классификатор.

Приложение Mobile Reader: Ранняя предварительная версия мобильного приложения для чтения, которая позволяет мгновенно преобразовывать текст и URL-адреса в аудио, упрощая пользователям доступ к контенту на другом носителе во время движения. В качестве ознакомительной пробной версии приложение будет доступно бесплатно в течение первых трех месяцев, и пользователи смогут зарегистрироваться для получения раннего доступа через список ожидания.

#elevenlabs
Media is too big
VIEW IN TELEGRAM
ElevenLabs добавил возможность заработать на клонировании голоса

В одном из прошлых постов я писала, что ElevenLabs анонсировали возможность заработать пользователям на клонировании голоса. И вот теперь все желающие могут загрузить свой голос и получать деньги за его использование.

Как работает:
Пользователь загружает 30 минут аудио голоса, добавляет описание, затем назначает цену и указывает реквизиты.
Голосом будет озвучиваться реклама и прочий контент, а взамен обещают пассивный доход.

Подать заявку можно здесь

Подробнее про ElevenLabs и сравнения с Resemble и тд в трех частях, начать отсюда

Про обновления и русский язык

Про возможность заработка на созданных голосах и инновации

Про дубляж видео на русский и сравнение с HeyGen

#elevenlabs
Media is too big
VIEW IN TELEGRAM
Еще одна новинка от ElevenLabs: Смешайте свой голос с любым другим и озвучьте на 29 языках⁠⁠

ElevenLabs выпустили новую функцию AI Voice Changer, теперь можно преобразовывать Speech to Speech (речь в речь) и превращать свой голос в другого персонажа, можно управлять его эмоциями и подачей. Сохраняется тембр, тайминги, благодаря чему синтезированная речь звучит ещё реалистичнее, имитируя ваше произношение.

Ваш голос можно преобразовать в любой другой на 29 языках, в том числе на русском. Достаточно будет записи вашей речи и образца чужого голоса.

Легко можно создать собственные AI голоса для своих видео, подкастов, игр и многого другого одним щелчком мыши.

Интересно, можно ли будет продать эти сгенерированные голоса? А так, видно вливание $80M инвестиций, ИИ-стартап развивается стремительно, недаром его недавно оценили в $1,1 млрд.

#elevenlabs
This media is not supported in your browser
VIEW IN TELEGRAM
Нейросеть для создания звуковых эффектов

ElevenLabs конечно молодцы - везде успели! Анонсировали свою последнюю разработку - нейросеть для создания звуковых эффектов и заодно Заколлабились с нейросетью Sora, которая успела наделать много шума, еще даже не выйдя в широкие массы. (Про нее здесь)

К генерациям Sora появится возможность добавлять реалистичные звуки по текстовому запросу.

Видео, на котором показываются возможности Sora, уже взорвало интернет, показывая, как визуализации превращаются в невероятные звуки.

Вырисовывается хорошая перспектива для sound-дизайнеров, больше не нужно проводить много времени за поисками подходящего звукового эффекта. ElevenLabs все автоматизирует - сама создаст уникальные звуки, которые можно настроить по текстовым подсказкам.

Да в принципе, для всех креативщиков открываются хорошие возможности для творчества - производство фильмов, игр, музыкальную индустрию ждут изменения. Не нужно быть звукорежиссером, чтобы создать свой проект.

ElevenLabs прям радует частотой инноваций, не даром привлекли $80M инвестиций

Записаться на ранний доступ можно здесь, чтобы в числе первых протестировать нейросеть бесплатно, может даже вотермарок не будет

#elevenlabs
Обновление в ElevenLabs - генератор звуковых эффектов 🗣️

ElevenLabs выпустили новую функцию Sounds Effect, которая положит конец аудиостокам. Теперь просто введя описание звукового эффекта можно мгновенно получить сэмплы звука — пение, дождь, взрыв, волны, искры и что угодно. - Посмотрите их промо ролик (второе видео)

Я затестила новую функцию (первое видео), пока работает хорошо на английском, можно совместить чью-то речь и звуковые эффекты. Например, я в своем примере соединила звуки дождя за окном и мужской голос, который говорит на английском “мой дом-моя крепость”.

По-русски пока не очень, если описывать действия на русском, то нейросеть просто озвучит все, что написано. Если совместить описание звуковых эффектов на английском, а саму речь на русском, получится вообще непонятный набор символов.

Что крутого

🟢 Пока бесплатно! Тестите
🟢 Можно настроить уровень креативности и уровень следования тестовой подсказке
🟢 Можно настроить время или предоставить ИИ самому выбрать наилучшую продолжительность

Классная возможность контентмейкерам не платить за soundstock, не тратить время на поиски, а просто самому сгенерировать то, что нужно и забыть про авторские права

Друзья, не скупитесь на реакции 😉

🤝 НейроProfit

#elevenlabs
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Нейросеть для клонирования голоса MARS5. Сравнение с ElevenLabs

Записала для вас видео сравнение двух нейросетей в клонировании голосов. Про ElevenLabs вы в курсе, освежить память можно, нажав #elevenlabs

Новая нейросеть MARS5 доступна бесплатно в GitHub, либо либо на платформе Camb AI. Где на старте дается 5 минут. На самой платформе еще есть видеодубляж с переводом, и это тоже входит в бесплатные 5 минут.
Политика как и у ElevenLabs - те каждый месяц дают бесплатно 10к знаков (10 мин аудио), которые можно потратить на дубляж с переводом, перевести текст в аудио, создать голоса, а звуковые эффекты и вовсе пока бесплатны.

🟣 Клонирование голоса:
Для того, чтобы клонировать голос, загружать аудио нужно в формате .wav, длина от 90 секунд до 10 минут.
Бесплатно дает загрузить 2 голоса для клонирования. Голосами можно озвучить до 400 символов текста за раз.
Работает со 140 языками, включая русский.

Намеренно не стала сравнивать с Whisper Speech и PlayHT, так как они не поддерживают русский язык.
Их возможности представлены в этих постах:

🟣 Бесплатное клонирование с Whisper Speech
🟣 Клонирование с PlayHT

Что скажете? Кто пробовал MARS5, у вас какие результаты?

#elevenlabs #mars5 #text2audio #texttoaudio

НейроProfit
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
В сети набирают популярность короткометражные фильмы ужасов от нейросетей. Их можно создать с помощью нейросетей, про которые я вам рассказывала:

🟣 Udio для музыки. Пост

🟣 Dream Machine для видео. Пост

🟣 ElevenLabs для голоса. #elevenlabs

🟣 Hedra для диалогов. Пост

🟣 Midjourney сделает картинки, из которых делали видео. Пока самый лучший способ получить качественное и реалистичное видео - создать видео из готовых изображений. Midjourney остается самой лучшей нейросетью для генерации реалистчиных изображений высокого качества. Научитесь пользоваться этим инструментом в 🌸Закрытом клубе Midjourney
Please open Telegram to view this post
VIEW IN TELEGRAM
Звуковые эффекты за 8 секунд

Soundeff - это ИИ-генератор звуковых эффектов, наподобие того, который есть в Elevenlabs. Заодно там так же есть библиотека пользовательских звуковых генераций. 👉🏻 Про функцию звуковые эффекты в Elevenlabs

🌸 Действия тоже такие же, как в Elevenlabs - пишете простой запрос по которому создается желаемый звуковой эффект - звук поезда, звуки природы, смех и на что хватит фантазии.
По времени обе нейросети генерирует звуковые эффекты тоже одинаково, примерно за 8 секунд. С чем похожи разобрались, теперь рассмотрим отличия.

Отличия Soundeff от Elevenlabs

🟠 Длина выходного аудио в Elevenlabs 8 секунд, а в Soundeff 5 секунд.

🟠 В Elevenlabs функция звуковых эффектов пока бесплатна для всех пользователей, в Soundeff бесплатно дается 3 генерации звука, далее подписка от 10$ за 400 генераций.

Так же, в платном плане Soundeff генерация звука будет быстрее, хотя итак за 8 секунд генерирует. Длину аудио в платном тарифе скоро увеличат до 10 секунд и добавят пользовательские настройки.
Что касается Elevenlabs, пока именно функция звуковых эффектов бесплатная, будет ли она платной потом, и какая будет цена, неизвестно. А так платформа обширная конечно, только появляется что-то из технологий для звука и голоса, а в ElevenLabs это уже реализовано. Недаром ElevenLabs привлекли $80M инвестиций

НейроProfit

#нейросеть #elevenlabs #soundeff
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM