📸Евгений🛠 Нейроиллюстратор
63 subscribers
61 photos
57 videos
33 links
Download Telegram
​​‼️ Создана нейросеть на базе Stable Diffusion, которая генерирует музыку по текстовому описанию ‼️

👉🏼 Нейросеть Stable Diffusion известна многим. Она позволяет генерировать изображения по текстовому описанию. Но, как оказалось, с её помощью можно также создавать и музыку.

🔷 Суть в том, что система может создавать аудиоспектрограммы - визуальные изображения звуковых частот в треке. После этого нужно лишь «воспроизвести» полученный звук.

🔷 В спектрограмме (или сонограмме) на оси представлен порядок воспроизведения частот слева направо.

🔷 По оси Y размещаются данные о частотах звука, а цвет пикселей задаёт амплитуду звука в каждой момент времени.

🔷 Нейросеть обучили на сонограммах, которые описывают музыкальные жанры или звуки.

🔷 В результате получилась Riffusion - нейросеть, способная генерировать звук из изображения, которое создаётся по текстовому описанию. Для вывода именно аудиодорожки используется Torchaudio.

🔷 При этом разработчики смогли заставить нейросеть генерировать такие аудиоклипы, которые могли бы плавно «перетекать» друг в друга. То есть, темп музыки не меняется резко.
👍6
🔥 Курс Свой Windows Server
💥 + Права Перепродажи
💥 + Автоматизация
💳 Только сегодня за 0 рублей
💥 + Новогодняя Акция!
👉 Секрет Goodly + Права Перепродажи в 🎁 подарок
👍3
Как работает Stable Diffusion: объяснение в картинках

Генерация изображений при помощи ИИ — одна из самых новых возможностей искусственного интеллекта, поражающая людей (в том числе и меня).

Способность создания потрясающих изображений на основании текстовых описаний похожа на магию; компьютер стал ближе к тому, как творит искусство человек.

Выпуск Stable Diffusion стал важной вехой в этом развитии, поскольку высокопроизводительная модель оказалась доступной широкойпублике (производительная с точки зрения качества изображения, скорости и относительно низких требований к ресурсам и памяти).

Поэкспериментировав в генерацией изображений, вы можете задаться вопросом, как же она работает.

Перейдя по сыслке ниже вы можете полностью ознакомиться с pdf пособием написанным на основе статей, как функционирует Stable Diffusion объяснение в картинках.
👍3
Прикольная серия картинок от нейросети на тему «Кот алкоголик — горе в семье».
👍4😁1
Алгоритм глубокого обучения может слышать алкоголь в голосе

Нейросети научились не только аватарки делать, но и уровень опьянения показывать.

Исследователи из университета La Trobe в Австралии разработали новую технологию искусственного интеллекта, которая позволяет мгновенно определить степень алкогольного опьянения по … голосу!

Алгоритм ADLAIA (Audio-based Deep Learning Algorithm to Identify Alcohol Inebriation) разработали и протестировали с использованием 12 360 записей голосов людей с разной степенью опьянения. А работает ADLAIA как обычное приложение на смартфоне.

Результаты поражают: алгоритм с 70% вероятностью определяет даже 0,5 промилле, что приравнивается к примерно 100 гр крепкого алкоголя.

Резюме: Новая технология искусственного интеллекта может мгновенно определять, превышает ли человек допустимую норму алкоголя, анализируя 12-секундный фрагмент его голоса.
👍3😱1
Нейросеть превратила песни «Короля и Шута» в фэнтези-вселенную.
👍7🔥4
Лучший звук с помощью нейросети от Adobe Podcast

Adobe Podcast с функцией Enhance speech – очередной успешный пример использование обученной нейросети в той сфере, куда, казалось бы, искусственный интеллект должен был прийти в последнюю очередь: в сфере творчества.

Нейросеть Enhance speech от Adobe может улучшить запись с диктофона и независимо от того, на какое оборудование вы записывались и сколько было посторонних шумов в комнате, приблизить ее по звучанию к дикторской версии записанной в студии. Вам при этом ничего делать не нужно, нейросеть все сделает за вас.
👍8🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Нейросеть показала, как выглядел мир, если бы Рим не пал.
🔥5👍4