📸Евгений🛠 Нейроиллюстратор

‼️ Создана нейросеть на базе Stable Diffusion, которая генерирует музыку по текстовому описанию ‼️

👉🏼 Нейросеть Stable Diffusion известна многим. Она позволяет генерировать изображения по текстовому описанию. Но, как оказалось, с её помощью можно также создавать и музыку.

🔷 Суть в том, что система может создавать аудиоспектрограммы - визуальные изображения звуковых частот в треке. После этого нужно лишь «воспроизвести» полученный звук.

🔷 В спектрограмме (или сонограмме) на оси представлен порядок воспроизведения частот слева направо.

🔷 По оси Y размещаются данные о частотах звука, а цвет пикселей задаёт амплитуду звука в каждой момент времени.

🔷 Нейросеть обучили на сонограммах, которые описывают музыкальные жанры или звуки.

🔷 В результате получилась Riffusion - нейросеть, способная генерировать звук из изображения, которое создаётся по текстовому описанию. Для вывода именно аудиодорожки используется Torchaudio.

🔷 При этом разработчики смогли заставить нейросеть генерировать такие аудиоклипы, которые могли бы плавно «перетекать» друг в друга. То есть, темп музыки не меняется резко.

👍6

331 views15:18

Попробовать онлайн здесь

📸Евгений🛠 Нейроиллюстратор

🔥 Курс Свой Windows Server
💥 + Права Перепродажи
💥 + Автоматизация
💳 Только сегодня за 0 рублей
💥 + Новогодняя Акция!
👉 Секрет Goodly + Права Перепродажи в 🎁 подарок

👍3

1.37K viewsedited 13:00

💥 Голандец за 0 рублей

🎁 Секрет Goodly

📸Евгений🛠 Нейроиллюстратор

https://telegra.ph/130-000r-za-4-dnya-s-nulya-01-17

Telegraph

130 000р за 4 дня с нуля.

В данной статье вы увидите мой пошаговый план хорошего заработка на одной партнёрке. Я новичок и ни когда раньше не зарабатывал в интернете на партнёрках. Недавно в интернете появилось шикарное обучение по освоению совершенно новой интернет-профессии «Специалист…

👍7

1.21K views17:50

📸Евгений🛠 Нейроиллюстратор

Как работает Stable Diffusion: объяснение в картинках

Генерация изображений при помощи ИИ — одна из самых новых возможностей искусственного интеллекта, поражающая людей (в том числе и меня).

Способность создания потрясающих изображений на основании текстовых описаний похожа на магию; компьютер стал ближе к тому, как творит искусство человек.

Выпуск Stable Diffusion стал важной вехой в этом развитии, поскольку высокопроизводительная модель оказалась доступной широкойпублике (производительная с точки зрения качества изображения, скорости и относительно низких требований к ресурсам и памяти).

Поэкспериментировав в генерацией изображений, вы можете задаться вопросом, как же она работает.

Перейдя по сыслке ниже вы можете полностью ознакомиться с pdf пособием написанным на основе статей, как функционирует Stable Diffusion объяснение в картинках.

👍3

273 views11:51

Stable Diffusion

📸Евгений🛠 Нейроиллюстратор

Прикольная серия картинок от нейросети на тему «Кот алкоголик — горе в семье».

👍4😁1

877 views13:31

📸Евгений🛠 Нейроиллюстратор

Алгоритм глубокого обучения может слышать алкоголь в голосе

Нейросети научились не только аватарки делать, но и уровень опьянения показывать.

Исследователи из университета La Trobe в Австралии разработали новую технологию искусственного интеллекта, которая позволяет мгновенно определить степень алкогольного опьянения по … голосу!

Алгоритм ADLAIA (Audio-based Deep Learning Algorithm to Identify Alcohol Inebriation) разработали и протестировали с использованием 12 360 записей голосов людей с разной степенью опьянения. А работает ADLAIA как обычное приложение на смартфоне.

Результаты поражают: алгоритм с 70% вероятностью определяет даже 0,5 промилле, что приравнивается к примерно 100 гр крепкого алкоголя.

Резюме: Новая технология искусственного интеллекта может мгновенно определять, превышает ли человек допустимую норму алкоголя, анализируя 12-секундный фрагмент его голоса.

👍3😱1

1.29K views18:04

📸Евгений🛠 Нейроиллюстратор

Нейросеть превратила песни «Короля и Шута» в фэнтези-вселенную.

👍7🔥4

1.36K views18:18

📸Евгений🛠 Нейроиллюстратор

Лучший звук с помощью нейросети от Adobe Podcast

Adobe Podcast с функцией Enhance speech – очередной успешный пример использование обученной нейросети в той сфере, куда, казалось бы, искусственный интеллект должен был прийти в последнюю очередь: в сфере творчества.

Нейросеть Enhance speech от Adobe может улучшить запись с диктофона и независимо от того, на какое оборудование вы записывались и сколько было посторонних шумов в комнате, приблизить ее по звучанию к дикторской версии записанной в студии. Вам при этом ничего делать не нужно, нейросеть все сделает за вас.

👍8🔥2

1.38K views13:45

Enhance speech от Adobe Podcast