В дополнение к датафесту советую еще одну активность.
Пару месяцев назад узнал про сообщество Union от своих друзей (уже 4 из них состоят в клубе). Место для будущих или уже гениев, плейбоев, миллиардеров и филантропов :)
Union Club — сообщество Tech-предпринимателей, которые развивают IT-продукты.
Сайт клуба: https://unionclub.pro
Скоро будет митап для участников сообщества, на который мне выпала честь прийти. Приходите тоже. Именно в юнионе можно найти человека, с которым вы за пару недель замутите темку и заработаете миллионы. Прямо перед моим носом, прямо несколько недель назад случилась такая история. К слову, я тоже делаю бизнес: недавно мы включили монетизацию для @Audio2MIDIBot .
Думаю, на митапах с акцентом на предпринимателей нужно максимально нетворкаться. С каждым индивидуально, понимая потребности и свои сильные стороны (хард скилы, связи в обществе, навыки руководства и тд). Нужно сделать так, чтобы когда вы или другой человек решит делать интересное дело, с бОльшей вероятностью его/ваше лицо вспомнилось первым.
Если вы готовы, все подробности по митапу здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤🔥6⚡4🥴1🤝1
Секция про ML в музыке стартует в 17:20, мой доклад в 18:40. До встречи в прямом эфире! Все ссылки здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
ODS Events
В 12:05 мы стартуем эфир с офлайн-площадки Data Fest 2025 в гостях у X5 Tech!
В программе доклады из секций:
🛒 Data и ML в Retail от хоста площадки X5 Tech
🧠 NLP, AI4SE, Advanced LLM и целый блок докладов ML in Music 🎶 — от сообщества ODS🦜
📺 Ссылка на трансляцию…
В программе доклады из секций:
🛒 Data и ML в Retail от хоста площадки X5 Tech
🧠 NLP, AI4SE, Advanced LLM и целый блок докладов ML in Music 🎶 — от сообщества ODS🦜
📺 Ссылка на трансляцию…
❤9👍6🔥5🌚1
Периодически я возвращаюсь к репозиторию, где удобно разделены аудио модельки, чтобы быстро подобрать актуальную под свою задачу.
В репозитории рассматриваются три ключевые области: (1) модели для репрезентаций, (2) аудиокодеки и (3) языковые модели, которые способствуют развитию больших языковых моделей для речи/аудио.*️⃣ Модели для репрезентаций: Эти модели сосредоточены на обучении структурных представлений речи, которые затем могут быть квантованы в дискретные речевые токены, часто называемые семантическими токенами.*️⃣ Аудиокодеки: Эти модели предназначены для обучения дискретных токенов речи и аудио, часто называемых акустическими токенами, при сохранении способности к реконструкции и низкой битовой скорости.*️⃣ LLM для речи: Эти модели обучаются на основе речевых и акустических токенов с использованием подхода языкового моделирования. Они демонстрируют высокую эффективность в задачах понимания речи и генерации речи.
GitHub: https://github.com/ga642381/speech-trident
#audio #papers
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - ga642381/speech-trident: Awesome speech/audio LLMs, representation learning, and codec models
Awesome speech/audio LLMs, representation learning, and codec models - ga642381/speech-trident
❤8👍6🔥5✍2 1
Меня зовут Захар Варфоломеев @varfolomeefff. Обучать нейронки это моя работа, я ML Engineer, объединяю музыку и технологии, а также немножко ученый и предприниматель + организатор и спикер на конференциях. Тяжело выделить конкретные факты, их много. Сначала начну со своей личности, потом расскажу про факты о карьере. Пора бы записать новый подкаст вообще)) А старые я, конечно, не дам
Самое актуальное:
Вот такой водопад слов! Теперь поделюсь примерами постов на разные темы:
1) Мое выступление с прошлого года и с этого года на DataFest.
2) Разбор в формате карточек секции ML in Music на датафесте (когда настроение хорошее, могу дизайнить, хы).
3) Немного о личной жизни.
4) О посещении конференции AIConf
5) Про мой ресерч VQ-VAE моделей: раз и два
Всем хорошего дня! Пора в путь.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥28❤19🏆13 5💩3
Посмотреть запись секции: https://vkvideo.ru/video-164555658_456241380?t=5h35m33s
Отдельно доклады будут выложены на ютубе позже.
Впервые за время существования датафеста (10 лет!) мною была собрана секция про ML в музыке и сразу 5 спикеров на 1 площадке:
На докладах мы послушали музычку и узнали множество инсайдов при работе с авторегрессией и диффузией для генерации музыки, а также обсудили задачи music information retrieval (MIR), где поговорили о foundation моделях в музыке, существующих подходах (актуальных и не очень), выделении трейлеров в музыке, исследованиях по аудио кодекам... список длинный, поэтому предлагаю почитать резюме в формате карточек!
#music #audio #perfomances
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤16❤🔥8👍3✍2🔥2
Forwarded from Ученый без степени | AI-блог Ани
🔗 «Discrete Audio Tokens: More Than a Survey!»
🔗 Бенчмарки
Исследователи создали:
Есть, что поизучать на выходных
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7✍5👍3
VF | Science
Video message
Кто любит джаз?) 🎶
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥18☃3🗿3❤1🍾1
Media is too big
VIEW IN TELEGRAM
Звучать стало несколько лучше на семплах, где модель повторялась и была неточной. Совсем скоро будет ещё лучше
Далее хочется ускорить инференс и сделать модель компактнее.
#audio #startup
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21❤9👏4 4
This media is not supported in your browser
VIEW IN TELEGRAM
Пов: как Захар проходил собесы в Яндекс, Сбер, Звук, Т-Банк и другие чудесные места
P. S. завтра сессия и 3 собеса в 1 день, как это произошло не знаю😢
P. S. завтра сессия и 3 собеса в 1 день, как это произошло не знаю
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣26😁6🔥3💘2⚡1