SpeechBrain - классный репозиторий для всего связанного со звуком. Сам им пользовался пару раз.
#sound #speech #audio
#sound #speech #audio
Twitter
Philip Vollet
SpeechBrain an open-source and all-in-one speech toolkit based on PyTorch Develop state-of-the-art speech technologies, including systems for speech recognition, speaker recognition, speech enhancement, multi-microphone signal processing @SpeechBrain1 gi…
Где машинка применяется в drug design
Довольно по верхам имхо. Только общее представление получить.
И, да, генерация молекул упоминается.
YouTube
NeurIPS
#ScientificML #medicine
Довольно по верхам имхо. Только общее представление получить.
И, да, генерация молекул упоминается.
YouTube
NeurIPS
#ScientificML #medicine
Ну или вот талк от главы Insilico Medicine. Про то, как у них пайплайн по разработке лекарств работает
Про longevity я бы не слушал, но это у меня аллергия.
YouTube
#ScientificML #medicine
Про longevity я бы не слушал, но это у меня аллергия.
YouTube
#ScientificML #medicine
YouTube
Alex Zhavoronkov - From AI-Powered Drug Discovery to Longevity Medicine
Alex Zhavoronkov, Insilico Medicine, Hong Kong, presents at the 2020 Aging Research and Drug Discovery conference.
About the Aging Research and Drug Discovery meeting:
According to the United Nations, the proportion of people aged over 65 now outnumber…
About the Aging Research and Drug Discovery meeting:
According to the United Nations, the proportion of people aged over 65 now outnumber…
На NeurIPS будет целая отдельная секция про AI for Science:
http://ai4sciencecommunity.github.io
Шикарный line-up и до 18 сентября можно подать абстракты
#ScientificML #conference
http://ai4sciencecommunity.github.io
Шикарный line-up и до 18 сентября можно подать абстракты
#ScientificML #conference
StyleGAN-NADA преобразует предварительно обученный генератор в новые домены, используя только текстовую подсказку и без обучающих данных.
Естественно направляет его CLIP.
Project
#GAN #CLIP #multimodal
Естественно направляет его CLIP.
Project
#GAN #CLIP #multimodal
AI Для Всех
Так же стоит отметить ициативу DeepChem, которые автоматизируют обучение на химических веществах. GitHub Там много неликвида или упрощенных схем, которые часто не будут работать, но как пример, что в принципе можно делать - они подходят. #ScientificML…
W&B
Using W&B with DeepChem: Molecular Graph Convolutional Networks
A quick tutorial on using W&B to track DeepChem molecular deep learning experiments. Made by Kevin Shen using Weights & Biases
Датасет жужжания москитов. Видимо что бы по звуку можно было определять виды этих комаров.
#datasets #ScientificML #sound #audio
#datasets #ScientificML #sound #audio
#SSL
#noise
#LNL
Contrast to Divide
Статья про то, как использовать self-supervised метод, если у вас много данных, но они все шумные (Learning with noisy labels, LNL)
Обычно в таких случаях пытаются пользоваться допущением, что на нейросеть поначалу будет учить лучше правильные примеры, а на тех, где метка неверна - будет выдавать большую ошибку. Потом же она войдет в memoization phase, где эта разница пропадет.
Потому главная проблема в таком подходе - "поймать момент", когда нейросеть уже выучила правильное, не запомнила кучу мусора.
Авторы показывают, что в общем случае это сделать сложно.
Кроме того они разбирают вариант, когда для LNL используется не архитектура с нуля, а self-superised предобученная на близком домене нейросеть. Первая проблема подхода в том, что не всегда такая сеть / чистый набор данных в принципе есть. Вторая - что он тоже может не работать.
Авторы предлагают использовать предобучение на именно целевом датасете и показывают, что это работает лучше других подходов.
Тема может очень подойти части студентов - у биологов часто данные получены с огромным шумом из-за артефактов эксперимента, неправильной аннотации, врущих пациентов и тд
#noise
#LNL
Contrast to Divide
Статья про то, как использовать self-supervised метод, если у вас много данных, но они все шумные (Learning with noisy labels, LNL)
Обычно в таких случаях пытаются пользоваться допущением, что на нейросеть поначалу будет учить лучше правильные примеры, а на тех, где метка неверна - будет выдавать большую ошибку. Потом же она войдет в memoization phase, где эта разница пропадет.
Потому главная проблема в таком подходе - "поймать момент", когда нейросеть уже выучила правильное, не запомнила кучу мусора.
Авторы показывают, что в общем случае это сделать сложно.
Кроме того они разбирают вариант, когда для LNL используется не архитектура с нуля, а self-superised предобученная на близком домене нейросеть. Первая проблема подхода в том, что не всегда такая сеть / чистый набор данных в принципе есть. Вторая - что он тоже может не работать.
Авторы предлагают использовать предобучение на именно целевом датасете и показывают, что это работает лучше других подходов.
Тема может очень подойти части студентов - у биологов часто данные получены с огромным шумом из-за артефактов эксперимента, неправильной аннотации, врущих пациентов и тд
Audio
neural waveshaping synthesis
С помощью нейросетей теперь можно переиграть любой звук виолончелью, флейтой или трубой. Любой желающий может сделать это, перейдя по ссылке.
А вот код для запуска у себя на ПК и cтатья на arxiv про эту нейросеть.
На сайте Gradio есть ещё очень много интересных демо-приложений с разными нейросетями.
Пример: известная мелодия из Rick Astley - Never Gonna Give You Up на виолончели. Звук сгенерирован полностью нейросетью.
Советую сделать звук динамиков потише.
#code #sound #signal #generative
С помощью нейросетей теперь можно переиграть любой звук виолончелью, флейтой или трубой. Любой желающий может сделать это, перейдя по ссылке.
А вот код для запуска у себя на ПК и cтатья на arxiv про эту нейросеть.
На сайте Gradio есть ещё очень много интересных демо-приложений с разными нейросетями.
Пример: известная мелодия из Rick Astley - Never Gonna Give You Up на виолончели. Звук сгенерирован полностью нейросетью.
Советую сделать звук динамиков потише.
#code #sound #signal #generative
Ещё одна версия VQGAN + CLIP с другим типом аугментации и сэмплирования из модели. Предположительно даёт лучшее качество.
Colab
#text2image #generative #gan #CLIP
Colab
#text2image #generative #gan #CLIP
Image to Latex
Позволяет преобразовывать картинки с формулами из LaTeX в собственно TeX код. Очень удобно, надо только онлайн демку где-то захостить (на Gradio) или на Spaces.
#image2text #latex #ScientificML
Позволяет преобразовывать картинки с формулами из LaTeX в собственно TeX код. Очень удобно, надо только онлайн демку где-то захостить (на Gradio) или на Spaces.
#image2text #latex #ScientificML
Twitter
PyTorch Lightning
⚡️🤓 Take a peek at this application which maps an image of a LaTeX math equation to LaTeX code using PyTorch Lightning. #deeplearning github.com/kingyiusuen/im…
Набор данных iNaturalist 2017 (iNat) содержит 675 170 обучающих и тестовых изображений из 5 089 природных мелкодисперсных категорий. Эти категории принадлежат к 13 суперкатегориям, включая Plantae (растения), Insecta (насекомые), Aves (птицы), Mammalia (млекопитающие) и так далее. Набор данных iNat очень несбалансирован, количество изображений в каждой категории резко отличается. Например, самая большая суперкатегория "Plantae (Растения)" содержит 196 613 изображений из 2 101 категории, в то время как самая маленькая суперкатегория "Protozoa" содержит только 381 изображение из 4 категорий.
По ссылке доступны датасеты по годам 2017-2021.
https://github.com/visipedia/inat_comp
#datasets #ScientificML #images
По ссылке доступны датасеты по годам 2017-2021.
https://github.com/visipedia/inat_comp
#datasets #ScientificML #images
Машинное обучение помогает детектировать гравитационные волны.
Чтобы задетектировать гравитационную волну, надо сначала записать смещение пробного тела, а потом в этих записях найти формы сигнала, которые соответствуют волновой форме, которую могли вызвать гравитационные волны.
В статье рассказывается про то как вот этот второй этап оптимизировать, то есть, среди смещения пробной массы найти похожие на вызванные гравитационными волнами.
https://developer.nvidia.com/blog/ai-detects-gravitational-waves-faster-than-real-time/?linkId=100000059156832
#ScientificML #astronomy
Чтобы задетектировать гравитационную волну, надо сначала записать смещение пробного тела, а потом в этих записях найти формы сигнала, которые соответствуют волновой форме, которую могли вызвать гравитационные волны.
В статье рассказывается про то как вот этот второй этап оптимизировать, то есть, среди смещения пробной массы найти похожие на вызванные гравитационными волнами.
https://developer.nvidia.com/blog/ai-detects-gravitational-waves-faster-than-real-time/?linkId=100000059156832
#ScientificML #astronomy
NVIDIA Developer Blog
AI Detects Gravitational Waves Faster than Real Time | NVIDIA Developer Blog
Created by a group of scientists, the new research highlights how AI and supercomputing can accelerate reproducible, data-driven discoveries.
Video contrastive learning with global context.
Предлагают новый метод контрастивного обучения на уровне видео, основанный на сегментах для формирования положительных пар.
Формулировка в статье позволяет улавливать глобальный контекст в видео, что делает ее устойчивой к временным изменениям контента. Авторы так же включают термин регуляризации временного порядка, чтобы обеспечить соблюдение присущей видео последовательной структуры.
GitHub
#ContrastiveLearning #video
Предлагают новый метод контрастивного обучения на уровне видео, основанный на сегментах для формирования положительных пар.
Формулировка в статье позволяет улавливать глобальный контекст в видео, что делает ее устойчивой к временным изменениям контента. Авторы так же включают термин регуляризации временного порядка, чтобы обеспечить соблюдение присущей видео последовательной структуры.
GitHub
#ContrastiveLearning #video