AI для Всех

SpeechBrain - классный репозиторий для всего связанного со звуком. Сам им пользовался пару раз.

#sound #speech #audio

SpeechBrain an open-source and all-in-one speech toolkit based on PyTorch Develop state-of-the-art speech technologies, including systems for speech recognition, speaker recognition, speech enhancement, multi-microphone signal processing @SpeechBrain1 gi…

150 viewsArtemii, edited 18:18

AI для Всех

Где машинка применяется в drug design
Довольно по верхам имхо. Только общее представление получить.

И, да, генерация молекул упоминается.

YouTube
NeurIPS

#ScientificML #medicine

114 viewsDmitry Penzar, edited 19:12

AI для Всех

Ну или вот талк от главы Insilico Medicine. Про то, как у них пайплайн по разработке лекарств работает
Про longevity я бы не слушал, но это у меня аллергия.

YouTube

#ScientificML #medicine

YouTube

Alex Zhavoronkov - From AI-Powered Drug Discovery to Longevity Medicine

Alex Zhavoronkov, Insilico Medicine, Hong Kong, presents at the 2020 Aging Research and Drug Discovery conference.

About the Aging Research and Drug Discovery meeting:
According to the United Nations, the proportion of people aged over 65 now outnumber…

100 viewsDmitry Penzar, edited 19:17

AI для Всех

На NeurIPS будет целая отдельная секция про AI for Science:

http://ai4sciencecommunity.github.io

Шикарный line-up и до 18 сентября можно подать абстракты

#ScientificML #conference

83 viewsArtemii, edited 19:49

AI для Всех

Немного растянуто, но зато на русском. Текст про применение ML в астрономии.

#ScientificML #astronomy

education.yandex.ru

Космическая работа: как решать задачи астрономов с помощью машинного обучения

Улучшение данных, полученных с телескопов, и автоматизация рутины учёных

85 viewsArtemii, edited 22:42

AI для Всех

StyleGAN-NADA преобразует предварительно обученный генератор в новые домены, используя только текстовую подсказку и без обучающих данных.

Естественно направляет его CLIP.

Project

#GAN #CLIP #multimodal

90 viewsArtemii, edited 05:55

AI для Всех

Kaggle про патологии растений.

#ScientificML #biology #botany #images

Medium

Practical Lighting Tips to Rank on Kaggle Image Challenges

This post outlines some PyTorch Lightning best practices from the recent Kaggle Plant Pathology image classification challenge that enabled

84 viewsArtemii, edited 21:44

AI для Всех

Репозиторий для fine-tuning (ну и обучения с нуля, если надо) CLIP.

#CLIP #multimodal #training

GitHub

GitHub - Zasder3/train-CLIP-FT

Contribute to Zasder3/train-CLIP-FT development by creating an account on GitHub.

88 viewsArtemii, edited 07:32

AI для Всех

Так же стоит отметить ициативу DeepChem, которые автоматизируют обучение на химических веществах. GitHub Там много неликвида или упрощенных схем, которые часто не будут работать, но как пример, что в принципе можно делать - они подходят. #ScientificML…

Туториал + Colab по DeepChem от Weights & Biases

#ScientificML #chemistry #tutorial

W&B

Using W&B with DeepChem: Molecular Graph Convolutional Networks

A quick tutorial on using W&B to track DeepChem molecular deep learning experiments. Made by Kevin Shen using Weights & Biases

86 viewsArtemii, edited 09:20

AI для Всех

Датасет жужжания москитов. Видимо что бы по звуку можно было определять виды этих комаров.

#datasets #ScientificML #sound #audio

85 viewsArtemii, edited 19:05

AI для Всех

10ого августа в 10 утра PT состоится live demo Open AI copilot

#news

Twitch

OpenAI - Twitch

OpenAI’s mission is to ensure that artificial general intelligence benefits all of humanity.

84 viewsArtemii, edited 19:35

76 viewsArtemii, edited 23:11

AI для Всех

#SSL
#noise
#LNL

Contrast to Divide

Статья про то, как использовать self-supervised метод, если у вас много данных, но они все шумные (Learning with noisy labels, LNL)
Обычно в таких случаях пытаются пользоваться допущением, что на нейросеть поначалу будет учить лучше правильные примеры, а на тех, где метка неверна - будет выдавать большую ошибку. Потом же она войдет в memoization phase, где эта разница пропадет.
Потому главная проблема в таком подходе - "поймать момент", когда нейросеть уже выучила правильное, не запомнила кучу мусора.
Авторы показывают, что в общем случае это сделать сложно.
Кроме того они разбирают вариант, когда для LNL используется не архитектура с нуля, а self-superised предобученная на близком домене нейросеть. Первая проблема подхода в том, что не всегда такая сеть / чистый набор данных в принципе есть. Вторая - что он тоже может не работать.
Авторы предлагают использовать предобучение на именно целевом датасете и показывают, что это работает лучше других подходов.

Тема может очень подойти части студентов - у биологов часто данные получены с огромным шумом из-за артефактов эксперимента, неправильной аннотации, врущих пациентов и тд

89 viewsDmitry Penzar, edited 10:52

AI для Всех

Иллюстрация к поведению метода

82 viewsDmitry Penzar, 10:52

AI для Всех

Audio

neural waveshaping synthesis

С помощью нейросетей теперь можно переиграть любой звук виолончелью, флейтой или трубой. Любой желающий может сделать это, перейдя по ссылке.

А вот код для запуска у себя на ПК и cтатья на arxiv про эту нейросеть.

На сайте Gradio есть ещё очень много интересных демо-приложений с разными нейросетями.

Пример: известная мелодия из Rick Astley - Never Gonna Give You Up на виолончели. Звук сгенерирован полностью нейросетью.

Советую сделать звук динамиков потише.

#code #sound #signal #generative

99 viewsDmitry Penzar, edited 15:23

AI для Всех

Я прошелся по всем сообщениям в канале и проставил тэги, что бы было потом удобнее искать (когда понадобится) + поформатировал ссылки. По возможности старайтесь использовать теги которые уже есть и не плодить сущностей типа #image и #images

87 viewsArtemii, edited 17:34

AI для Всех

Ещё одна версия VQGAN + CLIP с другим типом аугментации и сэмплирования из модели. Предположительно даёт лучшее качество.

Colab

#text2image #generative #gan #CLIP

91 viewsArtemii, edited 22:34

AI для Всех

Image to Latex

Позволяет преобразовывать картинки с формулами из LaTeX в собственно TeX код. Очень удобно, надо только онлайн демку где-то захостить (на Gradio) или на Spaces.

#image2text #latex #ScientificML

Twitter

PyTorch Lightning

⚡️🤓 Take a peek at this application which maps an image of a LaTeX math equation to LaTeX code using PyTorch Lightning. #deeplearning github.com/kingyiusuen/im…

114 viewsArtemii, edited 23:12

AI для Всех

Набор данных iNaturalist 2017 (iNat) содержит 675 170 обучающих и тестовых изображений из 5 089 природных мелкодисперсных категорий. Эти категории принадлежат к 13 суперкатегориям, включая Plantae (растения), Insecta (насекомые), Aves (птицы), Mammalia (млекопитающие) и так далее. Набор данных iNat очень несбалансирован, количество изображений в каждой категории резко отличается. Например, самая большая суперкатегория "Plantae (Растения)" содержит 196 613 изображений из 2 101 категории, в то время как самая маленькая суперкатегория "Protozoa" содержит только 381 изображение из 4 категорий.

По ссылке доступны датасеты по годам 2017-2021.

https://github.com/visipedia/inat_comp

#datasets #ScientificML #images

119 viewsArtemii, edited 09:03

AI для Всех

Машинное обучение помогает детектировать гравитационные волны.

Чтобы задетектировать гравитационную волну, надо сначала записать смещение пробного тела, а потом в этих записях найти формы сигнала, которые соответствуют волновой форме, которую могли вызвать гравитационные волны.

В статье рассказывается про то как вот этот второй этап оптимизировать, то есть, среди смещения пробной массы найти похожие на вызванные гравитационными волнами.

https://developer.nvidia.com/blog/ai-detects-gravitational-waves-faster-than-real-time/?linkId=100000059156832

#ScientificML #astronomy

NVIDIA Developer Blog

AI Detects Gravitational Waves Faster than Real Time | NVIDIA Developer Blog

Created by a group of scientists, the new research highlights how AI and supercomputing can accelerate reproducible, data-driven discoveries.

87 viewsArtemii, edited 09:26

About

Blog

Apps

Platform