AI для Всех

Статья с U-Net, но теперь на трансформерах.

Качество по дов. интервалам не отличается от обычного U-Net. Но идея интересная.

Практическая реализация и то же тексты (без доверительных интервалов ))

#transformer #segmentation

53 viewsDmitry Penzar, edited 09:27

July 8, 2021

AI для Всех

Прикольная статья на медиум. У многих естественников (как минимум) задача ставится таким образом, что качество 1.0 на ROC недостижимо. Например, наследственные заболевания не всегда проявляются (пенетрантность). Потому полезно им про это рассказывать

#metrics

Medium

What’s the Maximum ROC You Can Achieve? (No, the Answer Is Not 1)

Intuitively, it’s obvious that not all problems are equally hard. For instance, classifying MNIST digits is not as hard as predicting tomorrow’s stock market. In other words, every problem has an…

58 viewsDmitry Penzar, edited 13:44

July 8, 2021

AI для Всех

Иииии поехали комбинировать

#transformer #images #CNN

Meta

Audiovisual self-supervised representation learning

We’re sharing new research on using the natural association between video & sound to teach machines to better understand the world. Our self-supervised approach, which is a #CVPR21 best paper candidate, learns directly from sounds & images in videos.

61 viewsArtemii, edited 20:13

July 8, 2021

AI для Всех

Интерактивная статья по Gaussian Believe Propagation

#bayes

60 viewsArtemii, edited 08:10

July 9, 2021

AI для Всех

Ещё разочек про Perciever

#multimodal

64 viewsArtemii, edited 09:02

July 9, 2021

AI для Всех

Forwarded from эйай ньюз

DeepMind опубликовал статью, где они представляют новую архитектуру - Perceiver.
Главная идея и мотивация — учиться на данных любой модальности (картинки, аудио, видео, точки, и т.д.) без использования каких-либо предположений о структуре этих данных знаний, таких как, например, локально гладкая 2D-структура картинок, которая повсеместно эксплойтится конволюционными нейронными сетями.

Предлагаемая модель Perceiver — это хитрый трансформер, который имеет несколько преимуществ перед существующими архитектурами:

➞ 1) Он может работать со входными последовательностями огромной длины (> 100k входов). Это достигается за счет использования Cross Atention блока, который принимает входные данные как ключи (K) и как значения (V), а вместо запросов (Q) использует гораздо меньшее число (512, если быть точным) скрытых векторов. Интуитивно это можно представить как этакий ботлнек на основе self-attention. На вход N векторов (где N может быть очень большим), а на выходе получаем ровно 512 (что является гиперпараметром).

➞ 2) Из-за описанного выше Cross Atention блока, который выступает в роли ботлнека, мы можем сделать Perceiver очень глубоким. Все потому что каждый последующий self-attention блок будет работать со входами длины 512, а не N. Поэтому даже квадратичная по сложности от длины входа наивная реализация self-attention'а будет быстро работать и не будет выжирать всю память.

➞ 3) Архитектура не опирается ни на какие структурные предположения о данных. Она настолько универсальная, что может применяться к различным модальностям почти без изменений (если не считать positional encoding). Можно запускать на картинках - Perciever бьет базовый ViT-B, хотя вообще не содержит ни одной конволюции и на вход берет тупо 50 тыщ пикселей (для картинки 224x224). Также Perciever отлично работает на аудио, видео, на комбинации аудио+видео, и на облаках 3D точек.

Сама статья довольно хорошо написана, можете в ней почитать подробности.

69 viewsArtemii, 09:02

July 9, 2021

AI для Всех

интересная штука про аутлайеры и разные способы понижения размерности

Kaggle

Брать целиком не полуучится, но вырезать чего-нить интересное можно

#outliers #dimensionality

Kaggle

Applied Unsupervised Learning

Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources

61 viewsDmitry Penzar, edited 19:23

July 10, 2021

AI для Всех

Forwarded from Data Science by ODS.ai 🦜

Automated Machine Learning Library

Simple but powerful Automated Machine Learning library for tabular data. It uses efficient in-memory SAP HANA algorithms to automate routine Data Science tasks. Beats built-in solution in HANA, database from SAP. Written by 2 students as diploma project.

Features:
• Easy to use Python interface
• Automates most Machine Learning steps
• Complete documentation
• Intuitive web client
• Supports Regression and Binary Classification tasks

Roadmap:
• Text classification
• Multi class classification
• Forecasting
• Automate all ML steps
• Beat other libraries in accuracy
• More hyperparameter tuning methods

GitHub: https://github.com/dan0nchik/SAP-HANA-AutoML
Web app: https://share.streamlit.io/dan0nchik/sap-hana-automl/main/web.py
Docs: https://sap-hana-automl.readthedocs.io/en/latest/index.html#
Authors: @dan0nchik, @m_whiskas

#automl

GitHub

GitHub - dan0nchik/SAP-HANA-AutoML: Python Automated Machine Learning library for tabular data.

Python Automated Machine Learning library for tabular data. - dan0nchik/SAP-HANA-AutoML

70 viewsArtemii, 23:31

July 10, 2021

AI для Всех

Хороший ресурс для вдохновления. Все как мы хотим, только тем больше и на английском.

#resources

Madewithml

Home - Made With ML by Anyscale

Learn how to responsibly design, develop, deploy and iterate on production ML applications.

63 viewsArtemii, edited 06:38

July 12, 2021

AI для Всех

ViTGAN: Training GANs with Vision Transformers

ArXiv

achieves comparable performance to state-of-the-art CNN-based StyleGAN2 on CIFAR-10, CelebA, and LSUN bedroom datasets

#gan #transformer #images

73 viewsArtemii, edited 06:44

July 12, 2021

AI для Всех

Доступно про Diffusion models
Ещё один блог-пост

#generative #diffusion #images

Lil'Log

Diffusion Models

77 viewsArtemii, edited 07:50

July 12, 2021

AI для Всех

Хороший ресурс для вдохновления. Все как мы хотим, только тем больше и на английском. #resources

напомнило вот этот источник.

Что не нравится в https://madewithml.com/ - очень скупые объяснения. Те же трансформеры вообще не объяснены - просто запуск кода.

#resources

GitHub

GitHub - ageron/handson-ml2: A series of Jupyter notebooks that walk you through the fundamentals of Machine Learning and Deep…

A series of Jupyter notebooks that walk you through the fundamentals of Machine Learning and Deep Learning in Python using Scikit-Learn, Keras and TensorFlow 2. - ageron/handson-ml2

68 viewsDmitry Penzar, edited 08:31

July 12, 2021

AI для Всех

Случайно сделал идеальную картинку к переобучению:
#joke

60 viewsArtemii, edited 08:48

July 12, 2021

AI для Всех

Очень крутой пример про способность мозга к генерации
#generative #joke

59 viewsArtemii, edited 10:29

July 12, 2021

AI для Всех

GitHub с моделями для Video Super Resolution.

#video #superresolution #generative

GitHub

GitHub - Thmen/EGVSR: Efficient & Generic Video Super-Resolution

Efficient & Generic Video Super-Resolution. Contribute to Thmen/EGVSR development by creating an account on GitHub.

126 viewsArtemii, edited 06:01

July 13, 2021

AI для Всех

Очень достойно про трансформеры

Notion

#transformer

Aritra's Notion on Notion

Transformers

Neural Machine Translation

56 viewsArtemii, edited 09:13

July 13, 2021

AI для Всех

ESM-1v: новая языковая модель протеинов. Способна предсказывать zero-shot эффекты мутаций на функции протеинов

Twitter

#ScientificML #biology

Twitter

Alex Rives

Introducing ESM-1v: a new protein language model that performs zero-shot prediction of the effects of mutations on protein function. Paper: biorxiv.org/content/10.110… Model/Code: github.com/facebookresear…

53 viewsArtemii, edited 11:39

July 13, 2021

AI для Всех

Не знаю, почему авторы не ссылаются на эту модель и не сравниваются с ней, которая вышла раньше и не проверяют свои предсказания на ClinVar (де факто стандарт).

Конечно, это не умаляет сделанного ими, но даже подходы к zeroshot переносу у них похожие. И там и там есть вероятность, давайте введеме метрику на основе разницы вероятность референса и мутации. Было бы очень круто, будь у них сравнение.

#ScientificML #biology

52 viewsDmitry Penzar, edited 12:15

July 13, 2021

AI для Всех

Forwarded from DL in biology (Зоя Червонцева)

Large-scale clinical interpretation of genetic variants using evolutionary data and deep learning

Текст: https://www.biorxiv.org/content/10.1101/2020.12.21.423785v1
Код: модификация предыдущей работы авторов https://github.com/debbiemarkslab/DeepSequence
Модель: байесовский вариационный автоэнкодер

Что предсказывали
В конечном счете -- патогенность миссенс-мутаций в геноме человека. Но делали это очень красивым непрямым способом.

Предобучение
Сначала для каждого белок-кодирующего гена брали выравнивание гомологов из всех возможных геномов (> 139 тыс. организмов). Вариационный автоэнкодер обучали сжимать такие выравнивания. В процессе этого автоэнкодер выучивал распределения, по которым для каждой возможной мутации в каждой позиции можно было оценить, насколько она вероятна. Выражением этой вероятности считался некоторый “эволюционный индекс”.

Классификация
Эволюционные индексы всех возможных мутаций (каждого белка по отдельности?) собрали в одно распределение. Оно оказалось двугорбым, и его разделили на две гауссианы, условно соответствующие патогенным и не патогенным мутациям. Исходя из этих двух гауссиан, каждой отдельной мутации присвоили метку -- вероятность этой мутации оказаться или не оказаться патогенной.

Что получилось
Полученные скоры хорошо предсказывают метки из базы ClinVar (AUC 0.90) и дают уверенные предсказания для многих мутаций, эффект которых не известен.

Авторы особо подчеркивают, что их модель не видит меток при обучении, и это лишает ее возможности переобучиться. Что же касается возможности неявно переобучиться на конкретные группы организмов, которых просто больше секвенировано, -- то и эту проблему авторы успешно обходят. Они взвешивают последовательности в выравнивании пропорционально их уникальности.

66 viewsDmitry Penzar, 12:15

July 13, 2021

AI для Всех

По ссылкам в твиттере уввидел вот это:

Проект
ArXiv

Мне кажется интересным. Сравниваются авторы в основном не с state-of-art #GAN, где идет State-of-thee-art - результаты хуже (как в таблице выше).

Основано все на #diffusion process, который скидывал ранее Артемий и который ему очень понравился.
Предлагалось добавить его в лекцию по GAN.

Видим, что идея работает. Работает ли она лучше GAN - нет, потому по логике ее надо добавлять в конец.
И после того, как мы добавим объяснение тех же StyleGAN.

Но если у кого-то есть примеры успехов в сравнении с GAN - можно посмотреть, не добавить ли в часть с практическим кодом.

#generative #images

71 viewsDmitry Penzar, edited 12:51

July 13, 2021

About

Blog

Apps

Platform