AI Для Всех

AI News:
Deep Genomics 🧬 под научным руководством Yann LeCun подняла раунд финансирования на $180M.
Компания обещает AI Discovery platform for ‘Programmable’ RNA therapeutics

#news #ScientificML #money

81 viewsArtemii, edited 07:53

AI Для Всех

AI News:
Tesla AI Day August 19th

#news

Twitter

Elon Musk

Tesla AI Day August 19th

77 viewsArtemii, edited 08:12

AI Для Всех

Неплохой пример по примению графовых конволюций. На гите есть jupyter notebook с примером

#ScientificML

72 viewsDmitry Penzar, edited 09:45

AI Для Всех

Forwarded from Graph Machine Learning

Graph Convolutional Neural Networks to Analyze Complex Carbohydrates

A blog post by Daniel Bojar about an application of GNN to analyzing glycan sequences and their proposed GNN architecture called SweetNet. There are other coverages of this work (here and here). The paper is here and the code is here.

Medium

Graph Convolutional Neural Networks to Analyze Complex Carbohydrates

Using PyTorch Geometric to Work With Biological Data

93 viewsDmitry Penzar, 09:45

AI Для Всех

Antarctic Captioning - на основе CLIP и сети для image captioning:

Colab
Git

Позволяет генерировать описания к картинкам, которые значительно выходят за рамки любой обученной модели, например COCO.

#images #captioning #multimodal #CLIP

94 viewsArtemii, edited 10:42

AI Для Всех

Audio Captioning Transformer

Было бы круто обучить такую же модель, но для описания последовательностей/временных рядов. Например для графиков давления - типа «давление падает в виду движения циклона на северо-восток».

#waveforms #audio #captioning

120 viewsArtemii, edited 11:00

AI Для Всех

Отличное summary Alias-Free GAN с привязкой к StyleGan2:

YouTube

#gan #holdontoyoirpapers #images

YouTube

NVIDIA’s Face Generator AI: This Is The Next Level! 👩‍🔬

❤️ Check out Fully Connected by Weights & Biases: https://wandb.me/papers

📝 The paper "Alias-Free GAN" is available here:
https://nvlabs.github.io/alias-free-gan/

📝 Our material synthesis paper is available here: https://users.cg.tuwien.ac.at/zsolnai/gfx/gaussian…

126 viewsArtemii, edited 11:21

AI Для Всех

Библиотека для визуализации feature importance.

Интегрирует другие. Сама решений не предлагает

#explainability

GitHub

GitHub - MAIF/shapash: 🔅 Shapash: User-friendly Explainability and Interpretability to Develop Reliable and Transparent Machine…

🔅 Shapash: User-friendly Explainability and Interpretability to Develop Reliable and Transparent Machine Learning Models - MAIF/shapash

125 viewsDmitry Penzar, edited 14:17

AI Для Всех

Что такое CLIP и как он работает не объяснил только ленивый. А вот подъехала Open-Source имплементация.

#multimodal #CLIP

GitHub

GitHub - mlfoundations/open_clip: An open source implementation of CLIP.

An open source implementation of CLIP. Contribute to mlfoundations/open_clip development by creating an account on GitHub.

89 viewsArtemii, edited 20:16

AI Для Всех

В борьбе снаряда (hyperparameter optimization) и брони (neural architecture search) вновь победа за «снарядом».

AutoTinyBERT: Automatic Hyper-parameter Optimization for Efficient Pre-trained Language Models

#nlp #training

Twitter

AutoTinyBERT: Automatic Hyper-parameter Optimization for Efficient Pre-trained Language Models pdf: arxiv.org/pdf/2107.13686… abs: arxiv.org/abs/2107.13686 outperforms both the SOTA search-based baseline (NAS-BERT) and the SOTA distillation-based methods

99 viewsArtemii, edited 08:04

AI Для Всех

Pretrain, Prompt, Predict: новая парадигма в NLP prompt-based learning

#NLP

87 viewsArtemii, edited 08:10

AI Для Всех

https://t.co/aCIdIZmPV1

#AlphaFold2

AI Summer

Deep learning on computational biology and bioinformatics tutorial: from DNA to protein folding and alphafold2 | AI Summer

A self-complete guide for understanding biology concepts that are necessary for applying deep learning in biology and bioinformatics focused on protein folding and alphafold2 related stuff

90 viewsArtemii, edited 17:15

AI Для Всех

Forwarded from Dmitry Penzar

Они адекватно написали все. На уровне популяризации точно ок.

Почему задача фолдинга не решена они не поняли. Проблема не в комплексах - их альфафолдом2 иногда можно предсказать. Проблема в том, что он очень сильно не учитывает биологию, то, что у белка очень сильно структура зависит от малых изменений pH, молекул рядом и тд.
Условно канонический пример - alphafold2 предсказывает для белка, связывающегося с кальцием, структуру, характерную для того, когда он связался с кальцием. Хотя, очевидно, альфолдуу инфу про кальций не давали и по дефолту (если задача решена) он должен давать структуру без кальция.
А выдает он ее с кальцием, ибо в PDB преобладают структуры этого белка с кальцием.

Ну и аналогично есть белки, которые постоянно в ходе работы меняют две конформации - альфафолд может там предсказать одну форму, вторую форму, и среднее. И предугадать это заранее нельзя

93 viewsArtemii, 17:15

AI Для Всех

Нейросеть для генерации картинок.

DALL-E Mini демка на 🤗 spaces

Можно поиграться прямо с телефона. Красота :)

Видео-разбор

#text2image #images #generative #demo

huggingface.co

DALL·E mini by craiyon.com on Hugging Face

Discover amazing ML apps made by the community

288 viewsArtemii, edited 17:30

AI Для Всех

Шустрая демка YOLOv5 на 🤗 Spaces

#demo #detection

huggingface.co

YOLOv5 - a Hugging Face Space by akhaliq

Discover amazing ML apps made by the community

97 viewsArtemii, edited 17:58

AI Для Всех

3D визуализации рентгеновских снимков от NVidia

#ScientificML #medicine

NVIDIA Technical Blog

Creating 3D Visualizations from X-ray Data with Deep Learning | NVIDIA Technical Blog

Researchers from Argonne National Laboratory developed a new method for turning X-ray data into 3D visualizations, hundreds of times faster than traditional methods.

90 viewsArtemii, edited 21:37

AI Для Всех

Большая и поучительная история как AI не помог в борьбе с пандемией. Почему так вышло? Кто виноват? И что делать?

Если совсем кратко - то «garbage in - garbage out” (подаёшь мусорные данные на вход - получаешь мусорные предсказания на выходе)

Видео-разбор

#science #ScientificML #medicine

MIT Technology Review

Hundreds of AI tools have been built to catch covid. None of them helped.

Some have been used in hospitals, despite not being properly tested. But the pandemic could help make medical AI better.

85 viewsArtemii, edited 13:41

AI Для Всех

Screen Shot 2021-07-31 at 19.59.10.png

385.8 KB

В статье выше цитируется очень приятная и полезная работа - https://www.nature.com/articles/s42256-021-00307-0

Статья рассказывает о частых ошибках при машинном обучении, связанным с предсказанием COVID, и, что тоже очень полезно - дает ссылки на рекомендуемые чеклисты, которые надо смотреть:

1) автору, когда он делает работу
2) рецензенту, когда он работу оценивает
3) читателю, если он решает, стоит ли использовать работу как основу для своей

В частности, упоминаются common лажи типа исключения "неудобных" объектов, попадании фотографий из одной больницы/пациента/.. и в обучение, и в тест и тд.
И, конечно, мое любимое - сравнение качества моделей без малейшей попытки построить confidence interval для качаства моделей

На мой взгляд очень интересная статья сама по себе, и интересны те чеклисты (привел ниже cсылки), на которые она ссылается.
Надо обязательно проанализировать и сделать саммари, которое must have в нашем цикле лекций

RQS:
Lambin, P. et al. Radiomics: the bridge between medical imaging an

458 viewsDmitry Penzar, edited 17:20

AI Для Всех

#cnn #biology #dilation #ResNet #ScientificML

https://www.cell.com/cell/fulltext/S0092-8674(18)31629-5

Отличная статья на биологическую тему - предсказание сайтов сплайсинга.
Коротко - у человека ген, кодирующий белок, не весь кодирует последовательность этого белка. Есть кодирующие его части - экзоны и некодирующие,регуляторные и просто мусорные части - интроны. Отвечает за вырезание из всей последовательности мРНК только нужных экзонов процесс, называемый сплайсинг.
Одной из важных задач является предсказание по последовательности гена экзонов и интронов - соответственно участков, в которых будет происходить вырезание.
В данной работе авторы это делают при помощи resnet-like архитектуры.

Более того - на самом деле некоторые участки в зависимости от условий/великого корейского рандома могут то трактоваться сплайсингом как интроны, то как экзоны. И скоры, которые выдает модель для сайтов сплайсинга коррелируют с вероятностью участка быть экзоном/интроном. Что тоже круто.

Ну и конечно, модель умеет в insilico-скрининг - мутируем последовательность интересующего нас гена и смотрим, изменится ли предсказание модели. Если изменилось, то поменялось то, как спласинг нарезает наш ген. Это часто приводит к чему-то нехорошему - наследственные болезни, опухоли и тд.

Модель хорошая и повсеместно используется. Можно вставлять в примеры архитектур CNN. Более того - она приятна еще и тем, что в ней активно используются dilation конволюции, примеров применения которых у нас в лекциях сейчас мало

84 viewsDmitry Penzar, edited 18:45

AI Для Всех

SpliceAI2.jpeg

1.2 MB

Архитектуры моделей, тестировавшихся в статье

452 viewsDmitry Penzar, 18:46

About

Blog

Apps

Platform