AI Для Всех

На картинке не было ошибки (стр. 114)

476 viewsАнтон Ганичев, 14:32

Посмотрел очень по диагонали, но выглядит довольно релевантно (на концептуальном уровне как минимум):

YouTube

#ScientificML #Julia

YouTube

Webinar: Scientific Machine Learning for Enterprises | Feb 25 2020

Scientific machine learning is an emerging discipline which pulls together scientific modeling and machine learning techniques in order to allow for data-efficient, interpretable, and extrapolatable neural architectures. This webinar will dive into this Julia…

97 viewsArtemii, edited 18:55

AI Для Всех

Как получить гарантии генерализации машинного обучения? В статье моих любимейших ACME Labs предлагается использовать смесь размеченных данных и данных размеченных случайным образом.

Если модель выдает маленькую ошибку на чистых данных и большую ошибку на случайной разметке - мы можем надеятся на хорошую генерализацию.

В статье есть формальные доказательства и ещё много всего интересного

ArXiv

#training #classification

83 viewsArtemii, edited 05:28

AI Для Всех

Крутой пример применения #GAN для восстановления лиц на фотографиях:

ArXiv

81 viewsArtemii, edited 05:46

AI Для Всех

Я вообще не представляю как это кому-то может понадобиться, но посмотрите как мило!

Twitter пост

P.s.: обратите внимание на сайт. Papers with #datasets - отличный ресурс для поиска датасетов

Twitter

Papers with Datasets

🐇 SyntheticFur: A dataset for neural rendering with high quality lighting simulation via ray tracing. It contains approximately 140,000 procedurally generated images and 15 simulations with Houdini. Paper: paperswithcode.com/paper/syntheti… Dataset: pape…

90 viewsArtemii, edited 09:03

AI Для Всех

Если у кого-то есть аспиранты гуманитарии или интересующиеся, нашёл семинар BERT для гумунитариаев: https://melaniewalsh.github.io/BERT-for-Humanists/workshop/

#ScientificML #гумунитарии #social

86 viewsArtemii, edited 06:30

Сгенерил мем-ролик (сегментация при помощи DINO), что показать студент на лекции по сегментации

83 viewsDmitry Penzar, edited 04:14

AI Для Всех

Красивые задачи (особенно первые две). Можно использовать на вступительных.

#Отборочные

79 viewsDmitry Penzar, 13:37

AI Для Всех

Завтра (19ого мая) будет интересный доклад по зуму: http://www.physicsmeetsml.org/posts/sem_2021_05_20/

#news

www.physicsmeetsml.org

Are wider nets better given the same number of parameters?

Anna Golubeva, Perimeter Institute, 12:00 ET

70 viewsArtemii, edited 04:17

AI Для Всех

Просто шикарный психодел. Чувак написал песню используя названия классов из ImageNet и сгенерировал к ней видиоклип используя CLIP и BigGan:

YouTube

#GAN #joke #text2image #CLIP

YouTube

AI made this music video | What happens when OpenAI's CLIP meets BigGAN?

#artificialintelligence #musicvideo #clip

I used OpenAI's CLIP model and BigGAN to create a music video that goes along with the lyrics of a song that I wrote. The song lyrics are made from ImageNet class labels, and the song itself is performed by me on…

80 viewsArtemii, edited 18:20

AI Для Всех

Оказывается любой GAN уже умеет отделять изображения от фона:

Project

#GAN #Separation

68 viewsArtemii, edited 06:19

AI Для Всех

Forwarded from эйай ньюз

Итак, господа. Новый прорыв в self-supervised learning. Идея, как всегда, простая как апельсин.

До этого момента (почти) все тренили свои self-supervised модели на ImageNet и тестили там же. Фишка в том, что ImageNet — чистый датасет со сбалансированными классами и отцентрированными объектами. А если тренироваться на больших некурируемых датасетах как JFT-300M с 300-миллионами изображений (это внутряковый датасет Гугла) либо на YFCC100M с 95-миллионами, где распределение размера классов имеет тяжелый хвост, то точность SOTA моделей при тесте ImageNet существенно падает (с 74.3% до 65.3%). Все дело в том, что в таких больших датасетах очень много разных объектов, а иногда несколько на одной картинке, поэтому вероятность случайно выбрать сложные негативные примеры значительно ниже. То есть в среднем две случайные картинки слишком сильно отличаются => мало информации для обучения.

Авторы предлагают простой трюк. Разбиваем большой датасет на 5-10 кластеров и обучаем отдельные модели на каждом кластере, таким образом обучение отдельных моделей (экспертов) будет происходить на более близких картинках => негативные пары будут сложнее и более информативные. Далее фиксируем модели-эксперты и дистиллируем их в одну. Новая модель учится предсказывать фичи каждого эксперта с помощью L2 лосса. В итоге, офигенная точность на ImageNet при обучении без лейблов на JFT-300M: 77.3% Top1.

Подробнее в статье от DeepMind.

70 viewsArtemii, 12:05

AI Для Всех

Можно поспорить насколько это наука, но определенно применение нейронных сетей *в* науке.

Twitter

#ScientificML #biology

Twitter