AI Для Всех
12.1K subscribers
1.04K photos
130 videos
10 files
1.32K links
Канал, в котором мы говорим про искусственный интеллект простыми словами

Главный редактор и по рекламе: @crimeacs

Иногда пишут в канал: @GingerSpacetail, @innovationitsme
Download Telegram
Ещё в тему отладки и объяснения сетей, на этот раз в основном картиночных. Библиотека для торча с реализацией основных методов explainability.

GitHub

#debugging #XAI
Channel name was changed to «NN for Science»
Геометрический лернинг от его (по сути) создателя, который ещё и в Туле родился, а сейчас мега профессор в ICL и рулит графовыми сетями в Twitter.

Блог-пост

#geometric #GNN #graph
AI Для Всех
Аватарка канала сгенерированна с помощью OpenAI DALL-E. Блог-пост #generative #text2image #CLIP #images
Так как код к этой статье не выпущен (и вряд ли когда-нибудь будет. OpenAI как обычно очень *open*), нашлись умельцы которые сетку реплицировали и как смогли - обучили:

GitHub

#generative #images #text2image #CLIP
Для тех кто ещё не знаком: один из наиболее релевантных, по отношению к нам, источников информации. Physics meets ML. Раз в пару недель крутые физики рассказывают в зуме как и для чего они применяют ML

#community #ScientificML
Для форматирования кода, который будет публичным я использую BlackCellMagic.

Аналогичный функционал есть во многих IDE, но конкретно этот работает как магия в блокнотах.

#Python #presentation #code
У гугла (как впрочем и у многих других сервисов) есть отличная програма грантов на исследования. Для получения нужно прислать им тезисы и оценку необходимых ресурсов. В течение 2х недель вам выделят отдельную VM с GPU и прочими ништяками (совершенно бесплатно и без обязательств):

https://edu.google.com/programs/credits/research/

#resources #GPU
MLP-Mixer: An all-MLP Architecture for Vision. В этой сетке есть только полносвязанные слои, а работает она не хуже сверхточных сетей и визуальных трансформеров.

ArXiv

Думаю в ближайшие пару недель все будут обсуждать universal approximation theory и иже с ней. А для нас это значит что пора перестать рассказывать об особой эффективности conv по сравнению с linear.

Блог-пост разбор

#images #MLP #classification
Похожая статья была про #RNN
Forwarded from DL in NLP (nlpcontroller_bot)
Revisiting Simple Neural Probabilistic Language Models
Sun and Iyyer [UMass Amherst]
arxiv.org/abs/2104.03474

Помните на курсе по NLP мы говорили, что просто конкатенировать эмбеддинги текста и пихать их в полносвязную сетку — это тупо и не работает? И что лучше использовать RNN/Трансфрмеры.

В общем это не совсем так. Если сделать полносвязную сетку из 16 слоёв с layer norm, dropout и skip connections, то на коротких контекстах (<20 токенов) она работает сопоставимо с трансформерами на языковом моделировании 🤯

Кажется, мне нужно будет переделать пару слайдов...
Приложение, чтобы определять птиц по голосу.

#ScientificML #sound
- Источник материалов для презентаций.
Альманах №4_Web_v.4.18.pdf
5.5 MB
Пример с , кол-вом научных публикаций
Forwarded from эйай ньюз
Очередная крутая работа от OpenAI: Diffusion Models Beat GANs on Image Synthesis. SOTA для генерации картинок на ImageNet

Предлагается новый тип генеративных моделей — вероятностная модель диффузии (Diffusion Probabilistic Model), для краткости «диффузионная модель». Диффузионная модель представляет собой параметризованную цепь Маркова, обученную с использованием вариационного вывода для создания выборок, соответствующих данным, за конечное число шагов. Процесс диффузии тут — это цепь Маркова, которая постепенно добавляет шум к данным в направлении, противоположном семплированию, пока сигнал не будет разрушен. Так вот мы учим обратные переходы в этой цепочке, которые обращают вспять процесс диффузии. И к бабке не ходи, мы параметризуем всё нейронными сетями.

Получается очень качественная генерация, даже лучше чем ганами (особенно хорошо видно на дядьке с Язем, которого здорово так колошматит в моделе BigGAN). Минус диффузионных моделей сейчас — это медленная тренировка и инференс.

Есть код. Подробнее тут.