неглубокое обучение

а еще вот эту штуку, надо будет кстати попробовать ее

212 views20:58

🚀🗄 FAST DATA LOADER IS ALL YOU NEED: Fast Forward Computer Vision

Тут студенты из MiT собрали быстрейший даталоадер!

Все что нужно, так это заменить
from torch.utils.data import DataLoader на from ffcv.loader import Loader, OrderOption, и далее по примеру из картинки поста.

Такой подход позволяет затренить родным PyTorch модель ResNet на ImageNet всего за 35 минуут (1$ на AWS)

📮 FFCV 💻 Git 📚 Docs

🔥2

281 views20:58

неглубокое обучение

https://github.com/markovka17/apdl

GitHub

GitHub - markovka17/apdl: Applied Problems of Deep Learning

Applied Problems of Deep Learning. Contribute to markovka17/apdl development by creating an account on GitHub.

298 views11:17

неглубокое обучение

https://torchmetrics.readthedocs.io/en/stable/
Подсчет метрик в торче

👍4

322 viewsedited 11:24

неглубокое обучение

Как ускорить обучение вашей звуковой модельки в разы.

Обычно когда вы обучаете модельку для звука у вас много данных и вы в каждой эпохе для каждого батча достаете из обычной памяти нужные семплы, как то их предобрабатываете и дальше уже загоняете в модельку. Так вот, оказывается, в этом пайплайне есть ебейший ботлнек - подсчет мелспеки/мфсс. Чтоб убрать его достаточно 1 раз пройтись по всему датасету и к каждой вавке в пару к ней сделать файлик с предпосчитанной мелспекой/мфсс и при обучении считывать сразу его. Зато такой вот такой нехитрый метод ща спидапнул мне обучение на работе в 20 ебанных раз! Ну а еще я перестал жрать все ядра на машинке))) Сплошные плюсы.
P.S. Сначала я решил пожадничать и не делать для каждой вавки по файлу, а записать все в один, при инициализации датасета считывать его в оперативу и прям с ним работать. В теории такой подход должен работать быстрее. Но на практике я тыщу лет считывал этот файл в начале каждого эксперимента и это дико бесило. Ну и хранить много данных в оперативе тоже не лучшая идея. Learn from my mistakes)

👍7🔥1

263 viewsedited 09:31

неглубокое обучение

https://pytorch.org/blog/introducing-pytorch-fully-sharded-data-parallel-api/

237 views18:25

неглубокое обучение

https://openai.com/blog/whisper/
OpenAI обучили и опенсурснули ASR трансформер на 680к часах и он могет в мультиязычность

Openai

Introducing Whisper

We’ve trained and are open-sourcing a neural net called Whisper that approaches human level robustness and accuracy on English speech recognition.

268 viewsedited 19:52

неглубокое обучение

Осознал что метрика ранжирования MAP@K это MAPATK (для тех кто не в курсе админа этого паблика зовут Марат), это довольно тупо, но мне нравится! Буду как додик теперь считать ее своей любимой метрикой....

🔥7😁4

239 views21:21

неглубокое обучение

Нашел в торче ошибку....
Создал ишью...

UPD: все нормально, я лох

GitHub

vision/torchvision/models/vision_transformer.py at d7d90f56117ce0955332846a5f90b8d1346c4c09 · pytorch/vision

Datasets, Transforms and Models specific to Computer Vision - pytorch/vision

👍2

202 viewsedited 22:10

неглубокое обучение

Или я жоска наебался🤔🤔🤔
Похоже на то, завтра попробую разобраться...

198 viewsedited 23:16

неглубокое обучение

Да, действительно, инициализация одного слоя нулями не мешает обучению. Проблемы возникают при инициализации более одного слоя подряд нулями.

206 views10:39

неглубокое обучение

Я взял сверточную сетку, на которую накинул 2 линейных слоя с ReLU между ними.
1. Дефолтная торчовская инициализация
2. Инициализация двух слоев нулями
3. Инициализация только первого слоя нулями
4. Инициализация только второго слоя нулями

🤔3👍1

237 views10:54

неглубокое обучение

Подтверждая слова @Yar4ik000
1. Инициализация первого слоя нулями, но вместо релу взять сигмоиду (ключевое различие что в нуле релу выдает 0, а сигмоида 0.5).
2. Инициализация двух слоев нулями, но сигмоида вместо релу.

👍3

260 views11:01

неглубокое обучение

Про разницу между weight_decay и l2 в оптимизаторах с моментумом
https://www.fast.ai/posts/2018-07-02-adam-weight-decay.html

fast.ai

AdamW and Super-convergence is now the fastest way to train neural nets – fast.ai

Making neural nets uncool again

👍1

287 views20:39

неглубокое обучение

Базовые трюки для обучения трансформеров, но оформлено оч красиво.
https://www.borealisai.com/research-blogs/tutorial-17-transformers-iii-training/#:~:text=They%20found%20that%20without%20warm,Liu%20et%20al.%2C%202020
И еще
https://tnq177.github.io/data/transformers_without_tears.pdf

RBC Borealis