Aspiring Data Science

Артур Кузин рассказывает про переход и профессиональное развитие в Data Science. А также несколько кулстори и рекомендации начинающим дата сайентистам. Из видео вы сможете узнать:
- С чего начать, если хочешь стать дата сайентистом
- Зачем участвовать в соревнованиях…

126 viewsAnatoly Alekseev, edited 08:48

#trading #dl #mbo #lob #bidask

https://www.youtube.com/watch?v=yqccDoujAUc

YouTube

Zihao Zhang (Oxford-Man Institute) - "Deep Learning for Market by Order Data"

Next up in the Cornell-Citi webinar series is Dr. Zihao Zhang, who spoke on Tuesday, Oct. 26.

Abstract: Market by order (MBO) data - a detailed feed of individual trade instructions for a given stock on an exchange - is arguably one of the most granular…

107 viewsAnatoly Alekseev, 02:15

Aspiring Data Science

#ml #competitions #kaggle #dl #cnn

https://www.youtube.com/watch?v=G5UkWXehS_s

YouTube

Kaggle Planet Understanding: классификация спутниковых снимков — Роман Соловьёв

Роман @zfturbo Соловьёв недавно приходил к нам на тренировку и рассказывал про задачу классификации спутниковых снимков (Kaggle Planet Understanding the Amazon from Space). Роман вместе со Станиславом Семёновым занял в этом соревновании 3 место. Из видео…

119 viewsAnatoly Alekseev, 14:48

Aspiring Data Science

#trading #finance #lob #dl

Очень интересные открытия: нет следов большой нестационарности (даже для 1 года OOS), 1 модель для всех активов лучше отдельных моделей для каждого актива. Использование моделек с памятью типа LSTM улучшает точность (от 100 до 5000 тиков, к примеру, на 1% - path dependence/long memory effects).

https://www.youtube.com/watch?v=diLtyRg6cl4

YouTube

Universal features of intraday price formation: an exploration via Deep Learning

Live from QuantMinds International, Professor Rama Cont, Professor Of Mathematics And Chair In Mathematical Finance at Imperial College London presents on universal features of intraday price formation, including looking at a Deep Learning approach to analysis…

154 viewsAnatoly Alekseev, edited 16:54

Aspiring Data Science

#dl #tensorflow

Сильно удивился, что с релиза 2.11 TF перестал поддерживать GPU на винде. Да и правильно, хрен с ней, ведь в мире никто не пользуется виндой. Но вроде появились какие-то плагины directml, которые якобы могут задействовать на винде любой GPU, в т.ч. и от AMD. Тестить пока страшно. Кстати, версии куда, которые использует TF, по-прежнему отстают от того что релизит Нвидия. отстают уже почти на 2 года. почему команде tensorflow настолько насрать на их продукт?

conda install -c conda-forge cudatoolkit=11.2 cudnn=8.1.0
# Anything above 2.10 is not supported on the GPU on Windows Native
pip install "tensorflow<2.11"

При том, что текущая версия Cuda уже 12+.

TensorFlow

GPU device plugins | TensorFlow

😨1

121 viewsAnatoly Alekseev, edited 14:32

Aspiring Data Science

#trading #finance #twosigma #dl

https://www.youtube.com/watch?v=iyA6cVmShC0

YouTube

Two Sigma Presents Deep Learning for Sequences in Quantitative Finance David Kriegman

120 viewsAnatoly Alekseev, 03:26

Aspiring Data Science

#competitions #ml #hackathon #dl #keras #convnet

https://www.youtube.com/watch?v=T0zfD8Kf2CI

YouTube

Нейрохакатон: классификация сигналов ЭЭГ сверточными нейросетями — Андрей Киселев

Андрей Киселев рассказывает про задачу классификации действий людей по сигналам электроэнцефалограмм, которая решалась в рамках хакатона по нейронаукам в Яндексе, где Андрей занял 2 место. Из видео вы сможете узнать:
- Какие нейронные сети можно использовать…

126 viewsAnatoly Alekseev, 19:17

Aspiring Data Science

#trading #dl #cnn #autoencoder #agent #similation #balch

https://youtu.be/1XS57JCeePI?si=hoYMtcWlWjrnhS6e

YouTube

AI Research at J.P. Morgan

Tucker Balch, Managing Director, JP Morgan AI Research

Abstract:
J.P. Morgan has established a new group to focus on fundamental problems at the intersection of AI and Finance. In this talk, I will review a few of the projects underway, including advances…

96 viewsAnatoly Alekseev, edited 03:50

Aspiring Data Science

Forwarded from asisakov

ReLU, GELU, SiLU и ELU

Несколько лет назад на курсах нам рассказывали только про несколько функций активации: sigmoid, tanh, ReLU. Было круто, когда кто-то дополнительно ещё рассказывал про Leaky ReLU. И всего этих четырёх функций активации было достаточно, чтобы шатать сеточки.

Буквально несколько дней назад я слушал разбор статьи, где говорилось о том, что применение ReLU позволяет увеличить скорость инференса с небольшой потерей качества. Сравнение проводилось с функциями активации: GELU, SiLU. Я понял, что немного отстал от современных технологий в DL и решил погуглить и поделиться с вами.

Начнем с функции ReLU (Rectified Linear Unit). Эта функция активации имеет форму f(x) = max(0, x), что делает ее чрезвычайно эффективной для операций с большим количеством признаков, поскольку она увеличивает нелинейность модели без затрат на вычислительные ресурсы и без риска исчезновения градиента. Одним из главных недостатков ReLU является проблема «мертвых нейронов», когда нейроны перестают активироваться и вносить вклад в обучение сети из-за отрицательных значений на входе.

GELU (Gaussian Error Linear Unit), впервые представленная в 2016 году, стала более гладкой альтернативой ReLU. Функция GELU умножает входное значение на вероятность того, что значение будет активировано, что делает ее подходящей для использования в трансформерах и сетях с self-attention. Такая структура приводит к более динамичной адаптации нейронов к разным фазам обучения, позволяя достигать лучших результатов на сложных задачах.

Следующая в нашем списке — SiLU (Sigmoid Linear Unit). Эта функция активации представляет собой произведение входа на сигмоидную функцию от этого же входа, f(x) = x * σ(x). SiLU показала хорошие результаты в экспериментах по глубокому обучению, часто превосходя ReLU по разнообразным метрикам.

ELU (Exponential Linear Unit) добавляет еще одну интересную возможность в арсенал функций активации. В отличие от ReLU, ELU вводит отрицательные значения для отрицательных входов, что помогает сохранять более богатую информацию о распределении входных данных. Функция имеет форму f(x) = x, если x > 0, и f(x) = α(exp(x) - 1), если x ≤ 0, где α — параметр, обычно равный единице. Это улучшает скорость сходимости модели.

Вкратце: эти функции активации позволяют уменьшить вероятность возникновения проблемы размывания градиентов, но при этом тратят чуть больше компьюта на вычисления.

Пояснение с кодом есть тут
Дополнительное чтиво: 1, 2

#dl #code

❤1

111 viewsAnatoly Alekseev, 19:55

Aspiring Data Science

Forwarded from asisakov

Рашифровка аудио с Whisper

Всех приветствую! Возможно, каждый из вас сталкивался с небольшой проблемой, когда хочется сделать транскрибацию часового аудио или видео и перенести все это в текст и не хочется тратить много времени на прослушивание даже на x2 и конспектировании.

К счастью, все придумано уже до нас. Нам остается лишь правильно это применить.
Расчехляем гугл colab и подгружаем GPU.

В первую ячейку вписываем небольшой костыль:

import locale
def getpreferredencoding(do_setlocale = True):
return "UTF-8"
locale.getpreferredencoding = getpreferredencoding

Далее подгружаем Whisper и ставим ffmpeg

!pip install git+https://github.com/openai/whisper.git
!sudo apt update && sudo apt install ffmpeg

В файлы загружаем необходимую для расшифровки аудиодорожку и далее просто запускаем модель

!whisper "audio1891746601.m4a" --model large-v2

После --model мы видим, что в принципе можно применять разные модели. По желанию вы можете даже попробовать версию v3 или применить другие модели, например tiny, base, small, medium. Подробнее тут.

Если вы хотите загрузить аудио из интернетов, то допустим это можно сделать следующим образом (может меняться от кейса к кейсу, поэтому просто погуглите)

!wget -c -A '*.mp3' -r -l 1 -nd http://example.org/musics/

Либо если вы хотите расшифровать это видео, грузим его вот так, а потом снова применяем whisper

pip install yt-dlp
yt-dlp -x --audio-format mp3 -o use_whisper.mp3 -- 8SQV-B83tPU

!whisper "use_whisper.mp3" --model large-v3

Результат расшифровки сохранится у вас в той же папочке.
Несколько минут - и вам не нужно слушать весь текст. А если файл большой, то можно другой сеточкой сделать суммаризацию (ну и вообще это сейчас можно делать прямо в браузере).

Надеюсь, было полезно. Кидайте в коменты модели (с кодом!), которые можно было бы применить для решения этой задачи.
Подробнее тут, тут и тут.

#dl #audio

GitHub

GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision

Robust Speech Recognition via Large-Scale Weak Supervision - openai/whisper

136 viewsAnatoly Alekseev, 18:49

Aspiring Data Science

#dl #gpu #hpu

Прикольно, Intel Gaudi1 заруливают NVIDIA A100 по цена/производительность. Вот бы ещё для IPU (Graphcore Intelligence Processing Unit ) такое сравнение найти.

8 NVIDIA A100 --> $0.98 / COCO epoch
8 Intel Gaudi1 HPU --> $0.73 / COCO epoch

Намекают, что Gaudi2 (уже вышли) вчетверо быстрее Gaudi1.

https://blog.roboflow.com/gpu-vs-hpu/

Roboflow Blog

HPU vs GPU - Benchmarking the Frontier of AI Hardware

When you are training machine learning models, it is essential to pick hardware that optimizes your models performance relative to cost. In training, the name of the game is speed per epoch – how fast can your hardware run the calculations it needs to train…

128 viewsAnatoly Alekseev, edited 00:40

Aspiring Data Science

#dl #gpu #rocm

https://youtu.be/IhlL1_z8mCE?si=Renm-q7iqHNO_lBU

YouTube

MI210s vs A100 -- Is ROCm Finally Viable in 2023? Tested on the Supermicro AS-2114GT-DNR

Wendell discusses the race in machine learning, going over Google's, Nvidia's, and AMD's tech to see who's got what in 2023.

*********************************
Check us out online at the following places!
https://bio.link/level1techs

*IMPORTANT* Any email…

104 viewsAnatoly Alekseev, edited 15:48

Aspiring Data Science

#dl

https://www.youtube.com/watch?v=TLHYwbrhGJc

YouTube

Lenka Zdeborová - Statistical Physics of Machine Learning (May 1, 2024)

Machine learning provides an invaluable toolbox for the natural sciences, but it also comes with many open questions that the theoretical branches of the natural sciences can investigate.

In this Presidential Lecture, Lenka Zdeborová will describe recent…

123 viewsAnatoly Alekseev, 03:18

Aspiring Data Science

#hardware #benchmarking #dl

"Deep learning is a field with intense computational requirements, and your choice of GPU will fundamentally determine your deep learning experience. But what features are important if you want to buy a new GPU? GPU RAM, cores, tensor cores, caches? How to make a cost-efficient choice? This blog post will delve into these questions, tackle common misconceptions, give you an intuitive understanding of how to think about GPUs, and will lend you advice, which will help you to make a choice that is right for you."

Не знал про Tensor Memory Accelerator (TMA). Кстати, весьма странно, что Nvidia не даёт возможности программно запросить количество набортных Tensor Cores и RT cores (хотя десятки других параметров доступны через Cuda API). Зажрались!

https://timdettmers.com/2023/01/30/which-gpu-for-deep-learning/

Tim Dettmers

The Best GPUs for Deep Learning in 2023 — An In-depth Analysis

Here, I provide an in-depth analysis of GPUs for deep learning/machine learning and explain what is the best GPU for your use-case and budget.

94 viewsAnatoly Alekseev, edited 14:06

Aspiring Data Science

#pytorch #benchmarking #dl

TorchBench: Benchmarking PyTorch with High API Surface Coverage

В статье рассматриваются (на базе сравнений производительности подзадач) интересные аспекты разработки моделек в pytorch, в частности, недозагрузка GPU, Nvidia vs AMD, преимущества TorchInductor и TF32, etc.

В частности, показано, что в среднем задачи RL (в их популярных реализациях) загружают GPU всего на 10%, что аттрибутируется "взаимодействию с окружением". Я как знал, что объектно-ориентированный RL-код это ужасный тормоз.

https://arxiv.org/pdf/2304.14226

124 viewsAnatoly Alekseev, edited 14:27

Aspiring Data Science

#dl #ai #math #alphaproof

https://www.youtube.com/watch?v=ygqNjojA3Hk

YouTube

СПбМО -- 2025.04.22 -- AI в математике

Это запись доклада "AI и математика: что модели могут сейчас и куда мы идём" на заседании Санкт-Петербургского математического общества 22 апреля 2025 года.

Подписывайтесь на мой телеграм-канал "Sineкура":
https://t.me/sinecor

Слайды доклада размещены на…

86 viewsAnatoly Alekseev, edited 10:40

About

Blog

Apps

Platform