DeepSchool
10.3K subscribers
77 photos
1 video
1 file
432 links
Это канал школы deepschool.ru. Здесь мы будем:
- напоминать вам теорию ML/DL в виде коротких постов,
- задавать вопросы с собеседований,
- рассказывать про полезные фреймворки
- и делиться советами, которые помогут вам в работе.

@deepschool_support
Download Telegram
MobileOne

Эффективные модели — модели с балансом между скоростью работы и качеством. Это отдельное большое направление исследований в области CV. Классический пример — модели семейства MobileNet.

В 2022 году Apple предложили свой вариант архитектуры для мобильных и CPU устройств. О нем мы и поговорим, а также вы узнаете:
- почему FLOPs и количество параметров влияют на скорость инференса не так, как принято об этом думать
- на что еще стоит обратить внимание при разработке архитектуры для мобильных и CPU устройств
- как переделать multi-branch в single-branch архитектуру без потери качества для ускорения инференса

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/MobileOne-2126289e1f714b43a5d4c3d97e435ce4?pvs=4
🔥3698👍4
Как быстро освоить ускорение нейросетей

Тренд на создание более точных моделей на ImageNet прошел еще пару лет назад. В последнее время все актуальнее создавать не просто точные модели, а точные и максимально быстрые.

Быстрый инференс дает множество преимуществ:
- экономия на железе
- высокий fps в realtime задачах
- новый опыт для пользователей, когда нейросети помещаются на девайс
- безопасность локального использования
- возможность держать большую нагрузку на сервис

Навык ускорения (облегчения) моделей стал востребованным, и мы хотим помочь вам добавить его в свой арсенал. Поэтому мы готовим обучение, на котором вы сможете разобраться, какие есть методы ускорения, как они устроены и как их комбинировать на практике.

Если вам интересно это направление, заполните короткую форму, чтобы помочь нам адаптировать программу под вас. Это займёт 3-5 минут

https://forms.gle/ZnSX2tjHtRhhJ2fM9
🔥35👏13🤩63👍1🍾1
Основы основ обучения с подкреплением

В последнее время появляется все больше впечатляющих работ: управление плазмой, сумасшедший паркур четырехногого робота и устойчивая двуногая ходьба. Все они основаны на обучении с подкреплением. Ему и посвящена наша новая серия постов.

Вместе мы разберемся с основами этого процесса и уже в первой статье узнаем:
- что такое обучение с подкреплением
- как проходит само обучение
- что такое пространство состояний и действий, траектории и вознаграждения
- два основных подхода к обучению с подкреплением

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/df13838027b240bf903202731ab3b637?pvs=4
🔥36👍1211❤‍🔥3
Почему в 52% вакансий упоминают ускорение или конвертацию сетей

Раньше, чтобы комфортно чувствовать себя на рынке DS, было достаточно уметь обучать нейросети и знать теорему байеса.
Теперь же и навыком выката моделей в прод никого не удивишь. Но вот уметь делать этот “прод” быстрым — до сих пор редкий и востребованный навык.

И вот 3 причины, почему в вакансиях его упоминают все чаще

1️⃣Экономия на железе

С каждым 1% ускорения/облегчения модели, вы экономите 1% стоимости вычислительных ресурсов. Логика простая: чем быстрее сеть, тем раньше GPU возьмется за новый батч, а чем меньше весов, тем больше изображений в этот батч поместится.

За счет ускорения модели, даже 1 сервис может начать экономить компании сотни долларов в день. Кстати, зачастую можно ускорить уже имеющуюся модель без потерь в точности. Например, за счет фьюзинга и конвертации или смены бэкенда.

2️⃣Realtime обработка видео

В задачах AR/VR, нейрорендеринга, автономных роботах, контроле качества на производствах, безопасности на дорогах и других задачах анализа/синтеза видео важно принимать решения за миллисекунды.

Автопилот должен управлять машиной на скорости выше 35 метров в секунду, конвейерная лента за это время уже переместит более 100 объектов, а глаз человека будет видеть плавную картинку в VR очках или в смартфоне только при 120 fps и выше.

Все это накладывает очевидные ограничения на скорость инференса. Ведь помимо анализа изображения, системе еще и необходимо выполнить действие: сменить полосу, отбросить с ленты брак или отрисовать в очках объект — за очень короткий промежуток времени.

3️⃣Безопасность и скорость локального использования

Если вы не слышали про GDPR, вы счастливый датасайентист. В СНГ пространстве нет столь жесткого контроля за персональными данными, как в западных странах. Но за хранение информации без разрешения или ее утечку, даже наши компании могут получить если не исполинский штраф, то общественное порицание и потерю репутации.

Чтобы не рисковать, не смущать пользователей отправкой фото на сервер, и уменьшить время ожидания, модели помещают на мобильные устройства. А перед этим их необходимо облегчить и конвертировать в нужный формат (CoreML, TFLite, NNApi, etc), стараясь не потерять точность.

А так как DL сервисов становится больше, сети встречаются на устройствах чаще, а про безопасность пользователей в последние годы все больше споров — навыки ускорения моделей становятся более востребованными.

Ставьте реакции 🔥, если вам интересна эта тема и мы познакомим вас ближе с методами ускорения сетей!
#заметки_deepschool
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥189👍1510
Методы ускорения сетей

Мы написали статью, в которой собрали основные подходы к ускорению моделей⚡️
В ней познакомим вас с NAS, прунингом, дистилляцией и квантизацией.

В статье рассказали:
- в чем заключается каждый подход
- зачем их использовать
- советы по их применению
- частный случай каждого подхода

Мы привели примеры в основном для CV, но статья будет полезна для всех инженеров, так как подходы к ускорению могут быть использованы и в других направлениях.

Материал поможет вам разобраться, какие существуют методы ускорения и как они связаны между собой.

Читайте по ссылке

И подписывайтесь на DeepSchool
🔥58👍2213
Особенности 3D медицинских данных

В медицине используется несколько форматов данных. Самые распространенные из них — рентген, компьютерная и магнитно-резонансная томография (КТ и МРТ). Рентген представляет собой привычное двумерное изображение с единственным каналом и отличным от 0-255 диапазоном значений. А КТ и МРТ мы получаем в трехмерном виде.

В короткой статье мы познакомимся с последними поближе и узнаем:
- как выглядят 3D медицинские данные
- чем они отличаются от 2D данных
- как измерять расстояния по трехмерному изображению в реальных миллиметрах

Читайте статью по ссылке: https://www.notion.so/deepschool-pro/3D-a8d09fc0675d4235896750fd4c55beec?pvs=4
👍4320🔥13
DINO/DINOv2

Благодаря успеху трансформеров в NLP появляется всё больше foundation models на базе этой архитектуры и в других доменах, например, в CV. Если трансформеры так хорошо предобучаются на неразмеченных корпусах текстов — почему бы не сделать это с картинками?

Об этом и поговорим в нашей статье, а ещё расскажем:
- почему предобучение vision-трансформеров лучше делать без разметки
- чем хороши признаки vision-трансформеров, обученных с помощью DINO
- в каких задачах можно применять предобученные таким способом модели

Читайте новую статью по ссылке: https://deepschool-pro.notion.site/DINO-Self-distilation-with-no-labels-18e894250fae4e5d87e99a3312c1effd?pvs=4
👍39🔥2413
Как разобраться в ускорении нейросетей⚡️

Мы создали отдельный канал, посвященный теме ускорения нейросетей.

В нем мы будем:
— рассказывать про методы ускорения
— приводить примеры из практики
— делиться ошибками
— проводить лекции и эфиры с экспертами в области

Многие сталкивались с квантованием, дистилляцией, прунингом, конвертировали в ONNX, TRT, OpenVino, но мало кто понимает, как совмещать эти алгоритмы и инструменты.

Структурированной информации в этом направлении мало: меняются архитектуры вычислителей, обновляются фреймворки и бэкенды — приходится экспериментировать самостоятельно, перебирая разные варианты.

Мы решили помочь вам разобраться в ускорении моделей, в целевых вычислителях (CPU, GPU, NPU), в различных бэкендах (OpenVino, NNApi, TRT, etc), в запуске инференса на смартфонах и микрокомпьютерах.

Поэтому мы создаем образовательную программу по ускорению CV-моделей. И создали канал, где погрузим вас в эту тему. Там вас уже ждёт пост с 3 советами для ускорения нейросетей👇

Канал про ускорение нейросетей
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥29👻109👍7🤯1
История YOLO. Часть 5

В комьюнити есть мнение: YOLOv5 отличается от YOLOv4 только тем, что она написана на торче вместо darknet’a. В новой статье мы продолжим изучать историю YOLO и разберемся, почему это не совсем так.

А еще расскажем:
- чем новая модель отличается от YOLOv4 и при чем тут Scaled YOLOv4
- какая реакция была на ее выход
- и как авторы смогли сделать её такой популярной

Читайте статью по ссылке: https://www.notion.so/deepschool-pro/YOLO-history-Part-5-4c18fe7d29b6432dbcc53d38e0c534ae?pvs=4
25🔥12👏8👍5
FastViT, Apple

После небольшого, но всё же успеха MobileOne, ресёрчеры из Apple продолжили поиск моделей с лучшим балансом между скоростью работы и качеством. Весной 2023 года они представили FastViT — гибридный Computer Vision трансформер, который совмещает дизайн свёрточных сетей и обычного vision трансформера.

В этой статье мы:
- кратко вспомним ViT, первый успешный vision трансформер, а также структуру MobileOne блока, которая будет встречаться в дальнейшем
- познакомимся с новым взглядом на строение трансформеров и узнаем, почему выбор token mixer не ограничивается Self-Attention
- узнаем, как эффективно совместить дизайн свёрточных сетей и трансформера в одной архитектуре
- посмотрим на результаты применения FastViT в downstream задачах

Читайте нашу статью по ссылке: https://www.notion.so/deepschool-pro/FastVit-Apple-9aea903fdac14bdebb049b9b058aabdf?pvs=4
🔥5211❤‍🔥5
Сколько 💵 ускорение сетей экономит компаниям, надо ли в это погружаться инженеру и как выглядит инференс будущего

Это и не только мы обсудим сегодня на прямом эфире в нашем канале по теме ускорения нейросетей

Кто же расскажет об этом лучше Саши Гончаренко:
- CTO стартапа по ускорению моделей enot.ai
- автор статей, в том числе про low-power/precision вычисления
- спикер конференций (NAS, трансформеры, инференс на смартфоне)
- хэдлайнер нашего курса по ускорению

🗓 Сегодня в 15.30 по Мск мы проведём интервью с Александром Гончаренко, СТО ENOT.ai

Мы обсудим:
- сколько денег ускорение сетей экономит компаниям
- может ли навык ускорения повысить оклад инженеру
- где и почему важно ускорять сети
- как будет выглядеть инференс будущего
- что делать инженерам и командам: практические советы здесь и сейчас

И еще парочка интересных историй без спойлеров.

Переходите в канал ускорения и присоединяйтесь к нашему интервью!
До встречи на прямом эфире!🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18🔥136🤩1
Лекция по ускорению нейросетей во вторник в 18:00 МСК!

Ранее мы рассказывали, почему в индустрии все чаще поднимается тема ускорения нейросетей:
➡️ становится больше веб-сервисов и приложений на девайсах
➡️ для первых надо улучшать latency и throughput
➡️ вторые ограничены в ресурсах и могут работать только с легкими и быстрыми моделями

И чтобы помочь вам разобраться в этой теме, мы подготовили для вас лекцию-погружение в ускорение сетей.

В этот вторник 20 февраля Саша Гончаренко, СТО стартапа enot.ai проведет онлайн-лекцию, на которой:
— запрунит, квантанет и затюнит с дистилляцией MobileNet v2
— расскажет подробнее о каждом методе
— споткнётся о сложности и научит их решать
— объяснит, почему различается результат на разных вычислителях🤔
— и представит программу курса «Ускорение нейросетей»

Регистрируйтесь на лекцию по ссылке!

📚В канале ускорения Саша несколько раз упоминал, что ускорение надо начинать с фреймворка для инференса. Поэтому мы также подготовили туториал по использованию TensorRT и OpenVino. Он ждёт вас по ссылке!

И до встречи 20 февраля в 18:00 МСК!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥30👏943👍3🙏2
Метрики в задаче генерации изображений

В мире машинного обучения все более популярными становятся модели генерации изображений. Для оценки их качества важно использовать надёжные и точные метрики.

В этой статье разберёмся с тем, что отражает «точность» таких моделей.

А также рассмотрим следующие метрики:
- Inception Score (IS)
- Fréchet inception distance (FID)
- Precision/Recall

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/26acfe6403584cb0ac57be959d8a5c8d?pvs=4
🔥31👍1612
Начинаем лекцию через 1,5 часа, успевайте зарегистрироваться!

Напомним, что для слушателей мы подготовили туториал по использованию фреймворков для инференса: ONNX Runtime, TensorRT и OpenVino.

📺До встречи сегодня в 18:00 МСК!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥177👍6
9🔥3
Это было круто!

Спасибо, что пришли вчера на лекцию! Вы молодцы! Потому что вечером рабочего дня образовывались, были включены и задавали интересные вопросы!🎓

Отдельное спасибо за доверие к нашей команде тем, кто уже присоединился к курсу “Ускорение нейросетей”, который мы представили вчера на встрече!

Если вы тоже хотите повысить свою экспертизу и ценность как DL-инженера, научиться ускорять нейросети, экономить компаниям ресурсы и создавать приложения для edge-девайсов и смартфонов — присоединяйтесь к курсу по ранним условиям!

⚡️Наша программа разделена на 2 блока:

1️⃣ Методы ускорения нейронных сетей
— Distillation
— Pruning
— Matrix Decomposition
— Low-Precision Computing
— Neural Architecture Search (NAS)

2️⃣ Инференс на железе
— CPU. x86 (Intel)
— CPU. Android (ARM)
— CPU. Микроконтроллеры
— GPU
— NPU

В первой части вы научитесь комбинировать методы для ускорения сверточных и трансформер-подобных архитектур.
А во второй использовать особенности железа и инференс-фреймворков (OpenVino, ONNX Runtime, TensorRT, NNApi) для оптимальной утилизации вычислителей.

10 недель
10 zoom-лекций
10 заданий
10 спикеров
∞ поддержки на встречах и в чате
+ возможность взять академ до следующего старта
+ доступ к новым лекциям 2-х следующих потоков 🔥 действует только сейчас!

23 февраля будет повышение цены, успевайте оплатить или внести предоплату, чтобы зафиксировать скидку!

Подробнее о программе, спикерах и скидках на сайте программы — присоединяйтесь к обучению!
Please open Telegram to view this post
VIEW IN TELEGRAM
219👍5🔥3👏2
ClearML Data Management

Чем DL-специалисты отличаются от разработчиков? Помимо кода нам надо версионировать ещё эксперименты, данные и модели. Git здесь не поможет и на помощь приходят инструменты из мира DS. Один из таких инструментов — ClearML.

ClearML — это огромный комбайн, решающий множество задач, от логирования метрик до деплоя сервиса. Но сегодня мы рассмотрим его именно как инструмент менеджмента датасетов.

В новой статье вы узнаете:
- какие возможности для работы с данными есть в ClearML
- как использовать их с помощью командной строки или python-интерфейса
- как добавлять информацию, csv файлы, дебаг изображения и графики
- как кэшируются данные

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/ClearML-Data-Management-915ae05cd7654f4a9fff822c76c2ec7b?pvs=4
22🔥18👍5👏3
Q-Learning

Q-Обучение — один из фундаментальных алгоритмов обучения с подкреплением. Его использовали ещё при обучении агентов в играх на Атари. Он актуален и сегодня — применяется, например, в офлайн-обучении с подкреплением.

Из новой статьи вы узнаете:
- как работают методы обучения с подкреплением, основанные на функции ценности
- какие есть методы для оценки этой функции
- что такое уравнение Беллмана
- и конечно же, какой алгоритм у Q-обучения.

Читайте нашу статью по ссылке: https://www.notion.so/deepschool-pro/Q-314e0f83efb14ef19b12ffaacfc2b4a6?pvs=4
👍29🔥127
Стартовал курс «Ускорение нейросетей»🎉

В понедельник была вводная встреча со студентами первого потока!
Мы проводим такие встречи в начале каждого курса, чтобы познакомиться, рассказать, как будет проходить курс, и зарядить ребят на обучение 🔥

Уже завтра пройдёт первая лекция “Distillation”
Разберём, что такое дистилляция и DarkKnowledge, функции потерь, дистилляцию для уменьшения архитектуры, дистилляцию в классических CV-задачах, также затронем и NLP.
В качестве практики в этой лекции студенты будут дистиллировать сеть для задачи сегментации человека.

Остаётся 24 часа, чтобы присоединиться к курсу «Ускорение нейросетей»!

За 10 недель вы ускорите нейросеть разными методами и запустите её на нескольких устройствах ⚡️

На программе вы научитесь:
- ускорять нейросети, понимая теорию каждого алгоритма
- комбинировать разные подходы и решать вытекающие трудности
- оптимизировать инференс, сохраненяя точность
- запускать сети на различных устройствах
- использовать особенности железа и фреймворков OpenVino, ONNX Runtime, TensorRT, NNApi

Это всё с поддержкой от опытных инженеров. Каждый спикер несколько лет занимается той темой, которую преподаёт на курсе.
Вступайте в наше сообщество и получите возможность перенимать опыт у действующий специалистов из области ускорения. 🎓

Переходите на сайт, изучайте подробности и присоединяйтесь к «Ускорению нейросетей»!
До встречи на обучении!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20👍10🤩73🎉1