DeepSchool
10.3K subscribers
77 photos
1 video
1 file
432 links
Это канал школы deepschool.ru. Здесь мы будем:
- напоминать вам теорию ML/DL в виде коротких постов,
- задавать вопросы с собеседований,
- рассказывать про полезные фреймворки
- и делиться советами, которые помогут вам в работе.

@deepschool_support
Download Telegram
Ответим на множество вопросов по коду обучения сетей в 18:00 мск

Бывало, что вы увидели фреймворк, конфиг, сервис в какой-нибудь статье или на конференции и не знаете:
а это точно хорошая практика?
а есть подводные камни?
а в наш проект подойдет?
может есть вариант получше?

Сегодня в формате мастер-класса расскажем, как увязать вместе хорошие практики в один репозиторий, а также обсудим возможные вопросы, диллемы и сложности, которые могут возникнуть по пути.

Будет полезно как новичкам, так и более опытным.

Успевайте зарегистрироваться по ссылке! До встречи сегодня в 18:00 мск!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥118🤯5
​​Многорукие бандиты

В жизни мы часто сталкиваемся с выбором: например, какое вино купить или в какой ресторан сходить. Хочется попробовать новое, но в то же время не разочароваться.
В этой статье мы разберемся, как находить баланс между исследованием (новыми альтернативами) и эксплуатацией (проверенными вариантами).

А также узнаем:
- что такое action-value function (Q-function)
- почему жадный алгоритм не самое лучшее решение задачи многоруких бандитов
- какие есть методы для баланса исследования и эксплуатации

Читайте новую статью по ссылке: https://deepschool-pro.notion.site/8102543939e84867a64064edff7527c2?pvs=4
🔥32👍125🤩4❤‍🔥2
Эффективные ансамбли

Ансамбли помогают:
- повысить устойчивость к искажению входных данных
- определить принадлежность объекта к тренировочному распределению
- улучшить взаимосвязь между уверенностью модели и реальным качеством предсказания

⚠️ Но у ансамблей есть и недостаток — увеличивается время предсказания.

Чтобы снизить этот фактор и ускорить ансамбли, придумали несколько методов, с которыми мы и познакомим вас в новой статье.

А также рассмотрим базовые подходы к построению ансамблей и метрики для оценки их эффективности.

Читайте новую статью по ссылке: https://deepschool-pro.notion.site/e0b2a0bad14e414782b9ab3dff0cd2b5?pvs=4
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥29👍1511❤‍🔥1
Расширяем команду авторов DeepSchool

Мы расширяем команду и ищем ребят, кто хочет вместе с нами систематизировать свои знания, разбирать статьи и делиться наработками с аудиторией!

Ранее мы писали про то, как готовим статьи и успели познакомить вас с частью команды.

Если вам интересно присоединиться к нам, заполните эту анкету: https://forms.gle/g8BSe3YNDpFALmV39

Подробнее про условия рассказали в самой форме👆🏻
🥰18🔥11👍63👏3
Хорошего Нового года! 🎄

Всей командой авторов DeepSchool желаем вам получать больше удовольствия от работы и учебы в следующем году!

Пусть те, кто хочет перейти в ML, удачно в него перейдут. Кто хочет найти работу, устроится в хорошую команду. Кто хочет новых задач и высот на текущем месте, обязательно их достигнет!

Спасибо, что читаете нас! Ваши реакции, комментарии и советы — лучшие подарки, которые вы дарили нам весь этот год.

Не стали публиковать новые посты, чтобы не отвлекать в эти суетливые дни. Вы много изучили в уходящем году, вы молодцы! Отдыхайте, наслаждайтесь праздниками!🥳

До встречи в новом году!🎄
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
92🍾32😍10👍71🎉1👻1
История YOLO. Часть 4

Начнем 2024 год с 4 версии YOLO. Символичное напоминание в начале года от исходной аббревиатуры: You Only Live Once!💫

Надеемся, вы уже успели отдохнуть и готовы читать технические статьи, потому что сегодня расскажем про важную архитектуру.

В предыдущих сериях мы рассмотрели три версии YOLO: YOLOv1, YOLOv2 и YOLOv3. А сегодня познакомимся с YOLOv4 — архитектурой, которая сильно отличается от остальных.
Во-первых, ее создали новые авторы.
Во-вторых, они добавили много изменений.
Как им удалось сохранить скорость инференса и выдвинуть семейство YOLO на первое место в COCO среди real-time моделей? Давайте разбираться вместе 🙂

Из статьи вы узнаете:
- какие трюки позволили улучшить качество модели
- как при этом авторы сохранили легкость и скорость архитектуры
- какую проблему в предсказании ббоксов нашли у двух предыдущих версий YOLO и как ее решили

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/YOLO-history-Part-4-d8b6053c3f314768a5474dac9f11e708?pvs=4
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥44👍1911
MobileOne

Эффективные модели — модели с балансом между скоростью работы и качеством. Это отдельное большое направление исследований в области CV. Классический пример — модели семейства MobileNet.

В 2022 году Apple предложили свой вариант архитектуры для мобильных и CPU устройств. О нем мы и поговорим, а также вы узнаете:
- почему FLOPs и количество параметров влияют на скорость инференса не так, как принято об этом думать
- на что еще стоит обратить внимание при разработке архитектуры для мобильных и CPU устройств
- как переделать multi-branch в single-branch архитектуру без потери качества для ускорения инференса

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/MobileOne-2126289e1f714b43a5d4c3d97e435ce4?pvs=4
🔥3698👍4
Как быстро освоить ускорение нейросетей

Тренд на создание более точных моделей на ImageNet прошел еще пару лет назад. В последнее время все актуальнее создавать не просто точные модели, а точные и максимально быстрые.

Быстрый инференс дает множество преимуществ:
- экономия на железе
- высокий fps в realtime задачах
- новый опыт для пользователей, когда нейросети помещаются на девайс
- безопасность локального использования
- возможность держать большую нагрузку на сервис

Навык ускорения (облегчения) моделей стал востребованным, и мы хотим помочь вам добавить его в свой арсенал. Поэтому мы готовим обучение, на котором вы сможете разобраться, какие есть методы ускорения, как они устроены и как их комбинировать на практике.

Если вам интересно это направление, заполните короткую форму, чтобы помочь нам адаптировать программу под вас. Это займёт 3-5 минут

https://forms.gle/ZnSX2tjHtRhhJ2fM9
🔥35👏13🤩63👍1🍾1
Основы основ обучения с подкреплением

В последнее время появляется все больше впечатляющих работ: управление плазмой, сумасшедший паркур четырехногого робота и устойчивая двуногая ходьба. Все они основаны на обучении с подкреплением. Ему и посвящена наша новая серия постов.

Вместе мы разберемся с основами этого процесса и уже в первой статье узнаем:
- что такое обучение с подкреплением
- как проходит само обучение
- что такое пространство состояний и действий, траектории и вознаграждения
- два основных подхода к обучению с подкреплением

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/df13838027b240bf903202731ab3b637?pvs=4
🔥36👍1211❤‍🔥3
Почему в 52% вакансий упоминают ускорение или конвертацию сетей

Раньше, чтобы комфортно чувствовать себя на рынке DS, было достаточно уметь обучать нейросети и знать теорему байеса.
Теперь же и навыком выката моделей в прод никого не удивишь. Но вот уметь делать этот “прод” быстрым — до сих пор редкий и востребованный навык.

И вот 3 причины, почему в вакансиях его упоминают все чаще

1️⃣Экономия на железе

С каждым 1% ускорения/облегчения модели, вы экономите 1% стоимости вычислительных ресурсов. Логика простая: чем быстрее сеть, тем раньше GPU возьмется за новый батч, а чем меньше весов, тем больше изображений в этот батч поместится.

За счет ускорения модели, даже 1 сервис может начать экономить компании сотни долларов в день. Кстати, зачастую можно ускорить уже имеющуюся модель без потерь в точности. Например, за счет фьюзинга и конвертации или смены бэкенда.

2️⃣Realtime обработка видео

В задачах AR/VR, нейрорендеринга, автономных роботах, контроле качества на производствах, безопасности на дорогах и других задачах анализа/синтеза видео важно принимать решения за миллисекунды.

Автопилот должен управлять машиной на скорости выше 35 метров в секунду, конвейерная лента за это время уже переместит более 100 объектов, а глаз человека будет видеть плавную картинку в VR очках или в смартфоне только при 120 fps и выше.

Все это накладывает очевидные ограничения на скорость инференса. Ведь помимо анализа изображения, системе еще и необходимо выполнить действие: сменить полосу, отбросить с ленты брак или отрисовать в очках объект — за очень короткий промежуток времени.

3️⃣Безопасность и скорость локального использования

Если вы не слышали про GDPR, вы счастливый датасайентист. В СНГ пространстве нет столь жесткого контроля за персональными данными, как в западных странах. Но за хранение информации без разрешения или ее утечку, даже наши компании могут получить если не исполинский штраф, то общественное порицание и потерю репутации.

Чтобы не рисковать, не смущать пользователей отправкой фото на сервер, и уменьшить время ожидания, модели помещают на мобильные устройства. А перед этим их необходимо облегчить и конвертировать в нужный формат (CoreML, TFLite, NNApi, etc), стараясь не потерять точность.

А так как DL сервисов становится больше, сети встречаются на устройствах чаще, а про безопасность пользователей в последние годы все больше споров — навыки ускорения моделей становятся более востребованными.

Ставьте реакции 🔥, если вам интересна эта тема и мы познакомим вас ближе с методами ускорения сетей!
#заметки_deepschool
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥189👍1510
Методы ускорения сетей

Мы написали статью, в которой собрали основные подходы к ускорению моделей⚡️
В ней познакомим вас с NAS, прунингом, дистилляцией и квантизацией.

В статье рассказали:
- в чем заключается каждый подход
- зачем их использовать
- советы по их применению
- частный случай каждого подхода

Мы привели примеры в основном для CV, но статья будет полезна для всех инженеров, так как подходы к ускорению могут быть использованы и в других направлениях.

Материал поможет вам разобраться, какие существуют методы ускорения и как они связаны между собой.

Читайте по ссылке

И подписывайтесь на DeepSchool
🔥58👍2213
Особенности 3D медицинских данных

В медицине используется несколько форматов данных. Самые распространенные из них — рентген, компьютерная и магнитно-резонансная томография (КТ и МРТ). Рентген представляет собой привычное двумерное изображение с единственным каналом и отличным от 0-255 диапазоном значений. А КТ и МРТ мы получаем в трехмерном виде.

В короткой статье мы познакомимся с последними поближе и узнаем:
- как выглядят 3D медицинские данные
- чем они отличаются от 2D данных
- как измерять расстояния по трехмерному изображению в реальных миллиметрах

Читайте статью по ссылке: https://www.notion.so/deepschool-pro/3D-a8d09fc0675d4235896750fd4c55beec?pvs=4
👍4320🔥13
DINO/DINOv2

Благодаря успеху трансформеров в NLP появляется всё больше foundation models на базе этой архитектуры и в других доменах, например, в CV. Если трансформеры так хорошо предобучаются на неразмеченных корпусах текстов — почему бы не сделать это с картинками?

Об этом и поговорим в нашей статье, а ещё расскажем:
- почему предобучение vision-трансформеров лучше делать без разметки
- чем хороши признаки vision-трансформеров, обученных с помощью DINO
- в каких задачах можно применять предобученные таким способом модели

Читайте новую статью по ссылке: https://deepschool-pro.notion.site/DINO-Self-distilation-with-no-labels-18e894250fae4e5d87e99a3312c1effd?pvs=4
👍39🔥2413