Ответим на множество вопросов по коду обучения сетей в 18:00 мск
Бывало, что вы увидели фреймворк, конфиг, сервис в какой-нибудь статье или на конференции и не знаете:
❓ а это точно хорошая практика?
❓ а есть подводные камни?
❓ а в наш проект подойдет?
❓ может есть вариант получше?
Сегодня в формате мастер-класса расскажем, как увязать вместе хорошие практики в один репозиторий, а также обсудим возможные вопросы, диллемы и сложности, которые могут возникнуть по пути.
Будет полезно как новичкам, так и более опытным.
Успевайте зарегистрироваться по ссылке! До встречи сегодня в 18:00 мск!
Бывало, что вы увидели фреймворк, конфиг, сервис в какой-нибудь статье или на конференции и не знаете:
Сегодня в формате мастер-класса расскажем, как увязать вместе хорошие практики в один репозиторий, а также обсудим возможные вопросы, диллемы и сложности, которые могут возникнуть по пути.
Будет полезно как новичкам, так и более опытным.
Успевайте зарегистрироваться по ссылке! До встречи сегодня в 18:00 мск!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11❤8🤯5
Многорукие бандиты
В жизни мы часто сталкиваемся с выбором: например, какое вино купить или в какой ресторан сходить. Хочется попробовать новое, но в то же время не разочароваться.
В этой статье мы разберемся, как находить баланс между исследованием (новыми альтернативами) и эксплуатацией (проверенными вариантами).
А также узнаем:
- что такое action-value function (Q-function)
- почему жадный алгоритм не самое лучшее решение задачи многоруких бандитов
- какие есть методы для баланса исследования и эксплуатации
Читайте новую статью по ссылке: https://deepschool-pro.notion.site/8102543939e84867a64064edff7527c2?pvs=4
В жизни мы часто сталкиваемся с выбором: например, какое вино купить или в какой ресторан сходить. Хочется попробовать новое, но в то же время не разочароваться.
В этой статье мы разберемся, как находить баланс между исследованием (новыми альтернативами) и эксплуатацией (проверенными вариантами).
А также узнаем:
- что такое action-value function (Q-function)
- почему жадный алгоритм не самое лучшее решение задачи многоруких бандитов
- какие есть методы для баланса исследования и эксплуатации
Читайте новую статью по ссылке: https://deepschool-pro.notion.site/8102543939e84867a64064edff7527c2?pvs=4
🔥32👍12❤5🤩4❤🔥2
Эффективные ансамбли
Ансамбли помогают:
- повысить устойчивость к искажению входных данных
- определить принадлежность объекта к тренировочному распределению
- улучшить взаимосвязь между уверенностью модели и реальным качеством предсказания
⚠️ Но у ансамблей есть и недостаток — увеличивается время предсказания.
Чтобы снизить этот фактор и ускорить ансамбли, придумали несколько методов, с которыми мы и познакомим вас в новой статье.
А также рассмотрим базовые подходы к построению ансамблей и метрики для оценки их эффективности.
Читайте новую статью по ссылке: https://deepschool-pro.notion.site/e0b2a0bad14e414782b9ab3dff0cd2b5?pvs=4
Ансамбли помогают:
- повысить устойчивость к искажению входных данных
- определить принадлежность объекта к тренировочному распределению
- улучшить взаимосвязь между уверенностью модели и реальным качеством предсказания
Чтобы снизить этот фактор и ускорить ансамбли, придумали несколько методов, с которыми мы и познакомим вас в новой статье.
А также рассмотрим базовые подходы к построению ансамблей и метрики для оценки их эффективности.
Читайте новую статью по ссылке: https://deepschool-pro.notion.site/e0b2a0bad14e414782b9ab3dff0cd2b5?pvs=4
Please open Telegram to view this post
VIEW IN TELEGRAM
deepschool-pro on Notion
Эффективные ансамбли | Notion
Автор: Дмитрий Раков
Редактура: Илья Бакалец
Редактура: Илья Бакалец
🔥29👍15❤11❤🔥1
Расширяем команду авторов DeepSchool
Мы расширяем команду и ищем ребят, кто хочет вместе с нами систематизировать свои знания, разбирать статьи и делиться наработками с аудиторией!
Ранее мы писали про то, как готовим статьи и успели познакомить вас с частью команды.
Если вам интересно присоединиться к нам, заполните эту анкету: https://forms.gle/g8BSe3YNDpFALmV39
Подробнее про условия рассказали в самой форме👆🏻
Мы расширяем команду и ищем ребят, кто хочет вместе с нами систематизировать свои знания, разбирать статьи и делиться наработками с аудиторией!
Ранее мы писали про то, как готовим статьи и успели познакомить вас с частью команды.
Если вам интересно присоединиться к нам, заполните эту анкету: https://forms.gle/g8BSe3YNDpFALmV39
Подробнее про условия рассказали в самой форме👆🏻
🥰18🔥11👍6❤3👏3
Хорошего Нового года! 🎄
Всей командой авторов DeepSchool желаем вам получать больше удовольствия от работы и учебы в следующем году!
Пусть те, кто хочет перейти в ML, удачно в него перейдут. Кто хочет найти работу, устроится в хорошую команду. Кто хочет новых задач и высот на текущем месте, обязательно их достигнет!
Спасибо, что читаете нас! Ваши реакции, комментарии и советы — лучшие подарки, которые вы дарили нам весь этот год.
Не стали публиковать новые посты, чтобы не отвлекать в эти суетливые дни. Вы много изучили в уходящем году, вы молодцы! Отдыхайте, наслаждайтесь праздниками!🥳
До встречи в новом году!🎄
Всей командой авторов DeepSchool желаем вам получать больше удовольствия от работы и учебы в следующем году!
Пусть те, кто хочет перейти в ML, удачно в него перейдут. Кто хочет найти работу, устроится в хорошую команду. Кто хочет новых задач и высот на текущем месте, обязательно их достигнет!
Спасибо, что читаете нас! Ваши реакции, комментарии и советы — лучшие подарки, которые вы дарили нам весь этот год.
Не стали публиковать новые посты, чтобы не отвлекать в эти суетливые дни. Вы много изучили в уходящем году, вы молодцы! Отдыхайте, наслаждайтесь праздниками!
До встречи в новом году!🎄
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤92🍾32😍10👍7⚡1🎉1👻1
История YOLO. Часть 4
Начнем 2024 год с 4 версии YOLO. Символичное напоминание в начале года от исходной аббревиатуры: You Only Live Once!💫
Надеемся, вы уже успели отдохнуть и готовы читать технические статьи, потому что сегодня расскажем про важную архитектуру.
В предыдущих сериях мы рассмотрели три версии YOLO: YOLOv1, YOLOv2 и YOLOv3. А сегодня познакомимся с YOLOv4 — архитектурой, которая сильно отличается от остальных.
Во-первых, ее создали новые авторы.
Во-вторых, они добавили много изменений.
Как им удалось сохранить скорость инференса и выдвинуть семейство YOLO на первое место в COCO среди real-time моделей? Давайте разбираться вместе 🙂
Из статьи вы узнаете:
- какие трюки позволили улучшить качество модели
- как при этом авторы сохранили легкость и скорость архитектуры
- какую проблему в предсказании ббоксов нашли у двух предыдущих версий YOLO и как ее решили
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/YOLO-history-Part-4-d8b6053c3f314768a5474dac9f11e708?pvs=4
Начнем 2024 год с 4 версии YOLO. Символичное напоминание в начале года от исходной аббревиатуры: You Only Live Once!
Надеемся, вы уже успели отдохнуть и готовы читать технические статьи, потому что сегодня расскажем про важную архитектуру.
В предыдущих сериях мы рассмотрели три версии YOLO: YOLOv1, YOLOv2 и YOLOv3. А сегодня познакомимся с YOLOv4 — архитектурой, которая сильно отличается от остальных.
Во-первых, ее создали новые авторы.
Во-вторых, они добавили много изменений.
Как им удалось сохранить скорость инференса и выдвинуть семейство YOLO на первое место в COCO среди real-time моделей? Давайте разбираться вместе 🙂
Из статьи вы узнаете:
- какие трюки позволили улучшить качество модели
- как при этом авторы сохранили легкость и скорость архитектуры
- какую проблему в предсказании ббоксов нашли у двух предыдущих версий YOLO и как ее решили
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/YOLO-history-Part-4-d8b6053c3f314768a5474dac9f11e708?pvs=4
Please open Telegram to view this post
VIEW IN TELEGRAM
deepschool-pro on Notion
YOLO history (Part 4) | Notion
Автор: Антон Броиловский
🔥44👍19❤11
MobileOne
Эффективные модели — модели с балансом между скоростью работы и качеством. Это отдельное большое направление исследований в области CV. Классический пример — модели семейства MobileNet.
В 2022 году Apple предложили свой вариант архитектуры для мобильных и CPU устройств. О нем мы и поговорим, а также вы узнаете:
- почему FLOPs и количество параметров влияют на скорость инференса не так, как принято об этом думать
- на что еще стоит обратить внимание при разработке архитектуры для мобильных и CPU устройств
- как переделать multi-branch в single-branch архитектуру без потери качества для ускорения инференса
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/MobileOne-2126289e1f714b43a5d4c3d97e435ce4?pvs=4
Эффективные модели — модели с балансом между скоростью работы и качеством. Это отдельное большое направление исследований в области CV. Классический пример — модели семейства MobileNet.
В 2022 году Apple предложили свой вариант архитектуры для мобильных и CPU устройств. О нем мы и поговорим, а также вы узнаете:
- почему FLOPs и количество параметров влияют на скорость инференса не так, как принято об этом думать
- на что еще стоит обратить внимание при разработке архитектуры для мобильных и CPU устройств
- как переделать multi-branch в single-branch архитектуру без потери качества для ускорения инференса
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/MobileOne-2126289e1f714b43a5d4c3d97e435ce4?pvs=4
deepschool-pro on Notion
MobileOne | Notion
Автор: Герман Петров
🔥36❤9⚡8👍4
Как быстро освоить ускорение нейросетей
Тренд на создание более точных моделей на ImageNet прошел еще пару лет назад. В последнее время все актуальнее создавать не просто точные модели, а точные и максимально быстрые.
Быстрый инференс дает множество преимуществ:
- экономия на железе
- высокий fps в realtime задачах
- новый опыт для пользователей, когда нейросети помещаются на девайс
- безопасность локального использования
- возможность держать большую нагрузку на сервис
Навык ускорения (облегчения) моделей стал востребованным, и мы хотим помочь вам добавить его в свой арсенал. Поэтому мы готовим обучение, на котором вы сможете разобраться, какие есть методы ускорения, как они устроены и как их комбинировать на практике.
Если вам интересно это направление, заполните короткую форму, чтобы помочь нам адаптировать программу под вас. Это займёт 3-5 минут
https://forms.gle/ZnSX2tjHtRhhJ2fM9
Тренд на создание более точных моделей на ImageNet прошел еще пару лет назад. В последнее время все актуальнее создавать не просто точные модели, а точные и максимально быстрые.
Быстрый инференс дает множество преимуществ:
- экономия на железе
- высокий fps в realtime задачах
- новый опыт для пользователей, когда нейросети помещаются на девайс
- безопасность локального использования
- возможность держать большую нагрузку на сервис
Навык ускорения (облегчения) моделей стал востребованным, и мы хотим помочь вам добавить его в свой арсенал. Поэтому мы готовим обучение, на котором вы сможете разобраться, какие есть методы ускорения, как они устроены и как их комбинировать на практике.
Если вам интересно это направление, заполните короткую форму, чтобы помочь нам адаптировать программу под вас. Это займёт 3-5 минут
https://forms.gle/ZnSX2tjHtRhhJ2fM9
🔥35👏13🤩6❤3👍1🍾1
Основы основ обучения с подкреплением
В последнее время появляется все больше впечатляющих работ: управление плазмой, сумасшедший паркур четырехногого робота и устойчивая двуногая ходьба. Все они основаны на обучении с подкреплением. Ему и посвящена наша новая серия постов.
Вместе мы разберемся с основами этого процесса и уже в первой статье узнаем:
- что такое обучение с подкреплением
- как проходит само обучение
- что такое пространство состояний и действий, траектории и вознаграждения
- два основных подхода к обучению с подкреплением
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/df13838027b240bf903202731ab3b637?pvs=4
В последнее время появляется все больше впечатляющих работ: управление плазмой, сумасшедший паркур четырехногого робота и устойчивая двуногая ходьба. Все они основаны на обучении с подкреплением. Ему и посвящена наша новая серия постов.
Вместе мы разберемся с основами этого процесса и уже в первой статье узнаем:
- что такое обучение с подкреплением
- как проходит само обучение
- что такое пространство состояний и действий, траектории и вознаграждения
- два основных подхода к обучению с подкреплением
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/df13838027b240bf903202731ab3b637?pvs=4
deepschool-pro on Notion
Основы основ обучения с подкреплением | Notion
Автор: Шамиль Мамедов
Редактор: Иван Перминов
Редактор: Иван Перминов
🔥36👍12❤11❤🔥3
Почему в 52% вакансий упоминают ускорение или конвертацию сетей
Раньше, чтобы комфортно чувствовать себя на рынке DS, было достаточно уметь обучать нейросети и знать теорему байеса.
Теперь же и навыком выката моделей в прод никого не удивишь. Но вот уметь делать этот “прод” быстрым — до сих пор редкий и востребованный навык.
И вот 3 причины, почему в вакансиях его упоминают все чаще
1️⃣ Экономия на железе
С каждым 1% ускорения/облегчения модели, вы экономите 1% стоимости вычислительных ресурсов. Логика простая: чем быстрее сеть, тем раньше GPU возьмется за новый батч, а чем меньше весов, тем больше изображений в этот батч поместится.
За счет ускорения модели, даже 1 сервис может начать экономить компании сотни долларов в день. Кстати, зачастую можно ускорить уже имеющуюся модель без потерь в точности. Например, за счет фьюзинга и конвертации или смены бэкенда.
2️⃣ Realtime обработка видео
В задачах AR/VR, нейрорендеринга, автономных роботах, контроле качества на производствах, безопасности на дорогах и других задачах анализа/синтеза видео важно принимать решения за миллисекунды.
Автопилот должен управлять машиной на скорости выше 35 метров в секунду, конвейерная лента за это время уже переместит более 100 объектов, а глаз человека будет видеть плавную картинку в VR очках или в смартфоне только при 120 fps и выше.
Все это накладывает очевидные ограничения на скорость инференса. Ведь помимо анализа изображения, системе еще и необходимо выполнить действие: сменить полосу, отбросить с ленты брак или отрисовать в очках объект — за очень короткий промежуток времени.
3️⃣ Безопасность и скорость локального использования
Если вы не слышали про GDPR, вы счастливый датасайентист. В СНГ пространстве нет столь жесткого контроля за персональными данными, как в западных странах. Но за хранение информации без разрешения или ее утечку, даже наши компании могут получить если не исполинский штраф, то общественное порицание и потерю репутации.
Чтобы не рисковать, не смущать пользователей отправкой фото на сервер, и уменьшить время ожидания, модели помещают на мобильные устройства. А перед этим их необходимо облегчить и конвертировать в нужный формат (CoreML, TFLite, NNApi, etc), стараясь не потерять точность.
А так как DL сервисов становится больше, сети встречаются на устройствах чаще, а про безопасность пользователей в последние годы все больше споров — навыки ускорения моделей становятся более востребованными.
Ставьте реакции🔥 , если вам интересна эта тема и мы познакомим вас ближе с методами ускорения сетей!
#заметки_deepschool
Раньше, чтобы комфортно чувствовать себя на рынке DS, было достаточно уметь обучать нейросети и знать теорему байеса.
Теперь же и навыком выката моделей в прод никого не удивишь. Но вот уметь делать этот “прод” быстрым — до сих пор редкий и востребованный навык.
И вот 3 причины, почему в вакансиях его упоминают все чаще
С каждым 1% ускорения/облегчения модели, вы экономите 1% стоимости вычислительных ресурсов. Логика простая: чем быстрее сеть, тем раньше GPU возьмется за новый батч, а чем меньше весов, тем больше изображений в этот батч поместится.
За счет ускорения модели, даже 1 сервис может начать экономить компании сотни долларов в день. Кстати, зачастую можно ускорить уже имеющуюся модель без потерь в точности. Например, за счет фьюзинга и конвертации или смены бэкенда.
В задачах AR/VR, нейрорендеринга, автономных роботах, контроле качества на производствах, безопасности на дорогах и других задачах анализа/синтеза видео важно принимать решения за миллисекунды.
Автопилот должен управлять машиной на скорости выше 35 метров в секунду, конвейерная лента за это время уже переместит более 100 объектов, а глаз человека будет видеть плавную картинку в VR очках или в смартфоне только при 120 fps и выше.
Все это накладывает очевидные ограничения на скорость инференса. Ведь помимо анализа изображения, системе еще и необходимо выполнить действие: сменить полосу, отбросить с ленты брак или отрисовать в очках объект — за очень короткий промежуток времени.
Если вы не слышали про GDPR, вы счастливый датасайентист. В СНГ пространстве нет столь жесткого контроля за персональными данными, как в западных странах. Но за хранение информации без разрешения или ее утечку, даже наши компании могут получить если не исполинский штраф, то общественное порицание и потерю репутации.
Чтобы не рисковать, не смущать пользователей отправкой фото на сервер, и уменьшить время ожидания, модели помещают на мобильные устройства. А перед этим их необходимо облегчить и конвертировать в нужный формат (CoreML, TFLite, NNApi, etc), стараясь не потерять точность.
А так как DL сервисов становится больше, сети встречаются на устройствах чаще, а про безопасность пользователей в последние годы все больше споров — навыки ускорения моделей становятся более востребованными.
Ставьте реакции
#заметки_deepschool
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥189👍15❤10
Методы ускорения сетей
Мы написали статью, в которой собрали основные подходы к ускорению моделей⚡️
В ней познакомим вас с NAS, прунингом, дистилляцией и квантизацией.
В статье рассказали:
- в чем заключается каждый подход
- зачем их использовать
- советы по их применению
- частный случай каждого подхода
Мы привели примеры в основном для CV, но статья будет полезна для всех инженеров, так как подходы к ускорению могут быть использованы и в других направлениях.
Материал поможет вам разобраться, какие существуют методы ускорения и как они связаны между собой.
Читайте по ссылке
И подписывайтесь на DeepSchool
Мы написали статью, в которой собрали основные подходы к ускорению моделей⚡️
В ней познакомим вас с NAS, прунингом, дистилляцией и квантизацией.
В статье рассказали:
- в чем заключается каждый подход
- зачем их использовать
- советы по их применению
- частный случай каждого подхода
Мы привели примеры в основном для CV, но статья будет полезна для всех инженеров, так как подходы к ускорению могут быть использованы и в других направлениях.
Материал поможет вам разобраться, какие существуют методы ускорения и как они связаны между собой.
Читайте по ссылке
И подписывайтесь на DeepSchool
deepschool-pro on Notion
Введение в методы ускорения свёрточных нейронных сетей | Notion
Всё чаще DL-инженерам приходится ускорять нейросети, чтобы уместить их на процессоре смартфона, микрокомпьютере или просто снизить нагрузку на сервер.
🔥58👍22❤13
Особенности 3D медицинских данных
В медицине используется несколько форматов данных. Самые распространенные из них — рентген, компьютерная и магнитно-резонансная томография (КТ и МРТ). Рентген представляет собой привычное двумерное изображение с единственным каналом и отличным от 0-255 диапазоном значений. А КТ и МРТ мы получаем в трехмерном виде.
В короткой статье мы познакомимся с последними поближе и узнаем:
- как выглядят 3D медицинские данные
- чем они отличаются от 2D данных
- как измерять расстояния по трехмерному изображению в реальных миллиметрах
Читайте статью по ссылке: https://www.notion.so/deepschool-pro/3D-a8d09fc0675d4235896750fd4c55beec?pvs=4
В медицине используется несколько форматов данных. Самые распространенные из них — рентген, компьютерная и магнитно-резонансная томография (КТ и МРТ). Рентген представляет собой привычное двумерное изображение с единственным каналом и отличным от 0-255 диапазоном значений. А КТ и МРТ мы получаем в трехмерном виде.
В короткой статье мы познакомимся с последними поближе и узнаем:
- как выглядят 3D медицинские данные
- чем они отличаются от 2D данных
- как измерять расстояния по трехмерному изображению в реальных миллиметрах
Читайте статью по ссылке: https://www.notion.so/deepschool-pro/3D-a8d09fc0675d4235896750fd4c55beec?pvs=4
deepschool-pro on Notion
Особенности 3D медицинских данных | Notion
Автор: Александр Лекомцев
Редактор: Иван Перминов
Редактор: Иван Перминов
👍43❤20🔥13
DINO/DINOv2
Благодаря успеху трансформеров в NLP появляется всё больше foundation models на базе этой архитектуры и в других доменах, например, в CV. Если трансформеры так хорошо предобучаются на неразмеченных корпусах текстов — почему бы не сделать это с картинками?
Об этом и поговорим в нашей статье, а ещё расскажем:
- почему предобучение vision-трансформеров лучше делать без разметки
- чем хороши признаки vision-трансформеров, обученных с помощью DINO
- в каких задачах можно применять предобученные таким способом модели
Читайте новую статью по ссылке: https://deepschool-pro.notion.site/DINO-Self-distilation-with-no-labels-18e894250fae4e5d87e99a3312c1effd?pvs=4
Благодаря успеху трансформеров в NLP появляется всё больше foundation models на базе этой архитектуры и в других доменах, например, в CV. Если трансформеры так хорошо предобучаются на неразмеченных корпусах текстов — почему бы не сделать это с картинками?
Об этом и поговорим в нашей статье, а ещё расскажем:
- почему предобучение vision-трансформеров лучше делать без разметки
- чем хороши признаки vision-трансформеров, обученных с помощью DINO
- в каких задачах можно применять предобученные таким способом модели
Читайте новую статью по ссылке: https://deepschool-pro.notion.site/DINO-Self-distilation-with-no-labels-18e894250fae4e5d87e99a3312c1effd?pvs=4
deepschool-pro on Notion
DINO: Self-distilation with no labels | Notion
Автор: Булат Бадамшин
Редактор: Марк Страхов
Редактор: Марк Страхов
👍39🔥24❤13