DeepSchool
10.3K subscribers
77 photos
1 video
1 file
432 links
Это канал школы deepschool.ru. Здесь мы будем:
- напоминать вам теорию ML/DL в виде коротких постов,
- задавать вопросы с собеседований,
- рассказывать про полезные фреймворки
- и делиться советами, которые помогут вам в работе.

@deepschool_support
Download Telegram
Адаптируем Visual-Language модель для детекции аномалий

Детекция аномалий на медицинских изображениях — задача, требующая высокой точности и гибкости за счёт разнообразных форматов данных и типов патологий. Сегодня мы рассмотрим решение, которое использует необычную адаптацию модели CLIP под новый домен и задачу.

А также узнаем:
- что такое «‎аномалия» и какие они бывают
- как обучить универсальный детектор аномалий для работы с различными модальностями и анатомическими областями
- и можно ли обобщить подход на немедицинские изображения

Читайте нашу статью по ссылке: https://deepschool-pro.notion.site/Visual-Language-d3c607cc974942a78f60ed418147a1dd?pvs=4
1🔥268😍6❤‍🔥2
LLMSold Out!

Места на первый поток курса Large Language Models закончились!

Поздравляем всех, кто успел присоединиться! 3 сентября встретимся на лекции «Введение в задачи NLP»🎓

Если вы не успели попасть в этот раз, не переживайте! Запишитесь в лист ожидания, чтобы первыми узнать о старте нового потока и получить самую большую скидку!

Записаться в лист ожидания
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥31👍159🍾3
Сделай сам

Мы подготовили подборку полезных каналов на YouTube, где есть реализации архитектур с нуля, и, конечно, поделились ссылками на их примеры. Она поможет вам:
- детальнее погрузиться в тему архитектуры трансформеров для разных задач, именно этой архитектуре посвящена большая часть видео в нашей подборке
- попробовать применить трансформеры на практике для различных задач
- самостоятельно создать нужную для вас архитектуру с нуля с помощью представленных туториалов

Читайте новый пост по ссылке: https://deepschool-pro.notion.site/b1f197579cf648baa81c34a6005ad379?pvs=4
🔥58👍1412
Последний онлайн-поток курса 3D CV

В начале октября стартует 4 поток курса по 3D CV. Это программа, на которой вы на практике научитесь решать 3D задачи:
— сегментировать лидарные облака
— писать SLAM алгоритмы
— строить 3D-модели объектов
— создавать аватаров
— синтезировать данные в Blender
— обучать NeRF, 3D Gaussian Splatting
и другое

🔥 Это будет последний поток в формате онлайн-лекций в Zoom, где вы можете задавать вопросы спикерам по ходу лекции и общаться в конце в кулуарах.

В конце этой недели мы проведём закрытую презентацию курса для участников листа ожидания — представим программу, ответим на ваши вопросы и подарим скидки.
Запишитесь, чтобы раньше всех узнать о программе, успеть занять место и получить самые выгодные условия!🔥

Записаться в лист ожидания
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥159👍52
Дистилляция диффузии. Часть 1

Диффузионные модели очень круто генерируют изображения, но в «ванильном» исполнении они очень медленные. Поэтому нужны методы их ускорения. Недавно мы разобрали один из них — InstaFlow.
Сегодня мы рассмотрим ещё один вид ускорения — дистилляцию. Это процесс, при котором мы передаём знания от нашей большой модели-учителя к более быстрой модели-ученику.

В этой статье мы узнаем:
- что представляет собой дистилляция диффузионной модели
- каким образом проходит процесс progressive-дистилляции
- и как можно дистиллировать conditional модели

Читайте новую статью по ссылке: https://deepschool-pro.notion.site/1-917a8a82ad2e450980a1ddb630b62956?pvs=4
🔥2612👍10
Сопоставляем изображения с помощью ключевых точек

Поиск ключевых точек и сопоставление изображений — это начальный этап перехода от 2D задач к 3D. Сопоставив между собой множество изображений сцены, мы сможем восстановить трёхмерную структуру объектов в ней. Но для этого важно иметь «хорошие» ключевые точки.

В новой статье мы расскажем:
- что значит «хорошие» ключевые точки
- как работают классические алгоритмы на примере SiFT
- и какие есть нейросетевые подходы разной степени мощности и сложности

Читайте нашу статью по ссылке: https://deepschool-pro.notion.site/96ea7f72daa64c948baeec3b4ccc72f1?pvs=4
🔥379👍5😁1
Учим беспилотную машину видеть

В мире 3D Computer Vision одна из основных задач — это ориентация роботов в пространстве. Это позволяет автоматизировать множество повседневных процессов от беспилотных такси до доставки еды. Для решения этой задачи требуется работа с различными сенсорами, понимание алгоритмов 3D-реконструкции и SLAM.

Всё это мы разберём на бесплатном мастер-классе, где научим беспилотную машину ориентироваться в пространстве. Каждая лекция сопровождается домашним заданием для того, чтобы опробовать новые навыки на практике.

Мастер-класс будет состоять из трёх лекций, они пройдут 17, 18 и 20 сентября (вт, ср и пт).

На лекциях вы:
— научитесь восстанавливать 3D-сцену по данным с камеры и лидара 
— узнаете, как ориентировать робота в пространстве
— освоите симулятор Carla для синтеза данных
— поймёте теорию, стоящую за SLAM-алгоритмами

А также мы представим программу курса 3DCV и подарим скидки!🔥

🔔 Первая лекция пройдёт 17 сентября в 19:00 МСК.

Изучайте подробнее программу мастер-класса и регистрируйтесь по ссылке!
🔥21👍1310
Дистилляция диффузии. Часть 2

Сейчас диффузионные модели — лидеры по качеству и разнообразию генерации. Однако чаще всего они требуют большого количества шагов, что делает генерацию довольно медленной, например, в сравнении с GANs. Именно поэтому ускорение диффузионных моделей является важной задачей. Существует множество различных подходов для превращения 1000-шаговой диффузии в генератор, состоящий из нескольких шагов.

Недавно мы познакомились с понятием дистилляции диффузии и рассмотрели первые попытки её применения для ускорения. Однако эти работы не смогли добиться нужного качества и требовали значительных улучшений.

Сегодня мы рассмотрим несколько SOTA-работ, которые, в частности, использовались для ускорения известной SDXL Turbo. Познакомимся с основными методами и узнаем:
- что представляет собой Adversarial дистилляция с использованием GANs
- чем отличается Latent Adversarial Diffusion Distillation (LADD) от Adversarial Diffusion Distillation (ADD)
- и что такое Distribution Matching Distillation (DMD)

Читайте новую статью по ссылке: https://deepschool-pro.notion.site/2-fa4241bac68749beafffa7ddffda41a0?pvs=4
🔥26👍12103
CV-задачи над 3D-данными

Помимо 2D-изображений с камер всё чаще используются сенсоры, позволяющие получить трёхмерные данные. У таких сенсоров больше степеней свободы и они требуют других подходов к обработке.

В новой статье мы рассмотрим:
- какие бывают сенсоры и источники 3D-данных
- как можно представить эти данные для эффективной обработки сетями
- какие подходы можно применить для решения задач классификации, детекции, сегментации

Читайте нашу статью по ссылке: https://deepschool-pro.notion.site/CV-3D-0cfd8c893bc645dbbb324bf208a27af2?pvs=4
14👍9🔥8🤩2👻2
Tensorboard для Pytorch

Иногда в небольших проектах нам не очень хочется использовать слишком сложные инструменты для логирования метрик и артефактов. Здесь на помощь приходит Tensorboard — несложный инструмент для визуализации и мониторинга машинного обучения.

В новой статье мы познакомимся с ним поближе и узнаем, как можно:
- залогировать разные типы данных: видео, картинки, скаляры, распределения и графы
- создать красивую визуализацию эмбеддингов
- и сделать кастомные графики

Читайте нашу статью по ссылке: https://deepschool-pro.notion.site/Tensorboard-Pytorch-5a3a54c7844048d9b2bc53b39b6f5460?pvs=4
116👍10🔥9
«Релиз на салфетке». Спасаемся от самокатов при помощи CV 🛴

В этом формате мы собираемся командой инженеров, выбираем забавную задачу, брейнштормим, строим велосипеды и космолёты 🚀

Как будто решаем продуктовую задачу, но без сроков, рамок и коммитментов. А от того веселее 😉

В этом выпуске мы спасались от самокатчиков, которые врезаются в прохожих. Начали с советов «да приклей зеркала и ходи-посматривай», а закончили ключевыми точками, трекерами и foundation-моделями.

Смотрите выпуск на YouTube!
Please open Telegram to view this post
VIEW IN TELEGRAM
822🔥97
Лекция-погружение в 3D CV

На прошлой неделе мы проводили мастер-класс, на котором учили беспилотную машину видеть. Если вы его пропустили или хотите подробнее познакомиться с областью 3D CV, то приходите на открытую лекцию в эту субботу, на которой познакомим вас с основными терминами, задачами и инструментами.

На лекции вы узнаете:
- какие задачи решают в 3D
- почему таких задач становится больше
- с чего начать погружение в эту область
- почему CV-инженеру важно знакомиться с 3D
- что такое SLAM, SfM, SMPL, NeRF, 3D Gaussian Splatting и другие баззворды🐝

Также мы расскажем, как присоединиться к последнему онлайн-потоку курса 3D Computer Vision🔥
А всем участникам лекции подарим скидки на обучение!

🗓 28 сентября, суббота, 13:00 МСК.

🎁 После регистрации вы получите miro-схему с описанием направлений и инструментов в 3D.

Регистрируйтесь по ссылке — увидимся в субботу!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍116🔥5🍾2
Blender для генерации данных

Не всегда получается найти достаточно данных, чтобы решить задачу. На помощь приходят синтетические данные, которые можно замешать с реальными, а то и вовсе попытаться обучиться только на них. Даже если у нас есть достаточное количество реальных данных, синтетика может упростить отладку решения на искусственных примерах с изолированной проблемой. Но как получить синтетику для 2D или 3D-данных? Один из вариантов — нарисовать в Blender.

В этой статье мы обсудим:
- как программировать в Blender и работать с библиотекой BPY
- где найти подходящие 3D-модели для генерации синтетики
- как сгенерировать 2D-датасет из 3D-сцены
- каким образом можно получить разметку для двумерной сегментации и детекции из Blender
- и как аугментировать получаемый датасет в Blender

Читайте новую статью по ссылке: https://deepschool-pro.notion.site/Blender-8311ac63114d4d1f82cebda4d5e0733f?pvs=4
👍219🔥7
DeepSchool
Лекция-погружение в 3D CV На прошлой неделе мы проводили мастер-класс, на котором учили беспилотную машину видеть. Если вы его пропустили или хотите подробнее познакомиться с областью 3D CV, то приходите на открытую лекцию в эту субботу, на которой познакомим…
Начинаем через 1,5 часа

Успевайте зарегистрироваться!

На лекции обсудим:
1️⃣какие задачи решают в 3D
2️⃣почему таких задач становится больше
3️⃣с чего начать погружение в эту область
4️⃣почему CV-инженеру важно знакомиться с 3D
5️⃣что такое SLAM, SfM, SMPL, NeRF, 3D Gaussian Splatting и другие баззворды🐝

Расскажем, как присоединиться к последнему онлайн-потоку курса 3D Computer Vision и подарим скидки на обучение!🔥

Регистрируйтесь на лекцию!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍542
Научитесь решать задачи компьютерного зрения в 3D

В субботу прошла открытая лекция «Погружение в 3D CV», на которой мы рассказали о терминах, инструментах и задачах в этой области, обсудили, почему она становится популярнее и почему CV-инженеру важно с ней знакомиться.

А также представили курс 3D Computer Vision!

На курсе вы на практике научитесь:
— сегментировать лидарные облака
— писать SLAM-алгоритмы
— строить 3D-модели объектов
— создавать аватаров
— синтезировать данные в Blender
— обучать NeRF, 3D Gaussian Splatting
и другое

🔥 Это будет последний поток в формате онлайн-лекций в Zoom, где вы можете задавать вопросы спикерам по ходу лекции и общаться в конце в кулуарах.

Лекторы — опытные инженеры и исследователи. Каждый расскажет про задачу, с которой несколько лет работал в коммерческих проектах или лабораториях.

После каждой лекции — домашнее задание, которое проверяют спикеры курса.

🎁 До 4 октября вы можете записаться со скидкой 5%.

🗓 Начинаем 8 октября!

Переходите на сайт, изучайте подробности, выбирайте подходящий тариф и присоединяйтесь к обучению.
До встречи на курсе!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥75👍5😁3
Введение в OCR. Часть 1

Ранее мы писали про CLIP4STR — SOTА-модель в OCR на основе трансформера. А сейчас решили сделать цикл публикаций об OCR, потому что задача обширная и популярная 🙂

OCR состоит из нескольких задач: найти текст ➡️ распознать текст ➡️ извлечь информацию. Последний пункт помогает, например, найти отправителя и получателя платежа или общую сумму в чеке.

Для каждого из этапов есть свои модели. Но с появлением мультимодальных трансформеров можно решать все этапы End-to-End!

В новой статье мы рассмотрим:
- основные этапы решения OCR
- ключевые SOTA-модели для каждого этапа
- развитие подходов в OCR
- и, конечно, современные бенчмарки / модели / фреймворки

Читайте нашу статью по ссылке: https://deepschool-pro.notion.site/OCR-1-25c5e5c9f928486a80cb67020de270af?pvs=4
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥35👍2014
🎞 Гессиан. Видео

Методы второго порядка используют вторые производные функции потерь. Важный элемент этих методов — гессиан. Он и является второй производной по параметрам модели.

Главная проблема гессиана — его долго считать. Учёные придумали различные методы для его аппроксимации, чтобы экономить вычисления. А недавно появились и алгоритмы оптимизации, которые используют эти аппроксимации.

О методах второго порядка мы и записали наше новое видео!

В нём Шамиль Мамедов, исследователь из Amazon Robotics, напоминает теорию численной оптимизации и рассказывает про методы приближения гессиана. А также проходится по Sophia — свежему оптимизатору, который использует методы второго порядка.

Смотрите новое видео на Youtube!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27👍1311
Подкаст «Под капотом». Тимлидство и хакатоны

Мы приглашаем в подкаст экспертов, чтобы понять, как работают сложные системы изнутри. В этом выпуске к нам пришёл Валя Мамедов, LLM-инженер из SberDevices. В первой части мы поговорили про LLM, а во второй обсудили:

- что могут дать хакатоны опытным инженерам
- сложности перехода из бэкенда в машинное обучение
- внедрение практик разработки в мл (когда нужно, а когда нет)
- возвращение из тимлидов в инженеры и сложности карьерного роста

Смотрите выпуск по ссылке!
https://youtu.be/IM76-DPrh1s?si=md9H0sd3TCMG_xHU
15🔥9👍7
🎞 Pytest и внешние ресурсы

Написать тест на простую функцию, которая ни от чего не зависит — одно удовольствие. Говорим, какие входы, какие выходы ... profit.

Но как быть, если вы хотите протестировать функционал, который зависит от внешних сервисов? Ходить в production-базу во время тестов — так себе затея 😉

Для этого нам нужно либо в нужных местах мо́кать/манкипатчить, либо подменять внешние зависимости на что-то, что мы развернули локально для тестов. В этом видео мы начнём с «лёгких и быстрых», но далёких от реального поведения методов тестирования. А закончим «тяжёлыми, но близкими»:

- mock/monkeypatch
- pytest-httpserver
- pytest-docker-compose

Смотрите видео по ссылке: https://youtu.be/zCyQHZNOVCU?si=py7bNxI18ugU74_5
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1911👍91
Всё ещё учите модели в Jupyter-тетрадках? Тогда вы рискуете отстать от индустрии!

Лет 7-8 назад при онбординге в новый проект могла возникнуть такая ситуация: новичка отводили к «хранителю» юпитер-ноутбука. Они вместе смотрели на ячейки и передавали сакральные знания о том, в каком порядке их нужно нажимать. Хороших разработческих практик от ML-специалистов тогда не требовали. Им было бы не помереть от дебага первого tensorflow:)

Но сейчас фреймворки стали очень высокоуровневыми и простыми в использовании, а запустить обучение сети на своих данных может быть задачей нескольких минут-часа. Для многих задач есть стандартные подходы/модели, и обучение — это самая простая часть при построении ML-решения. Помимо этого нужно ещё собирать чистые данные, доводить решение с ML-моделью до клиентов и следить за тем, как она чувствует себя на бою.
ML-специалисты всё больше становятся похожи на разработчиков: они версионируют код (и данные), следят за его поддерживаемостью, пишут тесты, автоматизируют процессы через CI/CD, следят за воспроизводимостью экспериментов и т.д.

От «магии» в ноутбуках мы приходим к инженерным практикам, которые делают решения более надёжными и поддерживаемыми, а релизы — более частыми. Работодателям это нравится, а людей, делающих простой fit-predict, они уже не хотят:)

Чтобы помогать инженерам не отставать от индустрии, мы когда-то и создали нашу школу. В первую очередь мы подтягивали именно инженерные навыки, в курсе CVRocket. А сейчас мы сделали новый курс по разработке DL-сервисов и скоро его анонсируем!

Также на следующей неделе мы проведём открытую лекцию про путь модели после обучения.
Ставьте 🔥, если актуально!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1627👍7🤔6🐳6🎃3😁1🤯1👌1👻1
Что происходит с моделью после обучения

В прошлом посте мы говорили, что DL-инженеру недостаточно учить модели в Jupyter-тетрадках, чтобы соответствовать запросам индустрии. Важно перенимать инженерные практики. Даже в репозитории с моделингом должна быть понятная структура, соблюдён codestyle, присутствовать тесты и различные проверки перед коммитом.

Но это лишь начало, базовая гигиена. А дальше полезно понимать процесс доставки своих моделей до пользователей. Чтобы вас познакомить с этим, мы подготовили открытую лекцию, на которой покажем, как выглядит путь модели после обучения!

На лекции вы узнаете:
- когда стоит использовать Jupyter-ноутбуки, а когда нет
- как подготовить репозиторий моделинга
- варианты конвертации модели
- как обернуть инференс в http-приложение
- как деплоят приложения и автоматизируют этот процесс

А также мы анонсируем новый курс, на котором вы научитесь создавать и деплоить DL-сервисы!
Всем участникам лекции подарим скидки на обучение! 🔥

🙋‍♂️Спикеры лекции:
— Дмитрий Раков — руководитель ML в НИИАС, делает percpetion-алгоритмы для беспилотных поездов
— Тимур Фатыхов — основатель DeepSchool, ex Lead CV Engineer KoronaPay

Дата и время: 31 октября, чт, 19:00 мск

Регистрируйтесь по ссылке!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2011🔥11👏2