DeepSchool
10.3K subscribers
77 photos
1 video
1 file
432 links
Это канал школы deepschool.ru. Здесь мы будем:
- напоминать вам теорию ML/DL в виде коротких постов,
- задавать вопросы с собеседований,
- рассказывать про полезные фреймворки
- и делиться советами, которые помогут вам в работе.

@deepschool_support
Download Telegram
Как научиться решать end-to-end задачи в CV

Недавно мы провели лекцию об инструментах для ML-инженеров.
Спасибо, что пришли, задавали вопросы и делились впечатлениями!

На встрече мы представили программу курса CV Rocket.
И рады приветствовать всех, кто уже присоединился к 7-му потоку!🎓

Если вы хотите закрыть пробелы в знаниях Computer Vision и освоить весь путь создания DL-проектов: от сбора данных до деплоя веб-сервисов — приходите учиться на программу CV Rocket от нашей команды.

После обучения вы повысите свою ценность на рынке, улучшите процессы в команде и научитесь решать полный цикл CV-задач:
🔹собирать чистые данные
🔹быстрее обучать модели
🔹ускорять нейросети
🔹создавать веб-сервисы
🔹автоматизировать их деплой
🔹настраивать мониторинг приложений
🔹решать задачи распознавания лиц, текстов, генерации и многое другое

Что особенного в нашей программе:
🔸12 спикеров из разных отраслей и компаний
🔸много фидбека и общения со спикерами: на zoom-лекциях, в рамках code review, на семинарах и в чате
🔸сложные задачи: 2 больших end-to-end проекта, которые с гордостью можно добавить в резюме

До 28 марта у вас есть возможность присоединиться к обучению со скидкой 10.000 ₽ по промокоду 10CVR!
Или можете внести предоплату и зафиксировать за собой скидку и место на курсе до 1 апреля.

Подробнее о программе и спикерах читайте на сайте.

Присоединяйтесь к CV Rocket!🚀
И до встречи на лекциях!
Please open Telegram to view this post
VIEW IN TELEGRAM
10🔥8👍5
Grounding Dino

Мультимодальность сегодня — одна из самых популярных вещей в глубоком обучении. В новой статье мы рассмотрим, как на основе Grounding Dino можно добавить язык к задаче детекции объектов на изображениях. А ещё узнаем, что включение дополнительной модальности позволяет не только создавать запросы вида “самая правая кошечка”, но и находить объекты классов, которых нет в обучающей выборке.

Из этой статьи вы также узнаете:
- зачем нужна “дружба” между языком и картинками и какие у неё бонусы
- какая архитектура Grounding Dino
- как соединить модальности
- каким образом можно запустить и потрогать Grounding Dino
- как запустить и потрогать модель сегментации на основе Grounding Dino
- и как с помощью сегментации и диффузии заменить объект на картинке

Читайте нашу статью по ссылке: https://www.notion.so/deepschool-pro/Grounding-DINO-054a72d301d840ec99611cd76acba169?pvs=4
👍22🔥1612❤‍🔥1😁1
Дайджест статей за март

Встречайте первый дайджест статей на канале!
Мы собрали вместе все статьи за последний месяц и получилось очень разнообразно — от обучения сетей до 3D, от разбора трансформера для детекции до составления ансамбля моделей. Надеемся, что вы не упустите то, что вам интересно 🤗

Negative learning
Рассказываем, как обучиться с хорошими результатами на неидеальных датасетах с ошибками и противоречивыми данными:
- в чём ключевая идея подхода
- его плюсы и минусы
- и как добиться очень хороших результатов на шумных данных

3D Gaussian Splatting
Разбираемся, как обеспечить высокое качество сгенерированных 3D сцен вместе с быстротой обучения и отрисовки:
- как Gaussian Splatting использует гауссианы для представления трёхмерного пространства
- как позволяет эффективно отрисовать новые изображения для сцены
- как обучается создавать детализированное представление сцены

ModelSoups: варим суп из моделей
Изучаем, как усреднение весов моделей может улучшить точность итогового ансамбля:
- Model Soups подход к усреднению весов модели и его результаты
- теория подхода, а также границы применимости и сопутствующие требования
- применение подхода в СV и NLP направлениях

Как применяют CV в сейсморазведке
Познакомимся с применением DL в прикладной науке — сейсморазведке:
- что такое сейсморазведка
- как в ней применить подходы на основе глубоких нейронных сетей
- примеры открытых сейсмических данных
- как можно решить задачу их интерпретации с помощью CV
- и какие есть известные соревнования по МО на базе сейсмических датасетов

DETR
Препарируем пионера CV детекции на базе архитектуры трансформер:
- как решать задачу детекции напрямую — без дополнительных методов по типу NMS (non-maximum suppression) или генерации анкоров
- детальный разбор архитектуры DETR
- результаты её применения в downstream задачах

Grounding Dino
Выясняем, как мультимодальность улучшает детекцию объектов с помощью Grounding Dino:
- зачем нужна “дружба” между языком и картинками и какие у неё бонусы
- какая архитектура у Grounding Dino
- как соединить модальности
- каким образом можно запустить и потрогать Grounding Dino

✌️Что вам было интересно в этом месяце? О чём вы бы хотели прочитать на канале? Пишите в комментарии!
28🔥23👍13🐳1
Diffusion Models

Сегодня поговорим о моделях диффузии и их превосходстве над Generative Adversarial Networks (GANs) при создании высококачественных синтетических изображений. Познакомимся со статьёй “Diffusion Models Beat GANs on Image Synthesis”, авторы которой доказали: диффузионные модели помогают обеспечить наилучшее качество генерации изображений.

В статье также рассмотрим:
- процесс диффузии (forward и reverse)
- Denoising Diffusion Probabilistic Models (DDPM)
- большое количество ablation study
- обучение
- математику в первом приближении
- и ещё много чего :)

Читайте нашу новую статью по ссылке: https://www.notion.so/deepschool-pro/Diffusion-Models-Beat-GANs-on-Image-Synthesis-b178e701e6d44cac9df11a501067d666?pvs=4
🔥37👍96👏2
Полезные Linux-команды

Linux — неотъемлемая часть инструментария каждого Data Scientist'а.

В этой статье мы рассмотрим полезные команды, которые позволят:
- создавать виртуальные сессии
- профилировать ресурсы
- добавлять переменные окружения

А в конце вы найдёте шпаргалку с основными Linux-командами 😊

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/Linux-715cb84e836f402a911f28fa3c4e753a?pvs=4
🔥2710👍7
Запускаем наш новый подкаст «Под капотом»!

В нём мы говорим с экспертами из различных областей, чтобы понять, как работают сложные системы изнутри.

Первый выпуск: 3D, SLAM и лидары 🚗
Нашим гостем стал Игорь Ильин, Senior SLAM разработчик и спикер курса 3D CV от DeepSchool.

Вместе мы обсудили:
- что такое SLAM и как он связан с теорией управления
- принципы работы лидаров
- отличия компьютерного зрения в 3D от 2D
- сложно ли найти работу в 3D CV

Выпуск получился насыщенным, поэтому мы разделили его на две части. Скоро запостим следующую, там больше поговорили о жизни, карьере и будущем человечества 🙂

Смотрите подкаст на youtube!

Делитесь в комментариях, о чём бы вы хотели услышать в следующем выпуске!
Please open Telegram to view this post
VIEW IN TELEGRAM
19🔥16👍6
Прекрасное далёко. Где мы на пути к Метавёрсу

Сегодня построение Метавёрса — приоритетное направление для многих крупных компаний, таких как Epic Games. В статье мы рассмотрим, на каком этапе развития он находится, и какие задачи стоят перед разработчиками. А ещё представим обзор 3DCV алгоритмов и инструментов. Сейчас они уже широко применяются как для строительства Метавёрса, так и для решения более прикладных задач.

Из статьи вы узнаете:
- какие недостатки и преимущества NeRF
- почему учёные создали 3D Gaussian Splatting и зачем объединили его с NeRF
- какие бывают аватары людей и чем они отличаются
- какие инструменты позволяют использовать NeRF и 3D Gaussian Splatting в ваших проектах
- и какие актуальные задачи стоят перед 3DCV исследователями

Читайте статью по ссылке: https://deepschool-pro.notion.site/c181878b1532401a801fb995ab44d4f5
🔥18😍98👍1😁1
Новая программа курса 3DCV

Недавно закончился 2 поток курса по 3DCV, на этой неделе проведём выпускной🍬

Мы уже обновили программу и добавили новые лекции по Gaussian Splatting, а сейчас готовим новый поток. Скоро будем подробнее знакомить вас с направлением 3D, формируем подборку статей, не пропустите🔥

С последнего набора накопилось много желающих попасть на обучение, некоторые уже успели записаться в лист ожидания и даже присоединиться к новому потоку. Мы решили провести встречу, чтобы познакомить вас с обновлённой программой 3DCV и тем, какие направления есть в области 3DCV.

В среду 17 апреля проведём zoom-презентацию курса. На ней расскажем о курсе, представим обновленную программу и подарим самые большие скидки тем, кто готов присоединиться раньше всех. Если вам интересна тема 3DCV и вы хотите начать развиваться в этом направлении компьютерного зрения, регистрируйтесь и приходите на встречу!

Запишитесь в анкету по ссылке, чтобы попасть на презентацию, и мы отправим вам приглашение.
До встречи!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥188👍6
Диффузия на трансформерах

До недавнего времени самые популярные диффузионные модели имели архитектуру UNet (например, всеми любимый Stable Diffusion). В феврале 2024 года OpenAI написали про свою видео-диффузию SORA, а затем и Stability анонсировали StableDiffusion3, где основной архитектурой уже выступил трансформер. Оказывается, это совсем не первый случай работы диффузионной модели на трансформере.

В нашем обзоре мы:
- вспомним, что такое Vision Transformer
- разберём несколько статей, где применили эту архитектуру для диффузионной генерации
- рассмотрим результаты улучшения качества генерации с помощью такого подхода

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/187d749559ae4717a13f0cc8c708ced2?pvs=4
🔥43👍1312❤‍🔥5
Подборка статей 3DCV от DeepSchool

Собрали коллекцию постов по теме 3D Computer Vision, опубликованных в нашем канале. Теперь в них проще ориентироваться и перечитывать интересующие 🔥

Основы
🔹 Знакомство с 3D CV: обзор основных задач и способов их решения.
🔹 Геометрия формирования изображения: обсуждение модели камеры и матриц, нужных для превращения 3D-объекта в изображение.
🔹 Калибровка камеры: анализ краеугольного камня всего CV, который играет важную роль в 3D-задачах.

Научные статьи
🔹 SIGGRAPH: обзор интересных статей по случаю самой известной конференции по 3D.
🔹 NeRV: Neural Reflectance and Visibility Fields for Relighting and View Synthesis: обсуждение возможности изменять освещение сцены в NeRF-представлениях.
🔹 3D Gaussian Splatting: Revolutionizing Real-Time Radiance Filed Rendering: разбор недавно нашумевшего Gaussian Splatting’а.

LiDAR
🔹 Виды представления лидарных данных. Часть 1: анализ работы лидара и видов данных, в которых мы можем их представлять.
🔹 Виды представления лидарных данных. Часть 2: разбор трансформации данных в многоканальные изображения и Bag-of-Points представление.
🔹 Виды представления лидарных данных. Часть 3: обзор представления в виде вокселей.

Решаемые задачи
🔹 Сегментация поверхности земли: туториал по тому, как определять плоскость земли с помощью лидарных данных (чтобы уверенно стоять на ногах в области 3D 😉).
🔹 Как применяют CV в сейсморазведке: изучение 3D не только вдаль, но и вглубь.
🔹 Особенности 3D медецинских данных: обзор задачи анализа 3D-данных в медицине.
🔹 Прекрасное далёко. Где мы на пути к Метавёрсу: обсуждение вызовов, которые стоят перед инженерами 3D CV при строительстве Метавёрса.
26👍11🔥9🤔1
Почему логотип канала розовый или история одного пивота

Привет! Меня зовут Тимур, я один из основателей DeepSchool. Сегодня для нас знаменательное событие — мы сменим лого тг-канала🤩 Но перед этим расскажу, как вообще оно появилось :)

Учась в университете, я преподавал ML и DL в Технопарке Академгородка и в лицее рядом с универом. Уже тогда 8-классники учили RL, чтобы сажать квадрокоптеры на ML-олимпиадах 😵 а скоро они выпускаются из универов, и я даже не представляю, что они умеют теперь💪

Спустя год ребята начали участвовать в олимпиадах, а спустя два — побеждать. И после нескольких призовых мест всё больше школ интересовались курсами по DL и меня пригласили преподавать сразу в 10+ школ

Вести очные занятия, разумеется, стало невозможно, да и повторять материал 10 раз — сомнительное удовольствие. Поэтому я перенёс программу в ютуб, а курс назвал DeepSchool и поставил милый розовый логотип

Затем, летом 2021 года, пока школьники отдыхали, появилось свободное время после работы и пришла идея создать курсы повышения квалификации уже не для школьников/студентов, а для практиков. Мне самому не хватало программы, на которой опытные ребята из сферы разложили бы все по полочкам в каждой задаче от краудсорсинга до деплоя сервисов. Хоть я уже 2 года как я перешел из «ресёрча» в «индустрию», у меня все равно оставалось миллион вопросов. Да и всегда появлялись новые)

В первой итерации мы провели интервью, собрали программу и запустили курс с 6 спикерами. Теперь спикеров 12, а недавно мы запустили 7-й поток! А история со школами завершилась требованиями очных занятий, которые я физически не мог вести, и в последствии появлением новых студентов-преподавателей, которые пришли на смену мне.

А логотип у канала, который подразумевался для школьников, так и остался…) Пора бы уже и сменить!🫡

Кстати, недавно мы сменили и дизайн нашего сайта. Забегайте посмотреть, поделитесь в комментариях, какой нравится больше, новый или старый)
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3415🥰7🍾5👏3❤‍🔥2🤔1
Адаптация SAM под 3D медицинские данные

В компьютерном зрении уже давно активно используются трансформеры, такие как Segment Anything Model. Однако при работе с 3D медицинскими данными применение обученного на 2D изображениях SAM не всегда эффективно.

В статье вы узнаете:
- Как с помощью low-rank адаптации настроить SAM для работы с медицинскими снимками
- Как заставить SAM учитывать связи между срезами 3D изображений
- Где найти таймлайн статей по SAM в медицине

Читайте статью по ссылке: https://www.notion.so/deepschool-pro/SAM-3D-f21f005dcd734b35a8ac80303c82a483?pvs=4
🔥32👍148🤯4🤔1
Запускаем подкаст «Кухонная Академия»!
В нём обсуждаем технологии, статьи и быт людей, получающих PhD, в живом формате, прямо "на кухне". ☕️

Ведущие подкаста, спикеры нашего курса по 3D CV:
— Давид Свитов, PhD @ IIT, ex Samsung AI Center
— Оля Гребенькова, CS PhD student @ LMU Munich
— Артур Григорьев, PhD student — AIT lab @ ETH Zurich
— Дима Чудаков, CV инженер @ 2GIS

В первом выпуске ребята обсудили:
— общение с научными руководителями
— авторство в статьях
— что выйдет после SORA
— и когда ждать нейросети в играх

Смотрите выпуск по ссылке: https://youtu.be/eVaY8IAQBEA

Расскажите, как вам такой разговорный формат? Будем рады обратной связи по пилотному выпуску 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥28❤‍🔥10👏7👍1🤔1
Лекция "Погружение в 3D CV"

Если вы тоже стали чаще замечать термины, задачи и инструменты из мира 3D, вам интересно узнать, что они значат и что происходит в индустрии, приходите на открытую лекцию "Погружение в 3D CV".

На лекции вы узнаете:
- какие задачи решают в 3D
- почему таких задач становится больше
- с чего начать погружение в эту область
- почему CV-инженеру важно знакомиться с 3D
- что такое SLAM, SfM, SMPL, NeRF, 3D Gaussian Splatting и другие баззворды🐝

А также мы представим программу курса "3D Computer Vision" и подарим скидки участникам🎁

📌 Лекция пройдет в четверг, 25 апреля, 18:00 МСК

💡 Всем, кто зарегистрируется на встречу, мы отправим miro-схему с описанием направлений и инструментов в 3D — поможет быстро сориентироваться и погрузиться.

Регистрируйтесь по ссылке!
21🔥14👍8
Под Капотом. Игорь Ильин. Про будущее, карьеру и нетворкинг. Часть 2/2

Встречайте вторую часть подкаста с Игорем Ильиным! Игорь — Senior SLAM разработчика в Kudan io и спикер курса 3D CV от DeepSchool. В первой части мы говорили про технологии: 3D, лидары, SLAM. А сейчас больше углубились в карьеру, нетворкинг и немного пофантазировали о том, когда появятся разные технологии. А именно:

— Попробовали предсказать, когда появятся андроиды
— Обсудили, как совмещать работу, учёбу, преподавание и личную жизнь (да-да и всё сразу)
— Что могут спросить на собеседовании по SLAM
— Хватает ли онлайна для нетворкинга

Смотрите выпуск по ссылке: https://youtu.be/7G3SffDyK4Q
👍1813🔥8🤔1
DeepSchool
Лекция "Погружение в 3D CV" Если вы тоже стали чаще замечать термины, задачи и инструменты из мира 3D, вам интересно узнать, что они значат и что происходит в индустрии, приходите на открытую лекцию "Погружение в 3D CV". На лекции вы узнаете: - какие задачи…
🔥Начинаем через 2 часа

Вы ещё успеваете зарегистрироваться!

На лекции разберём:
1️⃣ какие задачи решают в 3D
2️⃣ почему таких задач становится больше
3️⃣ с чего начать погружение в эту область
4️⃣ почему CV-инженеру важно знакомиться с 3D
5️⃣ что такое SLAM, SfM, SMPL, NeRF, 3D Gaussian Splatting

И представим программу курса 3D CV.

Присоединяйтесь к лекции!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍98🔥6
Как научиться решать 3D CV задачи

Вчера прошла открытая лекция «Погружение в 3D CV», на которой мы рассказали о терминах, инструментах и задачах 3D CV, обсудили, почему эта область становится популярнее и почему CV-инженеру важно с ней знакомиться.

Также представили обновлённый курс 3D Computer Vision!

3D CV — это программа, на которой вы научитесь решать 3D задачи: сегментировать лидарные облака, писать SLAM алгоритмы, строить 3D-модели объектов, создавать аватаров, синтезировать данные в Blender, обучать NeRF, 3D Gaussian Splatting и другое.

Кратко о курсе:
🔹все лекции проходят онлайн (записи выкладываем в тот же вечер)
🔹8 спикеров из индустрии и ресерча
🔹13 лекций, 12 заданий
🔹4 месяца поддержки в чате и на онлайн-семинарах

Если вы не планируете переходить в области AR/VR, self-driving, GameDev, геосервисы, медтех и другие направления с активным применением 3D, то освоите работу с новыми сенсорами, научитесь решать 2D задачи новыми способами и расширите знания в CV.

🎁 До 29 апреля вы можете присоединиться к сильной команде инженеров (и тут мы не только про спикеров, но и про студентов) со скидкой!
Старт потока 30 апреля.

Подробнее о программе, спикерах и скидках на сайте программы — присоединяйтесь к обучению!
До встречи на лекциях!🎓
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1211👍9
💼 Рубрика «Вопрос с собеседования»

Очень короткий: подберите веса для одного или нескольких сверточных слоев так, чтобы из изображения А получить B, C или D.

⚠️Важно: обучать модель нельзя, такое решение мы не засчитаем.
Советуем: отключить баес и не использовать активации между свертками.

🍕Авторам верных ответов отправим пиццу! По одной на каждую картинку.
🍕И бонусом подарим пиццу за самое подробное и интересное рассуждение!

Итого можно выиграть 4 пиццы и не готовить 2 дня🤩

В комментариях напишите код или псевдокод для получения одной из заданных картинок.

Результаты подведем завтра вечером!

# Исходная картинка
img = torch.tensor([
[0, 0, 0, 0, 0, 0],
[0, 1, 1, 1, 1, 0],
[0, 1, 2, 2, 1, 0],
[0, 1, 2, 2, 1, 0],
[0, 1, 1, 1, 1, 0],
[0, 0, 0, 0, 0, 0],
])[None, None,...]
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥41👍18🐳115😁2
Ответ на вопрос с собеседования 💼

❶ Матрица весов для B:
    [1, 0, 0, 0, 1],

вместе с паддингом (0, 2) свертка дает желаемую картинку. Ещё можно использовать свертку 5х5, заполнив все строчки нулями, кроме центральной.

❷ Матрица весов для D:
    [[1, 0, 0, 0, 1],
[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0],
[1, 0, 0, 0, 1]]


❸ Изображение C оказалось самым сложным. Тут мы добавили небольшой секрет 🤫 Его можно получить из D применением следующей свертки:
weight = torch.tensor([
[1, 0, 1],
[0, 0, 0],
[1, 0, 1],
], dtype=torch.float32)[None, None, ...]
result = torch.nn.functional.conv2d(image_d, weight, padding=3, dilation=3)


Изображения B и D легко поддались и вы нашли правильные ответы быстрее, чем за час! Изображение C было тяжелее, но зато получило самое необычное решение.

Итак, победители, к которым отправляются пиццы:
🍕 @Storks89 — первым нашел решение для изображения B
🍕 @science_boy — первым нашел решение для изображения D
🍕 @vdjakov — 2 пиццы за правильное решение для изображения С и за интересный подход с использованием СЛАУ для подбора весов свёрточного слоя!
🔥3812👍8🤯2
Основные термины и инструменты в Generative Computer Vision

Последние 2 года самая обсуждаемая и быстро развивающаяся тема в DL — генеративные модели. В CV это DALL-E, Midjourney, Stable Diffusion и прочие.

Но на волне хайпа многие забывают, что помимо генерации авокадо-кресел, генеративки используют для реконструкции и генерации снимков в медицине, восстановления невидимой части объектов в робототехнике, в онлайн-примерочных в фешн-индустрии, в рекламе, дизайне и других областях.

Мы тоже видим популярность и развитие генеративных моделей и хотим помочь вам разобраться в этом направлении. Поэтому вместе с инженерами и исследователями из области создаём курс Generative Computer Vision, а также готовим серию материалов.

Наша программа позволит вам разобраться в теории генеративных моделей и, разумеется, отточить все навыки на практике. Мы хотим учесть ваши пожелания и поэтому предлагаем поучаствовать в небольшом опросе.

Если вам интересно направление Генеративного Computer Vision, заполните, пожалуйста, короткую форму. Это займёт 3-5 минут.
Вы можете пройти опрос вне зависимости от вашего грейда или направления в DL, нам важно мнение каждого, кому интересна область Gen CV.
Для всех заполнивших мы подготовили zoom-лекцию по основным терминам и инструментам в Gen CV, на которой ответим на ваши вопросы и подарим скидки на обучение!🎓

Переходите по ссылке и заполняйте анкету.
Please open Telegram to view this post
VIEW IN TELEGRAM
26🔥13👍12🐳2🤔1
Введение в генеративный Computer Vision

Зрение — естественный, но крайне сложный процесс для человека. Мы не просто наблюдаем за каким-то объектом, мы смотрим на него сквозь призму наших знаний. Как научить компьютер воспринимать наш мир также? Один из способов — обучить его генеративному компьютерному зрению.

В статье рассказали:
- почему генеративный СV — один из путей к тому, чтобы компьютер понимал окружающий мир так же, как человек
- как генеративный Computer Vision применяется в разных областях
- какие задачи предстоит решить DL-инженерам и как в этом помогут генеративные модели

Читайте статью по ссылке: https://deepschool-pro.notion.site/Computer-Vision-452ba8f085e6477aa17123848e28b1f3
🔥3322👍14🐳2