DeepSchool
10.3K subscribers
77 photos
1 video
1 file
432 links
Это канал школы deepschool.ru. Здесь мы будем:
- напоминать вам теорию ML/DL в виде коротких постов,
- задавать вопросы с собеседований,
- рассказывать про полезные фреймворки
- и делиться советами, которые помогут вам в работе.

@deepschool_support
Download Telegram
Почему логотип канала розовый или история одного пивота

Привет! Меня зовут Тимур, я один из основателей DeepSchool. Сегодня для нас знаменательное событие — мы сменим лого тг-канала🤩 Но перед этим расскажу, как вообще оно появилось :)

Учась в университете, я преподавал ML и DL в Технопарке Академгородка и в лицее рядом с универом. Уже тогда 8-классники учили RL, чтобы сажать квадрокоптеры на ML-олимпиадах 😵 а скоро они выпускаются из универов, и я даже не представляю, что они умеют теперь💪

Спустя год ребята начали участвовать в олимпиадах, а спустя два — побеждать. И после нескольких призовых мест всё больше школ интересовались курсами по DL и меня пригласили преподавать сразу в 10+ школ

Вести очные занятия, разумеется, стало невозможно, да и повторять материал 10 раз — сомнительное удовольствие. Поэтому я перенёс программу в ютуб, а курс назвал DeepSchool и поставил милый розовый логотип

Затем, летом 2021 года, пока школьники отдыхали, появилось свободное время после работы и пришла идея создать курсы повышения квалификации уже не для школьников/студентов, а для практиков. Мне самому не хватало программы, на которой опытные ребята из сферы разложили бы все по полочкам в каждой задаче от краудсорсинга до деплоя сервисов. Хоть я уже 2 года как я перешел из «ресёрча» в «индустрию», у меня все равно оставалось миллион вопросов. Да и всегда появлялись новые)

В первой итерации мы провели интервью, собрали программу и запустили курс с 6 спикерами. Теперь спикеров 12, а недавно мы запустили 7-й поток! А история со школами завершилась требованиями очных занятий, которые я физически не мог вести, и в последствии появлением новых студентов-преподавателей, которые пришли на смену мне.

А логотип у канала, который подразумевался для школьников, так и остался…) Пора бы уже и сменить!🫡

Кстати, недавно мы сменили и дизайн нашего сайта. Забегайте посмотреть, поделитесь в комментариях, какой нравится больше, новый или старый)
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3415🥰7🍾5👏3❤‍🔥2🤔1
Адаптация SAM под 3D медицинские данные

В компьютерном зрении уже давно активно используются трансформеры, такие как Segment Anything Model. Однако при работе с 3D медицинскими данными применение обученного на 2D изображениях SAM не всегда эффективно.

В статье вы узнаете:
- Как с помощью low-rank адаптации настроить SAM для работы с медицинскими снимками
- Как заставить SAM учитывать связи между срезами 3D изображений
- Где найти таймлайн статей по SAM в медицине

Читайте статью по ссылке: https://www.notion.so/deepschool-pro/SAM-3D-f21f005dcd734b35a8ac80303c82a483?pvs=4
🔥32👍148🤯4🤔1
Запускаем подкаст «Кухонная Академия»!
В нём обсуждаем технологии, статьи и быт людей, получающих PhD, в живом формате, прямо "на кухне". ☕️

Ведущие подкаста, спикеры нашего курса по 3D CV:
— Давид Свитов, PhD @ IIT, ex Samsung AI Center
— Оля Гребенькова, CS PhD student @ LMU Munich
— Артур Григорьев, PhD student — AIT lab @ ETH Zurich
— Дима Чудаков, CV инженер @ 2GIS

В первом выпуске ребята обсудили:
— общение с научными руководителями
— авторство в статьях
— что выйдет после SORA
— и когда ждать нейросети в играх

Смотрите выпуск по ссылке: https://youtu.be/eVaY8IAQBEA

Расскажите, как вам такой разговорный формат? Будем рады обратной связи по пилотному выпуску 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥28❤‍🔥10👏7👍1🤔1
Лекция "Погружение в 3D CV"

Если вы тоже стали чаще замечать термины, задачи и инструменты из мира 3D, вам интересно узнать, что они значат и что происходит в индустрии, приходите на открытую лекцию "Погружение в 3D CV".

На лекции вы узнаете:
- какие задачи решают в 3D
- почему таких задач становится больше
- с чего начать погружение в эту область
- почему CV-инженеру важно знакомиться с 3D
- что такое SLAM, SfM, SMPL, NeRF, 3D Gaussian Splatting и другие баззворды🐝

А также мы представим программу курса "3D Computer Vision" и подарим скидки участникам🎁

📌 Лекция пройдет в четверг, 25 апреля, 18:00 МСК

💡 Всем, кто зарегистрируется на встречу, мы отправим miro-схему с описанием направлений и инструментов в 3D — поможет быстро сориентироваться и погрузиться.

Регистрируйтесь по ссылке!
21🔥14👍8
Под Капотом. Игорь Ильин. Про будущее, карьеру и нетворкинг. Часть 2/2

Встречайте вторую часть подкаста с Игорем Ильиным! Игорь — Senior SLAM разработчика в Kudan io и спикер курса 3D CV от DeepSchool. В первой части мы говорили про технологии: 3D, лидары, SLAM. А сейчас больше углубились в карьеру, нетворкинг и немного пофантазировали о том, когда появятся разные технологии. А именно:

— Попробовали предсказать, когда появятся андроиды
— Обсудили, как совмещать работу, учёбу, преподавание и личную жизнь (да-да и всё сразу)
— Что могут спросить на собеседовании по SLAM
— Хватает ли онлайна для нетворкинга

Смотрите выпуск по ссылке: https://youtu.be/7G3SffDyK4Q
👍1813🔥8🤔1
DeepSchool
Лекция "Погружение в 3D CV" Если вы тоже стали чаще замечать термины, задачи и инструменты из мира 3D, вам интересно узнать, что они значат и что происходит в индустрии, приходите на открытую лекцию "Погружение в 3D CV". На лекции вы узнаете: - какие задачи…
🔥Начинаем через 2 часа

Вы ещё успеваете зарегистрироваться!

На лекции разберём:
1️⃣ какие задачи решают в 3D
2️⃣ почему таких задач становится больше
3️⃣ с чего начать погружение в эту область
4️⃣ почему CV-инженеру важно знакомиться с 3D
5️⃣ что такое SLAM, SfM, SMPL, NeRF, 3D Gaussian Splatting

И представим программу курса 3D CV.

Присоединяйтесь к лекции!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍98🔥6
Как научиться решать 3D CV задачи

Вчера прошла открытая лекция «Погружение в 3D CV», на которой мы рассказали о терминах, инструментах и задачах 3D CV, обсудили, почему эта область становится популярнее и почему CV-инженеру важно с ней знакомиться.

Также представили обновлённый курс 3D Computer Vision!

3D CV — это программа, на которой вы научитесь решать 3D задачи: сегментировать лидарные облака, писать SLAM алгоритмы, строить 3D-модели объектов, создавать аватаров, синтезировать данные в Blender, обучать NeRF, 3D Gaussian Splatting и другое.

Кратко о курсе:
🔹все лекции проходят онлайн (записи выкладываем в тот же вечер)
🔹8 спикеров из индустрии и ресерча
🔹13 лекций, 12 заданий
🔹4 месяца поддержки в чате и на онлайн-семинарах

Если вы не планируете переходить в области AR/VR, self-driving, GameDev, геосервисы, медтех и другие направления с активным применением 3D, то освоите работу с новыми сенсорами, научитесь решать 2D задачи новыми способами и расширите знания в CV.

🎁 До 29 апреля вы можете присоединиться к сильной команде инженеров (и тут мы не только про спикеров, но и про студентов) со скидкой!
Старт потока 30 апреля.

Подробнее о программе, спикерах и скидках на сайте программы — присоединяйтесь к обучению!
До встречи на лекциях!🎓
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1211👍9
💼 Рубрика «Вопрос с собеседования»

Очень короткий: подберите веса для одного или нескольких сверточных слоев так, чтобы из изображения А получить B, C или D.

⚠️Важно: обучать модель нельзя, такое решение мы не засчитаем.
Советуем: отключить баес и не использовать активации между свертками.

🍕Авторам верных ответов отправим пиццу! По одной на каждую картинку.
🍕И бонусом подарим пиццу за самое подробное и интересное рассуждение!

Итого можно выиграть 4 пиццы и не готовить 2 дня🤩

В комментариях напишите код или псевдокод для получения одной из заданных картинок.

Результаты подведем завтра вечером!

# Исходная картинка
img = torch.tensor([
[0, 0, 0, 0, 0, 0],
[0, 1, 1, 1, 1, 0],
[0, 1, 2, 2, 1, 0],
[0, 1, 2, 2, 1, 0],
[0, 1, 1, 1, 1, 0],
[0, 0, 0, 0, 0, 0],
])[None, None,...]
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥41👍18🐳115😁2
Ответ на вопрос с собеседования 💼

❶ Матрица весов для B:
    [1, 0, 0, 0, 1],

вместе с паддингом (0, 2) свертка дает желаемую картинку. Ещё можно использовать свертку 5х5, заполнив все строчки нулями, кроме центральной.

❷ Матрица весов для D:
    [[1, 0, 0, 0, 1],
[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0],
[1, 0, 0, 0, 1]]


❸ Изображение C оказалось самым сложным. Тут мы добавили небольшой секрет 🤫 Его можно получить из D применением следующей свертки:
weight = torch.tensor([
[1, 0, 1],
[0, 0, 0],
[1, 0, 1],
], dtype=torch.float32)[None, None, ...]
result = torch.nn.functional.conv2d(image_d, weight, padding=3, dilation=3)


Изображения B и D легко поддались и вы нашли правильные ответы быстрее, чем за час! Изображение C было тяжелее, но зато получило самое необычное решение.

Итак, победители, к которым отправляются пиццы:
🍕 @Storks89 — первым нашел решение для изображения B
🍕 @science_boy — первым нашел решение для изображения D
🍕 @vdjakov — 2 пиццы за правильное решение для изображения С и за интересный подход с использованием СЛАУ для подбора весов свёрточного слоя!
🔥3812👍8🤯2
Основные термины и инструменты в Generative Computer Vision

Последние 2 года самая обсуждаемая и быстро развивающаяся тема в DL — генеративные модели. В CV это DALL-E, Midjourney, Stable Diffusion и прочие.

Но на волне хайпа многие забывают, что помимо генерации авокадо-кресел, генеративки используют для реконструкции и генерации снимков в медицине, восстановления невидимой части объектов в робототехнике, в онлайн-примерочных в фешн-индустрии, в рекламе, дизайне и других областях.

Мы тоже видим популярность и развитие генеративных моделей и хотим помочь вам разобраться в этом направлении. Поэтому вместе с инженерами и исследователями из области создаём курс Generative Computer Vision, а также готовим серию материалов.

Наша программа позволит вам разобраться в теории генеративных моделей и, разумеется, отточить все навыки на практике. Мы хотим учесть ваши пожелания и поэтому предлагаем поучаствовать в небольшом опросе.

Если вам интересно направление Генеративного Computer Vision, заполните, пожалуйста, короткую форму. Это займёт 3-5 минут.
Вы можете пройти опрос вне зависимости от вашего грейда или направления в DL, нам важно мнение каждого, кому интересна область Gen CV.
Для всех заполнивших мы подготовили zoom-лекцию по основным терминам и инструментам в Gen CV, на которой ответим на ваши вопросы и подарим скидки на обучение!🎓

Переходите по ссылке и заполняйте анкету.
Please open Telegram to view this post
VIEW IN TELEGRAM
26🔥13👍12🐳2🤔1
Введение в генеративный Computer Vision

Зрение — естественный, но крайне сложный процесс для человека. Мы не просто наблюдаем за каким-то объектом, мы смотрим на него сквозь призму наших знаний. Как научить компьютер воспринимать наш мир также? Один из способов — обучить его генеративному компьютерному зрению.

В статье рассказали:
- почему генеративный СV — один из путей к тому, чтобы компьютер понимал окружающий мир так же, как человек
- как генеративный Computer Vision применяется в разных областях
- какие задачи предстоит решить DL-инженерам и как в этом помогут генеративные модели

Читайте статью по ссылке: https://deepschool-pro.notion.site/Computer-Vision-452ba8f085e6477aa17123848e28b1f3
🔥3322👍14🐳2
Unsupervised Segmentation

Сегментация — одна из самых востребованных и важных задач компьютерного зрения, но разметка данных под неё часто трудоёмкий и дорогой процесс. Сейчас всё чаще обращаются к решениям, которые не требуют разметки, к self-supervised подходам.
В частности, успех DINO вдохновил исследователей использовать её «богатые» признаки для решения своих даунстрим задач, например, для сегментации изображения.

Из этой статьи вы узнаете, как объединить два успешных решения для инстанс и семантической сегментации в новое универсальное решение, которое позволит решить сразу три вида задач сегментации изображения.

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/Unsupervised-Segmentation-b91e2f7a5441488eb4e37f63ee0a1d2a?pvs=4
👍27106
Задачка по генеративному CV

У вас есть обученный свёрточный декодер, генерирующий текстурные изображения на основе вектора случайного шума. Архитектура декодера состоит из свёрточных слоев и upsample блоков. Все свёрточные слои имеют стандартные параметры: kernel 3х3, padding 1 и stride 1.

Необходимо внести изменения в уже обученный декодер, чтобы генерировать бесшовные текстурные изображения, которые можно периодически замостить на бесконечной плоскости без видимых стыков.

На рисунке ниже изображены два варианта генерации текстур в виде железных труб. В первом варианте декодер без изменений генерирует текстуру, которая мостит бесконечную плоскость со стыками. Во втором — декодер с изменением генерирует текстуру, которая мостит без видимых стыков.

Ваша задача — предложить модификацию операции свёртки, которая позволит декодеру генерировать бесшовные текстурные изображения.
Пишите свои варианты в комментариях, а правильный ответ мы расскажем через несколько дней.

Автору первого правильного решения мы подарим пиццу 🍕

Ждём ваши варианты в комментариях!👇
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥28👍14🤯129🐳1
Глубокое Q-обучение

В далеком 2016 году весь IT-мир заговорил об обучении с подкреплением — reinforcement learning, или RL. И неспроста: алгоритм глубокого Q-обучения научился играть в игры Atari на уровне людей-экспертов. С тех пор и проснулся большой интерес к обучению с подкреплением. Многие идеи, которые используются в глубоком Q-обучении, применяются также в современных алгоритмах.

Из этой статьи вы узнаете:
- как адаптировать классическое Q-обучение для решения реальных задач
- какие трюки используют для стабилизации тренировок в глубоком Q-обучении
- и, конечно же, что представляет собой сам алгоритм глубокого Q-обучения

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/Q-1ed7a65cc3d24a70928275bf0406296a?pvs=4
🔥20👍108🤔1
Введение в файн-тюнинг Stable Diffusion

В середине 2022 года миру была представлена Stable Diffusion — диффузионная модель для генерации изображений, которая перевернула всю сферу генеративного computer vision. Открытие её исходного кода и весов сообществу позволило всем желающим изучать и адаптировать их для своих задач. Зачастую это требует дотренировки модели, поэтому исследователи придумали ряд способов, как осуществлять такую дотренировку на небольшом объёме данных без потери качества модели.

Из этой статьи вы узнаете:
- что такое Stable Diffusion и как она устроена
- какие версии Stable Diffusion есть сейчас
- различные методы файн-тюна: Textual Inversion, HyperNetwork, Dreambooth и LoRA, их сильные и слабые стороны

Читайте статью по ссылке

И подписывайтесь на DeepSchool
🔥2514👍14🤯1
DeepSchool
Задачка по генеративному CV У вас есть обученный свёрточный декодер, генерирующий текстурные изображения на основе вектора случайного шума. Архитектура декодера состоит из свёрточных слоев и upsample блоков. Все свёрточные слои имеют стандартные параметры:…
Решение задачки по генеративному CV ✌️

Спасибо, что поучаствовали в нашем интерактиве! Пришло время подвести итоги.

Решение задачи:
Если сделать паддинг в свёртке циклическим по двум осям, то ядро свертки достигая границ как бы «оборачивается» вокруг тензора с другой стороны. Это позволяет обрабатывать элементы на границах так же, как и внутренние элементы, обеспечивая бесшовную периодическую текстуру.
Прикладываем картинку, иллюстрирующую циклический паддинг.

Победители, к которым отправляются пиццы:
🍕@cypic — за первый правильный ответ
🍕@MalchuL — за ещё один правильный ответ, о котором мы даже не подозревали!

Оказывается, если рассматривать двухмерный шум, можно задать все паддинги в свёртках нулевыми, а сам шум на входе дополнить циклическим паддингом. При этом, нужно учесть совпадения всех шейпов внутри сети при пробрасывании residual и skip connections — сделать это можно центрированным кропом.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥30👍9👏73
СlearML Session

ClearML — огромный комбайн, который решает самые разные задачи: от логирования метрик до деплоя сервиса. Мы уже рассказывали про управление данными в этой статье, а сегодня рассмотрим следующий модуль экосистемы — ClearML Session.

В статье вы узнаете:
- как настроить себе рабочее место на удалённой машине
- какие есть сценарии использования ClearML Session
- что такое ClearML Agent
- зачем создавать очередь задач и назначать их для выполнения агенту

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/ClearML-Session-611d2962606e448e83b8b6e26056ff0a?pvs=4
🔥24👍1310🤔1
Подкаст «Под капотом». Generative CV ✌️

В подкасте мы говорим с экспертами из различных областей, чтобы понять, как работают сложные системы изнутри. В этом выпуске мы поговорили с Кирамом Аль-Харба, Research-инженером в области GenCV.

В выпуске обсудили:
- что такое генеративный CV, чем он отличается от «обычного» и где применяется
- какие проблемы есть у GAN'ов, а какие у диффузионок. Почему последние выстрелили
- есть ли в GenCV хорошие метрики или нужно на глаз ловить чекпоинты
- какое будущее нас ждёт и как защищаться от дипфейков
- что классного можно запустить у себя из open source

Смотрите подкаст на youtube!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2723👍106
Кто работает или планирует работать с LLM, отзовитесь!

Мы готовим программу по LLM и хотим пообщаться с аудиторией нашего канала, кому интересна эта тема.

Заполните, пожалуйста, короткую форму, если вам интересно разобраться или углубить свои знания в LLM. Неважно из какой вы отрасли: CV, NLP, ML, python-разработка, DevOps, и т.д.

Всех, кто заполнит форму, мы пригласим на закрытую лекцию по LLM. На ней же мы презентуем программу нового курса и подарим самые большие скидки.

Заполнить форму
🔥41👍1611
Super Resolution

Super Resolution — это задача восстановления высокого разрешения для картинки или видео из их версий более низкого разрешения. Существует много различных методов её решения — это и классические, и обучаемые методы.

В этом обзоре мы рассмотрим задачу Single Image Super Resolution. Изучим популярные метрики оценки качества, используемые функции потерь и подходы к проектированию моделей, а также разберём самого популярного представителя этой задачи — семейство моделей SRGAN.

В статье расскажем о:
- метриках качества
- функциях потерь
- подходах к проектированию
- семействе моделей SRGAN

Читайте статью по ссылке: https://deepschool-pro.notion.site/Single-Image-Super-Resolution-c9761c026f73489c95874775ed7410b4
1913🔥10👍6
Лекция «Погружение в Generative CV»

Если переживаете, что эпоха генеративных моделей проходит мимо вас, приходите на открытую лекцию “Погружение в Generative CV”. На лекции мы расскажем про актуальные термины, задачи и подходы в этой области и ответим на ваши вопросы.

На лекции вы узнаете:
- почему генеративные модели стали так популярны
- какие задачи решают в Generative CV и какие там есть направления
- с чего начать погружение в эту область
- почему CV-инженеру важно знакомиться с GenCV
- как связаны друг с другом диффузионные модели, вариационные автоэнкодеры и генеративно-состязательные сети

А также мы представим программу курса "Generative Computer Vision" и подарим скидки участникам🎁

📌 Лекция пройдет в четверг, 30 мая, 18:00 МСК

💡 Всем, кто зарегистрируется на встречу, мы отправим miro-схему с описанием направлений и инструментов в Generative CV — поможет быстро сориентироваться и погрузиться.

Регистрируйтесь по ссылке!
🔥169👍85