DeepSchool
10.3K subscribers
77 photos
1 video
1 file
432 links
Это канал школы deepschool.ru. Здесь мы будем:
- напоминать вам теорию ML/DL в виде коротких постов,
- задавать вопросы с собеседований,
- рассказывать про полезные фреймворки
- и делиться советами, которые помогут вам в работе.

@deepschool_support
Download Telegram
Как научиться решать 3D CV задачи

Вчера прошла открытая лекция «Погружение в 3D CV», на которой мы рассказали о терминах, инструментах и задачах 3D CV, обсудили, почему эта область становится популярнее и почему CV-инженеру важно с ней знакомиться.

Также представили обновлённый курс 3D Computer Vision!

3D CV — это программа, на которой вы научитесь решать 3D задачи: сегментировать лидарные облака, писать SLAM алгоритмы, строить 3D-модели объектов, создавать аватаров, синтезировать данные в Blender, обучать NeRF, 3D Gaussian Splatting и другое.

Кратко о курсе:
🔹все лекции проходят онлайн (записи выкладываем в тот же вечер)
🔹8 спикеров из индустрии и ресерча
🔹13 лекций, 12 заданий
🔹4 месяца поддержки в чате и на онлайн-семинарах

Если вы не планируете переходить в области AR/VR, self-driving, GameDev, геосервисы, медтех и другие направления с активным применением 3D, то освоите работу с новыми сенсорами, научитесь решать 2D задачи новыми способами и расширите знания в CV.

🎁 До 29 апреля вы можете присоединиться к сильной команде инженеров (и тут мы не только про спикеров, но и про студентов) со скидкой!
Старт потока 30 апреля.

Подробнее о программе, спикерах и скидках на сайте программы — присоединяйтесь к обучению!
До встречи на лекциях!🎓
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1211👍9
💼 Рубрика «Вопрос с собеседования»

Очень короткий: подберите веса для одного или нескольких сверточных слоев так, чтобы из изображения А получить B, C или D.

⚠️Важно: обучать модель нельзя, такое решение мы не засчитаем.
Советуем: отключить баес и не использовать активации между свертками.

🍕Авторам верных ответов отправим пиццу! По одной на каждую картинку.
🍕И бонусом подарим пиццу за самое подробное и интересное рассуждение!

Итого можно выиграть 4 пиццы и не готовить 2 дня🤩

В комментариях напишите код или псевдокод для получения одной из заданных картинок.

Результаты подведем завтра вечером!

# Исходная картинка
img = torch.tensor([
[0, 0, 0, 0, 0, 0],
[0, 1, 1, 1, 1, 0],
[0, 1, 2, 2, 1, 0],
[0, 1, 2, 2, 1, 0],
[0, 1, 1, 1, 1, 0],
[0, 0, 0, 0, 0, 0],
])[None, None,...]
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥41👍18🐳115😁2
Ответ на вопрос с собеседования 💼

❶ Матрица весов для B:
    [1, 0, 0, 0, 1],

вместе с паддингом (0, 2) свертка дает желаемую картинку. Ещё можно использовать свертку 5х5, заполнив все строчки нулями, кроме центральной.

❷ Матрица весов для D:
    [[1, 0, 0, 0, 1],
[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0],
[1, 0, 0, 0, 1]]


❸ Изображение C оказалось самым сложным. Тут мы добавили небольшой секрет 🤫 Его можно получить из D применением следующей свертки:
weight = torch.tensor([
[1, 0, 1],
[0, 0, 0],
[1, 0, 1],
], dtype=torch.float32)[None, None, ...]
result = torch.nn.functional.conv2d(image_d, weight, padding=3, dilation=3)


Изображения B и D легко поддались и вы нашли правильные ответы быстрее, чем за час! Изображение C было тяжелее, но зато получило самое необычное решение.

Итак, победители, к которым отправляются пиццы:
🍕 @Storks89 — первым нашел решение для изображения B
🍕 @science_boy — первым нашел решение для изображения D
🍕 @vdjakov — 2 пиццы за правильное решение для изображения С и за интересный подход с использованием СЛАУ для подбора весов свёрточного слоя!
🔥3812👍8🤯2
Основные термины и инструменты в Generative Computer Vision

Последние 2 года самая обсуждаемая и быстро развивающаяся тема в DL — генеративные модели. В CV это DALL-E, Midjourney, Stable Diffusion и прочие.

Но на волне хайпа многие забывают, что помимо генерации авокадо-кресел, генеративки используют для реконструкции и генерации снимков в медицине, восстановления невидимой части объектов в робототехнике, в онлайн-примерочных в фешн-индустрии, в рекламе, дизайне и других областях.

Мы тоже видим популярность и развитие генеративных моделей и хотим помочь вам разобраться в этом направлении. Поэтому вместе с инженерами и исследователями из области создаём курс Generative Computer Vision, а также готовим серию материалов.

Наша программа позволит вам разобраться в теории генеративных моделей и, разумеется, отточить все навыки на практике. Мы хотим учесть ваши пожелания и поэтому предлагаем поучаствовать в небольшом опросе.

Если вам интересно направление Генеративного Computer Vision, заполните, пожалуйста, короткую форму. Это займёт 3-5 минут.
Вы можете пройти опрос вне зависимости от вашего грейда или направления в DL, нам важно мнение каждого, кому интересна область Gen CV.
Для всех заполнивших мы подготовили zoom-лекцию по основным терминам и инструментам в Gen CV, на которой ответим на ваши вопросы и подарим скидки на обучение!🎓

Переходите по ссылке и заполняйте анкету.
Please open Telegram to view this post
VIEW IN TELEGRAM
26🔥13👍12🐳2🤔1
Введение в генеративный Computer Vision

Зрение — естественный, но крайне сложный процесс для человека. Мы не просто наблюдаем за каким-то объектом, мы смотрим на него сквозь призму наших знаний. Как научить компьютер воспринимать наш мир также? Один из способов — обучить его генеративному компьютерному зрению.

В статье рассказали:
- почему генеративный СV — один из путей к тому, чтобы компьютер понимал окружающий мир так же, как человек
- как генеративный Computer Vision применяется в разных областях
- какие задачи предстоит решить DL-инженерам и как в этом помогут генеративные модели

Читайте статью по ссылке: https://deepschool-pro.notion.site/Computer-Vision-452ba8f085e6477aa17123848e28b1f3
🔥3322👍14🐳2
Unsupervised Segmentation

Сегментация — одна из самых востребованных и важных задач компьютерного зрения, но разметка данных под неё часто трудоёмкий и дорогой процесс. Сейчас всё чаще обращаются к решениям, которые не требуют разметки, к self-supervised подходам.
В частности, успех DINO вдохновил исследователей использовать её «богатые» признаки для решения своих даунстрим задач, например, для сегментации изображения.

Из этой статьи вы узнаете, как объединить два успешных решения для инстанс и семантической сегментации в новое универсальное решение, которое позволит решить сразу три вида задач сегментации изображения.

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/Unsupervised-Segmentation-b91e2f7a5441488eb4e37f63ee0a1d2a?pvs=4
👍27106
Задачка по генеративному CV

У вас есть обученный свёрточный декодер, генерирующий текстурные изображения на основе вектора случайного шума. Архитектура декодера состоит из свёрточных слоев и upsample блоков. Все свёрточные слои имеют стандартные параметры: kernel 3х3, padding 1 и stride 1.

Необходимо внести изменения в уже обученный декодер, чтобы генерировать бесшовные текстурные изображения, которые можно периодически замостить на бесконечной плоскости без видимых стыков.

На рисунке ниже изображены два варианта генерации текстур в виде железных труб. В первом варианте декодер без изменений генерирует текстуру, которая мостит бесконечную плоскость со стыками. Во втором — декодер с изменением генерирует текстуру, которая мостит без видимых стыков.

Ваша задача — предложить модификацию операции свёртки, которая позволит декодеру генерировать бесшовные текстурные изображения.
Пишите свои варианты в комментариях, а правильный ответ мы расскажем через несколько дней.

Автору первого правильного решения мы подарим пиццу 🍕

Ждём ваши варианты в комментариях!👇
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥28👍14🤯129🐳1
Глубокое Q-обучение

В далеком 2016 году весь IT-мир заговорил об обучении с подкреплением — reinforcement learning, или RL. И неспроста: алгоритм глубокого Q-обучения научился играть в игры Atari на уровне людей-экспертов. С тех пор и проснулся большой интерес к обучению с подкреплением. Многие идеи, которые используются в глубоком Q-обучении, применяются также в современных алгоритмах.

Из этой статьи вы узнаете:
- как адаптировать классическое Q-обучение для решения реальных задач
- какие трюки используют для стабилизации тренировок в глубоком Q-обучении
- и, конечно же, что представляет собой сам алгоритм глубокого Q-обучения

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/Q-1ed7a65cc3d24a70928275bf0406296a?pvs=4
🔥20👍108🤔1
Введение в файн-тюнинг Stable Diffusion

В середине 2022 года миру была представлена Stable Diffusion — диффузионная модель для генерации изображений, которая перевернула всю сферу генеративного computer vision. Открытие её исходного кода и весов сообществу позволило всем желающим изучать и адаптировать их для своих задач. Зачастую это требует дотренировки модели, поэтому исследователи придумали ряд способов, как осуществлять такую дотренировку на небольшом объёме данных без потери качества модели.

Из этой статьи вы узнаете:
- что такое Stable Diffusion и как она устроена
- какие версии Stable Diffusion есть сейчас
- различные методы файн-тюна: Textual Inversion, HyperNetwork, Dreambooth и LoRA, их сильные и слабые стороны

Читайте статью по ссылке

И подписывайтесь на DeepSchool
🔥2514👍14🤯1
DeepSchool
Задачка по генеративному CV У вас есть обученный свёрточный декодер, генерирующий текстурные изображения на основе вектора случайного шума. Архитектура декодера состоит из свёрточных слоев и upsample блоков. Все свёрточные слои имеют стандартные параметры:…
Решение задачки по генеративному CV ✌️

Спасибо, что поучаствовали в нашем интерактиве! Пришло время подвести итоги.

Решение задачи:
Если сделать паддинг в свёртке циклическим по двум осям, то ядро свертки достигая границ как бы «оборачивается» вокруг тензора с другой стороны. Это позволяет обрабатывать элементы на границах так же, как и внутренние элементы, обеспечивая бесшовную периодическую текстуру.
Прикладываем картинку, иллюстрирующую циклический паддинг.

Победители, к которым отправляются пиццы:
🍕@cypic — за первый правильный ответ
🍕@MalchuL — за ещё один правильный ответ, о котором мы даже не подозревали!

Оказывается, если рассматривать двухмерный шум, можно задать все паддинги в свёртках нулевыми, а сам шум на входе дополнить циклическим паддингом. При этом, нужно учесть совпадения всех шейпов внутри сети при пробрасывании residual и skip connections — сделать это можно центрированным кропом.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥30👍9👏73
СlearML Session

ClearML — огромный комбайн, который решает самые разные задачи: от логирования метрик до деплоя сервиса. Мы уже рассказывали про управление данными в этой статье, а сегодня рассмотрим следующий модуль экосистемы — ClearML Session.

В статье вы узнаете:
- как настроить себе рабочее место на удалённой машине
- какие есть сценарии использования ClearML Session
- что такое ClearML Agent
- зачем создавать очередь задач и назначать их для выполнения агенту

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/ClearML-Session-611d2962606e448e83b8b6e26056ff0a?pvs=4
🔥24👍1310🤔1
Подкаст «Под капотом». Generative CV ✌️

В подкасте мы говорим с экспертами из различных областей, чтобы понять, как работают сложные системы изнутри. В этом выпуске мы поговорили с Кирамом Аль-Харба, Research-инженером в области GenCV.

В выпуске обсудили:
- что такое генеративный CV, чем он отличается от «обычного» и где применяется
- какие проблемы есть у GAN'ов, а какие у диффузионок. Почему последние выстрелили
- есть ли в GenCV хорошие метрики или нужно на глаз ловить чекпоинты
- какое будущее нас ждёт и как защищаться от дипфейков
- что классного можно запустить у себя из open source

Смотрите подкаст на youtube!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2723👍106
Кто работает или планирует работать с LLM, отзовитесь!

Мы готовим программу по LLM и хотим пообщаться с аудиторией нашего канала, кому интересна эта тема.

Заполните, пожалуйста, короткую форму, если вам интересно разобраться или углубить свои знания в LLM. Неважно из какой вы отрасли: CV, NLP, ML, python-разработка, DevOps, и т.д.

Всех, кто заполнит форму, мы пригласим на закрытую лекцию по LLM. На ней же мы презентуем программу нового курса и подарим самые большие скидки.

Заполнить форму
🔥41👍1611
Super Resolution

Super Resolution — это задача восстановления высокого разрешения для картинки или видео из их версий более низкого разрешения. Существует много различных методов её решения — это и классические, и обучаемые методы.

В этом обзоре мы рассмотрим задачу Single Image Super Resolution. Изучим популярные метрики оценки качества, используемые функции потерь и подходы к проектированию моделей, а также разберём самого популярного представителя этой задачи — семейство моделей SRGAN.

В статье расскажем о:
- метриках качества
- функциях потерь
- подходах к проектированию
- семействе моделей SRGAN

Читайте статью по ссылке: https://deepschool-pro.notion.site/Single-Image-Super-Resolution-c9761c026f73489c95874775ed7410b4
1913🔥10👍6
Лекция «Погружение в Generative CV»

Если переживаете, что эпоха генеративных моделей проходит мимо вас, приходите на открытую лекцию “Погружение в Generative CV”. На лекции мы расскажем про актуальные термины, задачи и подходы в этой области и ответим на ваши вопросы.

На лекции вы узнаете:
- почему генеративные модели стали так популярны
- какие задачи решают в Generative CV и какие там есть направления
- с чего начать погружение в эту область
- почему CV-инженеру важно знакомиться с GenCV
- как связаны друг с другом диффузионные модели, вариационные автоэнкодеры и генеративно-состязательные сети

А также мы представим программу курса "Generative Computer Vision" и подарим скидки участникам🎁

📌 Лекция пройдет в четверг, 30 мая, 18:00 МСК

💡 Всем, кто зарегистрируется на встречу, мы отправим miro-схему с описанием направлений и инструментов в Generative CV — поможет быстро сориентироваться и погрузиться.

Регистрируйтесь по ссылке!
🔥169👍85
DeepSchool
Лекция «Погружение в Generative CV» Если переживаете, что эпоха генеративных моделей проходит мимо вас, приходите на открытую лекцию “Погружение в Generative CV”. На лекции мы расскажем про актуальные термины, задачи и подходы в этой области и ответим на…
🔥Начинаем через 2 часа

Успевайте зарегистрироваться!

На лекции разберём:
1️⃣ почему генеративные модели стали так популярны
2️⃣ какие задачи решают в Generative CV и какие там есть направления
3️⃣ с чего начать погружение в эту область
4️⃣ почему CV-инженеру важно знакомиться с GenCV
5️⃣ как связаны друг с другом диффузионные модели, вариационные автоэнкодеры и генеративно-состязательные сети

И представим программу курса GenCV!

Присоединяйтесь к лекции!
Please open Telegram to view this post
VIEW IN TELEGRAM
76🔥4👍1
Где получить практику по генеративным моделям

Вчера мы провели открытую лекцию, на которой рассказали про актуальные технологии из сферы генеративного Comupter Vision, почему эта область стала такой популярной и где применяют GenCV помимо генерации изображений для развлечения.

Недавно мы писали, что генеративный CV стал применяться в медицине, промышленности, дизайне и других областях. Это привело к тому, что появляется больше вакансий, где умение работать с генеративными моделями упоминают в требованиях или пожеланиях к кандидату.

Поэтому мы создали курс GenCV, который поможет DL-инженерам разобраться в области генеративного CV: изучить необходимую теорию и научиться решать задачи на практике.

На курсе вы:
🔹узнаете, как устроены SOTA модели и подходы
🔹научитесь тюнить генеративные модели
🔹разберётесь со Stable Diffusion и экосистемой вокруг
🔹освоите super-resolution, image editing/inpainting, face restoration, text2image
🔹а также более комплексные задачи: генерацию видео и виртуальную примерку

Курс длится 3 месяца. Старт 6 июня

После программы вы сможете собеседоваться в генеративные команды, решать новые интересные задачи, повысить свою ценность на рынке и быть в курсе актуальных технологий

Присоединяйтесь к обучению по скидке до 5 июня!

Подробнее о программе, спикерах, тарифах и скидках читайте на сайте программы!

Если у вас возникают вопросы или трудности, то пишите нам в поддержку в Телеграм.
14🔥1010👍3
Качество данных с Evidently

В новой статье мы познакомимся с Evidently — библиотекой для python, которая позволит значительно ускорить анализ качества данных.

Рассмотрим воображаемый, но приближенный к реальности пример и расскажем, как:
- быстро сделать отчет о корреляциях, значениях фичей и перформансе моделей
- задетектить data drift
- и написать тесты на данные

Читайте нашу статью по ссылке: https://www.notion.so/deepschool-pro/Evidently-1ae04b810d5e4177abea0891c505bb33?pvs=4
👍20🔥169
Последняя возможность присоединиться к курсу GenCV со скидкой

Завтра, 6 июня, пройдёт первая лекция, на которой мы начнём изучать VAE.
А сегодня вы ещё успеваете присоединиться к обучению со скидкой до 15%!

На курсе вы научитесь:
🔹решать различные генеративные задачи: Super-Resolution, Text2Image, Image inpainting, Virtual try-on
🔹решать более комплексные задачи: генерацию видео и виртуальную примерку
🔹обучать и тюнить собственные модели
🔹работать со Stable Diffusion и экосистемой вокруг
🔹а также разберётесь в теории генеративных моделей и SOTA решениях

Ждём вас на курсе, если вы хотите освоить теорию генеративных моделей и их обучение на практике!

Обучаясь у нас, вы попадаете в сообщество практикующих инженеров и исследователей, где всегда можно спросить совет и перенять опыт🎓

Переходите на сайт, выбирайте подходящий тариф и присоединяйтесь к обучению

До встречи на лекциях!
Please open Telegram to view this post
VIEW IN TELEGRAM
9🔥8👍74
Введение в диффузионные модели

Диффузионные модели сейчас активно используются в самых разных задачах: при генерации изображений, видео, 3D-моделей, музыки и многих других. Но что же такое диффузионные модели, и какая математика скрывается за этим процессом?

В новом посте вы:
- узнаете, что такое диффузионные модели
- разберётесь, как они соотносятся со score matching'ом
- поймёте, как связаны вариационные автокодировщики и стохастические дифференциальные уравнения с диффузией

Будет сложно, но интересно! 🙂

Читайте нашу статью по ссылке!

И подписывайтесь на DeepSchool
🔥4012🥰8👍6🤯2
Edge Inference. Лекция

Мы завершили первый поток «Ускорения нейросетей»! 🥳 Уже завтра пройдёт выпускной, на которым мы подведём итоги обучения и ребята получат сертификаты об успешном прохождении курса.

Хотим поделиться с вами одной из лекцией курса: Edge Inference. Её провёл Антон Мальцев, автор блога «Заметки Computer Vision Инженера».

На лекции вы:
- узнаете, что в «ландшафте» производителей одноплатников
- посмотрите на общую схему запуска микрокомпьютеров
- разберёте проблемные слои, которые не заработают на вашем микрокомпьютере

Смотрите лекцию по ссылке в следующем посте👇

Мы планируем новый поток курса «Ускорение нейросетей» этим летом, а уже сейчас вы можете записаться в лист ожидания. Так вы забронируете место на курсе, получите самую большую скидку, и мы заранее сообщим о старте обучения.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2111👍6🙏1