Дайджест статей за март
Встречайте первый дайджест статей на канале!
Мы собрали вместе все статьи за последний месяц и получилось очень разнообразно — от обучения сетей до 3D, от разбора трансформера для детекции до составления ансамбля моделей. Надеемся, что вы не упустите то, что вам интересно 🤗
Negative learning
Рассказываем, как обучиться с хорошими результатами на неидеальных датасетах с ошибками и противоречивыми данными:
- в чём ключевая идея подхода
- его плюсы и минусы
- и как добиться очень хороших результатов на шумных данных
3D Gaussian Splatting
Разбираемся, как обеспечить высокое качество сгенерированных 3D сцен вместе с быстротой обучения и отрисовки:
- как Gaussian Splatting использует гауссианы для представления трёхмерного пространства
- как позволяет эффективно отрисовать новые изображения для сцены
- как обучается создавать детализированное представление сцены
ModelSoups: варим суп из моделей
Изучаем, как усреднение весов моделей может улучшить точность итогового ансамбля:
- Model Soups подход к усреднению весов модели и его результаты
- теория подхода, а также границы применимости и сопутствующие требования
- применение подхода в СV и NLP направлениях
Как применяют CV в сейсморазведке
Познакомимся с применением DL в прикладной науке — сейсморазведке:
- что такое сейсморазведка
- как в ней применить подходы на основе глубоких нейронных сетей
- примеры открытых сейсмических данных
- как можно решить задачу их интерпретации с помощью CV
- и какие есть известные соревнования по МО на базе сейсмических датасетов
DETR
Препарируем пионера CV детекции на базе архитектуры трансформер:
- как решать задачу детекции напрямую — без дополнительных методов по типу NMS (non-maximum suppression) или генерации анкоров
- детальный разбор архитектуры DETR
- результаты её применения в downstream задачах
Grounding Dino
Выясняем, как мультимодальность улучшает детекцию объектов с помощью Grounding Dino:
- зачем нужна “дружба” между языком и картинками и какие у неё бонусы
- какая архитектура у Grounding Dino
- как соединить модальности
- каким образом можно запустить и потрогать Grounding Dino
✌️Что вам было интересно в этом месяце? О чём вы бы хотели прочитать на канале? Пишите в комментарии!
Встречайте первый дайджест статей на канале!
Мы собрали вместе все статьи за последний месяц и получилось очень разнообразно — от обучения сетей до 3D, от разбора трансформера для детекции до составления ансамбля моделей. Надеемся, что вы не упустите то, что вам интересно 🤗
Negative learning
Рассказываем, как обучиться с хорошими результатами на неидеальных датасетах с ошибками и противоречивыми данными:
- в чём ключевая идея подхода
- его плюсы и минусы
- и как добиться очень хороших результатов на шумных данных
3D Gaussian Splatting
Разбираемся, как обеспечить высокое качество сгенерированных 3D сцен вместе с быстротой обучения и отрисовки:
- как Gaussian Splatting использует гауссианы для представления трёхмерного пространства
- как позволяет эффективно отрисовать новые изображения для сцены
- как обучается создавать детализированное представление сцены
ModelSoups: варим суп из моделей
Изучаем, как усреднение весов моделей может улучшить точность итогового ансамбля:
- Model Soups подход к усреднению весов модели и его результаты
- теория подхода, а также границы применимости и сопутствующие требования
- применение подхода в СV и NLP направлениях
Как применяют CV в сейсморазведке
Познакомимся с применением DL в прикладной науке — сейсморазведке:
- что такое сейсморазведка
- как в ней применить подходы на основе глубоких нейронных сетей
- примеры открытых сейсмических данных
- как можно решить задачу их интерпретации с помощью CV
- и какие есть известные соревнования по МО на базе сейсмических датасетов
DETR
Препарируем пионера CV детекции на базе архитектуры трансформер:
- как решать задачу детекции напрямую — без дополнительных методов по типу NMS (non-maximum suppression) или генерации анкоров
- детальный разбор архитектуры DETR
- результаты её применения в downstream задачах
Grounding Dino
Выясняем, как мультимодальность улучшает детекцию объектов с помощью Grounding Dino:
- зачем нужна “дружба” между языком и картинками и какие у неё бонусы
- какая архитектура у Grounding Dino
- как соединить модальности
- каким образом можно запустить и потрогать Grounding Dino
✌️Что вам было интересно в этом месяце? О чём вы бы хотели прочитать на канале? Пишите в комментарии!
❤28🔥23👍13🐳1
Diffusion Models
Сегодня поговорим о моделях диффузии и их превосходстве над Generative Adversarial Networks (GANs) при создании высококачественных синтетических изображений. Познакомимся со статьёй “Diffusion Models Beat GANs on Image Synthesis”, авторы которой доказали: диффузионные модели помогают обеспечить наилучшее качество генерации изображений.
В статье также рассмотрим:
- процесс диффузии (forward и reverse)
- Denoising Diffusion Probabilistic Models (DDPM)
- большое количество ablation study
- обучение
- математику в первом приближении
- и ещё много чего :)
Читайте нашу новую статью по ссылке: https://www.notion.so/deepschool-pro/Diffusion-Models-Beat-GANs-on-Image-Synthesis-b178e701e6d44cac9df11a501067d666?pvs=4
Сегодня поговорим о моделях диффузии и их превосходстве над Generative Adversarial Networks (GANs) при создании высококачественных синтетических изображений. Познакомимся со статьёй “Diffusion Models Beat GANs on Image Synthesis”, авторы которой доказали: диффузионные модели помогают обеспечить наилучшее качество генерации изображений.
В статье также рассмотрим:
- процесс диффузии (forward и reverse)
- Denoising Diffusion Probabilistic Models (DDPM)
- большое количество ablation study
- обучение
- математику в первом приближении
- и ещё много чего :)
Читайте нашу новую статью по ссылке: https://www.notion.so/deepschool-pro/Diffusion-Models-Beat-GANs-on-Image-Synthesis-b178e701e6d44cac9df11a501067d666?pvs=4
deepschool-pro on Notion
Diffusion Models Beat GANs on Image Synthesis | Notion
Автор: Даниил Соловьёв
Редактура: Кирам Аль-Харба
Редактура: Кирам Аль-Харба
🔥37👍9❤6👏2
Полезные Linux-команды
Linux — неотъемлемая часть инструментария каждого Data Scientist'а.
В этой статье мы рассмотрим полезные команды, которые позволят:
- создавать виртуальные сессии
- профилировать ресурсы
- добавлять переменные окружения
А в конце вы найдёте шпаргалку с основными Linux-командами 😊
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/Linux-715cb84e836f402a911f28fa3c4e753a?pvs=4
Linux — неотъемлемая часть инструментария каждого Data Scientist'а.
В этой статье мы рассмотрим полезные команды, которые позволят:
- создавать виртуальные сессии
- профилировать ресурсы
- добавлять переменные окружения
А в конце вы найдёте шпаргалку с основными Linux-командами 😊
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/Linux-715cb84e836f402a911f28fa3c4e753a?pvs=4
deepschool-pro on Notion
Полезные Linux-команды | Notion
Автор: Александр Гончаренко
Редактура: Андрей Шадриков, Илья Бакалец
Редактура: Андрей Шадриков, Илья Бакалец
🔥27❤10👍7
Запускаем наш новый подкаст «Под капотом»!
В нём мы говорим с экспертами из различных областей, чтобы понять, как работают сложные системы изнутри.
Первый выпуск: 3D, SLAM и лидары🚗
Нашим гостем стал Игорь Ильин, Senior SLAM разработчик и спикер курса 3D CV от DeepSchool.
Вместе мы обсудили:
- что такое SLAM и как он связан с теорией управления
- принципы работы лидаров
- отличия компьютерного зрения в 3D от 2D
- сложно ли найти работу в 3D CV
Выпуск получился насыщенным, поэтому мы разделили его на две части. Скоро запостим следующую, там больше поговорили о жизни, карьере и будущем человечества 🙂
Смотрите подкаст на youtube!
Делитесь в комментариях, о чём бы вы хотели услышать в следующем выпуске!
В нём мы говорим с экспертами из различных областей, чтобы понять, как работают сложные системы изнутри.
Первый выпуск: 3D, SLAM и лидары
Нашим гостем стал Игорь Ильин, Senior SLAM разработчик и спикер курса 3D CV от DeepSchool.
Вместе мы обсудили:
- что такое SLAM и как он связан с теорией управления
- принципы работы лидаров
- отличия компьютерного зрения в 3D от 2D
- сложно ли найти работу в 3D CV
Выпуск получился насыщенным, поэтому мы разделили его на две части. Скоро запостим следующую, там больше поговорили о жизни, карьере и будущем человечества 🙂
Смотрите подкаст на youtube!
Делитесь в комментариях, о чём бы вы хотели услышать в следующем выпуске!
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Под Капотом | Игорь Ильин о мире 3D CV, SLAM и лидарах. Часть 1
#computervision #3d #3dcv #lidar #slam #cv #career
На подкасте «Под капотом» мы говорим с экспертами из различных областей, чтобы понять, как работают сложные системы изнутри.
В этот раз поговорили с Игорем Ильиным, Senior SLAM разработчиком и спикером…
На подкасте «Под капотом» мы говорим с экспертами из различных областей, чтобы понять, как работают сложные системы изнутри.
В этот раз поговорили с Игорем Ильиным, Senior SLAM разработчиком и спикером…
❤19🔥16👍6
Прекрасное далёко. Где мы на пути к Метавёрсу
Сегодня построение Метавёрса — приоритетное направление для многих крупных компаний, таких как Epic Games. В статье мы рассмотрим, на каком этапе развития он находится, и какие задачи стоят перед разработчиками. А ещё представим обзор 3DCV алгоритмов и инструментов. Сейчас они уже широко применяются как для строительства Метавёрса, так и для решения более прикладных задач.
Из статьи вы узнаете:
- какие недостатки и преимущества NeRF
- почему учёные создали 3D Gaussian Splatting и зачем объединили его с NeRF
- какие бывают аватары людей и чем они отличаются
- какие инструменты позволяют использовать NeRF и 3D Gaussian Splatting в ваших проектах
- и какие актуальные задачи стоят перед 3DCV исследователями
Читайте статью по ссылке: https://deepschool-pro.notion.site/c181878b1532401a801fb995ab44d4f5
Сегодня построение Метавёрса — приоритетное направление для многих крупных компаний, таких как Epic Games. В статье мы рассмотрим, на каком этапе развития он находится, и какие задачи стоят перед разработчиками. А ещё представим обзор 3DCV алгоритмов и инструментов. Сейчас они уже широко применяются как для строительства Метавёрса, так и для решения более прикладных задач.
Из статьи вы узнаете:
- какие недостатки и преимущества NeRF
- почему учёные создали 3D Gaussian Splatting и зачем объединили его с NeRF
- какие бывают аватары людей и чем они отличаются
- какие инструменты позволяют использовать NeRF и 3D Gaussian Splatting в ваших проектах
- и какие актуальные задачи стоят перед 3DCV исследователями
Читайте статью по ссылке: https://deepschool-pro.notion.site/c181878b1532401a801fb995ab44d4f5
deepschool-pro on Notion
Прекрасное далёко. Где мы на пути к Метавёрсу | Notion
Автор: Давид Свитов
🔥18😍9❤8👍1😁1
Новая программа курса 3DCV
Недавно закончился 2 поток курса по 3DCV, на этой неделе проведём выпускной🍬
Мы уже обновили программу и добавили новые лекции по Gaussian Splatting, а сейчас готовим новый поток. Скоро будем подробнее знакомить вас с направлением 3D, формируем подборку статей, не пропустите🔥
С последнего набора накопилось много желающих попасть на обучение, некоторые уже успели записаться в лист ожидания и даже присоединиться к новому потоку. Мы решили провести встречу, чтобы познакомить вас с обновлённой программой 3DCV и тем, какие направления есть в области 3DCV.
В среду 17 апреля проведём zoom-презентацию курса. На ней расскажем о курсе, представим обновленную программу и подарим самые большие скидки тем, кто готов присоединиться раньше всех. Если вам интересна тема 3DCV и вы хотите начать развиваться в этом направлении компьютерного зрения, регистрируйтесь и приходите на встречу!
Запишитесь в анкету по ссылке, чтобы попасть на презентацию, и мы отправим вам приглашение.
До встречи!
Недавно закончился 2 поток курса по 3DCV, на этой неделе проведём выпускной
Мы уже обновили программу и добавили новые лекции по Gaussian Splatting, а сейчас готовим новый поток. Скоро будем подробнее знакомить вас с направлением 3D, формируем подборку статей, не пропустите
С последнего набора накопилось много желающих попасть на обучение, некоторые уже успели записаться в лист ожидания и даже присоединиться к новому потоку. Мы решили провести встречу, чтобы познакомить вас с обновлённой программой 3DCV и тем, какие направления есть в области 3DCV.
В среду 17 апреля проведём zoom-презентацию курса. На ней расскажем о курсе, представим обновленную программу и подарим самые большие скидки тем, кто готов присоединиться раньше всех. Если вам интересна тема 3DCV и вы хотите начать развиваться в этом направлении компьютерного зрения, регистрируйтесь и приходите на встречу!
Запишитесь в анкету по ссылке, чтобы попасть на презентацию, и мы отправим вам приглашение.
До встречи!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18❤8👍6
Диффузия на трансформерах
До недавнего времени самые популярные диффузионные модели имели архитектуру UNet (например, всеми любимый Stable Diffusion). В феврале 2024 года OpenAI написали про свою видео-диффузию SORA, а затем и Stability анонсировали StableDiffusion3, где основной архитектурой уже выступил трансформер. Оказывается, это совсем не первый случай работы диффузионной модели на трансформере.
В нашем обзоре мы:
- вспомним, что такое Vision Transformer
- разберём несколько статей, где применили эту архитектуру для диффузионной генерации
- рассмотрим результаты улучшения качества генерации с помощью такого подхода
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/187d749559ae4717a13f0cc8c708ced2?pvs=4
До недавнего времени самые популярные диффузионные модели имели архитектуру UNet (например, всеми любимый Stable Diffusion). В феврале 2024 года OpenAI написали про свою видео-диффузию SORA, а затем и Stability анонсировали StableDiffusion3, где основной архитектурой уже выступил трансформер. Оказывается, это совсем не первый случай работы диффузионной модели на трансформере.
В нашем обзоре мы:
- вспомним, что такое Vision Transformer
- разберём несколько статей, где применили эту архитектуру для диффузионной генерации
- рассмотрим результаты улучшения качества генерации с помощью такого подхода
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/187d749559ae4717a13f0cc8c708ced2?pvs=4
deepschool-pro on Notion
Диффузия на трансформерах | Notion
Автор: Нина Коновалова
Редактура: Шамиль Мамедов
Редактура: Шамиль Мамедов
🔥43👍13❤12❤🔥5
Подборка статей 3DCV от DeepSchool
Собрали коллекцию постов по теме 3D Computer Vision, опубликованных в нашем канале. Теперь в них проще ориентироваться и перечитывать интересующие 🔥
Основы
🔹 Знакомство с 3D CV: обзор основных задач и способов их решения.
🔹 Геометрия формирования изображения: обсуждение модели камеры и матриц, нужных для превращения 3D-объекта в изображение.
🔹 Калибровка камеры: анализ краеугольного камня всего CV, который играет важную роль в 3D-задачах.
Научные статьи
🔹 SIGGRAPH: обзор интересных статей по случаю самой известной конференции по 3D.
🔹 NeRV: Neural Reflectance and Visibility Fields for Relighting and View Synthesis: обсуждение возможности изменять освещение сцены в NeRF-представлениях.
🔹 3D Gaussian Splatting: Revolutionizing Real-Time Radiance Filed Rendering: разбор недавно нашумевшего Gaussian Splatting’а.
LiDAR
🔹 Виды представления лидарных данных. Часть 1: анализ работы лидара и видов данных, в которых мы можем их представлять.
🔹 Виды представления лидарных данных. Часть 2: разбор трансформации данных в многоканальные изображения и Bag-of-Points представление.
🔹 Виды представления лидарных данных. Часть 3: обзор представления в виде вокселей.
Решаемые задачи
🔹 Сегментация поверхности земли: туториал по тому, как определять плоскость земли с помощью лидарных данных (чтобы уверенно стоять на ногах в области 3D 😉).
🔹 Как применяют CV в сейсморазведке: изучение 3D не только вдаль, но и вглубь.
🔹 Особенности 3D медецинских данных: обзор задачи анализа 3D-данных в медицине.
🔹 Прекрасное далёко. Где мы на пути к Метавёрсу: обсуждение вызовов, которые стоят перед инженерами 3D CV при строительстве Метавёрса.
Собрали коллекцию постов по теме 3D Computer Vision, опубликованных в нашем канале. Теперь в них проще ориентироваться и перечитывать интересующие 🔥
Основы
🔹 Знакомство с 3D CV: обзор основных задач и способов их решения.
🔹 Геометрия формирования изображения: обсуждение модели камеры и матриц, нужных для превращения 3D-объекта в изображение.
🔹 Калибровка камеры: анализ краеугольного камня всего CV, который играет важную роль в 3D-задачах.
Научные статьи
🔹 SIGGRAPH: обзор интересных статей по случаю самой известной конференции по 3D.
🔹 NeRV: Neural Reflectance and Visibility Fields for Relighting and View Synthesis: обсуждение возможности изменять освещение сцены в NeRF-представлениях.
🔹 3D Gaussian Splatting: Revolutionizing Real-Time Radiance Filed Rendering: разбор недавно нашумевшего Gaussian Splatting’а.
LiDAR
🔹 Виды представления лидарных данных. Часть 1: анализ работы лидара и видов данных, в которых мы можем их представлять.
🔹 Виды представления лидарных данных. Часть 2: разбор трансформации данных в многоканальные изображения и Bag-of-Points представление.
🔹 Виды представления лидарных данных. Часть 3: обзор представления в виде вокселей.
Решаемые задачи
🔹 Сегментация поверхности земли: туториал по тому, как определять плоскость земли с помощью лидарных данных (чтобы уверенно стоять на ногах в области 3D 😉).
🔹 Как применяют CV в сейсморазведке: изучение 3D не только вдаль, но и вглубь.
🔹 Особенности 3D медецинских данных: обзор задачи анализа 3D-данных в медицине.
🔹 Прекрасное далёко. Где мы на пути к Метавёрсу: обсуждение вызовов, которые стоят перед инженерами 3D CV при строительстве Метавёрса.
❤26👍11🔥9🤔1
Почему логотип канала розовый или история одного пивота
Привет! Меня зовут Тимур, я один из основателей DeepSchool. Сегодня для нас знаменательное событие — мы сменим лого тг-канала🤩 Но перед этим расскажу, как вообще оно появилось :)
Учась в университете, я преподавал ML и DL в Технопарке Академгородка и в лицее рядом с универом. Уже тогда 8-классники учили RL, чтобы сажать квадрокоптеры на ML-олимпиадах😵 а скоро они выпускаются из универов, и я даже не представляю, что они умеют теперь💪
Спустя год ребята начали участвовать в олимпиадах, а спустя два — побеждать. И после нескольких призовых мест всё больше школ интересовались курсами по DL и меня пригласили преподавать сразу в 10+ школ
Вести очные занятия, разумеется, стало невозможно, да и повторять материал 10 раз — сомнительное удовольствие. Поэтому я перенёс программу в ютуб, а курс назвал DeepSchool и поставил милый розовый логотип
Затем, летом 2021 года, пока школьники отдыхали, появилось свободное время после работы и пришла идея создать курсы повышения квалификации уже не для школьников/студентов, а для практиков. Мне самому не хватало программы, на которой опытные ребята из сферы разложили бы все по полочкам в каждой задаче от краудсорсинга до деплоя сервисов. Хоть я уже 2 года как я перешел из «ресёрча» в «индустрию», у меня все равно оставалось миллион вопросов. Да и всегда появлялись новые)
В первой итерации мы провели интервью, собрали программу и запустили курс с 6 спикерами. Теперь спикеров 12, а недавно мы запустили 7-й поток! А история со школами завершилась требованиями очных занятий, которые я физически не мог вести, и в последствии появлением новых студентов-преподавателей, которые пришли на смену мне.
А логотип у канала, который подразумевался для школьников, так и остался…) Пора бы уже и сменить!🫡
Кстати, недавно мы сменили и дизайн нашего сайта. Забегайте посмотреть, поделитесь в комментариях, какой нравится больше, новый или старый)
Привет! Меня зовут Тимур, я один из основателей DeepSchool. Сегодня для нас знаменательное событие — мы сменим лого тг-канала🤩 Но перед этим расскажу, как вообще оно появилось :)
Учась в университете, я преподавал ML и DL в Технопарке Академгородка и в лицее рядом с универом. Уже тогда 8-классники учили RL, чтобы сажать квадрокоптеры на ML-олимпиадах
Спустя год ребята начали участвовать в олимпиадах, а спустя два — побеждать. И после нескольких призовых мест всё больше школ интересовались курсами по DL и меня пригласили преподавать сразу в 10+ школ
Вести очные занятия, разумеется, стало невозможно, да и повторять материал 10 раз — сомнительное удовольствие. Поэтому я перенёс программу в ютуб, а курс назвал DeepSchool и поставил милый розовый логотип
Затем, летом 2021 года, пока школьники отдыхали, появилось свободное время после работы и пришла идея создать курсы повышения квалификации уже не для школьников/студентов, а для практиков. Мне самому не хватало программы, на которой опытные ребята из сферы разложили бы все по полочкам в каждой задаче от краудсорсинга до деплоя сервисов. Хоть я уже 2 года как я перешел из «ресёрча» в «индустрию», у меня все равно оставалось миллион вопросов. Да и всегда появлялись новые)
В первой итерации мы провели интервью, собрали программу и запустили курс с 6 спикерами. Теперь спикеров 12, а недавно мы запустили 7-й поток! А история со школами завершилась требованиями очных занятий, которые я физически не мог вести, и в последствии появлением новых студентов-преподавателей, которые пришли на смену мне.
А логотип у канала, который подразумевался для школьников, так и остался…) Пора бы уже и сменить!
Кстати, недавно мы сменили и дизайн нашего сайта. Забегайте посмотреть, поделитесь в комментариях, какой нравится больше, новый или старый)
Please open Telegram to view this post
VIEW IN TELEGRAM
👍34❤15🥰7🍾5👏3❤🔥2🤔1
Адаптация SAM под 3D медицинские данные
В компьютерном зрении уже давно активно используются трансформеры, такие как Segment Anything Model. Однако при работе с 3D медицинскими данными применение обученного на 2D изображениях SAM не всегда эффективно.
В статье вы узнаете:
- Как с помощью low-rank адаптации настроить SAM для работы с медицинскими снимками
- Как заставить SAM учитывать связи между срезами 3D изображений
- Где найти таймлайн статей по SAM в медицине
Читайте статью по ссылке: https://www.notion.so/deepschool-pro/SAM-3D-f21f005dcd734b35a8ac80303c82a483?pvs=4
В компьютерном зрении уже давно активно используются трансформеры, такие как Segment Anything Model. Однако при работе с 3D медицинскими данными применение обученного на 2D изображениях SAM не всегда эффективно.
В статье вы узнаете:
- Как с помощью low-rank адаптации настроить SAM для работы с медицинскими снимками
- Как заставить SAM учитывать связи между срезами 3D изображений
- Где найти таймлайн статей по SAM в медицине
Читайте статью по ссылке: https://www.notion.so/deepschool-pro/SAM-3D-f21f005dcd734b35a8ac80303c82a483?pvs=4
deepschool-pro on Notion
Адаптация SAM под 3D медицинские данные | Notion
Автор: Александр Лекомцев
Редактура: Булат Бадамшин
Редактура: Булат Бадамшин
🔥32👍14❤8🤯4🤔1
Запускаем подкаст «Кухонная Академия»!
В нём обсуждаем технологии, статьи и быт людей, получающих PhD, в живом формате, прямо "на кухне".☕️
Ведущие подкаста, спикеры нашего курса по 3D CV:
— Давид Свитов, PhD @ IIT, ex Samsung AI Center
— Оля Гребенькова, CS PhD student @ LMU Munich
— Артур Григорьев, PhD student — AIT lab @ ETH Zurich
— Дима Чудаков, CV инженер @ 2GIS
В первом выпуске ребята обсудили:
— общение с научными руководителями
— авторство в статьях
— что выйдет после SORA
— и когда ждать нейросети в играх
Смотрите выпуск по ссылке: https://youtu.be/eVaY8IAQBEA
Расскажите, как вам такой разговорный формат? Будем рады обратной связи по пилотному выпуску 🔥
В нём обсуждаем технологии, статьи и быт людей, получающих PhD, в живом формате, прямо "на кухне".
Ведущие подкаста, спикеры нашего курса по 3D CV:
— Давид Свитов, PhD @ IIT, ex Samsung AI Center
— Оля Гребенькова, CS PhD student @ LMU Munich
— Артур Григорьев, PhD student — AIT lab @ ETH Zurich
— Дима Чудаков, CV инженер @ 2GIS
В первом выпуске ребята обсудили:
— общение с научными руководителями
— авторство в статьях
— что выйдет после SORA
— и когда ждать нейросети в играх
Смотрите выпуск по ссылке: https://youtu.be/eVaY8IAQBEA
Расскажите, как вам такой разговорный формат? Будем рады обратной связи по пилотному выпуску 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Кухонная академия: научники, статьи и нейронки в играх
В «Кухонной академии» обсуждаем технологии, статьи и быт людей, получающих PhD.
В этом выпуске поговорили об общении с научными руководителями, обсудили интересные статьи и когда ждать нейросети в играх.
Присоединяйтесь к нашему курсу 3DCV: https://dee…
В этом выпуске поговорили об общении с научными руководителями, обсудили интересные статьи и когда ждать нейросети в играх.
Присоединяйтесь к нашему курсу 3DCV: https://dee…
🔥28❤🔥10👏7👍1🤔1
Лекция "Погружение в 3D CV"
Если вы тоже стали чаще замечать термины, задачи и инструменты из мира 3D, вам интересно узнать, что они значат и что происходит в индустрии, приходите на открытую лекцию "Погружение в 3D CV".
На лекции вы узнаете:
- какие задачи решают в 3D
- почему таких задач становится больше
- с чего начать погружение в эту область
- почему CV-инженеру важно знакомиться с 3D
- что такое SLAM, SfM, SMPL, NeRF, 3D Gaussian Splatting и другие баззворды🐝
А также мы представим программу курса "3D Computer Vision" и подарим скидки участникам🎁
📌 Лекция пройдет в четверг, 25 апреля, 18:00 МСК
💡 Всем, кто зарегистрируется на встречу, мы отправим miro-схему с описанием направлений и инструментов в 3D — поможет быстро сориентироваться и погрузиться.
Регистрируйтесь по ссылке!
Если вы тоже стали чаще замечать термины, задачи и инструменты из мира 3D, вам интересно узнать, что они значат и что происходит в индустрии, приходите на открытую лекцию "Погружение в 3D CV".
На лекции вы узнаете:
- какие задачи решают в 3D
- почему таких задач становится больше
- с чего начать погружение в эту область
- почему CV-инженеру важно знакомиться с 3D
- что такое SLAM, SfM, SMPL, NeRF, 3D Gaussian Splatting и другие баззворды🐝
А также мы представим программу курса "3D Computer Vision" и подарим скидки участникам🎁
📌 Лекция пройдет в четверг, 25 апреля, 18:00 МСК
💡 Всем, кто зарегистрируется на встречу, мы отправим miro-схему с описанием направлений и инструментов в 3D — поможет быстро сориентироваться и погрузиться.
Регистрируйтесь по ссылке!
❤21🔥14👍8
Под Капотом. Игорь Ильин. Про будущее, карьеру и нетворкинг. Часть 2/2
Встречайте вторую часть подкаста с Игорем Ильиным! Игорь — Senior SLAM разработчика в Kudan io и спикер курса 3D CV от DeepSchool. В первой части мы говорили про технологии: 3D, лидары, SLAM. А сейчас больше углубились в карьеру, нетворкинг и немного пофантазировали о том, когда появятся разные технологии. А именно:
— Попробовали предсказать, когда появятся андроиды
— Обсудили, как совмещать работу, учёбу, преподавание и личную жизнь (да-да и всё сразу)
— Что могут спросить на собеседовании по SLAM
— Хватает ли онлайна для нетворкинга
Смотрите выпуск по ссылке: https://youtu.be/7G3SffDyK4Q
Встречайте вторую часть подкаста с Игорем Ильиным! Игорь — Senior SLAM разработчика в Kudan io и спикер курса 3D CV от DeepSchool. В первой части мы говорили про технологии: 3D, лидары, SLAM. А сейчас больше углубились в карьеру, нетворкинг и немного пофантазировали о том, когда появятся разные технологии. А именно:
— Попробовали предсказать, когда появятся андроиды
— Обсудили, как совмещать работу, учёбу, преподавание и личную жизнь (да-да и всё сразу)
— Что могут спросить на собеседовании по SLAM
— Хватает ли онлайна для нетворкинга
Смотрите выпуск по ссылке: https://youtu.be/7G3SffDyK4Q
YouTube
Под Капотом | Игорь Ильин: будущее, work-life-balance, нетворкинг. Часть 2/2
#computervision #cv #worklifebalance #career #networking
На подкасте «Под капотом» мы говорим с экспертами из различных областей, чтобы понять, как работают сложные системы изнутри.
Продолжили разговор с Игорем Ильиным, Senior SLAM разработчиком и спикером…
На подкасте «Под капотом» мы говорим с экспертами из различных областей, чтобы понять, как работают сложные системы изнутри.
Продолжили разговор с Игорем Ильиным, Senior SLAM разработчиком и спикером…
👍18❤13🔥8🤔1
DeepSchool
Лекция "Погружение в 3D CV" Если вы тоже стали чаще замечать термины, задачи и инструменты из мира 3D, вам интересно узнать, что они значат и что происходит в индустрии, приходите на открытую лекцию "Погружение в 3D CV". На лекции вы узнаете: - какие задачи…
🔥Начинаем через 2 часа
Вы ещё успеваете зарегистрироваться!
На лекции разберём:
1️⃣ какие задачи решают в 3D
2️⃣ почему таких задач становится больше
3️⃣ с чего начать погружение в эту область
4️⃣ почему CV-инженеру важно знакомиться с 3D
5️⃣ что такое SLAM, SfM, SMPL, NeRF, 3D Gaussian Splatting
И представим программу курса 3D CV.
Присоединяйтесь к лекции!
Вы ещё успеваете зарегистрироваться!
На лекции разберём:
И представим программу курса 3D CV.
Присоединяйтесь к лекции!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤8🔥6
Как научиться решать 3D CV задачи
Вчера прошла открытая лекция «Погружение в 3D CV», на которой мы рассказали о терминах, инструментах и задачах 3D CV, обсудили, почему эта область становится популярнее и почему CV-инженеру важно с ней знакомиться.
Также представили обновлённый курс 3D Computer Vision!
3D CV — это программа, на которой вы научитесь решать 3D задачи: сегментировать лидарные облака, писать SLAM алгоритмы, строить 3D-модели объектов, создавать аватаров, синтезировать данные в Blender, обучать NeRF, 3D Gaussian Splatting и другое.
Кратко о курсе:
🔹все лекции проходят онлайн (записи выкладываем в тот же вечер)
🔹8 спикеров из индустрии и ресерча
🔹13 лекций, 12 заданий
🔹4 месяца поддержки в чате и на онлайн-семинарах
Если вы не планируете переходить в области AR/VR, self-driving, GameDev, геосервисы, медтех и другие направления с активным применением 3D, то освоите работу с новыми сенсорами, научитесь решать 2D задачи новыми способами и расширите знания в CV.
🎁 До 29 апреля вы можете присоединиться к сильной команде инженеров (и тут мы не только про спикеров, но и про студентов) со скидкой!
Старт потока 30 апреля.
Подробнее о программе, спикерах и скидках на сайте программы — присоединяйтесь к обучению!
До встречи на лекциях!🎓
Вчера прошла открытая лекция «Погружение в 3D CV», на которой мы рассказали о терминах, инструментах и задачах 3D CV, обсудили, почему эта область становится популярнее и почему CV-инженеру важно с ней знакомиться.
Также представили обновлённый курс 3D Computer Vision!
3D CV — это программа, на которой вы научитесь решать 3D задачи: сегментировать лидарные облака, писать SLAM алгоритмы, строить 3D-модели объектов, создавать аватаров, синтезировать данные в Blender, обучать NeRF, 3D Gaussian Splatting и другое.
Кратко о курсе:
🔹все лекции проходят онлайн (записи выкладываем в тот же вечер)
🔹8 спикеров из индустрии и ресерча
🔹13 лекций, 12 заданий
🔹4 месяца поддержки в чате и на онлайн-семинарах
Если вы не планируете переходить в области AR/VR, self-driving, GameDev, геосервисы, медтех и другие направления с активным применением 3D, то освоите работу с новыми сенсорами, научитесь решать 2D задачи новыми способами и расширите знания в CV.
🎁 До 29 апреля вы можете присоединиться к сильной команде инженеров (и тут мы не только про спикеров, но и про студентов) со скидкой!
Старт потока 30 апреля.
Подробнее о программе, спикерах и скидках на сайте программы — присоединяйтесь к обучению!
До встречи на лекциях!
Please open Telegram to view this post
VIEW IN TELEGRAM
deepschool.ru
Курс 3D CV — DeepSchool
Узнаете, какие задачи есть в 3D CV и научитесь решать их на практике
🔥12❤11👍9
Очень короткий: подберите веса для одного или нескольких сверточных слоев так, чтобы из изображения А получить B, C или D.
⚠️Важно: обучать модель нельзя, такое решение мы не засчитаем.
Советуем: отключить баес и не использовать активации между свертками.
🍕Авторам верных ответов отправим пиццу! По одной на каждую картинку.
🍕И бонусом подарим пиццу за самое подробное и интересное рассуждение!
Итого можно выиграть 4 пиццы и не готовить 2 дня
В комментариях напишите код или псевдокод для получения одной из заданных картинок.
Результаты подведем завтра вечером!
# Исходная картинка
img = torch.tensor([
[0, 0, 0, 0, 0, 0],
[0, 1, 1, 1, 1, 0],
[0, 1, 2, 2, 1, 0],
[0, 1, 2, 2, 1, 0],
[0, 1, 1, 1, 1, 0],
[0, 0, 0, 0, 0, 0],
])[None, None,...]
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥41👍18🐳11❤5😁2
Ответ на вопрос с собеседования 💼
❶ Матрица весов для B:
вместе с паддингом (0, 2) свертка дает желаемую картинку. Ещё можно использовать свертку 5х5, заполнив все строчки нулями, кроме центральной.
❷ Матрица весов для D:
❸ Изображение C оказалось самым сложным. Тут мы добавили небольшой секрет 🤫 Его можно получить из D применением следующей свертки:
Изображения B и D легко поддались и вы нашли правильные ответы быстрее, чем за час! Изображение C было тяжелее, но зато получило самое необычное решение.
Итак, победители, к которым отправляются пиццы:
🍕 @Storks89 — первым нашел решение для изображения B
🍕 @science_boy — первым нашел решение для изображения D
🍕 @vdjakov — 2 пиццы за правильное решение для изображения С и за интересный подход с использованием СЛАУ для подбора весов свёрточного слоя!
❶ Матрица весов для B:
[1, 0, 0, 0, 1],
вместе с паддингом (0, 2) свертка дает желаемую картинку. Ещё можно использовать свертку 5х5, заполнив все строчки нулями, кроме центральной.
❷ Матрица весов для D:
[[1, 0, 0, 0, 1],
[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0],
[1, 0, 0, 0, 1]]
❸ Изображение C оказалось самым сложным. Тут мы добавили небольшой секрет 🤫 Его можно получить из D применением следующей свертки:
weight = torch.tensor([
[1, 0, 1],
[0, 0, 0],
[1, 0, 1],
], dtype=torch.float32)[None, None, ...]
result = torch.nn.functional.conv2d(image_d, weight, padding=3, dilation=3)
Изображения B и D легко поддались и вы нашли правильные ответы быстрее, чем за час! Изображение C было тяжелее, но зато получило самое необычное решение.
Итак, победители, к которым отправляются пиццы:
🍕 @Storks89 — первым нашел решение для изображения B
🍕 @science_boy — первым нашел решение для изображения D
🍕 @vdjakov — 2 пиццы за правильное решение для изображения С и за интересный подход с использованием СЛАУ для подбора весов свёрточного слоя!
🔥38❤12👍8🤯2
Основные термины и инструменты в Generative Computer Vision
Последние 2 года самая обсуждаемая и быстро развивающаяся тема в DL — генеративные модели. В CV это DALL-E, Midjourney, Stable Diffusion и прочие.
Но на волне хайпа многие забывают, что помимо генерации авокадо-кресел, генеративки используют для реконструкции и генерации снимков в медицине, восстановления невидимой части объектов в робототехнике, в онлайн-примерочных в фешн-индустрии, в рекламе, дизайне и других областях.
Мы тоже видим популярность и развитие генеративных моделей и хотим помочь вам разобраться в этом направлении. Поэтому вместе с инженерами и исследователями из области создаём курс Generative Computer Vision, а также готовим серию материалов.
Наша программа позволит вам разобраться в теории генеративных моделей и, разумеется, отточить все навыки на практике. Мы хотим учесть ваши пожелания и поэтому предлагаем поучаствовать в небольшом опросе.
Если вам интересно направление Генеративного Computer Vision, заполните, пожалуйста, короткую форму. Это займёт 3-5 минут.
Вы можете пройти опрос вне зависимости от вашего грейда или направления в DL, нам важно мнение каждого, кому интересна область Gen CV.
Для всех заполнивших мы подготовили zoom-лекцию по основным терминам и инструментам в Gen CV, на которой ответим на ваши вопросы и подарим скидки на обучение!🎓
Переходите по ссылке и заполняйте анкету.
Последние 2 года самая обсуждаемая и быстро развивающаяся тема в DL — генеративные модели. В CV это DALL-E, Midjourney, Stable Diffusion и прочие.
Но на волне хайпа многие забывают, что помимо генерации авокадо-кресел, генеративки используют для реконструкции и генерации снимков в медицине, восстановления невидимой части объектов в робототехнике, в онлайн-примерочных в фешн-индустрии, в рекламе, дизайне и других областях.
Мы тоже видим популярность и развитие генеративных моделей и хотим помочь вам разобраться в этом направлении. Поэтому вместе с инженерами и исследователями из области создаём курс Generative Computer Vision, а также готовим серию материалов.
Наша программа позволит вам разобраться в теории генеративных моделей и, разумеется, отточить все навыки на практике. Мы хотим учесть ваши пожелания и поэтому предлагаем поучаствовать в небольшом опросе.
Если вам интересно направление Генеративного Computer Vision, заполните, пожалуйста, короткую форму. Это займёт 3-5 минут.
Вы можете пройти опрос вне зависимости от вашего грейда или направления в DL, нам важно мнение каждого, кому интересна область Gen CV.
Для всех заполнивших мы подготовили zoom-лекцию по основным терминам и инструментам в Gen CV, на которой ответим на ваши вопросы и подарим скидки на обучение!
Переходите по ссылке и заполняйте анкету.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤26🔥13👍12🐳2🤔1
Введение в генеративный Computer Vision
Зрение — естественный, но крайне сложный процесс для человека. Мы не просто наблюдаем за каким-то объектом, мы смотрим на него сквозь призму наших знаний. Как научить компьютер воспринимать наш мир также? Один из способов — обучить его генеративному компьютерному зрению.
В статье рассказали:
- почему генеративный СV — один из путей к тому, чтобы компьютер понимал окружающий мир так же, как человек
- как генеративный Computer Vision применяется в разных областях
- какие задачи предстоит решить DL-инженерам и как в этом помогут генеративные модели
Читайте статью по ссылке: https://deepschool-pro.notion.site/Computer-Vision-452ba8f085e6477aa17123848e28b1f3
Зрение — естественный, но крайне сложный процесс для человека. Мы не просто наблюдаем за каким-то объектом, мы смотрим на него сквозь призму наших знаний. Как научить компьютер воспринимать наш мир также? Один из способов — обучить его генеративному компьютерному зрению.
В статье рассказали:
- почему генеративный СV — один из путей к тому, чтобы компьютер понимал окружающий мир так же, как человек
- как генеративный Computer Vision применяется в разных областях
- какие задачи предстоит решить DL-инженерам и как в этом помогут генеративные модели
Читайте статью по ссылке: https://deepschool-pro.notion.site/Computer-Vision-452ba8f085e6477aa17123848e28b1f3
deepschool-pro on Notion
Введение в генеративный Computer Vision | Notion
Автор: Кирам Аль-Харба
🔥33❤22👍14🐳2
Unsupervised Segmentation
Сегментация — одна из самых востребованных и важных задач компьютерного зрения, но разметка данных под неё часто трудоёмкий и дорогой процесс. Сейчас всё чаще обращаются к решениям, которые не требуют разметки, к self-supervised подходам.
В частности, успех DINO вдохновил исследователей использовать её «богатые» признаки для решения своих даунстрим задач, например, для сегментации изображения.
Из этой статьи вы узнаете, как объединить два успешных решения для инстанс и семантической сегментации в новое универсальное решение, которое позволит решить сразу три вида задач сегментации изображения.
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/Unsupervised-Segmentation-b91e2f7a5441488eb4e37f63ee0a1d2a?pvs=4
Сегментация — одна из самых востребованных и важных задач компьютерного зрения, но разметка данных под неё часто трудоёмкий и дорогой процесс. Сейчас всё чаще обращаются к решениям, которые не требуют разметки, к self-supervised подходам.
В частности, успех DINO вдохновил исследователей использовать её «богатые» признаки для решения своих даунстрим задач, например, для сегментации изображения.
Из этой статьи вы узнаете, как объединить два успешных решения для инстанс и семантической сегментации в новое универсальное решение, которое позволит решить сразу три вида задач сегментации изображения.
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/Unsupervised-Segmentation-b91e2f7a5441488eb4e37f63ee0a1d2a?pvs=4
deepschool-pro on Notion
Unsupervised Segmentation | Notion
Автор: Булат Бадамшин
Редактура: Александр Лекомцев
Редактура: Александр Лекомцев
👍27❤10⚡6
Задачка по генеративному CV
У вас есть обученный свёрточный декодер, генерирующий текстурные изображения на основе вектора случайного шума. Архитектура декодера состоит из свёрточных слоев и upsample блоков. Все свёрточные слои имеют стандартные параметры: kernel 3х3, padding 1 и stride 1.
Необходимо внести изменения в уже обученный декодер, чтобы генерировать бесшовные текстурные изображения, которые можно периодически замостить на бесконечной плоскости без видимых стыков.
На рисунке ниже изображены два варианта генерации текстур в виде железных труб. В первом варианте декодер без изменений генерирует текстуру, которая мостит бесконечную плоскость со стыками. Во втором — декодер с изменением генерирует текстуру, которая мостит без видимых стыков.
Ваша задача — предложить модификацию операции свёртки, которая позволит декодеру генерировать бесшовные текстурные изображения.
Пишите свои варианты в комментариях, а правильный ответ мы расскажем через несколько дней.
Автору первого правильного решения мы подарим пиццу🍕
Ждём ваши варианты в комментариях!👇
У вас есть обученный свёрточный декодер, генерирующий текстурные изображения на основе вектора случайного шума. Архитектура декодера состоит из свёрточных слоев и upsample блоков. Все свёрточные слои имеют стандартные параметры: kernel 3х3, padding 1 и stride 1.
Необходимо внести изменения в уже обученный декодер, чтобы генерировать бесшовные текстурные изображения, которые можно периодически замостить на бесконечной плоскости без видимых стыков.
На рисунке ниже изображены два варианта генерации текстур в виде железных труб. В первом варианте декодер без изменений генерирует текстуру, которая мостит бесконечную плоскость со стыками. Во втором — декодер с изменением генерирует текстуру, которая мостит без видимых стыков.
Ваша задача — предложить модификацию операции свёртки, которая позволит декодеру генерировать бесшовные текстурные изображения.
Пишите свои варианты в комментариях, а правильный ответ мы расскажем через несколько дней.
Автору первого правильного решения мы подарим пиццу
Ждём ваши варианты в комментариях!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥28👍14🤯12❤9🐳1