Как работают продуктовые Computer Vision команды?
DeepSchool зародился летом 2021 года, когда мы создали наш первый онлайн-курс Computer Vision Rocket.
Идея создания курса пришла с осознанием того, как много DL-инженеров разбирается в математике, и как мало из них «хорошо программируют», а еще меньше умеют в «командную разработку».
… подумали мы и сделали такую программу. В этом месяце стартует 7 поток!
И мы хотим рассказать вам больше о разработке CV-приложений в индустрии и о нашем курсе!
Но чтобы не утомить читателей канала, которым эта тема не интересна, создали отдельный: CV Rocket
Подписывайтесь, если хотите утянуть к себе пару полезных техник/фреймворков/подходов и узнать больше о том, как работают в DL-командах!
DeepSchool зародился летом 2021 года, когда мы создали наш первый онлайн-курс Computer Vision Rocket.
Идея создания курса пришла с осознанием того, как много DL-инженеров разбирается в математике, и как мало из них «хорошо программируют», а еще меньше умеют в «командную разработку».
Вот был бы курс, куда приходишь и тебе ребята из индустрии рассказывают:
- как управлять экспериментами и данными внутри команды
- что такое хороший код и как его поддерживать
- как создавать веб-сервисы
- какие фреймворки для каких задач использовать
- какие сложности встречаются в разных CV-задачах и как их решать
В общем, показали бы как работают CV-команды, на вопросы ответили бы и весь мой код отревьюили🤩
… подумали мы и сделали такую программу. В этом месяце стартует 7 поток!
И мы хотим рассказать вам больше о разработке CV-приложений в индустрии и о нашем курсе!
Но чтобы не утомить читателей канала, которым эта тема не интересна, создали отдельный: CV Rocket
Подписывайтесь, если хотите утянуть к себе пару полезных техник/фреймворков/подходов и узнать больше о том, как работают в DL-командах!
Telegram
DeepSchool | CV Rocket
О том, как работать в продуктовой CV-команде:
- обзоры фреймворков/подходов/сервисов
- советы опытных инженеров
- интервью и лекции от практиков
CVRocket — курс, где мы учим решать end-to-end CV задачи с командным подходом к разработке
От @deep_school
- обзоры фреймворков/подходов/сервисов
- советы опытных инженеров
- интервью и лекции от практиков
CVRocket — курс, где мы учим решать end-to-end CV задачи с командным подходом к разработке
От @deep_school
👍26❤10🔥6
Девушки, поздравляем с вашим днем! 💐
Статистика нашего канала говорит, что в Data Science мужчин в 4 раза больше, чем женщин!
И в это начинаешь верить, вспоминая составы команд на работе))
Но знайте, коллеги всегда готовы вас поддержать, помочь, подсказать и выслушать. Ведь важно не количество, важно какие вы умные, образованные и уникальные!
Пусть весна будет по-настоящему теплой для вас! С вашим днем!
Статистика нашего канала говорит, что в Data Science мужчин в 4 раза больше, чем женщин!
И в это начинаешь верить, вспоминая составы команд на работе))
Но знайте, коллеги всегда готовы вас поддержать, помочь, подсказать и выслушать. Ведь важно не количество, важно какие вы умные, образованные и уникальные!
Пусть весна будет по-настоящему теплой для вас! С вашим днем!
Please open Telegram to view this post
VIEW IN TELEGRAM
🍾51❤39👏7🤔3👍2😁2
3D Gaussian Splatting
Gaussian Splatting (GS) — новый метод рендеринга, которому прочат большое будущее в индустрии компьютерной графики. Gaussian Splatting превосходит state-of-the-art методы, сочетая высокое качество синтеза с быстротой обучения и отрисовки. Сейчас активно разрабатывают новые применения метода. Использовать GS уже можно в самых разнообразных задачах: от 3D-аватаров до навигации.
Из текста вы узнаете, как Gaussian Splatting:
- использует гауссианы для представления трёхмерного пространства
- позволяет эффективно отрисовать новые изображения для сцены
- обучается создавать детализированное представление сцены
Читайте нашу статью по ссылке: https://www.notion.so/deepschool-pro/3D-Gaussian-Splatting-Revolutionizing-Real-Time-Radiance-Field-Rendering-73cfad31a57c443d9c073f2b7aa246eb?pvs=4
Gaussian Splatting (GS) — новый метод рендеринга, которому прочат большое будущее в индустрии компьютерной графики. Gaussian Splatting превосходит state-of-the-art методы, сочетая высокое качество синтеза с быстротой обучения и отрисовки. Сейчас активно разрабатывают новые применения метода. Использовать GS уже можно в самых разнообразных задачах: от 3D-аватаров до навигации.
Из текста вы узнаете, как Gaussian Splatting:
- использует гауссианы для представления трёхмерного пространства
- позволяет эффективно отрисовать новые изображения для сцены
- обучается создавать детализированное представление сцены
Читайте нашу статью по ссылке: https://www.notion.so/deepschool-pro/3D-Gaussian-Splatting-Revolutionizing-Real-Time-Radiance-Field-Rendering-73cfad31a57c443d9c073f2b7aa246eb?pvs=4
deepschool-pro on Notion
3D Gaussian Splatting: Revolutionizing Real-Time Radiance Field Rendering | Notion
Автор: Глеб Бобровских
Редактура: Давид Свитов
Редактура: Давид Свитов
❤🔥23👍11❤7🔥3
Задачка про Docker 🖥
Мы завели канал DeepSchool | CV Rocket для того, чтобы рассказывать, как учить модели и как их потом доставлять до клиента (писать сервисы). И там, и там помогает Docker.
Предлагаем вам интерактив по нему: мы задаем вопрос, вы отвечаете в комментариях и получаете пиццу за правильный ответ!
Чтобы собрать docker-образ, в docker-файле нам обычно нужно перетащить весь код и установить зависимости. Это делают две строчки на изображении под этим постом. Они даже решат нашу задачу, но с ними что-то не так...🤔
Пишите в комментариях:
- что не так в этих строчках
- как их можно улучшить
Мы загадали два варианта решения. Первому комментарию на каждое из этих двух улучшений мы подарим пиццу 🍕
Варианты принимаются под постом с задачей в канале DeepSchool | CV Rocket до 14 марта 17:00 МСК. Потом мы выложим правильный вариант.
Ответ выложим там же через 2 дня.
Предлагайте свои решения!
Мы завели канал DeepSchool | CV Rocket для того, чтобы рассказывать, как учить модели и как их потом доставлять до клиента (писать сервисы). И там, и там помогает Docker.
Предлагаем вам интерактив по нему: мы задаем вопрос, вы отвечаете в комментариях и получаете пиццу за правильный ответ!
Чтобы собрать docker-образ, в docker-файле нам обычно нужно перетащить весь код и установить зависимости. Это делают две строчки на изображении под этим постом. Они даже решат нашу задачу, но с ними что-то не так...🤔
Пишите в комментариях:
- что не так в этих строчках
- как их можно улучшить
Мы загадали два варианта решения. Первому комментарию на каждое из этих двух улучшений мы подарим пиццу 🍕
Варианты принимаются под постом с задачей в канале DeepSchool | CV Rocket до 14 марта 17:00 МСК. Потом мы выложим правильный вариант.
Ответ выложим там же через 2 дня.
Предлагайте свои решения!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17❤7🔥7🤯3👏1
ModelSoups: варим суп из моделей
Если вы когда-нибудь участвовали в хакатоне или пытались повысить качество продуктового решения — скорее всего, вы уже сталкивались с усреднением предсказаний нейронных сетей. Но что делать, если мы хотим улучшить точность решения, не потратив при этом дополнительного времени на инференс нескольких моделей? Ответ есть: усреднение весов моделей, а не их выходов.
В 2022 году вышла статья, поймавшая тогда большой хайп: “Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time”. Авторы показали, как можно из нескольких моделей получить одну — лучшую по качеству модель за счет усреднения весов. В нашей статье мы подробно разобрали теорию и результаты, чтобы вы могли применять этот подход в своих задачах 🙂
Сегодня мы рассмотрим:
- Model Soups подход к усреднению весов модели и его результаты
- теорию подхода, а также границы применимости и сопутствующие требования
- применение подхода в СV и NLP направлениях
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/ModelSoups-2a26f819d3964a61ac7bdde0e48897c8?pvs=4
Если вы когда-нибудь участвовали в хакатоне или пытались повысить качество продуктового решения — скорее всего, вы уже сталкивались с усреднением предсказаний нейронных сетей. Но что делать, если мы хотим улучшить точность решения, не потратив при этом дополнительного времени на инференс нескольких моделей? Ответ есть: усреднение весов моделей, а не их выходов.
В 2022 году вышла статья, поймавшая тогда большой хайп: “Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time”. Авторы показали, как можно из нескольких моделей получить одну — лучшую по качеству модель за счет усреднения весов. В нашей статье мы подробно разобрали теорию и результаты, чтобы вы могли применять этот подход в своих задачах 🙂
Сегодня мы рассмотрим:
- Model Soups подход к усреднению весов модели и его результаты
- теорию подхода, а также границы применимости и сопутствующие требования
- применение подхода в СV и NLP направлениях
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/ModelSoups-2a26f819d3964a61ac7bdde0e48897c8?pvs=4
deepschool-pro on Notion
ModelSoups: варим суп из моделей | Notion
Автор: Дмитрий Раков
Редактура: Александр Лекомцев
Редактура: Александр Лекомцев
❤25🔥13👏7👍2🎉2🤩2🍾1
Как применяют CV в сейсморазведке
Есть малоизвестный (в силу своей специфики) домен, где можно применять CV — сейсморазведка. Сегодня мы познакомимся с этой наукой и расскажем, как в ней можно применить глубокие нейронные сети. А еще докажем, что многие задачи возможно представить как хорошо нам знакомые задачи компьютерного зрения.
Из статьи вы узнаете:
- что такое сейсморазведка
- как в ней применить подходы на основе глубоких нейронных сетей
- примеры открытых сейсмических данных
- как можно решить задачу их интерпретации с помощью CV
- и какие есть известные соревнования по МО на базе сейсмических датасетов
Если хотите узнать, как компьютерное зрение помогает находить нефть и другие полезные ископаемые — скорее переходите по ссылке: https://www.notion.so/deepschool-pro/CV-0ec38f8cd403420ab5570cdd4785503e?pvs=4
Есть малоизвестный (в силу своей специфики) домен, где можно применять CV — сейсморазведка. Сегодня мы познакомимся с этой наукой и расскажем, как в ней можно применить глубокие нейронные сети. А еще докажем, что многие задачи возможно представить как хорошо нам знакомые задачи компьютерного зрения.
Из статьи вы узнаете:
- что такое сейсморазведка
- как в ней применить подходы на основе глубоких нейронных сетей
- примеры открытых сейсмических данных
- как можно решить задачу их интерпретации с помощью CV
- и какие есть известные соревнования по МО на базе сейсмических датасетов
Если хотите узнать, как компьютерное зрение помогает находить нефть и другие полезные ископаемые — скорее переходите по ссылке: https://www.notion.so/deepschool-pro/CV-0ec38f8cd403420ab5570cdd4785503e?pvs=4
deepschool-pro on Notion
Как применяют CV в сейсморазведке | Notion
Автор: Булат Бадамшин
Редактура: Иван Перминов
Редактура: Иван Перминов
👍27❤14🔥12🤯4🐳1
5 инструментов эффективного DS-инженера
Выше мы писали, что любому DS-инженеру важно перенимать навыки и инструменты от разработчиков.
Ведь мы тоже пишем код, правим бизнес-логику, стараемся снижать bus factor и хотим, чтобы в проектах не было багов. Разве что следить нам приходится не только за кодом, но и за данными, экспериментами, моделями и прочими артефактами.
Чтобы упростить нашу жизнь, есть множество инструментов. Часть DS-специфичны (DVC, CML, MLFlow, etc), а часть просто перенята от коллег-разработчиков (CI/CD, тесты, конфиг-файлы, docker, etc).
🔥 И на ближайшей лекции мы расскажем о 5 важных инструментах!
А именно обсудим:
1️⃣ как использовать makefile для автоматизации рутины
2️⃣ какие тесты писать для моделинга
3️⃣ чем хорош lightning и как его использовать
4️⃣ как повысить качество кода с помощью линтеров
5️⃣ трекинг и визуализацию в CML
А также представим программу курса CV Rocket и подарим скидки на обучение!
🙋♂️ Спикер лекции — Егор Осинкин, Lead CV Engineer, EPAM
🗓 Встречаемся 21 марта, чт, 18:00 МСК!
Регистрируйтесь по ссылке!
После регистрации мы пришлем вам список полезных библиотек и сервисов для CV-инженеров!
Также в телеграм-боте будет краткий анализ CV-вакансий, где мы изучили, как менялись зарплаты, как они зависят от требований и от грейдов.
Зарегистрироваться
Выше мы писали, что любому DS-инженеру важно перенимать навыки и инструменты от разработчиков.
Ведь мы тоже пишем код, правим бизнес-логику, стараемся снижать bus factor и хотим, чтобы в проектах не было багов. Разве что следить нам приходится не только за кодом, но и за данными, экспериментами, моделями и прочими артефактами.
Чтобы упростить нашу жизнь, есть множество инструментов. Часть DS-специфичны (DVC, CML, MLFlow, etc), а часть просто перенята от коллег-разработчиков (CI/CD, тесты, конфиг-файлы, docker, etc).
А именно обсудим:
А также представим программу курса CV Rocket и подарим скидки на обучение!
🙋♂️ Спикер лекции — Егор Осинкин, Lead CV Engineer, EPAM
Регистрируйтесь по ссылке!
После регистрации мы пришлем вам список полезных библиотек и сервисов для CV-инженеров!
Также в телеграм-боте будет краткий анализ CV-вакансий, где мы изучили, как менялись зарплаты, как они зависят от требований и от грейдов.
Зарегистрироваться
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥9❤7🐳2
Где грань между синдромом самозванца и адекватной оценкой навыков и как планировать своё развитие как специалиста
Об этом мы поговорим на прямом эфире с Андреем Шадриковым сегодня 19 марта
Коротко об Андрее:
- Head of R&D Verigram
- команда Андрея занимает топовые места в главном бенчмарке по распознаванию лиц от NIST
- большую часть карьеры посвятил задачам биометрии
- организует митапы и выступает на них (BeeTech, Sberloga, Samsung AI Campus)
- преподает блок по распознаванию лиц на CV Rocket
🗓 19 марта в 18:00 МСК проведём интервью с Андреем, где обсудим:
- как адекватно оценить свой уровень
- какие задачи брать в первую очередь
- как составить роадмап развития в индустрии
- и как это развитие ускорить
Эфир пройдёт в нашем канале DeepSchool | CV Rocket
Переходите в канал и присоединяйтесь к нашему интервью!
До встречи на прямом эфире!🔥
Об этом мы поговорим на прямом эфире с Андреем Шадриковым сегодня 19 марта
Коротко об Андрее:
- Head of R&D Verigram
- команда Андрея занимает топовые места в главном бенчмарке по распознаванию лиц от NIST
- большую часть карьеры посвятил задачам биометрии
- организует митапы и выступает на них (BeeTech, Sberloga, Samsung AI Campus)
- преподает блок по распознаванию лиц на CV Rocket
- как адекватно оценить свой уровень
- какие задачи брать в первую очередь
- как составить роадмап развития в индустрии
- и как это развитие ускорить
Эфир пройдёт в нашем канале DeepSchool | CV Rocket
Переходите в канал и присоединяйтесь к нашему интервью!
До встречи на прямом эфире!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17❤🔥5👍5❤2👏1
DeepSchool
Где грань между синдромом самозванца и адекватной оценкой навыков и как планировать своё развитие как специалиста Об этом мы поговорим на прямом эфире с Андреем Шадриковым сегодня 19 марта Коротко об Андрее: - Head of R&D Verigram - команда Андрея занимает…
Мы начали, подключайтесь!🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10
Повышаем эффективность DS-инженеров
Напоминаем, что уже завтра проведём лекцию, на которой расскажем об инструментах, которые позволяют развиваться CV-инженеру и решать задачи эффективнее.
Обсудим:
1️⃣ как использовать makefile для автоматизации рутины
2️⃣ какие тесты писать для моделинга
3️⃣ чем хорош lightning и как его использовать
4️⃣ как повысить качество кода с помощью линтеров
5️⃣ трекинг и визуализацию в CML
Регистрируйтесь и приходите завтра в 18.00 МСК!
🔥 Ещё после регистрации вы получите список полезных библиотек и сервисов для CV-инженеров
До встречи на лекции!😉
Напоминаем, что уже завтра проведём лекцию, на которой расскажем об инструментах, которые позволяют развиваться CV-инженеру и решать задачи эффективнее.
Обсудим:
Регистрируйтесь и приходите завтра в 18.00 МСК!
До встречи на лекции!😉
Please open Telegram to view this post
VIEW IN TELEGRAM
DeepSchool | 5 инструментов для повышения эффективности DS-инженера
Онлайн-лекция"5 инструментов эффективного DS-инженера"
❤11🔥9👏7👍1
🔥Начинаем через 15 минут
Вы ещё успеваете зарегистрироваться!
На лекции разберём:
1️⃣ как использовать makefile для автоматизации рутины
2️⃣ как помогают тесты
3️⃣ чем хорош lightning и как его использовать
4️⃣ как повысить качество кода с помощью линтеров
5️⃣ трекинг и визуализацию в CML
И представим программу курса «CV Rocket»
Присоединяйтесь к лекции!
Вы ещё успеваете зарегистрироваться!
На лекции разберём:
И представим программу курса «CV Rocket»
Присоединяйтесь к лекции!
Please open Telegram to view this post
VIEW IN TELEGRAM
DeepSchool | 5 инструментов для повышения эффективности DS-инженера
Онлайн-лекция"5 инструментов эффективного DS-инженера"
❤9🔥5👏4
DETR
Для 2024 года трансформеры в различных задачах CV — частое явление, которым мало кого удивишь. Тем интереснее первые шаги ресёрчеров на пути использования знаменитой encoder-decoder архитектуры.
В середине 2020 года миру представили детектор DETR, или DEtection TRansformer. Он оказался способным решать задачу детекции напрямую: предсказывать список боксов и соответствующих им классов по изображению.
В этой статье мы:
- узнаем, как решать задачу детекции напрямую — без дополнительных методов по типу NMS (non-maximum suppression) или генерации анкоров
- детально разберем архитектуру DETR
- и посмотрим на результаты её применения в downstream задачах
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/DETR-ce96a32c90974db5825a3b6698a9ae2b?pvs=4
Для 2024 года трансформеры в различных задачах CV — частое явление, которым мало кого удивишь. Тем интереснее первые шаги ресёрчеров на пути использования знаменитой encoder-decoder архитектуры.
В середине 2020 года миру представили детектор DETR, или DEtection TRansformer. Он оказался способным решать задачу детекции напрямую: предсказывать список боксов и соответствующих им классов по изображению.
В этой статье мы:
- узнаем, как решать задачу детекции напрямую — без дополнительных методов по типу NMS (non-maximum suppression) или генерации анкоров
- детально разберем архитектуру DETR
- и посмотрим на результаты её применения в downstream задачах
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/DETR-ce96a32c90974db5825a3b6698a9ae2b?pvs=4
deepschool-pro on Notion
DETR | Notion
Автор: Герман Петров
Редактура: Булат Бадамшин
Редактура: Булат Бадамшин
👍25🔥19❤11
Как научиться решать end-to-end задачи в CV
Недавно мы провели лекцию об инструментах для ML-инженеров.
Спасибо, что пришли, задавали вопросы и делились впечатлениями!
На встрече мы представили программу курса CV Rocket.
И рады приветствовать всех, кто уже присоединился к 7-му потоку!🎓
Если вы хотите закрыть пробелы в знаниях Computer Vision и освоить весь путь создания DL-проектов: от сбора данных до деплоя веб-сервисов — приходите учиться на программу CV Rocket от нашей команды.
После обучения вы повысите свою ценность на рынке, улучшите процессы в команде и научитесь решать полный цикл CV-задач:
🔹собирать чистые данные
🔹быстрее обучать модели
🔹ускорять нейросети
🔹создавать веб-сервисы
🔹автоматизировать их деплой
🔹настраивать мониторинг приложений
🔹решать задачи распознавания лиц, текстов, генерации и многое другое
Что особенного в нашей программе:
🔸12 спикеров из разных отраслей и компаний
🔸много фидбека и общения со спикерами: на zoom-лекциях, в рамках code review, на семинарах и в чате
🔸сложные задачи: 2 больших end-to-end проекта, которые с гордостью можно добавить в резюме
До 28 марта у вас есть возможность присоединиться к обучению со скидкой 10.000 ₽ по промокоду 10CVR!
Или можете внести предоплату и зафиксировать за собой скидку и место на курсе до 1 апреля.
Подробнее о программе и спикерах читайте на сайте.
Присоединяйтесь к CV Rocket!🚀
И до встречи на лекциях!
Недавно мы провели лекцию об инструментах для ML-инженеров.
Спасибо, что пришли, задавали вопросы и делились впечатлениями!
На встрече мы представили программу курса CV Rocket.
И рады приветствовать всех, кто уже присоединился к 7-му потоку!
Если вы хотите закрыть пробелы в знаниях Computer Vision и освоить весь путь создания DL-проектов: от сбора данных до деплоя веб-сервисов — приходите учиться на программу CV Rocket от нашей команды.
После обучения вы повысите свою ценность на рынке, улучшите процессы в команде и научитесь решать полный цикл CV-задач:
🔹собирать чистые данные
🔹быстрее обучать модели
🔹ускорять нейросети
🔹создавать веб-сервисы
🔹автоматизировать их деплой
🔹настраивать мониторинг приложений
🔹решать задачи распознавания лиц, текстов, генерации и многое другое
Что особенного в нашей программе:
🔸12 спикеров из разных отраслей и компаний
🔸много фидбека и общения со спикерами: на zoom-лекциях, в рамках code review, на семинарах и в чате
🔸сложные задачи: 2 больших end-to-end проекта, которые с гордостью можно добавить в резюме
До 28 марта у вас есть возможность присоединиться к обучению со скидкой 10.000 ₽ по промокоду 10CVR!
Или можете внести предоплату и зафиксировать за собой скидку и место на курсе до 1 апреля.
Подробнее о программе и спикерах читайте на сайте.
Присоединяйтесь к CV Rocket!
И до встречи на лекциях!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10🔥8👍5
Grounding Dino
Мультимодальность сегодня — одна из самых популярных вещей в глубоком обучении. В новой статье мы рассмотрим, как на основе Grounding Dino можно добавить язык к задаче детекции объектов на изображениях. А ещё узнаем, что включение дополнительной модальности позволяет не только создавать запросы вида “самая правая кошечка”, но и находить объекты классов, которых нет в обучающей выборке.
Из этой статьи вы также узнаете:
- зачем нужна “дружба” между языком и картинками и какие у неё бонусы
- какая архитектура Grounding Dino
- как соединить модальности
- каким образом можно запустить и потрогать Grounding Dino
- как запустить и потрогать модель сегментации на основе Grounding Dino
- и как с помощью сегментации и диффузии заменить объект на картинке
Читайте нашу статью по ссылке: https://www.notion.so/deepschool-pro/Grounding-DINO-054a72d301d840ec99611cd76acba169?pvs=4
Мультимодальность сегодня — одна из самых популярных вещей в глубоком обучении. В новой статье мы рассмотрим, как на основе Grounding Dino можно добавить язык к задаче детекции объектов на изображениях. А ещё узнаем, что включение дополнительной модальности позволяет не только создавать запросы вида “самая правая кошечка”, но и находить объекты классов, которых нет в обучающей выборке.
Из этой статьи вы также узнаете:
- зачем нужна “дружба” между языком и картинками и какие у неё бонусы
- какая архитектура Grounding Dino
- как соединить модальности
- каким образом можно запустить и потрогать Grounding Dino
- как запустить и потрогать модель сегментации на основе Grounding Dino
- и как с помощью сегментации и диффузии заменить объект на картинке
Читайте нашу статью по ссылке: https://www.notion.so/deepschool-pro/Grounding-DINO-054a72d301d840ec99611cd76acba169?pvs=4
deepschool-pro on Notion
Grounding DINO: обучаем модель детекции понимать человеческий язык | Notion
Автор: Игорь Иткин
Редактура: Булат Бадамшин
Редактура: Булат Бадамшин
👍22🔥16❤12❤🔥1😁1
Дайджест статей за март
Встречайте первый дайджест статей на канале!
Мы собрали вместе все статьи за последний месяц и получилось очень разнообразно — от обучения сетей до 3D, от разбора трансформера для детекции до составления ансамбля моделей. Надеемся, что вы не упустите то, что вам интересно 🤗
Negative learning
Рассказываем, как обучиться с хорошими результатами на неидеальных датасетах с ошибками и противоречивыми данными:
- в чём ключевая идея подхода
- его плюсы и минусы
- и как добиться очень хороших результатов на шумных данных
3D Gaussian Splatting
Разбираемся, как обеспечить высокое качество сгенерированных 3D сцен вместе с быстротой обучения и отрисовки:
- как Gaussian Splatting использует гауссианы для представления трёхмерного пространства
- как позволяет эффективно отрисовать новые изображения для сцены
- как обучается создавать детализированное представление сцены
ModelSoups: варим суп из моделей
Изучаем, как усреднение весов моделей может улучшить точность итогового ансамбля:
- Model Soups подход к усреднению весов модели и его результаты
- теория подхода, а также границы применимости и сопутствующие требования
- применение подхода в СV и NLP направлениях
Как применяют CV в сейсморазведке
Познакомимся с применением DL в прикладной науке — сейсморазведке:
- что такое сейсморазведка
- как в ней применить подходы на основе глубоких нейронных сетей
- примеры открытых сейсмических данных
- как можно решить задачу их интерпретации с помощью CV
- и какие есть известные соревнования по МО на базе сейсмических датасетов
DETR
Препарируем пионера CV детекции на базе архитектуры трансформер:
- как решать задачу детекции напрямую — без дополнительных методов по типу NMS (non-maximum suppression) или генерации анкоров
- детальный разбор архитектуры DETR
- результаты её применения в downstream задачах
Grounding Dino
Выясняем, как мультимодальность улучшает детекцию объектов с помощью Grounding Dino:
- зачем нужна “дружба” между языком и картинками и какие у неё бонусы
- какая архитектура у Grounding Dino
- как соединить модальности
- каким образом можно запустить и потрогать Grounding Dino
✌️Что вам было интересно в этом месяце? О чём вы бы хотели прочитать на канале? Пишите в комментарии!
Встречайте первый дайджест статей на канале!
Мы собрали вместе все статьи за последний месяц и получилось очень разнообразно — от обучения сетей до 3D, от разбора трансформера для детекции до составления ансамбля моделей. Надеемся, что вы не упустите то, что вам интересно 🤗
Negative learning
Рассказываем, как обучиться с хорошими результатами на неидеальных датасетах с ошибками и противоречивыми данными:
- в чём ключевая идея подхода
- его плюсы и минусы
- и как добиться очень хороших результатов на шумных данных
3D Gaussian Splatting
Разбираемся, как обеспечить высокое качество сгенерированных 3D сцен вместе с быстротой обучения и отрисовки:
- как Gaussian Splatting использует гауссианы для представления трёхмерного пространства
- как позволяет эффективно отрисовать новые изображения для сцены
- как обучается создавать детализированное представление сцены
ModelSoups: варим суп из моделей
Изучаем, как усреднение весов моделей может улучшить точность итогового ансамбля:
- Model Soups подход к усреднению весов модели и его результаты
- теория подхода, а также границы применимости и сопутствующие требования
- применение подхода в СV и NLP направлениях
Как применяют CV в сейсморазведке
Познакомимся с применением DL в прикладной науке — сейсморазведке:
- что такое сейсморазведка
- как в ней применить подходы на основе глубоких нейронных сетей
- примеры открытых сейсмических данных
- как можно решить задачу их интерпретации с помощью CV
- и какие есть известные соревнования по МО на базе сейсмических датасетов
DETR
Препарируем пионера CV детекции на базе архитектуры трансформер:
- как решать задачу детекции напрямую — без дополнительных методов по типу NMS (non-maximum suppression) или генерации анкоров
- детальный разбор архитектуры DETR
- результаты её применения в downstream задачах
Grounding Dino
Выясняем, как мультимодальность улучшает детекцию объектов с помощью Grounding Dino:
- зачем нужна “дружба” между языком и картинками и какие у неё бонусы
- какая архитектура у Grounding Dino
- как соединить модальности
- каким образом можно запустить и потрогать Grounding Dino
✌️Что вам было интересно в этом месяце? О чём вы бы хотели прочитать на канале? Пишите в комментарии!
❤28🔥23👍13🐳1
Diffusion Models
Сегодня поговорим о моделях диффузии и их превосходстве над Generative Adversarial Networks (GANs) при создании высококачественных синтетических изображений. Познакомимся со статьёй “Diffusion Models Beat GANs on Image Synthesis”, авторы которой доказали: диффузионные модели помогают обеспечить наилучшее качество генерации изображений.
В статье также рассмотрим:
- процесс диффузии (forward и reverse)
- Denoising Diffusion Probabilistic Models (DDPM)
- большое количество ablation study
- обучение
- математику в первом приближении
- и ещё много чего :)
Читайте нашу новую статью по ссылке: https://www.notion.so/deepschool-pro/Diffusion-Models-Beat-GANs-on-Image-Synthesis-b178e701e6d44cac9df11a501067d666?pvs=4
Сегодня поговорим о моделях диффузии и их превосходстве над Generative Adversarial Networks (GANs) при создании высококачественных синтетических изображений. Познакомимся со статьёй “Diffusion Models Beat GANs on Image Synthesis”, авторы которой доказали: диффузионные модели помогают обеспечить наилучшее качество генерации изображений.
В статье также рассмотрим:
- процесс диффузии (forward и reverse)
- Denoising Diffusion Probabilistic Models (DDPM)
- большое количество ablation study
- обучение
- математику в первом приближении
- и ещё много чего :)
Читайте нашу новую статью по ссылке: https://www.notion.so/deepschool-pro/Diffusion-Models-Beat-GANs-on-Image-Synthesis-b178e701e6d44cac9df11a501067d666?pvs=4
deepschool-pro on Notion
Diffusion Models Beat GANs on Image Synthesis | Notion
Автор: Даниил Соловьёв
Редактура: Кирам Аль-Харба
Редактура: Кирам Аль-Харба
🔥37👍9❤6👏2
Полезные Linux-команды
Linux — неотъемлемая часть инструментария каждого Data Scientist'а.
В этой статье мы рассмотрим полезные команды, которые позволят:
- создавать виртуальные сессии
- профилировать ресурсы
- добавлять переменные окружения
А в конце вы найдёте шпаргалку с основными Linux-командами 😊
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/Linux-715cb84e836f402a911f28fa3c4e753a?pvs=4
Linux — неотъемлемая часть инструментария каждого Data Scientist'а.
В этой статье мы рассмотрим полезные команды, которые позволят:
- создавать виртуальные сессии
- профилировать ресурсы
- добавлять переменные окружения
А в конце вы найдёте шпаргалку с основными Linux-командами 😊
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/Linux-715cb84e836f402a911f28fa3c4e753a?pvs=4
deepschool-pro on Notion
Полезные Linux-команды | Notion
Автор: Александр Гончаренко
Редактура: Андрей Шадриков, Илья Бакалец
Редактура: Андрей Шадриков, Илья Бакалец
🔥27❤10👍7
Запускаем наш новый подкаст «Под капотом»!
В нём мы говорим с экспертами из различных областей, чтобы понять, как работают сложные системы изнутри.
Первый выпуск: 3D, SLAM и лидары🚗
Нашим гостем стал Игорь Ильин, Senior SLAM разработчик и спикер курса 3D CV от DeepSchool.
Вместе мы обсудили:
- что такое SLAM и как он связан с теорией управления
- принципы работы лидаров
- отличия компьютерного зрения в 3D от 2D
- сложно ли найти работу в 3D CV
Выпуск получился насыщенным, поэтому мы разделили его на две части. Скоро запостим следующую, там больше поговорили о жизни, карьере и будущем человечества 🙂
Смотрите подкаст на youtube!
Делитесь в комментариях, о чём бы вы хотели услышать в следующем выпуске!
В нём мы говорим с экспертами из различных областей, чтобы понять, как работают сложные системы изнутри.
Первый выпуск: 3D, SLAM и лидары
Нашим гостем стал Игорь Ильин, Senior SLAM разработчик и спикер курса 3D CV от DeepSchool.
Вместе мы обсудили:
- что такое SLAM и как он связан с теорией управления
- принципы работы лидаров
- отличия компьютерного зрения в 3D от 2D
- сложно ли найти работу в 3D CV
Выпуск получился насыщенным, поэтому мы разделили его на две части. Скоро запостим следующую, там больше поговорили о жизни, карьере и будущем человечества 🙂
Смотрите подкаст на youtube!
Делитесь в комментариях, о чём бы вы хотели услышать в следующем выпуске!
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Под Капотом | Игорь Ильин о мире 3D CV, SLAM и лидарах. Часть 1
#computervision #3d #3dcv #lidar #slam #cv #career
На подкасте «Под капотом» мы говорим с экспертами из различных областей, чтобы понять, как работают сложные системы изнутри.
В этот раз поговорили с Игорем Ильиным, Senior SLAM разработчиком и спикером…
На подкасте «Под капотом» мы говорим с экспертами из различных областей, чтобы понять, как работают сложные системы изнутри.
В этот раз поговорили с Игорем Ильиным, Senior SLAM разработчиком и спикером…
❤19🔥16👍6