Заметки Computer Vision инженера
5.84K subscribers
35 photos
13 videos
332 links
Мои статьи из разных мест.
Моя телега - @wk_zb

Про консультации - https://telegra.ph/Pro-konsultacii-03-19
Про рекламу - https://telegra.ph/Pro-reklamu-v-bloge-03-19
Про политоту - https://telegra.ph/Pro-politiku-na-kanale-vo-izbezhanie-bana-04-11
Download Telegram
Ещё в августе Tesla выпустила классное видео про то как сейчас у них все устроено. Мне всегда приятно смотреть такие видюшки, они познавательны и приятно видеть в них какие-то идеи про которые уже думал или использовал. Сделал небольшое обзор про основные идеи которые мне там понравились.
https://youtu.be/QRR1bdMumJI
Недавно Московский Метрополитен объявил что в ближайший месяц начнет разворачивание системы FacePay на все метро, и все смогут ей пользоваться. Решил немного поговорить на эту тему, посмотреть на текущую статистику по NIST и проговорить другие варианты как можно повысить точность такой системы.
https://youtu.be/jgTaNg2InjY
Порой слышишь мнение что One-Shot-Learning это некоторая универсальная серебряная пуля которой можно решить любую задачу. Но реальность и маркетинговые трюки как всегда разнятся. Поговорим о том что можно назвать ZeroShot learning и где его в реальности можно использовать.
https://youtu.be/5YShYKayua0
Одно из прошлых видео (про нестандартные применения сегментации) вроде неплохо зашло. И я решил по его мотивам поговорить о том когда можно обойтись без детекции. Поговорим о том когда детекцию эффективно заменить не только сегментацией, но и регрессией, а иногда и классификацией.
https://youtu.be/QiilFXx8VTg
Когда-то я уже писал в блоге на тему самого главного навыка в DS. Но дело было давно, так что решил обновить и записать коротенькое видео. Немного о адекватности:)
https://youtu.be/oJIXla41H1E
Сегодня классное видео. Поговорили с Григорием (CTO Xperience AI) о том, куда движется сегодняшняя Embedded разработка в Computer Vision. Насколько становится все быстрее, насколько удобнее, и будет ли там место для OpenCV.
https://youtu.be/0pc8gjxCcBs
Есть одна тема, на счет которой я могу говорить бесконечно. Да ладно, половина моих статей на Хабре про эту тему:)
Но отдельного видео на эту тему ни разу не делал. Небольшой рассказ о том что такое pet-проекты в ComputerVision, зачем они нужны, насколько их реально монетизировать, и насколько они полезны при устройстве на работу.
https://youtu.be/Yn5RJUVXTVQ
Я думаю что ruDALL-E - одна из самых интересных и наглядных работ этой осени. Хорошая комбинация их понятных сеток и море залитых ресурсов дают очень красивый результат.
Но поговорить я хочу не об этом. Несколько мыслей на тему "насколько это все полезно для небольших стартапов", "куда бы это вообще эти технологии приткнуть" и "как бороться с плохим качеством".
https://youtu.be/dipsep_XbiQ
За последние полгода пару раз наталкивался на тематику рендеринга. И в наших проектах, и просто из интереса. Решил все это дело обобщить и немного скомпоновать для себя. А лучший способ это сделать - статья на Хабр - https://habr.com/ru/company/recognitor/blog/593833/
Далее в комментах к посту - ссылка на youtube + попытка запостить то же самое в vc:)
Постановки задачи для любой CV проблемы - залог хорошего качества работы системы.
Если правильно поставить задачу, придумав логику использования, тогда не только точность будет выше, но и ощущения от использования.
Ровно поэтому я периодически возвращаюсь к этой теме с разных сторон. И раз уж в течение дня попалось два хороших примера, иллюстрирующих проблему - то почему бы не обсудить ещё раз, как делать надо, а как нет - https://youtu.be/prmaBf3S-Xs
А вот вам небольшой новогодний подарочек. Классное интервью с Максом Гончаровым (CEO Cherry Labs) на тему того насколько вообще ML нужен в стартапах, как все поменялось за последние лет 6-7, и как оценивается стартап с ML внутри.
https://youtu.be/yWJ-s7xbw7w
Всем привет!
Отдельный пост/видео делать наверное не буду, так что небольшая заметка. Вчера был рождественский коллоквиум. В целом - интересное мероприятие, стараюсь на него ходить/слушать последние года 4-5. Присутствовать, конечно, сильно интереснее, там можно потрепаться. Но в пандемию такого варианта нет.
https://www.youtube.com/watch?v=vrSCD88X8BU

Было три интересных обзорных доклада, два из которых мне весьма зашли:
1) Про квантизацию сеточек (QPP: Real-Time Quantization Parameter Prediction for Deep Neural Networks). Большую часть того что рассказывали я знал/на много натыкался. Но тут весьма стройный рассказ, есть инсайды и обзор алгоритмов (правда с акцентом на работу авторов).
2) Про детекторы ( State-of-the-art решения задач компьютерного зрения: Object detection, Semantic segmentation, Depth estimation ). Очень классный обзор на тему того когда имеют смысл трансформеры, а когда свёрточные сеточки. Из минусов - не разобрана область embedded + нет оценки того как все это плывет если датасеты небольшие (по паре тысяч кадров). Но, с другой стороны, это увеличило бы размер рассказа раза в 2. Для себя неплохо структурировал логику в паре моментов.
3) В целом неплохой обзор трансформеров и последних двух лет их внедрения с CV ( Transformers for Computer Vision ). Но для себя ничего нового не открыл.

Остальные доклады тоже весьма достойны. Но советовать их странно, они про весьма конкретные ресерчи в конкретных областях. Плюс, многое из них - почти дословный текст публикации. Мне было любопытно посмотреть некоторые из них, так как я их пропустил. Но советовать для просмотра всем наверное не буду.
Немного посмеялся. В прошлой статье на Хабре, в которой я говорил про генерацию людей(позы/одежда, и.т.д.), была одна статья в которой были очень крутые результаты. Я, естественно, поставил ремарку "сорсов нет, верить нельзя". Сорсы выложили. Качество, естественно, не соответствует картинкам из презентации:)
Не впервой. Cherry Picking - популярная штука. Решил написать небольшую заметку с примерами где статьи могут недоговаривать - https://cv-blog.ru/?p=458
А у вас есть прикольные истории из практики то как статьи кардинально не соответствовала реальности?:)
🔥115💩1
Давно хотел написать обстоятельную статью о том какие задачи решает Action Recognition. Какой он бывает и зачем нужен. Мне кажется что рассмотреть в статье все - принципиально невозможно. Есть множество кастомных методов и их гибридов. Но основные способы решить реальные задачи, как мне кажется, я описал.
Видео к статье в коментах.
https://habr.com/ru/company/recognitor/blog/647343/
🔥20😱1
Я достаточно много рассказывал про разметку данных, но всегда рассказывал с двух позиций. Либо со стороны разметки под конкретный небольшой проект, либо со стороны inhouse разметки для законченной команды/продукта. Но есть и другая интересная грань разметки - разметка под заказ. Когда нужно размечать много данных, поддерживая качество и для разных задач.
И сегодняшнее видео именно про эту сторону разметки. Мы поговорим с Романом, CSA в TrainDataSolution о том как разметка выглядит когда это основной бизнес процесс.
https://youtu.be/FH6nwtFR9nU
Небольшой рассказ о том какие вообще сейчас есть подходы к 3D сканированию. С каких стороны заходить, куда смотреть.
https://youtu.be/iUOBaBf9Y2A
Небольшой дисклеймер. Видео записывал за пару дней до выхода быстрой версии NeRF. И про этот вариант я вообще не рассказываю.
Но:
1) NeRF и его аналоги делаются на базе COLMAP. Который далеко не топовый, и про который я упоминаю. В целом этого пункта достаточно для того чтобы отследить его положение среди методов:)
2) И сам NeRF и другие аналогичные подходы не меняют расстановки в том что я рассказываю. Они не изменяют точность сканирования. Они не меняют точность SLAM-навигации. Максимум качество натягивания текстуры.
При этом как сама работа - он классный. И для каких-то задач он просто супер.
На днях ВкусВилл открыл умный магазин. Он открылся совсем рядом от меня - так что решил съездить посмотреть как устроен. Я уже делал обзор умного магазина от Азбуки Вкуса, так что есть с чем сравнить:)
https://youtu.be/JZP9z1jc54s
6🔥2😱2
Летс мэйк смалл эксперимент;)
Мне с месяц назад пришел Oak-D Lite, который я заказал на кикстартере. На мой взгляд он сильно интереснее позиционирует себя чем обычный Oak-D. Решил сделать небольшой обзор, с упором под те задачи где нам такие девайсы нужны. Посмотреть на конструктив, на теплоотвод, на качество 3D.
По дороге понял что обзор надо сделать на английском, ибо полезных видео по этой теме вообще нет. Так что сорян:)
https://youtu.be/jrdc-Xak154
🔥10