Заметки Computer Vision инженера
5.84K subscribers
35 photos
13 videos
332 links
Мои статьи из разных мест.
Моя телега - @wk_zb

Про консультации - https://telegra.ph/Pro-konsultacii-03-19
Про рекламу - https://telegra.ph/Pro-reklamu-v-bloge-03-19
Про политоту - https://telegra.ph/Pro-politiku-na-kanale-vo-izbezhanie-bana-04-11
Download Telegram
На прошлой неделе Intel сказал что RealSence все. Потом, правда, немного откатил назад и смягчил формулировку. Но осадочек остался. Поговорили с Васей "Кто если не", и обсудили варианты камер глубины.
https://youtu.be/79rdhdzd2V4
А сегодня поговорим о том что такое продакт менеджмент для машинного обучения. Как его готовят, как ML разработка с ним взаимодействует, и когда без него уже не обойтись. И прочее и прочее:)
https://youtu.be/BrLaHzHV1W8
Забавно, но в последнее время часто наталкивался на мысль "Сегментация это просто сегментация". Но в реальности на сегментации может быть масса других, в том числе необычных алгоритмов. Решил немного поговорить на эту тему.
https://youtu.be/uATZU2ABoYM
В последний раз пару раз просвещал людей на тему того "на чем обучать". Для профессионалов, наверное, бесполезное видел. Но знаю много людей, которые только входят в ML, или которые интегрируют ML продукты себе в прод - и им, наверное, должно зайти:)
https://youtu.be/o5lS--V0gsI
Ещё в августе Tesla выпустила классное видео про то как сейчас у них все устроено. Мне всегда приятно смотреть такие видюшки, они познавательны и приятно видеть в них какие-то идеи про которые уже думал или использовал. Сделал небольшое обзор про основные идеи которые мне там понравились.
https://youtu.be/QRR1bdMumJI
Недавно Московский Метрополитен объявил что в ближайший месяц начнет разворачивание системы FacePay на все метро, и все смогут ей пользоваться. Решил немного поговорить на эту тему, посмотреть на текущую статистику по NIST и проговорить другие варианты как можно повысить точность такой системы.
https://youtu.be/jgTaNg2InjY
Порой слышишь мнение что One-Shot-Learning это некоторая универсальная серебряная пуля которой можно решить любую задачу. Но реальность и маркетинговые трюки как всегда разнятся. Поговорим о том что можно назвать ZeroShot learning и где его в реальности можно использовать.
https://youtu.be/5YShYKayua0
Одно из прошлых видео (про нестандартные применения сегментации) вроде неплохо зашло. И я решил по его мотивам поговорить о том когда можно обойтись без детекции. Поговорим о том когда детекцию эффективно заменить не только сегментацией, но и регрессией, а иногда и классификацией.
https://youtu.be/QiilFXx8VTg
Когда-то я уже писал в блоге на тему самого главного навыка в DS. Но дело было давно, так что решил обновить и записать коротенькое видео. Немного о адекватности:)
https://youtu.be/oJIXla41H1E
Сегодня классное видео. Поговорили с Григорием (CTO Xperience AI) о том, куда движется сегодняшняя Embedded разработка в Computer Vision. Насколько становится все быстрее, насколько удобнее, и будет ли там место для OpenCV.
https://youtu.be/0pc8gjxCcBs
Есть одна тема, на счет которой я могу говорить бесконечно. Да ладно, половина моих статей на Хабре про эту тему:)
Но отдельного видео на эту тему ни разу не делал. Небольшой рассказ о том что такое pet-проекты в ComputerVision, зачем они нужны, насколько их реально монетизировать, и насколько они полезны при устройстве на работу.
https://youtu.be/Yn5RJUVXTVQ
Я думаю что ruDALL-E - одна из самых интересных и наглядных работ этой осени. Хорошая комбинация их понятных сеток и море залитых ресурсов дают очень красивый результат.
Но поговорить я хочу не об этом. Несколько мыслей на тему "насколько это все полезно для небольших стартапов", "куда бы это вообще эти технологии приткнуть" и "как бороться с плохим качеством".
https://youtu.be/dipsep_XbiQ
За последние полгода пару раз наталкивался на тематику рендеринга. И в наших проектах, и просто из интереса. Решил все это дело обобщить и немного скомпоновать для себя. А лучший способ это сделать - статья на Хабр - https://habr.com/ru/company/recognitor/blog/593833/
Далее в комментах к посту - ссылка на youtube + попытка запостить то же самое в vc:)
Постановки задачи для любой CV проблемы - залог хорошего качества работы системы.
Если правильно поставить задачу, придумав логику использования, тогда не только точность будет выше, но и ощущения от использования.
Ровно поэтому я периодически возвращаюсь к этой теме с разных сторон. И раз уж в течение дня попалось два хороших примера, иллюстрирующих проблему - то почему бы не обсудить ещё раз, как делать надо, а как нет - https://youtu.be/prmaBf3S-Xs
А вот вам небольшой новогодний подарочек. Классное интервью с Максом Гончаровым (CEO Cherry Labs) на тему того насколько вообще ML нужен в стартапах, как все поменялось за последние лет 6-7, и как оценивается стартап с ML внутри.
https://youtu.be/yWJ-s7xbw7w
Всем привет!
Отдельный пост/видео делать наверное не буду, так что небольшая заметка. Вчера был рождественский коллоквиум. В целом - интересное мероприятие, стараюсь на него ходить/слушать последние года 4-5. Присутствовать, конечно, сильно интереснее, там можно потрепаться. Но в пандемию такого варианта нет.
https://www.youtube.com/watch?v=vrSCD88X8BU

Было три интересных обзорных доклада, два из которых мне весьма зашли:
1) Про квантизацию сеточек (QPP: Real-Time Quantization Parameter Prediction for Deep Neural Networks). Большую часть того что рассказывали я знал/на много натыкался. Но тут весьма стройный рассказ, есть инсайды и обзор алгоритмов (правда с акцентом на работу авторов).
2) Про детекторы ( State-of-the-art решения задач компьютерного зрения: Object detection, Semantic segmentation, Depth estimation ). Очень классный обзор на тему того когда имеют смысл трансформеры, а когда свёрточные сеточки. Из минусов - не разобрана область embedded + нет оценки того как все это плывет если датасеты небольшие (по паре тысяч кадров). Но, с другой стороны, это увеличило бы размер рассказа раза в 2. Для себя неплохо структурировал логику в паре моментов.
3) В целом неплохой обзор трансформеров и последних двух лет их внедрения с CV ( Transformers for Computer Vision ). Но для себя ничего нового не открыл.

Остальные доклады тоже весьма достойны. Но советовать их странно, они про весьма конкретные ресерчи в конкретных областях. Плюс, многое из них - почти дословный текст публикации. Мне было любопытно посмотреть некоторые из них, так как я их пропустил. Но советовать для просмотра всем наверное не буду.
Немного посмеялся. В прошлой статье на Хабре, в которой я говорил про генерацию людей(позы/одежда, и.т.д.), была одна статья в которой были очень крутые результаты. Я, естественно, поставил ремарку "сорсов нет, верить нельзя". Сорсы выложили. Качество, естественно, не соответствует картинкам из презентации:)
Не впервой. Cherry Picking - популярная штука. Решил написать небольшую заметку с примерами где статьи могут недоговаривать - https://cv-blog.ru/?p=458
А у вас есть прикольные истории из практики то как статьи кардинально не соответствовала реальности?:)
🔥115💩1
Давно хотел написать обстоятельную статью о том какие задачи решает Action Recognition. Какой он бывает и зачем нужен. Мне кажется что рассмотреть в статье все - принципиально невозможно. Есть множество кастомных методов и их гибридов. Но основные способы решить реальные задачи, как мне кажется, я описал.
Видео к статье в коментах.
https://habr.com/ru/company/recognitor/blog/647343/
🔥20😱1