Заметки Computer Vision инженера
5.84K subscribers
35 photos
13 videos
332 links
Мои статьи из разных мест.
Моя телега - @wk_zb

Про консультации - https://telegra.ph/Pro-konsultacii-03-19
Про рекламу - https://telegra.ph/Pro-reklamu-v-bloge-03-19
Про политоту - https://telegra.ph/Pro-politiku-na-kanale-vo-izbezhanie-bana-04-11
Download Telegram
https://youtu.be/sVUJF50Jdqk
Есть темы в которых я плохо разбираюсь (например найм людей в проект). Конечно, за двенадцать лет работы я нанимал людей, но все же, не считаю что разбираюсь как это сделать интересно и правильно.
У Александра (автора https://t.me/snakers4 ) была прекрасная статья про найм - https://spark-in.me/post/silero-junior-ml-researcher . Мне очень понравился подход. Решил поговорить с ним про найм, про проблемы которые сегодня есть, и про то как он видит их решение. В комментарии к этому посту приложу запись подскаста в аудио варианте.
Давно хотел свести несколько своих разрозненных статей в один рассказ. Как декомпозировать CV задачу заказчика, перевести её в ТЗ и формализовать. Плюс попробовал немного над форматом поработать.
https://youtu.be/LynVS25Notk
Давно надо было сделать какой-то краткий обзор про OCR: что за зверь такой, с какой стороны подступаться. Конечно, описать все подробности в одном видео не реально. Но может, как-нибудь, запишу ещё несколько про отдельные задачи в OCR. Сейчас видео общее, с обзором подходов и существующих фреймворков.
https://youtu.be/-g9huhHXXJQ
Немного запоздалый обзор датафеста на взгляд CV разработчика. В целом, мне понравилось. Докладов меньше чем на прошлом, но качество мне кажется повыше. Было интересно посмотреть. Попробовал вкратце осветить на что обращать внимание.
https://youtu.be/dsM_Ep-32HQ
Ещё в апреле, опубликовав статью про трансформеры - хотел опубликовать и статью про StyleGAN'ы через пару недель. Пришлось с ними немного столкнуться/разобраться/поработать весной. Ну, за пару недель написать статью не вышло:)
Наконец дописал - https://habr.com/ru/company/recognitor/blog/568000/
Давно хотел небольшой рассказик сделать о том как я работаю со статьями с CV. Как и что выбираю, на что смотрю, где достаю. Собственно видео + статья в блоге.
https://youtu.be/l0lC7aXdRsY
Уже очень много раз я рассказывал про распознавание автомобильных номеров. Но никогда не говорил о том, что можно сделать с тех же камер, и какие будут в каждой из задач сложности. Попробую сделать быстрый обзор по пару минут на каждую тему.
https://youtu.be/Lk-kSm4go0s
На прошлой неделе Intel сказал что RealSence все. Потом, правда, немного откатил назад и смягчил формулировку. Но осадочек остался. Поговорили с Васей "Кто если не", и обсудили варианты камер глубины.
https://youtu.be/79rdhdzd2V4
А сегодня поговорим о том что такое продакт менеджмент для машинного обучения. Как его готовят, как ML разработка с ним взаимодействует, и когда без него уже не обойтись. И прочее и прочее:)
https://youtu.be/BrLaHzHV1W8
Забавно, но в последнее время часто наталкивался на мысль "Сегментация это просто сегментация". Но в реальности на сегментации может быть масса других, в том числе необычных алгоритмов. Решил немного поговорить на эту тему.
https://youtu.be/uATZU2ABoYM
В последний раз пару раз просвещал людей на тему того "на чем обучать". Для профессионалов, наверное, бесполезное видел. Но знаю много людей, которые только входят в ML, или которые интегрируют ML продукты себе в прод - и им, наверное, должно зайти:)
https://youtu.be/o5lS--V0gsI
Ещё в августе Tesla выпустила классное видео про то как сейчас у них все устроено. Мне всегда приятно смотреть такие видюшки, они познавательны и приятно видеть в них какие-то идеи про которые уже думал или использовал. Сделал небольшое обзор про основные идеи которые мне там понравились.
https://youtu.be/QRR1bdMumJI
Недавно Московский Метрополитен объявил что в ближайший месяц начнет разворачивание системы FacePay на все метро, и все смогут ей пользоваться. Решил немного поговорить на эту тему, посмотреть на текущую статистику по NIST и проговорить другие варианты как можно повысить точность такой системы.
https://youtu.be/jgTaNg2InjY
Порой слышишь мнение что One-Shot-Learning это некоторая универсальная серебряная пуля которой можно решить любую задачу. Но реальность и маркетинговые трюки как всегда разнятся. Поговорим о том что можно назвать ZeroShot learning и где его в реальности можно использовать.
https://youtu.be/5YShYKayua0
Одно из прошлых видео (про нестандартные применения сегментации) вроде неплохо зашло. И я решил по его мотивам поговорить о том когда можно обойтись без детекции. Поговорим о том когда детекцию эффективно заменить не только сегментацией, но и регрессией, а иногда и классификацией.
https://youtu.be/QiilFXx8VTg
Когда-то я уже писал в блоге на тему самого главного навыка в DS. Но дело было давно, так что решил обновить и записать коротенькое видео. Немного о адекватности:)
https://youtu.be/oJIXla41H1E
Сегодня классное видео. Поговорили с Григорием (CTO Xperience AI) о том, куда движется сегодняшняя Embedded разработка в Computer Vision. Насколько становится все быстрее, насколько удобнее, и будет ли там место для OpenCV.
https://youtu.be/0pc8gjxCcBs
Есть одна тема, на счет которой я могу говорить бесконечно. Да ладно, половина моих статей на Хабре про эту тему:)
Но отдельного видео на эту тему ни разу не делал. Небольшой рассказ о том что такое pet-проекты в ComputerVision, зачем они нужны, насколько их реально монетизировать, и насколько они полезны при устройстве на работу.
https://youtu.be/Yn5RJUVXTVQ
Я думаю что ruDALL-E - одна из самых интересных и наглядных работ этой осени. Хорошая комбинация их понятных сеток и море залитых ресурсов дают очень красивый результат.
Но поговорить я хочу не об этом. Несколько мыслей на тему "насколько это все полезно для небольших стартапов", "куда бы это вообще эти технологии приткнуть" и "как бороться с плохим качеством".
https://youtu.be/dipsep_XbiQ
За последние полгода пару раз наталкивался на тематику рендеринга. И в наших проектах, и просто из интереса. Решил все это дело обобщить и немного скомпоновать для себя. А лучший способ это сделать - статья на Хабр - https://habr.com/ru/company/recognitor/blog/593833/
Далее в комментах к посту - ссылка на youtube + попытка запостить то же самое в vc:)