Заметки Computer Vision инженера
5.84K subscribers
35 photos
13 videos
332 links
Мои статьи из разных мест.
Моя телега - @wk_zb

Про консультации - https://telegra.ph/Pro-konsultacii-03-19
Про рекламу - https://telegra.ph/Pro-reklamu-v-bloge-03-19
Про политоту - https://telegra.ph/Pro-politiku-na-kanale-vo-izbezhanie-bana-04-11
Download Telegram
За последние полгода пару раз наталкивался на тематику рендеринга. И в наших проектах, и просто из интереса. Решил все это дело обобщить и немного скомпоновать для себя. А лучший способ это сделать - статья на Хабр - https://habr.com/ru/company/recognitor/blog/593833/
Далее в комментах к посту - ссылка на youtube + попытка запостить то же самое в vc:)
Постановки задачи для любой CV проблемы - залог хорошего качества работы системы.
Если правильно поставить задачу, придумав логику использования, тогда не только точность будет выше, но и ощущения от использования.
Ровно поэтому я периодически возвращаюсь к этой теме с разных сторон. И раз уж в течение дня попалось два хороших примера, иллюстрирующих проблему - то почему бы не обсудить ещё раз, как делать надо, а как нет - https://youtu.be/prmaBf3S-Xs
А вот вам небольшой новогодний подарочек. Классное интервью с Максом Гончаровым (CEO Cherry Labs) на тему того насколько вообще ML нужен в стартапах, как все поменялось за последние лет 6-7, и как оценивается стартап с ML внутри.
https://youtu.be/yWJ-s7xbw7w
Всем привет!
Отдельный пост/видео делать наверное не буду, так что небольшая заметка. Вчера был рождественский коллоквиум. В целом - интересное мероприятие, стараюсь на него ходить/слушать последние года 4-5. Присутствовать, конечно, сильно интереснее, там можно потрепаться. Но в пандемию такого варианта нет.
https://www.youtube.com/watch?v=vrSCD88X8BU

Было три интересных обзорных доклада, два из которых мне весьма зашли:
1) Про квантизацию сеточек (QPP: Real-Time Quantization Parameter Prediction for Deep Neural Networks). Большую часть того что рассказывали я знал/на много натыкался. Но тут весьма стройный рассказ, есть инсайды и обзор алгоритмов (правда с акцентом на работу авторов).
2) Про детекторы ( State-of-the-art решения задач компьютерного зрения: Object detection, Semantic segmentation, Depth estimation ). Очень классный обзор на тему того когда имеют смысл трансформеры, а когда свёрточные сеточки. Из минусов - не разобрана область embedded + нет оценки того как все это плывет если датасеты небольшие (по паре тысяч кадров). Но, с другой стороны, это увеличило бы размер рассказа раза в 2. Для себя неплохо структурировал логику в паре моментов.
3) В целом неплохой обзор трансформеров и последних двух лет их внедрения с CV ( Transformers for Computer Vision ). Но для себя ничего нового не открыл.

Остальные доклады тоже весьма достойны. Но советовать их странно, они про весьма конкретные ресерчи в конкретных областях. Плюс, многое из них - почти дословный текст публикации. Мне было любопытно посмотреть некоторые из них, так как я их пропустил. Но советовать для просмотра всем наверное не буду.
Немного посмеялся. В прошлой статье на Хабре, в которой я говорил про генерацию людей(позы/одежда, и.т.д.), была одна статья в которой были очень крутые результаты. Я, естественно, поставил ремарку "сорсов нет, верить нельзя". Сорсы выложили. Качество, естественно, не соответствует картинкам из презентации:)
Не впервой. Cherry Picking - популярная штука. Решил написать небольшую заметку с примерами где статьи могут недоговаривать - https://cv-blog.ru/?p=458
А у вас есть прикольные истории из практики то как статьи кардинально не соответствовала реальности?:)
🔥115💩1
Давно хотел написать обстоятельную статью о том какие задачи решает Action Recognition. Какой он бывает и зачем нужен. Мне кажется что рассмотреть в статье все - принципиально невозможно. Есть множество кастомных методов и их гибридов. Но основные способы решить реальные задачи, как мне кажется, я описал.
Видео к статье в коментах.
https://habr.com/ru/company/recognitor/blog/647343/
🔥20😱1
Я достаточно много рассказывал про разметку данных, но всегда рассказывал с двух позиций. Либо со стороны разметки под конкретный небольшой проект, либо со стороны inhouse разметки для законченной команды/продукта. Но есть и другая интересная грань разметки - разметка под заказ. Когда нужно размечать много данных, поддерживая качество и для разных задач.
И сегодняшнее видео именно про эту сторону разметки. Мы поговорим с Романом, CSA в TrainDataSolution о том как разметка выглядит когда это основной бизнес процесс.
https://youtu.be/FH6nwtFR9nU
Небольшой рассказ о том какие вообще сейчас есть подходы к 3D сканированию. С каких стороны заходить, куда смотреть.
https://youtu.be/iUOBaBf9Y2A
Небольшой дисклеймер. Видео записывал за пару дней до выхода быстрой версии NeRF. И про этот вариант я вообще не рассказываю.
Но:
1) NeRF и его аналоги делаются на базе COLMAP. Который далеко не топовый, и про который я упоминаю. В целом этого пункта достаточно для того чтобы отследить его положение среди методов:)
2) И сам NeRF и другие аналогичные подходы не меняют расстановки в том что я рассказываю. Они не изменяют точность сканирования. Они не меняют точность SLAM-навигации. Максимум качество натягивания текстуры.
При этом как сама работа - он классный. И для каких-то задач он просто супер.
На днях ВкусВилл открыл умный магазин. Он открылся совсем рядом от меня - так что решил съездить посмотреть как устроен. Я уже делал обзор умного магазина от Азбуки Вкуса, так что есть с чем сравнить:)
https://youtu.be/JZP9z1jc54s
6🔥2😱2
Летс мэйк смалл эксперимент;)
Мне с месяц назад пришел Oak-D Lite, который я заказал на кикстартере. На мой взгляд он сильно интереснее позиционирует себя чем обычный Oak-D. Решил сделать небольшой обзор, с упором под те задачи где нам такие девайсы нужны. Посмотреть на конструктив, на теплоотвод, на качество 3D.
По дороге понял что обзор надо сделать на английском, ибо полезных видео по этой теме вообще нет. Так что сорян:)
https://youtu.be/jrdc-Xak154
🔥10
Ускорение моделей на мой взгляд достаточно сложная штука, которую почти невозможно поставить на поток. Но в компании Сергея есть продукт в рамках которого такое ускорение делается серийно.
Поговорим об особенностях ускорения. Что можно автоматизировать, что нельзя. На каких платформах можно завести такие системы, а где нет. Что дает максимальный профит к ускорению, а где это бесполезно.
https://youtu.be/IgLKm2eRDjY
😱3
После того что произошло в прошлый четверг не было никаких моральных сил записывать новые видео. Да и как-то на мой взгляд это неправильно. Все же в каком-то смысле мои видео это развлекательный контент. Но потом понял, что полезное сделать тоже могу. Пусть хоть кому-нибудь такое видео поможет. В видео нет никаких откровений/магии. И для профессионала скорее всего будет скучно. Но есть много людей которые не знают/не понимают базовую логику устройства алгоритмов распознавания лиц и где их проблемы. Это видео для них.
https://youtu.be/wCa-gXFQt3E
35💩1
Что-то я раньше не допер. Но лучше поздно чем никогда:)
Все, наверное, знают что я консультирую по Computer Vision и его окрестностям ( http://cv-blog.ru/?page_id=455 ). В среднем, в год где-то 20-30 компаний получается. Кого-то час, кого-то каждую неделю.
Такой консалтинг это не основное мое занятие, но опыт есть;)

В общем это я к чему. Следующий месяц готов консультировать бесплатно всех кто сделает пожертвование в российские правозащитные (ОВД-инфо, и.т.д.) / журналистские независимые организации (Медиазона, ???????????*, и.т.д.). Можете придумать какую-нибудь другую организацию, но лучше в начале уточните.
Пожертвование от 6т.р. за час консультаций;)

* - тут самое известно Русскоязычное медиа, которое нынче назвали нежелательной организацией. Очевидно какое!:) На момент поста нежелательной не было. Так как один еблан (автор Spark in me) ходит и катает на меня доносики всем со ссылкой сюда (настоящий доносчик Русский Коммунист, что с него взять), то прикрою его вопросиками, чтобы он бесился;)
71💩20🔥15
Наверное все же выложу несколько видео которые начал делать ещё месяц назад. Не знаю насколько это все актуально сейчас будет, но путь будут до того как закроется youtube.
Это видео - обзор различных технологий магазинов без касс. Я уже рассказывал про несколько, но тут большой обзор. Хотел к нему ещё сделать статью на Хабр/VC, но её не будет.
З.Ю. на английском
https://youtu.be/xTzvpqlKXvU
🔥21
И сходу такой вопрос. Сейчас многие компании с которыми я работаю - релоцируются. Кто-то отдельные отделы, кто-то целиком. Кто-то делает резервную фирму за границей. Где-то просто помогают сотрудникам с переездом.
Подробно по всем процессам обзор сделать не смогу, но если вдруг будет интересно - могу попробовать подсобрать материалы, какие документы нужны для релокации, какие варианты есть.
Но:
1) Проблема в том что ситуация постоянно меняется
2) Есть много хороших гайдов, которые более подробно рассматривают каждое направление

Так что не знаю насколько это нужно и полезно подписчикам. Хочет кто?
🔥9710💩5
Пару дней назад провел опрос в своем telegram - канале на предмет того, нужно ли сделать обзор по тому как сейчас устроена релокация. Я работаю/знаком с большим числом стартапов/компаний. Так что могу подсобрать какую-то статистику по людям вокруг (~15-20 компаний).
В опросе в первую очередь попросили сделать обзор на предмет статистики/подходов которая существует. Попробовал побеседовать, собрал что можно. Видео состоит из нескольких частей:
1) Обзор причин/способов релокации
2) Попытка как-то оценить статистику вокруг
3) Базовые кейворды на тему налогов/регистрации бизнеса
4) Как оставаться в России и работать с иностранными компаниями
5) Три интервью с ребятами которые недавно уезжали в разные страны. Как туда переехать/как атмосфера/как бюрократия поживает
6) Интервью с человеком который уже давно живет за границей в разных странах. Общие концепты по документам/бизнесу/налогам.

Видео достаточно длинное и к Computer Vision не имеет никакого отношения. Но, судя по всему, может быть достаточно полезно сейчас.
https://youtu.be/sf-g11yKu54
🔥167
Месяца два назад решил наверстать упущенное - пройтись по RISK-V платам на которых можно делать Computer Vision. Такие платы начали появляться году в 2018, но до удобного состояния доросли (на мой взгляд) лишь 2-3 года назад. Среди них есть и достаточно мощные платы,и совсем небольшие. Есть те, которые могут долго жить от батарейки, и есть те которые потребляют на уровне RPi.
Я больше привык к Linux-based платам (RPi, Jetson, RockChip, etc) или телефонам. Так что вернуться к микроконтроллерам было интересно. А область, за те годы, что я ей не занимался, удивительным образом продвинулась.

В ходе этого небольшого путешествия у меня скопилось какое-то количество заметок. Что-то про общие впечатления, что-то про более практические задачи.
Начну я с самой базовой вещи, с которой все начинают свои эксперименты. Сегодняшнее видео про ESP32 и разные способы запускать нейронки на нём. От официальных до не очень.
https://youtu.be/w_sCTPDuutQ
🔥19
Как и обещал - дополнение/завершение прошлого видео. Рассказываю как натренировать модель для ESP32 и развернуть её там за час. Colab прилагается.
https://youtu.be/ms6uoZr-4dc
11🔥3