Заметки Computer Vision инженера
5.84K subscribers
36 photos
13 videos
334 links
Мои статьи из разных мест.
Моя телега - @wk_zb

Про консультации - https://telegra.ph/Pro-konsultacii-03-19
Про рекламу - https://telegra.ph/Pro-reklamu-v-bloge-03-19
Про политоту - https://telegra.ph/Pro-politiku-na-kanale-vo-izbezhanie-bana-04-11
Download Telegram
Надобность создать этот канал возникла давно. Но что-то только сейчас решил это сделать. Изначально, когда создавал свой блог году в 2016 как-то телегу не очень активно использовал, так что дублировал блок в группа вконтакте, на фэйсбуке и в твиттере. В фейсбуке и твиттере аудитория была человек пять, так что оставил только вконтакт.
Но знаю очень много народу которым это неудобно. Зато, наверное, всем удобна телега. Так что создаю канал тут.
Для разнообразия попробовал опубликовать статью в месте где раньше ни разу не публиковался, но которое, на мой взгляд, имеет достаточно адекватное число статей хороших:)
https://rb.ru/opinion/computer-vision-mvp/
🔥1
Натолкнулся на весьма интересное мнение, что использование DL в браузере это никому не нужные игрушки. Но, как ни странно, на сегодняшний день это достаточно уникальный способ инференса моделей. Этот способ поддерживает телефоны, intel, amd, nvidia и всё-всё-всё.
Конечно, производительность не максимальная. Но вам не нужно заботиться о том, что что-то у кого-то не пойдёт. Примерно 90% устройств будут поддержаны, и всё будет работать там.
Сделал краткий обзор на тему того, почему это не страшно:)

https://youtu.be/aIP3lSHvyC4
Неделю назад в качестве эксперимента публиковал статью на rb. Но из-за ограничения числа символов в статье она была очень общей. Пока её писал в реальности написал ещё вторую статью, куда более подробную
На Хабре такое не формат публиковать, попробовал пристроить на VC:)
https://vc.ru/ml/130523-kak-mashinnomu-obucheniyu-prokrastsya-v-produkt
Мы работаем с достаточно большим количеством компаний. Кому-то что-то разрабатываем, кого-то консультируем. Наверное, единовременно фирм 5-6 в среднем.
Одно из мест, которое я последние пару месяцев совсем немного консультирую, - ДиТ ДЗМ. Это такие ребята, через которых проходят почти все КТ и МРТ исследования Москвы. Недавно ребята попросили, чтобы я провёл какую-то лекцию про Computer Vision в медицине. Ну и я, естественно, не удержался рассказать в очередной раз, почему при переходе к практике большинство моделей перестают работать.
https://youtu.be/dExf8a7hm9U
🔥1
Редко, когда я сажусь и за пару часов пишу такую классную статью. Но реально, после последней статьи FaceBook прямо-таки нахлынули воспоминания на очень классную тему, которая весьма поучительна.
Реальное применение очень крутой сетки, опередившей своё время на практике:
https://cv-blog.ru/?p=310
Сейчас делаю очередной проект для себя, в котором, как водится, есть embedded, openvino, RPi, Computer Vision, сколько-то машинлёнинга и куча разных свистелок и перделок.
Такие проекты помогают немного встряхнуться, пересмотреть взгляд на окружающие проблемы, поделать руками что-то максимально простое и притом максимально быстро.
Про сам проект расскажу, наверное, через несколько месяцев, когда пойму, насколько всё работает и какой результат даёт.
Но по ходу родилось несколько прикольных решений, которые (на мой взгляд), может использовать много людей в своих других задачах. Сегодня небольшая статья про штуку, которая меня давно мучила:
"как использовать RaspberryPi в проектах машинного зрения, чтобы не нужно было каждый раз настраивать сеть через монитор/клавиатуру/ssh".
В итоге сделал решение, которое занимает несколько строк и можно использовать в любом другом проекте.
http://cv-blog.ru/?p=318 - описание
https://github.com/ZlodeiBaal/RPi_WiFi_autoconnect - сорсы
В целом я не люблю конференции по ML. И хожу обычно туда поговорить с людьми. Хорошая конференция - много интересного народу. Но иногда, в перерывах между разговорами, можно и что-то интересное послушать.
Хорошая популярная лекция в таких местах редкость, но бывает.
В последние года два всегда ходил на machinescansee. Из бесплатных она самая крутая среди тех что в Москве проходит. В этом году они будут онлайн, понятное дело (вечера с понедельника по среду). Может быть, кому-то тоже будет интересно - http://machinescansee.com/
Они, естественно, бесплатные.
Небольшой лайфхак про трекинг.
Обнаружил что много кто для трекинга объектов в видео использует очень сомнительные алгоритмы трекинга из OpenCV или Dlib. По сути корреляционные или их аналоги.
Оно и логично. Ведь 90% примеров в интернете именно про это.
Как правильно делать трекинг и какой он бывает - я расскажу как-нибудь на Хабре, статья уже почти готова.
Но не мог удержаться чтобы не сделать минималистичный пример о том как трекинг всё-же делать надо. Из всех подходов что мне встречались/что я использовал этот самый простой - https://cv-blog.ru/?p=322
Вчера вышло YoloV5. Уже читая статью стало понятно что что-то там не так:
1) А где описания того что сделано собственно?
2) А где нормальные тесты со всем что есть?
3) А где нормальное портирование хоть на какие-то фреймоврки? После того как v4 было портировано всюду
4) А какое отношение оно имеет к прошлым релизам
Примерно про это и записал видео - https://youtu.be/ptDTHla2U3o