Заметки Computer Vision инженера – Telegram

Заметки Computer Vision инженера

5.84K subscribers

36 photos

13 videos

333 links

Мои статьи из разных мест.
Моя телега - @wk_zb

Про консультации - https://telegra.ph/Pro-konsultacii-03-19
Про рекламу - https://telegra.ph/Pro-reklamu-v-bloge-03-19
Про политоту - https://telegra.ph/Pro-politiku-na-kanale-vo-izbezhanie-bana-04-11

Download Telegram

About

Blog

Apps

Platform

Заметки Computer Vision инженера

5.84K subscribers

Заметки Computer Vision инженера

Небольшой лайфхак про трекинг.
Обнаружил что много кто для трекинга объектов в видео использует очень сомнительные алгоритмы трекинга из OpenCV или Dlib. По сути корреляционные или их аналоги.
Оно и логично. Ведь 90% примеров в интернете именно про это.
Как правильно делать трекинг и какой он бывает - я расскажу как-нибудь на Хабре, статья уже почти готова.
Но не мог удержаться чтобы не сделать минималистичный пример о том как трекинг всё-же делать надо. Из всех подходов что мне встречались/что я использовал этот самый простой - https://cv-blog.ru/?p=322

450 views00:52

Заметки Computer Vision инженера

Вчера вышло YoloV5. Уже читая статью стало понятно что что-то там не так:
1) А где описания того что сделано собственно?
2) А где нормальные тесты со всем что есть?
3) А где нормальное портирование хоть на какие-то фреймоврки? После того как v4 было портировано всюду
4) А какое отношение оно имеет к прошлым релизам
Примерно про это и записал видео - https://youtu.be/ptDTHla2U3o

YOLO v5 - как по описанию понять что с работой что-то не то

YoloV5 вышло пару дней назад. Но уже прочитав страничку описания стало как-то странно... И оказалось не зря.
Небольшой пример того на что можно обращать внимание чтобы понять что с релизом что-то не то.
Больше моих статей и видео тут - https://vk.com/cvml_team…

481 views00:52

Заметки Computer Vision инженера

Написал эпичнейшую статью про то как трекать объекты. Что в последнее время работает, что нет - https://habr.com/ru/company/recognitor/blog/505694/
Возможно даже слишком длинная вышла:)

Самая сложная задача в Computer Vision

Среди всего многообразия задач Computer Vision есть одна, которая стоит особняком. К ней обычно стараются лишний раз не притрагиваться. И, если не дай бог работает, — не ворошить. У неё нет общего...

449 views00:52

Заметки Computer Vision инженера

Channel photo updated

00:54

Заметки Computer Vision инженера

Сегодня натолкнулся на то что Nvidia выпустила "NVIDIA Feature Map Explorer". Я, скорее, считаю что визуализация внутренних состояний сети - скорее бесполезная затея, но решил посмотреть.
Инструмент и его интерфейс скорее меня рассмешил своей бесполезность, зато дал повод поговорить о интересной теме. А зачем вообще может на практике потребоваться визуализировать отклики или внутренние параметры сети, как это делать, и что для этого нужно.
Короче, пара лов про Class Activation Mapping, Attention-like механизмы, и прочее велосипедостроение.

https://youtu.be/b1adJbT2mb4

Нужна ли визуализация отклика нейронной сети на практике?

Натолкнулся на новый инструмент от NVIDIA и решил рассказать о том как на практике использовал разные визуализации сети.

Больше моих статей тут - https://vk.com/cvml_team
Или в телеграмме - https://t.me/CVML_team

❤1

468 views01:03

Заметки Computer Vision инженера

Недавно спросили вопрос, который меня поставил в ступор: "какая математика нужна чтобы заниматься Computer Vision?".
Проскрипев шариками за роликами сделал небольшую подборку тех скилов которые помогают в CV. По сути две части:
1) Обязательная - то без чего соваться бессмысленно
2) Дополнительная - то что увеличит вашу цену как специалисту + поможет решать интересные задачи.
А дальше - смотрите в видео!
https://youtu.be/lUH2QHSVFdk

Где в Computer Vision нужна математика. И какая.

Краткий гайд про то, какая математика была мне полезна на практике.
Больше моих статей можно найти тут - https://vk.com/cvml_team
Дублирую сюда - https://t.me/CVML_team

449 views00:26

Заметки Computer Vision инженера

Прошлое видео достаточно неплохо зашло, так что решил записать продолжение на более общий вопрос: "Как стать специалистом в ComputerVision".
У меня достаточно своеобразный взгляд на эту тему. Мне кажется, что для того чтобы стать специалистом - не нужны курсы. Это бесполезно. Вам нужна практика и интерес. Научиться решать проблемы, научиться понимать почему ваше решение не работает.
Этого не дадут ни на Курсере, ни в очередной пачке курсов от СкилБокса или Мэйла.
Вам надо находить задачи и учиться их решать. Общаться с людьми, нарабатывать знакомства, обсуждать решения, пробовать что-то сделать.
Машинное обучение это не та тема где можно слушать и получать знания. Представьте себе музыканта который 10 лет изучает нотную грамоту или как играть гаммы. Вам нужно сломать стереотивы и научить себя работать и решать проблемы.
Собственно об этом и видео.
Может эта позиция работает не для всех, но есть люди для кого всё устроено так же.
https://youtu.be/EgdyvMfPBOQ

Как стать специалистом в ComputerVision и не стать вечным студентом

Описал путь в ComputerVision который мне кажется оптимальным

Прошлое видео - https://youtu.be/lUH2QHSVFdk
Больше моих статей можно найти тут - https://vk.com/cvml_team
Дублирую сюда - https://t.me/CVML_team
И не забывайте подписываться на LinkedIn…

499 views00:13

Заметки Computer Vision инженера

Недавно в очередной раз спросили о том как в своей статье 8-летней давности я обучал какой-то каскад Хаара... Не выдержал и написал статью-шаблон чтобы отвечать на такие вопросы:)
http://cv-blog.ru/?p=327

451 views15:27

Заметки Computer Vision инженера

Одна из проблем рассказов о любых задачах Computer Vision - обычно вся разработка под NDA. Нельзя рассказывать как задача реально реализована у заказчика. Нельзя показывать промежуточные результаты и что-то спойлерить.
Но, ведь можно рассказывать про свои проекты! Так что записал видео про то как делали систему распознавания по радужке, и куда оно в итоге пришло. Проект начинался пока мы были студентами (году в 2008) - так что выглядит местами безумно. Но, надеюсь, кому-то будет полезно:)
https://youtu.be/qRRCsk19-o8

Как мы делали распознавание радужки

Время охренительных историй - 1: Как мы делали систему распознавания по радужке.

То, что я писал в 2013 году по этой теме -https://habr.com/ru/post/167849/

Больше моих статей можно найти тут - https://vk.com/cvml_team
Дублирую сюда - https://t.me/CVML_team

503 views02:16

Заметки Computer Vision инженера

Одна из задач машинного зрения которую мы делали "для себя" - классическое распознавание автомобильных номеров. Она дала на безумное количество опыта в том как можно с помощью нейронок делать классические алгоритмы. Показала много примеров того как надо и не надо заходить на рынок (да, да, много вынесенных "полезных" уроков на тех граблях что мы собрали).
Я попробовал кратко рассказать весь пройденный путь. От каскадов Хаара до того что используем сейчас.
https://youtu.be/OAUokQgnupA

Как мы делали распознавание автомобильных номеров

Время охренительных историй - 2: Как мы делали систему распознавания автомобильных номеров.

Блог на хабре где вся эта история видна от начала до конца - https://habr.com/ru/company/recognitor/
Рассказ про другую нашу систему, про распознавание по радужке…

591 views23:52

Заметки Computer Vision инженера

Не так много тем в организации процесса в CV, про которые я совсем не писал. Тут понял - что совсем не писал про ТЗ. А там тоже есть интересные вопросы и решения.
http://cv-blog.ru/?p=335

579 views08:11

Заметки Computer Vision инженера

Внезапно узнал что один из самых популярных запросов ведущих в мой блог - "Dlib" и его вариации. Но, алло, мы живём в 2020 году. Не надо так!
Краткий рассказ что лучше использовать вместо него в 2020 году (Естественно OpenCV), и какие методы когда-то популярные в Dlib есть в других библиотеках:
https://youtu.be/2fnNhYCpToE

Dlib. НЕ ИСПОЛЬЗУЙТЕ ЕГО!

Внезапно узнал что один из самых популярных запросов ведущих в мой блог - "Dlib" и его вариации. Но, алло, мы живём в 2020 году. Не надо так!

Лица в TensorFlow - https://blog.tensorflow.org/2020/03/face-and-hand-tracking-in-browser-with-mediapipe-and-tensorflowjs.html…

599 views13:15

Заметки Computer Vision инженера

В ComputerVision дескрипторы особых точек это одна из самых старых тем. Я столкнулся с ними ещё году в 2010. И, глобально, с тех пор тема не менялась. Даже приходы нейронных сетей не поменяли основную стратегию.
Но в последнее время стали появляться интересные работы. Наверное я сделаю какой-нибудь краткий обзор в ближайшее время.
В работе про которой пойдёт речь - фишка совсем в другом. Она не просто про то как можно работать в этой странной теме. Она о том как в ComputerVision использовать нейронки для графов. До сих пор не встречал ни одной интересной реализации этого подхода.
http://cv-blog.ru/?p=341

533 views23:15

Заметки Computer Vision инженера

Вчера я рассказывал про применение Graph Neural Network в задаче сопоставления особых точек. Сегодня чуть более общий рассказ. Откуда задача сопоставления особых точек пошла, как к ней подходят, и что нового появилось в 2020 году (первые реально классные изменения за последние 20 лет).
https://youtu.be/kBZVZbKiTk4

Особые точка в ComputerVision. Откуда пришли и зачем нужны сейчас.

Особые точки - это необычная тема. Подходы минимально изменились за последние 15 лет. Но в 2020 году появились две новые мощные статьи, которые возможно куда-то нас и приведут.
Мой рассказ про GNN - http://cv-blog.ru/?p=341

Больше моих статей можно найти…

518 views18:07

Заметки Computer Vision инженера

Сегодня Mail.ru выпустила сервис электронного диктора новостей. Вбиваете свой текст - получаете обработанную видюшку где диктор его начитывает. Вообще, мне кажется, классная штука, в ближайшее время будет масса похожих.
В этом видео я попробовал разобраться с тем как такие сервисы делают.
Так как сам я такого ни разу не разрабатывал, то рассказал про два основных, на мой взгляд варианта -
https://youtu.be/PG5GjZ5TI3I

Как работают "Искусственные ведущие", как сгенерировать "FakeNews"

Китайский диктор - https://www.youtube.com/watch?v=cYFNNEUbm-A
Диктор сбербанка - https://youtu.be/MkMR0EiG4uc
Диктор Mail.ru - https://dictor.mail.ru/

Больше моих статей можно найти тут - https://vk.com/cvml_team
Дублирую сюда - https://t.me/CVML_team

518 views00:28

Заметки Computer Vision инженера

Периодически делаю ComputerVision проекты для себя:)
Прошлый крупный был про птичью кормушку. Текущий я пока пилю и окончательно выложу где-то через месяц.
Но, сейчас, речь не совсем о том. В текущем проекте решил разметить датасет через Толоку. На проде мы её иногда используем, но редко. А в хоббийных проектах раньше не использовал.
Цель рассказа - показать что это не сложно. Зачастую это сильно проще чем делать свой разметчик и плодить сущности.
Статья - http://cv-blog.ru/?p=350
И видео - https://youtu.be/BvQY_PpI7zE

Как использовать Яндекс.Толоку в простом ComputerVision проекте

Статья про это же, но с письменном виде и со ссылками - http://cv-blog.ru/?p=350

Больше моих статей можно найти тут - https://vk.com/cvml_team
Дублирую сюда - https://t.me/CVML_team

548 views01:08

Заметки Computer Vision инженера

Год назад я делал классную статью про Embedded платформы на Хабре. Но за год появилось много нового и интересного, так что я сделал дополнение с обзором за последний год - https://youtu.be/5yHgpS6O0A0

Что появилось нового за год в мире Embedded для нейронных сетей

Моя любимая статья на Хабре - https://habr.com/ru/company/recognitor/blog/468421/
Прошлое видео про Embedded - https://youtu.be/DIHsof24MbQ
Небольшой рассказ про JS, и почему телефончик можно использовать как Embedded - https://youtu.be/aIP3lSHvyC4

Больше…

533 views00:02

Заметки Computer Vision инженера

Вчера я рассказывал про различные новые Embedded платформы, появившиеся за последний год, а сегодня небольшой рассказ, почему мы чаще других платформ используем именно Jetson в своих проектах.
https://youtu.be/bkhkGYMcxzA

Почему мы любим использовать Jetson в своих проектах

Про новые embedded платформы - https://www.youtube.com/watch?v=5yHgpS6O0A0
Проект где использовали Jetson в какой-то момент - https://www.youtube.com/watch?v=qRRCsk19-o8
И распознавание номеров была версия на Jetson - https://www.youtube.com/watch?v=OAUokQgnupA…

602 viewsedited 21:42

Заметки Computer Vision инженера

Четыре года назад я рассказывал о том, как устроен NDA в задачах ML - http://cv-blog.ru/?p=46
С тех пор появилось несколько новых мыслей, так что решил заапдейтить статью видео.
В целом, ничего нового:
- NDA в России не работает.
- NDA хорошая проверка на адекватность заказчика/нанимающей фирмы.
- На мой взгляд, в NDA можно помещать только эксклюзивные вещи, разработанные под заказчика, такие как датасеты или написанный код. И никогда математику.
- Самый грамотный NDA - вписанный в договор
https://youtu.be/UQ5itWwK240

597 viewsedited 00:59

Заметки Computer Vision инженера

В наших проектах часто приходится использовать Intel - процессоры в качестве основного движка выполнения. И тогда без OpenVino никак. Но в реальности OpenVino это множество различных применений.
В OpenVino есть множество готовых сетей, которые можно использовать из коробки. Есть поддержка странных железных устройств.
И это открывает путь к прототипированию. Попробовал рассказать про это подробнее - https://youtu.be/GzgeGbHSl7A

OpenVino как хороший инструмент для хоббийного проекта

Краткий рассказ почему я люблю использовать OpenVino в качестве демо-платформы для своих наработок.
Больше моих статей можно найти тут - https://vk.com/cvml_team
Дублирую сюда - https://t.me/CVML_team

642 views01:24

Заметки Computer Vision инженера

Война между разными фреймворками идёт давно. И это приятно. Мы остаёмся всегда в прибыли. Очередной удар от TFLite по OpenCV|OpenVino - выпуск нового бэкенда на XNNPACK. Немного рассказываю про это.
https://blog.tensorflow.org/2020/07/accelerating-tensorflow-lite-xnnpack-integration.html

https://youtu.be/aHYZ9m0vHQM

blog.tensorflow.org

Accelerating TensorFlow Lite with XNNPACK Integration

Leveraging the CPU for ML inference yields the widest reach across the space of edge devices. Consequently, improving neural network inference performance on CPUs has been among the top requests to the TensorFlow Lite team. We listened and are excited to…

677 views23:29