Заметки Computer Vision инженера – Telegram

Заметки Computer Vision инженера

5.85K subscribers

36 photos

13 videos

334 links

Мои статьи из разных мест.
Моя телега - @wk_zb

Про консультации - https://telegra.ph/Pro-konsultacii-03-19
Про рекламу - https://telegra.ph/Pro-reklamu-v-bloge-03-19
Про политоту - https://telegra.ph/Pro-politiku-na-kanale-vo-izbezhanie-bana-04-11

Download Telegram

About

Blog

Apps

Platform

Заметки Computer Vision инженера

5.85K subscribers

Заметки Computer Vision инженера

Мы работаем с достаточно большим количеством компаний. Кому-то что-то разрабатываем, кого-то консультируем. Наверное, единовременно фирм 5-6 в среднем.
Одно из мест, которое я последние пару месяцев совсем немного консультирую, - ДиТ ДЗМ. Это такие ребята, через которых проходят почти все КТ и МРТ исследования Москвы. Недавно ребята попросили, чтобы я провёл какую-то лекцию про Computer Vision в медицине. Ну и я, естественно, не удержался рассказать в очередной раз, почему при переходе к практике большинство моделей перестают работать.
https://youtu.be/dExf8a7hm9U

Машинное зрение в медицине сложность внедрения и использования

Уважаемые слушатели!

Приглашаем вас посетить вебинар на тему: «Машинное зрение в медицине - сложность внедрения и использования».

Лектор: Мальцев Антон Владимирович, кандидат технических наук, CEO в CVML (cvml.ru), ML Team Lead CherryHome (cherryhome.ai)"…

🔥1

417 views00:51

Заметки Computer Vision инженера

Редко, когда я сажусь и за пару часов пишу такую классную статью. Но реально, после последней статьи FaceBook прямо-таки нахлынули воспоминания на очень классную тему, которая весьма поучительна.
Реальное применение очень крутой сетки, опередившей своё время на практике:
https://cv-blog.ru/?p=310

400 views00:52

Заметки Computer Vision инженера

Сейчас делаю очередной проект для себя, в котором, как водится, есть embedded, openvino, RPi, Computer Vision, сколько-то машинлёнинга и куча разных свистелок и перделок.
Такие проекты помогают немного встряхнуться, пересмотреть взгляд на окружающие проблемы, поделать руками что-то максимально простое и притом максимально быстро.
Про сам проект расскажу, наверное, через несколько месяцев, когда пойму, насколько всё работает и какой результат даёт.
Но по ходу родилось несколько прикольных решений, которые (на мой взгляд), может использовать много людей в своих других задачах. Сегодня небольшая статья про штуку, которая меня давно мучила:
"как использовать RaspberryPi в проектах машинного зрения, чтобы не нужно было каждый раз настраивать сеть через монитор/клавиатуру/ssh".
В итоге сделал решение, которое занимает несколько строк и можно использовать в любом другом проекте.
http://cv-blog.ru/?p=318 - описание
https://github.com/ZlodeiBaal/RPi_WiFi_autoconnect - сорсы

GitHub - ZlodeiBaal/RPi_WiFi_autoconnect: WiFi automatic connection for Raspberry Pi via QRcode

WiFi automatic connection for Raspberry Pi via QRcode - ZlodeiBaal/RPi_WiFi_autoconnect

432 views00:52

Заметки Computer Vision инженера

В целом я не люблю конференции по ML. И хожу обычно туда поговорить с людьми. Хорошая конференция - много интересного народу. Но иногда, в перерывах между разговорами, можно и что-то интересное послушать.
Хорошая популярная лекция в таких местах редкость, но бывает.
В последние года два всегда ходил на machinescansee. Из бесплатных она самая крутая среди тех что в Москве проходит. В этом году они будут онлайн, понятное дело (вечера с понедельника по среду). Может быть, кому-то тоже будет интересно - http://machinescansee.com/
Они, естественно, бесплатные.

Machines Can See 2025

Join us at Machines Can See, the largest annual professional AI summit in the Middle East, taking place on April 23-24, 2025, in Dubai. Get your invite!

440 views00:52

Заметки Computer Vision инженера

Небольшой лайфхак про трекинг.
Обнаружил что много кто для трекинга объектов в видео использует очень сомнительные алгоритмы трекинга из OpenCV или Dlib. По сути корреляционные или их аналоги.
Оно и логично. Ведь 90% примеров в интернете именно про это.
Как правильно делать трекинг и какой он бывает - я расскажу как-нибудь на Хабре, статья уже почти готова.
Но не мог удержаться чтобы не сделать минималистичный пример о том как трекинг всё-же делать надо. Из всех подходов что мне встречались/что я использовал этот самый простой - https://cv-blog.ru/?p=322

450 views00:52

Заметки Computer Vision инженера

Вчера вышло YoloV5. Уже читая статью стало понятно что что-то там не так:
1) А где описания того что сделано собственно?
2) А где нормальные тесты со всем что есть?
3) А где нормальное портирование хоть на какие-то фреймоврки? После того как v4 было портировано всюду
4) А какое отношение оно имеет к прошлым релизам
Примерно про это и записал видео - https://youtu.be/ptDTHla2U3o

YOLO v5 - как по описанию понять что с работой что-то не то

YoloV5 вышло пару дней назад. Но уже прочитав страничку описания стало как-то странно... И оказалось не зря.
Небольшой пример того на что можно обращать внимание чтобы понять что с релизом что-то не то.
Больше моих статей и видео тут - https://vk.com/cvml_team…

481 views00:52

Заметки Computer Vision инженера

Написал эпичнейшую статью про то как трекать объекты. Что в последнее время работает, что нет - https://habr.com/ru/company/recognitor/blog/505694/
Возможно даже слишком длинная вышла:)

Самая сложная задача в Computer Vision

Среди всего многообразия задач Computer Vision есть одна, которая стоит особняком. К ней обычно стараются лишний раз не притрагиваться. И, если не дай бог работает, — не ворошить. У неё нет общего...

449 views00:52

Заметки Computer Vision инженера

Channel photo updated

00:54

Заметки Computer Vision инженера

Сегодня натолкнулся на то что Nvidia выпустила "NVIDIA Feature Map Explorer". Я, скорее, считаю что визуализация внутренних состояний сети - скорее бесполезная затея, но решил посмотреть.
Инструмент и его интерфейс скорее меня рассмешил своей бесполезность, зато дал повод поговорить о интересной теме. А зачем вообще может на практике потребоваться визуализировать отклики или внутренние параметры сети, как это делать, и что для этого нужно.
Короче, пара лов про Class Activation Mapping, Attention-like механизмы, и прочее велосипедостроение.

https://youtu.be/b1adJbT2mb4

Нужна ли визуализация отклика нейронной сети на практике?

Натолкнулся на новый инструмент от NVIDIA и решил рассказать о том как на практике использовал разные визуализации сети.

Больше моих статей тут - https://vk.com/cvml_team
Или в телеграмме - https://t.me/CVML_team

❤1

468 views01:03

Заметки Computer Vision инженера

Недавно спросили вопрос, который меня поставил в ступор: "какая математика нужна чтобы заниматься Computer Vision?".
Проскрипев шариками за роликами сделал небольшую подборку тех скилов которые помогают в CV. По сути две части:
1) Обязательная - то без чего соваться бессмысленно
2) Дополнительная - то что увеличит вашу цену как специалисту + поможет решать интересные задачи.
А дальше - смотрите в видео!
https://youtu.be/lUH2QHSVFdk

Где в Computer Vision нужна математика. И какая.

Краткий гайд про то, какая математика была мне полезна на практике.
Больше моих статей можно найти тут - https://vk.com/cvml_team
Дублирую сюда - https://t.me/CVML_team

449 views00:26

Заметки Computer Vision инженера

Прошлое видео достаточно неплохо зашло, так что решил записать продолжение на более общий вопрос: "Как стать специалистом в ComputerVision".
У меня достаточно своеобразный взгляд на эту тему. Мне кажется, что для того чтобы стать специалистом - не нужны курсы. Это бесполезно. Вам нужна практика и интерес. Научиться решать проблемы, научиться понимать почему ваше решение не работает.
Этого не дадут ни на Курсере, ни в очередной пачке курсов от СкилБокса или Мэйла.
Вам надо находить задачи и учиться их решать. Общаться с людьми, нарабатывать знакомства, обсуждать решения, пробовать что-то сделать.
Машинное обучение это не та тема где можно слушать и получать знания. Представьте себе музыканта который 10 лет изучает нотную грамоту или как играть гаммы. Вам нужно сломать стереотивы и научить себя работать и решать проблемы.
Собственно об этом и видео.
Может эта позиция работает не для всех, но есть люди для кого всё устроено так же.
https://youtu.be/EgdyvMfPBOQ

Как стать специалистом в ComputerVision и не стать вечным студентом

Описал путь в ComputerVision который мне кажется оптимальным

Прошлое видео - https://youtu.be/lUH2QHSVFdk
Больше моих статей можно найти тут - https://vk.com/cvml_team
Дублирую сюда - https://t.me/CVML_team
И не забывайте подписываться на LinkedIn…

499 views00:13

Заметки Computer Vision инженера

Недавно в очередной раз спросили о том как в своей статье 8-летней давности я обучал какой-то каскад Хаара... Не выдержал и написал статью-шаблон чтобы отвечать на такие вопросы:)
http://cv-blog.ru/?p=327

451 views15:27

Заметки Computer Vision инженера

Одна из проблем рассказов о любых задачах Computer Vision - обычно вся разработка под NDA. Нельзя рассказывать как задача реально реализована у заказчика. Нельзя показывать промежуточные результаты и что-то спойлерить.
Но, ведь можно рассказывать про свои проекты! Так что записал видео про то как делали систему распознавания по радужке, и куда оно в итоге пришло. Проект начинался пока мы были студентами (году в 2008) - так что выглядит местами безумно. Но, надеюсь, кому-то будет полезно:)
https://youtu.be/qRRCsk19-o8

Как мы делали распознавание радужки

Время охренительных историй - 1: Как мы делали систему распознавания по радужке.

То, что я писал в 2013 году по этой теме -https://habr.com/ru/post/167849/

Больше моих статей можно найти тут - https://vk.com/cvml_team
Дублирую сюда - https://t.me/CVML_team

503 views02:16

Заметки Computer Vision инженера

Одна из задач машинного зрения которую мы делали "для себя" - классическое распознавание автомобильных номеров. Она дала на безумное количество опыта в том как можно с помощью нейронок делать классические алгоритмы. Показала много примеров того как надо и не надо заходить на рынок (да, да, много вынесенных "полезных" уроков на тех граблях что мы собрали).
Я попробовал кратко рассказать весь пройденный путь. От каскадов Хаара до того что используем сейчас.
https://youtu.be/OAUokQgnupA

Как мы делали распознавание автомобильных номеров

Время охренительных историй - 2: Как мы делали систему распознавания автомобильных номеров.

Блог на хабре где вся эта история видна от начала до конца - https://habr.com/ru/company/recognitor/
Рассказ про другую нашу систему, про распознавание по радужке…

591 views23:52

Заметки Computer Vision инженера

Не так много тем в организации процесса в CV, про которые я совсем не писал. Тут понял - что совсем не писал про ТЗ. А там тоже есть интересные вопросы и решения.
http://cv-blog.ru/?p=335

579 views08:11

Заметки Computer Vision инженера

Внезапно узнал что один из самых популярных запросов ведущих в мой блог - "Dlib" и его вариации. Но, алло, мы живём в 2020 году. Не надо так!
Краткий рассказ что лучше использовать вместо него в 2020 году (Естественно OpenCV), и какие методы когда-то популярные в Dlib есть в других библиотеках:
https://youtu.be/2fnNhYCpToE

Dlib. НЕ ИСПОЛЬЗУЙТЕ ЕГО!

Внезапно узнал что один из самых популярных запросов ведущих в мой блог - "Dlib" и его вариации. Но, алло, мы живём в 2020 году. Не надо так!

Лица в TensorFlow - https://blog.tensorflow.org/2020/03/face-and-hand-tracking-in-browser-with-mediapipe-and-tensorflowjs.html…

599 views13:15

Заметки Computer Vision инженера

В ComputerVision дескрипторы особых точек это одна из самых старых тем. Я столкнулся с ними ещё году в 2010. И, глобально, с тех пор тема не менялась. Даже приходы нейронных сетей не поменяли основную стратегию.
Но в последнее время стали появляться интересные работы. Наверное я сделаю какой-нибудь краткий обзор в ближайшее время.
В работе про которой пойдёт речь - фишка совсем в другом. Она не просто про то как можно работать в этой странной теме. Она о том как в ComputerVision использовать нейронки для графов. До сих пор не встречал ни одной интересной реализации этого подхода.
http://cv-blog.ru/?p=341

533 views23:15

Заметки Computer Vision инженера

Вчера я рассказывал про применение Graph Neural Network в задаче сопоставления особых точек. Сегодня чуть более общий рассказ. Откуда задача сопоставления особых точек пошла, как к ней подходят, и что нового появилось в 2020 году (первые реально классные изменения за последние 20 лет).
https://youtu.be/kBZVZbKiTk4

Особые точка в ComputerVision. Откуда пришли и зачем нужны сейчас.

Особые точки - это необычная тема. Подходы минимально изменились за последние 15 лет. Но в 2020 году появились две новые мощные статьи, которые возможно куда-то нас и приведут.
Мой рассказ про GNN - http://cv-blog.ru/?p=341

Больше моих статей можно найти…

518 views18:07

Заметки Computer Vision инженера

Сегодня Mail.ru выпустила сервис электронного диктора новостей. Вбиваете свой текст - получаете обработанную видюшку где диктор его начитывает. Вообще, мне кажется, классная штука, в ближайшее время будет масса похожих.
В этом видео я попробовал разобраться с тем как такие сервисы делают.
Так как сам я такого ни разу не разрабатывал, то рассказал про два основных, на мой взгляд варианта -
https://youtu.be/PG5GjZ5TI3I

Как работают "Искусственные ведущие", как сгенерировать "FakeNews"

Китайский диктор - https://www.youtube.com/watch?v=cYFNNEUbm-A
Диктор сбербанка - https://youtu.be/MkMR0EiG4uc
Диктор Mail.ru - https://dictor.mail.ru/

Больше моих статей можно найти тут - https://vk.com/cvml_team
Дублирую сюда - https://t.me/CVML_team

518 views00:28

Заметки Computer Vision инженера

Периодически делаю ComputerVision проекты для себя:)
Прошлый крупный был про птичью кормушку. Текущий я пока пилю и окончательно выложу где-то через месяц.
Но, сейчас, речь не совсем о том. В текущем проекте решил разметить датасет через Толоку. На проде мы её иногда используем, но редко. А в хоббийных проектах раньше не использовал.
Цель рассказа - показать что это не сложно. Зачастую это сильно проще чем делать свой разметчик и плодить сущности.
Статья - http://cv-blog.ru/?p=350
И видео - https://youtu.be/BvQY_PpI7zE

Как использовать Яндекс.Толоку в простом ComputerVision проекте

Статья про это же, но с письменном виде и со ссылками - http://cv-blog.ru/?p=350

Больше моих статей можно найти тут - https://vk.com/cvml_team
Дублирую сюда - https://t.me/CVML_team

548 views01:08

Заметки Computer Vision инженера

Год назад я делал классную статью про Embedded платформы на Хабре. Но за год появилось много нового и интересного, так что я сделал дополнение с обзором за последний год - https://youtu.be/5yHgpS6O0A0

Что появилось нового за год в мире Embedded для нейронных сетей

Моя любимая статья на Хабре - https://habr.com/ru/company/recognitor/blog/468421/
Прошлое видео про Embedded - https://youtu.be/DIHsof24MbQ
Небольшой рассказ про JS, и почему телефончик можно использовать как Embedded - https://youtu.be/aIP3lSHvyC4

Больше…

533 views00:02