Заметки Computer Vision инженера
5.84K subscribers
35 photos
13 videos
332 links
Мои статьи из разных мест.
Моя телега - @wk_zb

Про консультации - https://telegra.ph/Pro-konsultacii-03-19
Про рекламу - https://telegra.ph/Pro-reklamu-v-bloge-03-19
Про политоту - https://telegra.ph/Pro-politiku-na-kanale-vo-izbezhanie-bana-04-11
Download Telegram
Предположим, у вас в фирме возникла необходимость разметить датасет. Попробовал пробежаться по основным способам, как можно организовать этот процесс (не вдаваясь в логику разметчиков/способы съёмки датасетов). Надеюсь, что какой-то из этих подходов будет для вас новым:)
https://youtu.be/fwbHkVka3G4
Всем привет!
Вчера ко мне пришли ребята, которые устраивают что-то среднее между хакатоном/буткампом/онлайн школой, при поддержке Yandex|NVIDIA|IBM.
Участников разбивают на команды, каждой команде выдают задачку кого-то из партнёров, по ходу решения задачи активно менторят/развлекают лекциями/проводят итоговую проверку и оценку результатов и успехов.

И попросили поучаствовать как эксперт/судья по полученным результатам в ComputerVision задаче + какую-нибудь лекцию по ходу прочитать. Мне показалось любопытно, так что согласился (денег ни за участие ни за анонс не предлагали:).

Самое мероприятие длится пять недель, бесплатно для участников. Может я чего-то не понял (ранее такого формата не видел), но выглядит вполне адекватно и осмысленно.

Пара моментов:
-Основная постановка задач нацелена на бизнес применение ML и CV. Цель не в обучении моделей, а в том, чтобы понять, как с их помощью решить задачи бизнеса и собрать интересующие метрики.
-Как следствие - в первую очередь берут тех, у кого есть уже какой-то опыт в DS.
-Число команд ограничено, нужно писать резюме краткое, будет какой-то отбор

Более подробно рассказано тут -
http://ycloud.school/?utm_source=facebook&utm_medium=social&utm_campaign=partner&utm_content=anton_malcev
Года три назад мы написали, как внутренний тул нашей команды, сервер разметки. Он обеспечивал нам модель, которую нынче принято называть "human-in-the-loop": интеграцию рабочего места разметчика, сервера распознавания и сервера обучения в единый интерфейс.
Мы использовали его в десятке проектов. Сегодня ещё 3-4 фирмы кроме нас тоже используют его.
Сегодня я расскажу про него, про то как такое можно использовать. А что самое главное - дам ссылку на исходники, которые мы выложили;)
Надеюсь вам поможет в ваших проектах.
Статья с рассказом - http://cv-blog.ru/?p=368
Видео с рассказом - https://youtu.be/fKnYZ4qR2po
🔥1
Сейчас вы захотите ругаться, что это вторая реклама за последние три дня, но, блин, нет:)
Просто хочу рассказать, в каком-то смысле похвастаться. Сегодня был анонсирован вот этот хакатон - https://hack2020.innoagency.ru
Одна из задач, которые там представлены от компании которую немного консультирую последние полгода. К её формулированию приложил большое участие (без меня задачи точно не было бы). И задача реально описывает существующую боль многих компаний;)

Меня просили не рассказывать какую конкретно, так как я буду принимать участие в судействе. Но если вы внимательно читаете канал, то могли заметить. А если не читаете - то возможно увидимся там.
А так, мне кажется, что по призовому фонду хакатон достаточно большой, и в нём вообще может быть интересно участвовать.
Небольшой рассказ о том, как мы в своих задачах применяли синтетические данные, где это разумно использовать, какие хорошие применения этого подхода я встречал, и.т.д.
https://youtu.be/X5i3owysLi0
Вторая статья, которую публикую сегодня - на Хабре. Про то, как я собрал умную видео-няню на базе Raspberry Pi, Movidius, OpenVino и PyTorch. Подписчики моего блога уже могли наблюдать отдельные куски этого проекта, которые я выкладывал с мая. Но целиком публикую и рассказываю только сейчас.
https://habr.com/ru/company/recognitor/blog/516232/
Решил запилить видео про немного бомбящую тему. Три лучших способа прослыть некомпетентным в Machine Learning. Регулярно с этим встречаюсь. Уже привык, но до их пор побаливает после каждого упоминания указанных терминов. Если вдруг что-то забыл, пишите:)
https://youtu.be/kHuQDCwA9gM
Давно хотел сформулировать эти мысли. Видео на тему того "На что надо смотреть, когда вы делаете ComputerVision проект". В первую очередь подойдёт тем, кто недавно стал руководить проектом или получил свой первый заказ на разработку готовой системы.
Пытаюсь рассказать что критично, на что обращать внимание, и как выстроить стратегию работ. От чего отталкиваться, что первично.
https://youtu.be/G6UtWlKq3gM
Всем привет! Я уже как-то рассказывал про "Школу будущих CTO" от Phoenix и Яндекс.Облака (по сути это что-то типа месячного хакатона ориентированного на законченный продукт). Ребята позвали меня прочитать несколько лекций + посудить.
Одна из моих лекций будет завтра, в 11 утра, в zoom. Мы решили сделать её открытой для всех, кто захочет придти. Тема лекции заявлена как "«Лучшие практики в CV” или “Интересные решения в CV» ", говорить на ней буду про несколько тем:
- Основная сложность внедрения моделей. Почему важна целостность МЛ-решения и бизнес задачи.
- Как правильно проводить эксперименты, что они должны решать.
- Как правильно выстраивать архитектуру и инфраструктуру МЛ решения.

Лекция будет минут 30-40+минут 20-30 вопросы. Запись надеюсь сюда выложить. Ссылка на завтрашний zoom - https://us02web.zoom.us/j/6161533272?pwd=ZGZXMkNEenZINnlTb1NucS8ySXp4UT09
Обещал вчера скинуть запись лекции, которую проводил. Получите-распишитесь:)
Лекция про то как обычно выстроена архитектура СМ решения, на что надо в первую очередь смотреть, если вы делаете систему с нуля. В какой момент вводить в проект метрики.
Попробовал это густо обмазать примерами из опыта.
А в конце ещё были интересные вопросы:)
https://youtu.be/YgLr9VUpSxU
Небольшой рассказ о том, как мы когда-то давно пришли к задачам распознавания товаров на полках:
1) Как мы рискнули взять задачу, которая на тот момент казалась нерешаемой
2) Как мы выстроили логику работы проекта
3) Как трансформировались алгоритмы с той поры

https://youtu.be/O7ujNLPGxMs
Сегодня Александр (автор весьма известного канала по NLP, с которым мы знакомы уже года 3) и его команда зарелизили очень крутые OpenSource модели SST.
Почему это круто? Банально, потому что любой SST высокого качества сейчас либо ужасно настраивается и неюзабилен (как тот же Kaldi), либо это платные он-лайн модели (тот же Yandex, Google), либо не оптимизированы под железо.

Мне кажется, что такие штуки могут породить новую волну стартапов. Это круто, что ребята решились на такой шаг.

Анонс - https://t.me/snakers4/2554
Сорсы - https://github.com/snakers4/silero-models
Канал - https://t.me/snakers4
Сайт Александра - http://spark-in.me
Какое-то время назад я уже рассказывал о том, как получается классический 3D.
Пришло время рассказать о том, что такое монокулярный и как к нему сейчас подходят. На запись видео меня сподвигли появившиеся недавно сорсы Consistent Video Depth Estimation. Но скорее я рассказываю вообще о том, какие подходы существуют, куда всё движется, и почему упомянутая статья это неплохо.
https://youtu.be/1gnUFHqq0hc
Пару дней назад уже записывал видюшку, в которой рассказывал про, то что такое сегодня монокулярный 3D. Параллельно сделал чуть более подробную статью на Хабр о том, как оно работает - https://habr.com/ru/company/recognitor/blog/519798/
Разобрал доклады по ComputerVision с прошедшего DataFest. Разбирал только из секции CV in industry. Остальные секции возможно тоже разберу, но начала поищу что там интересного было.
В первую очередь пытаюсь рассказать что понравилось + рассказать когда на похожие вещи натыкались на практике и что с ними делали сами:)
https://youtu.be/HoduB-KiDo0
Прошёл по оставшимся CV докладам с DataFest, которые не попали в секцию CV in industry. Старался брать те, которые могут понадобиться в CV, или быть интересными.
В целом, ещё 2-3 приятных доклада, которые любопытно послушать было - нашёл. Но, не скажу, что это фонтан. По сравнению с теми, про которые в прошлый раз говорил.
https://youtu.be/pGbyTtWRRmo
Я в этом году уже делал два поста про трекинг. Большую статью на Хабре + небольшую статью в своём блоге. Но это были скорее гайды на тему how-to. Решил несколько связать и докинуть пару мыслей и примеров из практики, которые в статьи плохо влезали.
https://youtu.be/PvwKVctCjsE
Какое-то время назад я рассказывал небольшую лекцию на 20-30 минут про общение с заказчиками в ML. В первую очередь говорил про метрики, когда на них обращать внимание, когда нет. И как понимать, что в реальности имеет в виду заказчик, а в каком случае его лучше не слушать.
Попробовал пересказать свой рассказ в виде записи. Немного сумбурно, но мысли, мне кажется, сохранились;)
https://youtu.be/bsyJ2CJcqcE
Небольшой рассказ о том, как можно решать Computer Vision задачи под заказ. Где искать, чего ожидать. В чём разница от фриланса. Это некоторое глубокое ИМХО, так как понимаю, что оно может разниться.
https://youtu.be/fJYcl-EF-0s
В последнее время часто слышал утверждения про специализации в ComputerVision, про большое различие в задачах, о разных технологиях, знаниях и навыках. Это и так и не так одновременно. Попробовал рассказать своё видение на эти вопросы.
https://youtu.be/rVPNzaBOUCk