Заметки Computer Vision инженера
5.84K subscribers
35 photos
13 videos
332 links
Мои статьи из разных мест.
Моя телега - @wk_zb

Про консультации - https://telegra.ph/Pro-konsultacii-03-19
Про рекламу - https://telegra.ph/Pro-reklamu-v-bloge-03-19
Про политоту - https://telegra.ph/Pro-politiku-na-kanale-vo-izbezhanie-bana-04-11
Download Telegram
В прошлом видео я просил накидать вопросов и идей на новые видео. Мне понравились вопросы про архитектуру сетей, попробовал их обобщить и ответить. Как выбрать нейронку для вашей задачи? А если разработать? Когда будет иметь смысл влезать в дебри?
https://youtu.be/Y-OnWYERy18
Для решения ваших задач через ML не всегда нужно выбирать и запускать нейронные сети. Не всегда надо ресерчить на просторах интернета и сравнивать разные подходы. Обычно можно взять что-то простое и быстро проверить.
Но порой приходиться все же запариться и начать копать. Где копать? На что смотреть? Для специалиста в теме это глупые вопросы. У каждого свой подход. Кто-то идет на Papers With Code, кто-то на Reddit кто-то в ODS.
Рассказал что делаю сам.
https://youtu.be/gIOhQe-dfr0
Меня уже много раз спрашивали что я использую для ML, как настраиваю окружение, где GPU и какие. Наверное, это все достаточно скучные вопросы для профессионалов. Они сформировали свои привычки в первые пол года после входа. Но, для новичков, возможно будет интересно, чтобы послушать какие бывают варианты. Все-таки моя инфраструктура не совсем стандартная.
https://youtu.be/zCHFFW2YJ1c
Летом я в первый раз в своей жизни заказал что-то на Кикстартере. И теперь странная девайсина наконец дошла до меня. Рассматриваю, запускаю и пытаюсь понять нужен ли этот формат вообще где-то.
Видео + пост в блоге с ссылками на код и более структурированными плюсами и минусами.
https://youtu.be/ZxfWp5_yRiw
http://cv-blog.ru/?p=429
Небольшой рассказ о том как выбирать баланс между нейронными сетями и аппаратной составляющей проекта. На полноту не претендует, но возможно натолкнет на идеи где важнее хорошая камера, где грамотный алгоритм, а где их взаимный баланс.
https://youtu.be/LxNmUitR7tY
Часто люди считают что в ComputerVision много математики. В реальности сложная и интересная математика - это скорее редкость для проектов. Небольшой рассказ на что и где наталкивался и с чем встречался.
https://youtu.be/D1cufPHgBB4
Записал свои мысли на тему автоматизации. Что можно автоматизировать в ML-пайплайне, как это делать, когда это нужно и куда смотреть.
https://youtu.be/B9-VZjqaIpY
Не все проекты в CV доходят до какого-то логического конца. Какие-то начинаются и умирают в первую неделю. Спешл к 1му апреля - рассказываю о историях когда делал разные пет-проекты или работы которые не доросли до полноценных проектов, зато выдавали много полезного опыта.
https://youtu.be/HG6SbYDwYsY
На днях вышла офигенная сетка которая бьет State-of-art на задачах сегментации и оценки глубины (естественно за счет трансформеров). Но почему-то про неё нет нигде информации. Исправляю это недоразумение, делаю краткий обзор сетки/что она умеет.
https://youtu.be/Bd8jFcoJBto
Периодически закапываюсь и делаю очередной обзор рынка embedded устройств для ComputerVision. Сейчас триггернул OAK, на который недели две назад я делал обзор. И вот, очередная статья на Хабр - https://habr.com/ru/company/recognitor/blog/551552/
Посмотрел доклады с GTC. Он пока ещё в процессе, но основная часть интересных докладов уже прошла. Часть 1 - про кейноты и развитие NVIDIA. Что-то на удивление слабо в этом году. Из сильного - OMNIVERSE, но это для огромных компаний. И, повсеместное продвижение TRITON. На этом, пожалуй, все.
Завтра выложу видео с обзором продуктовых рассказов на конференции.
https://youtu.be/QtSdxgm2JPg
Вчера обещал вторую часть разбора GTC. Про практические работы которые там докладывались по теме ComputerVision. Что-то стартапы, что-то студенческие проекты, что-то фанатские.
В целом уровень работ неплохой. Рассказываю что понравилось и что нет.
https://youtu.be/qYBEfxE4FSs
Всем привет! Мы в CherryLabs последние пару месяцев неспешно ищем BackEnd разработчика с некоторым пониманием/опытом в CV/ML. Решил тут тоже запостить, вдруг кому интересно - https://telegra.ph/Software-engineer-MLData-focus-04-19
Основные задачи - автоматизация пайплайнов сбора/передачи данных, запуска контейнеров с обучением/выкаткой в прод.
В последние пару месяцев идет масса новых статей по применению Трансформеров к ComputerVision. Попробовал систематизировать их и написать статью на Хабре что нового и откуда это все - https://habr.com/ru/company/recognitor/blog/553478/
А параллельно - видео, кому читать лень - https://youtu.be/xQFeeh5DqeY ;)
Меня часто спрашивают как сделать детекцию.
Статьи на хабре 10 летней давности о каскадах Хаара дают о себе знать;)
Небольшой обзор для людей кто хочет въехать с нуля в 2021. Куда смотреть, что использовать, что обучать или не обучать. Объясняю почему сейчас не надо использовать каскады Хаара и как зоопарки моделей завязываются на аппаратуру
https://youtu.be/5_z33SG5MYg
Немного рассуждений о том когда и зачем нужны Transfer Learning. Рассказ скорее для новичков, которые пытаются понять где это применимо, какие границы. Рассказываю базовые штуки + идеи что и как применять
https://youtu.be/n-bWMIqRsIM
За последние три дня мне уже 3-4 человека скинуло новую статью от фейсбука (DINO и PAWS), что меня очень удивило. Новизны то там почти нет, на мой взгляд, хоть и выглядит красиво. Решил записать свое мнение на эту тему.
https://youtu.be/Ozf7zPzps70
Всем привет!
Меня пару раз уже звали на датафесты что-то рассказывать. Но оффлайн датафест - это сложно. Готовиться, пол дня тратить, куда-то ехать. А онлайн датасет позволяет не так париться - и все аккуратно неспешно сделать и презентовать.
Короче, в этом году меня сподвигли сделать доклад для секции CV in Industry (в прошлом году там было много классных рассказов).
Сам доклад будет завтра в 12.50 примерно. Ссылку на него скину, как будет опубликован. Но в режиме онлайн, после доклада, можно будет позадавать вопросы.
А сегодня, в 12.00 будет небольшая QnA секция с докладчиками, если кому-то интересно.
Сайт датафеста - https://datafest.ru/2021/
Комната в spatialchat - CV in industry
Доклады секции CV in industry зарелизили - https://ods.ai/tracks/cv-in-industry-df2021
Мой доклад - https://www.youtube.com/watch?v=Kend6gDyRws
Сейчас идет его презентация в spatialchat как раз (ссылка на регистрацию и вход тут - https://datafest.ru/2021/ ). Минут через 45 будет секция ответов на вопросы, если кто захочет онлайн задать. Либо, можно под видео задавать - отвечу чуть позже.
Сегодня поговорим про некорректно поставленные задачи в ML. Когда задача есть, но лучше её не решать. Приведу пару примеров из жизни и из сегодняшней реальности
https://youtu.be/qUnZvsqq8H0
С одной стороны тема банальная, а с другой - один из самых популярных вопросов которые меня спрашивают. "А можно ли разрабатывать нейронки на языке X?", "А есть что-то кроме Python?", "А на каком языке запускать нейронку?".
Попробовал записать свои мысли на эту тему. Уверен что назвал не все, дополняйте!:)
https://youtu.be/tFNqQZFVEhU