Заметки Computer Vision инженера
5.84K subscribers
35 photos
13 videos
332 links
Мои статьи из разных мест.
Моя телега - @wk_zb

Про консультации - https://telegra.ph/Pro-konsultacii-03-19
Про рекламу - https://telegra.ph/Pro-reklamu-v-bloge-03-19
Про политоту - https://telegra.ph/Pro-politiku-na-kanale-vo-izbezhanie-bana-04-11
Download Telegram
Меня часто спрашивают как сделать детекцию.
Статьи на хабре 10 летней давности о каскадах Хаара дают о себе знать;)
Небольшой обзор для людей кто хочет въехать с нуля в 2021. Куда смотреть, что использовать, что обучать или не обучать. Объясняю почему сейчас не надо использовать каскады Хаара и как зоопарки моделей завязываются на аппаратуру
https://youtu.be/5_z33SG5MYg
Немного рассуждений о том когда и зачем нужны Transfer Learning. Рассказ скорее для новичков, которые пытаются понять где это применимо, какие границы. Рассказываю базовые штуки + идеи что и как применять
https://youtu.be/n-bWMIqRsIM
За последние три дня мне уже 3-4 человека скинуло новую статью от фейсбука (DINO и PAWS), что меня очень удивило. Новизны то там почти нет, на мой взгляд, хоть и выглядит красиво. Решил записать свое мнение на эту тему.
https://youtu.be/Ozf7zPzps70
Всем привет!
Меня пару раз уже звали на датафесты что-то рассказывать. Но оффлайн датафест - это сложно. Готовиться, пол дня тратить, куда-то ехать. А онлайн датасет позволяет не так париться - и все аккуратно неспешно сделать и презентовать.
Короче, в этом году меня сподвигли сделать доклад для секции CV in Industry (в прошлом году там было много классных рассказов).
Сам доклад будет завтра в 12.50 примерно. Ссылку на него скину, как будет опубликован. Но в режиме онлайн, после доклада, можно будет позадавать вопросы.
А сегодня, в 12.00 будет небольшая QnA секция с докладчиками, если кому-то интересно.
Сайт датафеста - https://datafest.ru/2021/
Комната в spatialchat - CV in industry
Доклады секции CV in industry зарелизили - https://ods.ai/tracks/cv-in-industry-df2021
Мой доклад - https://www.youtube.com/watch?v=Kend6gDyRws
Сейчас идет его презентация в spatialchat как раз (ссылка на регистрацию и вход тут - https://datafest.ru/2021/ ). Минут через 45 будет секция ответов на вопросы, если кто захочет онлайн задать. Либо, можно под видео задавать - отвечу чуть позже.
Сегодня поговорим про некорректно поставленные задачи в ML. Когда задача есть, но лучше её не решать. Приведу пару примеров из жизни и из сегодняшней реальности
https://youtu.be/qUnZvsqq8H0
С одной стороны тема банальная, а с другой - один из самых популярных вопросов которые меня спрашивают. "А можно ли разрабатывать нейронки на языке X?", "А есть что-то кроме Python?", "А на каком языке запускать нейронку?".
Попробовал записать свои мысли на эту тему. Уверен что назвал не все, дополняйте!:)
https://youtu.be/tFNqQZFVEhU
Сейчас на ODS датафесте идет прикольный трек, про медицинские данные - https://ods.ai/tracks/medical-data-df2021
Завтра (в смысле уже сегодня, 11.06.21), будет круглый стол, на котором пригласили принять участие. Поговорим про то чем медицинские данные отличаются от обычных, и почему временами Ground Truth - спорное понятие. Если будет интересное - заходите в SpatialChat. Плюс обещали трансляцию на ютубе.
https://youtu.be/sVUJF50Jdqk
Есть темы в которых я плохо разбираюсь (например найм людей в проект). Конечно, за двенадцать лет работы я нанимал людей, но все же, не считаю что разбираюсь как это сделать интересно и правильно.
У Александра (автора https://t.me/snakers4 ) была прекрасная статья про найм - https://spark-in.me/post/silero-junior-ml-researcher . Мне очень понравился подход. Решил поговорить с ним про найм, про проблемы которые сегодня есть, и про то как он видит их решение. В комментарии к этому посту приложу запись подскаста в аудио варианте.
Давно хотел свести несколько своих разрозненных статей в один рассказ. Как декомпозировать CV задачу заказчика, перевести её в ТЗ и формализовать. Плюс попробовал немного над форматом поработать.
https://youtu.be/LynVS25Notk
Давно надо было сделать какой-то краткий обзор про OCR: что за зверь такой, с какой стороны подступаться. Конечно, описать все подробности в одном видео не реально. Но может, как-нибудь, запишу ещё несколько про отдельные задачи в OCR. Сейчас видео общее, с обзором подходов и существующих фреймворков.
https://youtu.be/-g9huhHXXJQ
Немного запоздалый обзор датафеста на взгляд CV разработчика. В целом, мне понравилось. Докладов меньше чем на прошлом, но качество мне кажется повыше. Было интересно посмотреть. Попробовал вкратце осветить на что обращать внимание.
https://youtu.be/dsM_Ep-32HQ
Ещё в апреле, опубликовав статью про трансформеры - хотел опубликовать и статью про StyleGAN'ы через пару недель. Пришлось с ними немного столкнуться/разобраться/поработать весной. Ну, за пару недель написать статью не вышло:)
Наконец дописал - https://habr.com/ru/company/recognitor/blog/568000/
Давно хотел небольшой рассказик сделать о том как я работаю со статьями с CV. Как и что выбираю, на что смотрю, где достаю. Собственно видео + статья в блоге.
https://youtu.be/l0lC7aXdRsY
Уже очень много раз я рассказывал про распознавание автомобильных номеров. Но никогда не говорил о том, что можно сделать с тех же камер, и какие будут в каждой из задач сложности. Попробую сделать быстрый обзор по пару минут на каждую тему.
https://youtu.be/Lk-kSm4go0s
На прошлой неделе Intel сказал что RealSence все. Потом, правда, немного откатил назад и смягчил формулировку. Но осадочек остался. Поговорили с Васей "Кто если не", и обсудили варианты камер глубины.
https://youtu.be/79rdhdzd2V4
А сегодня поговорим о том что такое продакт менеджмент для машинного обучения. Как его готовят, как ML разработка с ним взаимодействует, и когда без него уже не обойтись. И прочее и прочее:)
https://youtu.be/BrLaHzHV1W8
Забавно, но в последнее время часто наталкивался на мысль "Сегментация это просто сегментация". Но в реальности на сегментации может быть масса других, в том числе необычных алгоритмов. Решил немного поговорить на эту тему.
https://youtu.be/uATZU2ABoYM
В последний раз пару раз просвещал людей на тему того "на чем обучать". Для профессионалов, наверное, бесполезное видел. Но знаю много людей, которые только входят в ML, или которые интегрируют ML продукты себе в прод - и им, наверное, должно зайти:)
https://youtu.be/o5lS--V0gsI
Ещё в августе Tesla выпустила классное видео про то как сейчас у них все устроено. Мне всегда приятно смотреть такие видюшки, они познавательны и приятно видеть в них какие-то идеи про которые уже думал или использовал. Сделал небольшое обзор про основные идеи которые мне там понравились.
https://youtu.be/QRR1bdMumJI