Заметки Computer Vision инженера
5.84K subscribers
36 photos
13 videos
333 links
Мои статьи из разных мест.
Моя телега - @wk_zb

Про консультации - https://telegra.ph/Pro-konsultacii-03-19
Про рекламу - https://telegra.ph/Pro-reklamu-v-bloge-03-19
Про политоту - https://telegra.ph/Pro-politiku-na-kanale-vo-izbezhanie-bana-04-11
Download Telegram
Дополз до тестов Hailo. Первое что мне хотелось посмотреть - а насколько Hailo вообще будет работать на разных платах. И, на удивление, все оказалось очень неплохо.
1) Заработало почти везде
2) Там где не заработало - вопрос скорее к вендорам железа, а не к Hailo
В ближайшие дни попробую ещё сделать небольшую статью с обзором как всё это дело запускать. А пока что видео с результатами бенчмарков
https://youtu.be/cUXSZcNgSz8
🔥234
Так, обещанная статья про запуск Hailo на разных платах. Никакой магии, но всё собрано в одном месте с ссылками и возможными проблемами.
https://medium.com/@zlodeibaal/how-to-run-hailo-on-arm-boards-d2ad599311fa
🔥25
После прошлых видео про 3D было много вопросов про точность, сравнение методов, и.т.д.
Решил сделать несколько наглядных примеров.
Тут в видео их разобрал (в комментах видео с примерами):
https://youtu.be/JnCCvnI8-jY
🔥184
Я уже затрагивал тему прототипирования. Какие сетки для этого нужны. И решил сделать небольшую подборку с топом того что сегодня разумно использовать. Часто с удивлением узнаю что люди не знают часть этих сеток
https://youtu.be/mPXjE5AB9oA
🔥344💩1
Доступ к статистике YouTube канала иногда даёт интересные инсайты. Например можно посмотреть какое маркетинговоре решение было верным. Или посмотреть на то как растёт популярность разных платформ со временем.
На этом графике статистика моего видео про Hailo-8 выпущенного два года назад. Как вы думаете в какой точке графика Hailo объявило партнёрство с RaspberryPi и они выпустили AIHat? :)
😱125💩3
Заметки Computer Vision инженера
Я уже затрагивал тему прототипирования. Какие сетки для этого нужны. И решил сделать небольшую подборку с топом того что сегодня разумно использовать. Часто с удивлением узнаю что люди не знают часть этих сеток https://youtu.be/mPXjE5AB9oA
Небольшое дополнение к прошлому видел. Выложил на втором канале.
Попробовал подробнее рассказать "а как вообще все эти VLM должны менять взгляд бизнеса на ML". Но не со стороны "сейчас промптов напишем и зашибём миллиарды", а со стороны "а что в реальности можно срезать за счет использования больших претрейнов, а что лучше оставить как есть".
https://youtu.be/E-vROjyjEQw
🔥236💩2
После каждого видео о 3D камере кто-нибудь да спрашивает: "А какую 2D камеру мне выбрать?". Когда пускаешься в пространные размышления про оптику, типы матриц и протоколы, человек всё равно перебивает и говорит: "Не, ну вот у меня проект простой, что выбрать то?!". И понимаешь всё бессилие.
Ведь зачастую "настроить камеру" для стартапа это 50% от работы. Понять куда вешать, как крепить, куда подключать. Но не кажется эта задача сравнимой с "сделать супер крутой AI алгоритм". Так, на пол часа.
У меня на канале было несколько отдалённых видео на эту тему. Но какого-то всеобъемлющего гайда я всё не решался сделать. Но слово за слово, обсудив с несколькими товарищами - решил таки написать статью. Писал её последний месяц, медленно шла, структура часто менялась. Понимаю, что она неполна, внутренне противоречива. Но очень надеюсь что достаточна чтобы любой человек который взялся строить свою систему - примерно понимал что надо делать, с чего начинать, и какие ключевые слова есть.
Я попросил трех человек, которые хорошо разбираются в своих областях, накидать идей и покритиковать. Считаю что их идеи были очень классными и помогли мне заметить много пропущенных лакун. Но... Многие из этих идей противоречили друг другу. Что лишь показывает что тема реально сложная, и есть очень много взглядов на то как решать этот вопрос.
Итак.
1) Видео - https://youtu.be/5ZTO4PPQ9Uo
2) Статья - https://medium.com/@zlodeibaal/how-to-choose-a-camera-for-a-computer-vision-project-1da6490bb3dd
Если просмотров / прочтений будет достаточно много - продублирую на хабр. Но пока что на это сил не хватило:)
🔥683💩2
Последние пару месяцев смотрю как все поголовно переходят на Сursor для питона. Интересно стало насколько это массово. Что используете вы? Если Сursor - то платную или бесплатную версию? Советуете?
Anonymous Poll
10%
Сursor
52%
VS Code
29%
PyCharm
2%
Spyder/IDLE/Eclipse прочие IDE
17%
Jupyter
9%
Текстовые редакторы (блокнот/vi/nano)
11%
Кто такой Питон?
😱6💩32
Ещё с лета у меня лежала Rock 5C Lite. Наконец добрался её позапускать недавно. Ожидал что будут какие-то проблемы, но нет. Реально одна из самых лучших плат сейчас (если смотреть по компромиссу удобства, цены и скорости). В отдельности по каждой характеристики, естественно есть варианты лучше. Думаю что на следующей неделе выпущу ещё одно видео про рокчип.
https://youtu.be/eFI08oQN4rA
🔥19💩2
Апдейтнул гайд по тому как запускать нейронки на рокчипе. Какие есть репозитории, какая в них общая логика, как настраивать платы, и.т.д.
За последний год появилось много нового и интересного. Появилось много экспортированных сеточек, почти для всех неплохо описана логика изменений.
https://youtu.be/Mm9eJoqXuto
🔥305
Представим ситуацию. К вам приходит заказчик. Сколько времени тратить на разговоры? Надо ли чарджить с первой минуты или можно разобраться в ТЗ и бесплатно сделать оценку проекта? Кажется что должен быть простой ответ. Но нет. Разные бизнес модели предполагают разное взаимодействие, разные ответы и разные разговоры. Я попробовал немного описать свой взгляд и восприятие - https://youtu.be/ej1BmC6w7a0
🔥1815💩2
Всем привет!
Раз в год я публикую статистику канала. Немножко сумбурно получилось в этот раз и без цельной канвы. Но кажется фанатам статистики должно зайти:) Попробовал собрать много приколов. Огромное спасибо всем кто отвечал на вопросы которые я задавал в канале.
Очень интересно было читать ответы и комменты. Часть попробовал отразить в тексте.
https://telegra.ph/Statistika-kanala-20242025-12-23
И один вопрос напоследок. Что на ваш взгляд было главное событие в 2024 в мире Computer Vision и вокруг?
🔥232💩2
Небольшое видео с результатами года. Что интересного произошло, какие тренды, куда смотреть. Пригласил Васю обсудить и поговорить какие тренды сейчас работают а какие нет.
https://youtu.be/PnkL8k3BBPg
Если что, на Васин LI можно подписаться тут. Он периодически рассказывает что-то интересное про роботов там.
🔥283💩3
Пару дней назад вышла модель Stable Point Aware 3D от StableDiffusion. Сама по себе модель не то чтобы очень полезная. Но зато хороший пример поговорить про ограничения таких моделей. Это полезно и для ChatGPT и для других генеративок
https://youtu.be/VsRVCWZrK0s
🔥112💩2
Уже достаточно давно я хотел протестировать NPU-шки от TI. Но как-то не срасталось. То было слишком устаревшее в продаже. То слишком дорого с доставкой получалось. То куча других плат в наличии.
Да и с документацией, как-то странно. Каждый разговор с представителями TI или соседних плат вызывал некоторый уровень недосказанности.
Но, тут я понял что TI плату можно потестить онлайн (ну, типа того). Собственно видео про это;)
https://youtu.be/NJSqmMEdc5c
🔥114💩2
Последние месяцы было много инсайтов про то насколько сломаны современные бенчмарки в LLM-ках. Попробовал собрать все в одном месте + докидать несколько логичных заключений - https://youtu.be/Vis2CRoQ52o
Расскажите о ваших проблемах и наблюдениях тоже:)
(я не знаю почему сломались превью в телеге, как починиться апдейтну пост)
🔥175💩2
Смехуёчки смехуёчками, и очевидная глупость (нет ничего уникального в этих консолях, чтобы там выламывать). Проще взять новый Intel/AMD.

Но вспомнил смешную байку. Году в 2013 одна компания с которой я был знаком скупала игровые приставки с Nvidia Tegra чтобы её оттуда выломать:)
Не то что это был единственный путь, но эти приставки стоили дешевле чем покупать Nvidia чипы официально партиями по 100 устройств и ждать поставку по пол года.
Зачем надо было это делать? В тот момент стало понятно что можно сделать дешевый M2M протокол если хватит производительности.
Edge девайсов тогда особо не было производительных. Большие компы были дорогими, большими, потребляющими.
В то же время алгоритмы хорошо параллелились, и CUDA спасала положение. Дешево, не греется, маленький размер.

Так что да, иногда купить дешевый хлам и выломать оттуда плату - это вариант. Но не тут:)
🔥334😱4💩1
Ок. Последняя неделя богата на LLM-ки. DeepSeek супер классный, но тут я про него ничего рассказывать не буду. А вот Qwen2.5VL - это просто супер прикольно. Мы уже много где использовали Qwen2VL. Так что было очень интересно посмотреть и потыкать.
Глобально, разница одна - детекция. Теперь не надо много думать и комбинировать пару сеток вместе.
https://youtu.be/YjbnSAyk56g
🔥401💩1
Давно хотел потестить AMD NPU и наконец добрался. В целом, скорее, я приятно удивлён. Видна рука большой компании. Много не доделано, но:
1) Сделано крайне по-человечески: есть вся документация, проблемы не встречены
2) Очень много поддержано
3) Видно развитие

Понятно, что для полного впечатления надо на этом что-то загнать в продакшн. Квантизация может испортить настроение. Но для "взял потетстить" оно прямо на топ-топ уровне.
https://youtu.be/mqtjsYAByEg
🔥323💩1
С одной стороны мне очень нравится современная робототехника. Очень много чего появилось нового. Явно расширились границы. Явно падают цены. Люди начинают смотреть на это не как на что-то из другого мира.
Но в то же время область сейчас супер перегрета. Хайп значит больше чем реальность. Люди не видят разницы между тем где реально AI и видео с вечеринки Теслы где был телеоп.
Решил в этом видео подсветить реальные проблемы роботов сегодня. А если зайдёт - сделаю продолжение на тему того что есть кроме хайпа:)
https://youtu.be/Fi7abF18pQ4
31🔥9💩1
Давно хотел добраться до VLM'ок на NPU.
У Рокчипа оно появилось ещё в декабре. Но из-за проблем с драйверами запустить было сложно без удаления системы с той борды которая мне была нужна. Но в какой-то момент вышло новое ядро - и я наконец смог проверить.
Кажется, что это первая плата за исключением Jetson где такое стало возможно.
https://youtu.be/iTq1m2ro6xg
🔥31💩21