Заметки Computer Vision инженера – Telegram

Заметки Computer Vision инженера

5.84K subscribers

36 photos

13 videos

333 links

Мои статьи из разных мест.
Моя телега - @wk_zb

Про консультации - https://telegra.ph/Pro-konsultacii-03-19
Про рекламу - https://telegra.ph/Pro-reklamu-v-bloge-03-19
Про политоту - https://telegra.ph/Pro-politiku-na-kanale-vo-izbezhanie-bana-04-11

Download Telegram

About

Blog

Apps

Platform

Заметки Computer Vision инженера

5.84K subscribers

Заметки Computer Vision инженера

Дополз до тестов Hailo. Первое что мне хотелось посмотреть - а насколько Hailo вообще будет работать на разных платах. И, на удивление, все оказалось очень неплохо.
1) Заработало почти везде
2) Там где не заработало - вопрос скорее к вендорам железа, а не к Hailo
В ближайшие дни попробую ещё сделать небольшую статью с обзором как всё это дело запускать. А пока что видео с результатами бенчмарков
https://youtu.be/cUXSZcNgSz8

How fast is Hailo-8L with boards other than RPi5?

00:00:00 - Intro
00:00:48 - How easy is it to run Hailo on a random board?
00:01:07 - How is the speed related to PCLe lines and protocol?
00:01:25 - Is the inference speed related to the CPU?
00:01:48 - Our players: RPi5, NanoPC-t6 (RK3588), RockPi…

🔥23❤4

6.97K views19:56

Заметки Computer Vision инженера

Так, обещанная статья про запуск Hailo на разных платах. Никакой магии, но всё собрано в одном месте с ссылками и возможными проблемами.
https://medium.com/@zlodeibaal/how-to-run-hailo-on-arm-boards-d2ad599311fa

How to run Hailo on ARM boards

Recently, I tested Hailo on different Edge boards. I was interested to see how much Hailo speed depends on the PCIe bus and how much it…

🔥25

7.43K views12:38

Заметки Computer Vision инженера

После прошлых видео про 3D было много вопросов про точность, сравнение методов, и.т.д.
Решил сделать несколько наглядных примеров.
Тут в видео их разобрал (в комментах видео с примерами):
https://youtu.be/JnCCvnI8-jY

A short sample: Classic stereo Depth vs. Neural stereo Depth vs. Monocular depth.

00:00:00 - Intro.
00:01:52 - The first example
00:02:36 - The second example

Stereo on the Edge - https://youtu.be/mEs_8vxxSqI
Stereo vs mono - https://youtu.be/UQBIKsUQZOc

My LinkedIn - https://www.linkedin.com/in/maltsevanton/
My Telegram channel…

🔥18❤4

7.72K views23:59

Заметки Computer Vision инженера

Я уже затрагивал тему прототипирования. Какие сетки для этого нужны. И решил сделать небольшую подборку с топом того что сегодня разумно использовать. Часто с удивлением узнаю что люди не знают часть этих сеток
https://youtu.be/mPXjE5AB9oA

Using big pre-trained models for prototyping

00:00:00 - Intro.
00:01:07 - Big VLM: ChatGPT, Qwen2 VL, LLAMA/LLAVA, NVLM, Molmo, etc.
00:03:38 - Grounding Dino, Grounding SAM, Florence 2, etc.
00:06:25 - SAM, SAM2
00:07:51 - CLIP, DINOv2, etc.
00:10:38 - From prototype to production.

My LinkedIn…

🔥34❤4💩1

7.21K viewsedited 07:15

Заметки Computer Vision инженера

Доступ к статистике YouTube канала иногда даёт интересные инсайты. Например можно посмотреть какое маркетинговоре решение было верным. Или посмотреть на то как растёт популярность разных платформ со временем.
На этом графике статистика моего видео про Hailo-8 выпущенного два года назад. Как вы думаете в какой точке графика Hailo объявило партнёрство с RaspberryPi и они выпустили AIHat? :)

😱12❤5💩3

7.26K views10:48

Заметки Computer Vision инженера

Заметки Computer Vision инженера

Я уже затрагивал тему прототипирования. Какие сетки для этого нужны. И решил сделать небольшую подборку с топом того что сегодня разумно использовать. Часто с удивлением узнаю что люди не знают часть этих сеток https://youtu.be/mPXjE5AB9oA

Небольшое дополнение к прошлому видел. Выложил на втором канале.
Попробовал подробнее рассказать "а как вообще все эти VLM должны менять взгляд бизнеса на ML". Но не со стороны "сейчас промптов напишем и зашибём миллиарды", а со стороны "а что в реальности можно срезать за счет использования больших претрейнов, а что лучше оставить как есть".
https://youtu.be/E-vROjyjEQw

Как современные LLM/VLM меняют подходы для ML ориентированных компаний?

Мой основной канал @AntonMaltsev
Мой TG канал - https://t.me/CVML_team

🔥23❤6💩2

7.02K views23:57

Заметки Computer Vision инженера

После каждого видео о 3D камере кто-нибудь да спрашивает: "А какую 2D камеру мне выбрать?". Когда пускаешься в пространные размышления про оптику, типы матриц и протоколы, человек всё равно перебивает и говорит: "Не, ну вот у меня проект простой, что выбрать то?!". И понимаешь всё бессилие.
Ведь зачастую "настроить камеру" для стартапа это 50% от работы. Понять куда вешать, как крепить, куда подключать. Но не кажется эта задача сравнимой с "сделать супер крутой AI алгоритм". Так, на пол часа.
У меня на канале было несколько отдалённых видео на эту тему. Но какого-то всеобъемлющего гайда я всё не решался сделать. Но слово за слово, обсудив с несколькими товарищами - решил таки написать статью. Писал её последний месяц, медленно шла, структура часто менялась. Понимаю, что она неполна, внутренне противоречива. Но очень надеюсь что достаточна чтобы любой человек который взялся строить свою систему - примерно понимал что надо делать, с чего начинать, и какие ключевые слова есть.
Я попросил трех человек, которые хорошо разбираются в своих областях, накидать идей и покритиковать. Считаю что их идеи были очень классными и помогли мне заметить много пропущенных лакун. Но... Многие из этих идей противоречили друг другу. Что лишь показывает что тема реально сложная, и есть очень много взглядов на то как решать этот вопрос.
Итак.
1) Видео - https://youtu.be/5ZTO4PPQ9Uo
2) Статья - https://medium.com/@zlodeibaal/how-to-choose-a-camera-for-a-computer-vision-project-1da6490bb3dd
Если просмотров / прочтений будет достаточно много - продублирую на хабр. Но пока что на это сил не хватило:)

Choosing a 2d camera for Computer Vision product: The Сomprehensive Guide

Article - https://medium.com/@zlodeibaal/how-to-choose-a-camera-for-a-computer-vision-project-1da6490bb3dd

Pavel - https://www.linkedin.com/in/pavelryabenko/
Yuriy - https://www.linkedin.com/in/yuriy-bukhtiyarov-74790b20/
Andrey - https://www.linkedin.c…

🔥68❤3💩2

7.75K views09:22

Заметки Computer Vision инженера

Последние пару месяцев смотрю как все поголовно переходят на Сursor для питона. Интересно стало насколько это массово. Что используете вы? Если Сursor - то платную или бесплатную версию? Советуете?

Anonymous Poll

Spyder/IDLE/Eclipse прочие IDE

Текстовые редакторы (блокнот/vi/nano)

Кто такой Питон?

😱6💩3❤2

1.24K voters6.76K views22:37

Заметки Computer Vision инженера

Ещё с лета у меня лежала Rock 5C Lite. Наконец добрался её позапускать недавно. Ожидал что будут какие-то проблемы, но нет. Реально одна из самых лучших плат сейчас (если смотреть по компромиссу удобства, цены и скорости). В отдельности по каждой характеристики, естественно есть варианты лучше. Думаю что на следующей неделе выпущу ещё одно видео про рокчип.
https://youtu.be/eFI08oQN4rA

Is the Radxa Rock5C Lite (RK3582) one of the best boards for hobby Computer Vision Right now?

My LinkedIn - https://www.linkedin.com/in/maltsevanton/
My Telegram channel - https://t.me/CVML_team
e-mail: anton@rembrain.ai
Twitter - https://twitter.com/Serious_WK

Video about:
Hailo on different boards - https://youtu.be/cUXSZcNgSz8

RK3576 - http…

🔥19💩2

6.01K views10:55

Заметки Computer Vision инженера

Апдейтнул гайд по тому как запускать нейронки на рокчипе. Какие есть репозитории, какая в них общая логика, как настраивать платы, и.т.д.
За последний год появилось много нового и интересного. Появилось много экспортированных сеточек, почти для всех неплохо описана логика изменений.
https://youtu.be/Mm9eJoqXuto

How to run neural networks on RockChip in 2025 (rknn-toolkit, rknn model zoo, rkllm).

00:00:00 - Intro
00:00:49 - General logic system preparation (RKNN-Toolkit, RKNPU, etc.)
00:03:29 - Difference with one year ago
00:04:40 - The process: step by step
00:07:35 - Don't use PyTorch for inference! How to avoid.
00:09:53 - Models overview
00:14:30…

🔥30❤5

6.29K viewsedited 10:11

Заметки Computer Vision инженера

Представим ситуацию. К вам приходит заказчик. Сколько времени тратить на разговоры? Надо ли чарджить с первой минуты или можно разобраться в ТЗ и бесплатно сделать оценку проекта? Кажется что должен быть простой ответ. Но нет. Разные бизнес модели предполагают разное взаимодействие, разные ответы и разные разговоры. Я попробовал немного описать свой взгляд и восприятие - https://youtu.be/ej1BmC6w7a0

Сколько тратить времени на разговоры в Computer Vision?

Мой основной канал @AntonMaltsev
Мой TG канал - https://t.me/CVML_team

🔥18❤15💩2

6.15K views12:51

Заметки Computer Vision инженера

Всем привет!
Раз в год я публикую статистику канала. Немножко сумбурно получилось в этот раз и без цельной канвы. Но кажется фанатам статистики должно зайти:) Попробовал собрать много приколов. Огромное спасибо всем кто отвечал на вопросы которые я задавал в канале.
Очень интересно было читать ответы и комменты. Часть попробовал отразить в тексте.
https://telegra.ph/Statistika-kanala-20242025-12-23
И один вопрос напоследок. Что на ваш взгляд было главное событие в 2024 в мире Computer Vision и вокруг?

Статистика канала 2024/2025

Всем привет! Традиционно в конце года хочу подвести статистику канала. На всякий случай, вот статистика за прошлые годы:2023/2024 2022/2023 Под каналом я подразумеваю: TG канал. Рост подписчиков 4000 → 5324. Youtube. Рост подписчиков 4100 → 6289. LinkedIn.…

🔥23❤2💩2

6.62K views10:52

Заметки Computer Vision инженера

Небольшое видео с результатами года. Что интересного произошло, какие тренды, куда смотреть. Пригласил Васю обсудить и поговорить какие тренды сейчас работают а какие нет.
https://youtu.be/PnkL8k3BBPg
Если что, на Васин LI можно подписаться тут. Он периодически рассказывает что-то интересное про роботов там.

Итоги 2024 года в CV и ML. Что было, что ждём.

00:00:00 - Вступление
00:00:49 - Визуальные модели (VLM, LVM)
00:05:55 - Видео генеративные модели
00:11:10 - Закон скейлинга. Перестал ли он работать? Что такое O1, O3?
00:16:43 - Новое и старое железо: Groq, Nvidia, RockChips, etc.
00:23:26 - Регуляция.…

🔥28❤3💩3

7.6K viewsedited 09:47

Заметки Computer Vision инженера

Пару дней назад вышла модель Stable Point Aware 3D от StableDiffusion. Сама по себе модель не то чтобы очень полезная. Но зато хороший пример поговорить про ограничения таких моделей. Это полезно и для ChatGPT и для других генеративок
https://youtu.be/VsRVCWZrK0s

The Dark Side of AI. Stable Point Aware 3D example (SPAR3D)

My LinkedIn - https://www.linkedin.com/in/maltsevanton/
My Telegram channel - https://t.me/CVML_team
e-mail: anton@rembrain.ai
Twitter - https://twitter.com/Serious_WK

🔥11❤2💩2

7.21K views09:24

Заметки Computer Vision инженера

Уже достаточно давно я хотел протестировать NPU-шки от TI. Но как-то не срасталось. То было слишком устаревшее в продаже. То слишком дорого с доставкой получалось. То куча других плат в наличии.
Да и с документацией, как-то странно. Каждый разговор с представителями TI или соседних плат вызывал некоторый уровень недосказанности.
Но, тут я понял что TI плату можно потестить онлайн (ну, типа того). Собственно видео про это;)
https://youtu.be/NJSqmMEdc5c

Usage of Texas Instruments (TI) NPU for Computer Vision

00:00:00 - Intro
00:01:58 - How can everyone test the TI board? (AM62A, AM68A, AM69A, TDA4VM)
00:02:34 - Or the Intel Board?
00:04:00 - Pros for TI NPU boards: ready-made server, ONNX-Runtime (export, inference). A lot of models.
00:08:42 - Cons. Overcomplex…

🔥11❤4💩2

7.86K views12:37

Заметки Computer Vision инженера

Последние месяцы было много инсайтов про то насколько сломаны современные бенчмарки в LLM-ках. Попробовал собрать все в одном месте + докидать несколько логичных заключений - https://youtu.be/Vis2CRoQ52o
Расскажите о ваших проблемах и наблюдениях тоже:)
(я не знаю почему сломались превью в телеге, как починиться апдейтну пост)

🔥17❤5💩2

6.26K viewsedited 09:45

Заметки Computer Vision инженера

Смехуёчки смехуёчками, и очевидная глупость (нет ничего уникального в этих консолях, чтобы там выламывать). Проще взять новый Intel/AMD.

Но вспомнил смешную байку. Году в 2013 одна компания с которой я был знаком скупала игровые приставки с Nvidia Tegra чтобы её оттуда выломать:)
Не то что это был единственный путь, но эти приставки стоили дешевле чем покупать Nvidia чипы официально партиями по 100 устройств и ждать поставку по пол года.
Зачем надо было это делать? В тот момент стало понятно что можно сделать дешевый M2M протокол если хватит производительности.
Edge девайсов тогда особо не было производительных. Большие компы были дорогими, большими, потребляющими.
В то же время алгоритмы хорошо параллелились, и CUDA спасала положение. Дешево, не греется, маленький размер.

Так что да, иногда купить дешевый хлам и выломать оттуда плату - это вариант. Но не тут:)

🔥33❤4😱4💩1

5.89K views16:58

Заметки Computer Vision инженера

Ок. Последняя неделя богата на LLM-ки. DeepSeek супер классный, но тут я про него ничего рассказывать не буду. А вот Qwen2.5VL - это просто супер прикольно. Мы уже много где использовали Qwen2VL. Так что было очень интересно посмотреть и потыкать.
Глобально, разница одна - детекция. Теперь не надо много думать и комбинировать пару сеток вместе.
https://youtu.be/YjbnSAyk56g

Qwen2.5-VL - short overview for a real tasks

00:00:00 - Intro
00:00:59 - The main difference between Qwen2-VL and Qwen2.5-VL
00:02:26 - Why Qwen2.5-VL is not the best decision for a lot of tasks
00:04:49 - Where Qwen is working and not working

My LinkedIn - https://www.linkedin.com/in/maltsevanton/…

🔥40❤1💩1

6.32K views21:57

Заметки Computer Vision инженера

Давно хотел потестить AMD NPU и наконец добрался. В целом, скорее, я приятно удивлён. Видна рука большой компании. Много не доделано, но:
1) Сделано крайне по-человечески: есть вся документация, проблемы не встречены
2) Очень много поддержано
3) Видно развитие

Понятно, что для полного впечатления надо на этом что-то загнать в продакшн. Квантизация может испортить настроение. Но для "взял потетстить" оно прямо на топ-топ уровне.
https://youtu.be/mqtjsYAByEg

Running AI on AMD NPU

00:00:00 - Intro. Is AMD - Edge device?
00:01:14 - What is this video about?
00:01:42 - General description of the framework / Ryzen AI / AMD Quark / Vitis AI
00:02:34 - Pros
00:03:41 - Cons
00:05:27 - Basic pipeline / Export / Quantization / NPU
00:08:00…

🔥32❤3💩1

7K views02:12

Заметки Computer Vision инженера

С одной стороны мне очень нравится современная робототехника. Очень много чего появилось нового. Явно расширились границы. Явно падают цены. Люди начинают смотреть на это не как на что-то из другого мира.
Но в то же время область сейчас супер перегрета. Хайп значит больше чем реальность. Люди не видят разницы между тем где реально AI и видео с вечеринки Теслы где был телеоп.
Решил в этом видео подсветить реальные проблемы роботов сегодня. А если зайдёт - сделаю продолжение на тему того что есть кроме хайпа:)
https://youtu.be/Fi7abF18pQ4

AI in robotics. How real is it?

00:00:00 - Intro. Is robotics fake?
00:00:40 - Fake availability
00:01:42 - General description of the framework / Ryzen AI / AMD Quark / Vitis AI
00:04:11 - Fake: teleop and trajectories
00:05:16 - Real algorithm problems

My LinkedIn - https:/…

❤31🔥9💩1

7.07K viewsedited 00:52

Заметки Computer Vision инженера

Давно хотел добраться до VLM'ок на NPU.
У Рокчипа оно появилось ещё в декабре. Но из-за проблем с драйверами запустить было сложно без удаления системы с той борды которая мне была нужна. Но в какой-то момент вышло новое ядро - и я наконец смог проверить.
Кажется, что это первая плата за исключением Jetson где такое стало возможно.
https://youtu.be/iTq1m2ro6xg

RKNN LLM - Running QWEN 2 VL (RK3588)

00:00:00 - Intro.
00:01:20 - How to prepare your RockChip board: drivers (Armbian or Core update)
00:02:48 - Qwen2-VL main guide
00:04:27 - Inference script
00:05:02 - Inference speed (current and how to optimize)
00:07:30 - How to use this in the real…

🔥31💩2❤1

6.45K views11:01