Заметки Computer Vision инженера

Уже достаточно давно я хотел протестировать NPU-шки от TI. Но как-то не срасталось. То было слишком устаревшее в продаже. То слишком дорого с доставкой получалось. То куча других плат в наличии.
Да и с документацией, как-то странно. Каждый разговор с представителями TI или соседних плат вызывал некоторый уровень недосказанности.
Но, тут я понял что TI плату можно потестить онлайн (ну, типа того). Собственно видео про это;)
https://youtu.be/NJSqmMEdc5c

YouTube

Usage of Texas Instruments (TI) NPU for Computer Vision

00:00:00 - Intro
00:01:58 - How can everyone test the TI board? (AM62A, AM68A, AM69A, TDA4VM)
00:02:34 - Or the Intel Board?
00:04:00 - Pros for TI NPU boards: ready-made server, ONNX-Runtime (export, inference). A lot of models.
00:08:42 - Cons. Overcomplex…

🔥11❤4💩2

7.87K views12:37

Заметки Computer Vision инженера

Последние месяцы было много инсайтов про то насколько сломаны современные бенчмарки в LLM-ках. Попробовал собрать все в одном месте + докидать несколько логичных заключений - https://youtu.be/Vis2CRoQ52o
Расскажите о ваших проблемах и наблюдениях тоже:)
(я не знаю почему сломались превью в телеге, как починиться апдейтну пост)

🔥17❤5💩2

6.26K viewsedited 09:45

Заметки Computer Vision инженера

Смехуёчки смехуёчками, и очевидная глупость (нет ничего уникального в этих консолях, чтобы там выламывать). Проще взять новый Intel/AMD.

Но вспомнил смешную байку. Году в 2013 одна компания с которой я был знаком скупала игровые приставки с Nvidia Tegra чтобы её оттуда выломать:)
Не то что это был единственный путь, но эти приставки стоили дешевле чем покупать Nvidia чипы официально партиями по 100 устройств и ждать поставку по пол года.
Зачем надо было это делать? В тот момент стало понятно что можно сделать дешевый M2M протокол если хватит производительности.
Edge девайсов тогда особо не было производительных. Большие компы были дорогими, большими, потребляющими.
В то же время алгоритмы хорошо параллелились, и CUDA спасала положение. Дешево, не греется, маленький размер.

Так что да, иногда купить дешевый хлам и выломать оттуда плату - это вариант. Но не тут:)

🔥33❤4😱4💩1

5.9K views16:58

Заметки Computer Vision инженера

Ок. Последняя неделя богата на LLM-ки. DeepSeek супер классный, но тут я про него ничего рассказывать не буду. А вот Qwen2.5VL - это просто супер прикольно. Мы уже много где использовали Qwen2VL. Так что было очень интересно посмотреть и потыкать.
Глобально, разница одна - детекция. Теперь не надо много думать и комбинировать пару сеток вместе.
https://youtu.be/YjbnSAyk56g

YouTube

Qwen2.5-VL - short overview for a real tasks

00:00:00 - Intro
00:00:59 - The main difference between Qwen2-VL and Qwen2.5-VL
00:02:26 - Why Qwen2.5-VL is not the best decision for a lot of tasks
00:04:49 - Where Qwen is working and not working

My LinkedIn - https://www.linkedin.com/in/maltsevanton/…

🔥40❤1💩1

6.33K views21:57

Заметки Computer Vision инженера

Давно хотел потестить AMD NPU и наконец добрался. В целом, скорее, я приятно удивлён. Видна рука большой компании. Много не доделано, но:
1) Сделано крайне по-человечески: есть вся документация, проблемы не встречены
2) Очень много поддержано
3) Видно развитие

Понятно, что для полного впечатления надо на этом что-то загнать в продакшн. Квантизация может испортить настроение. Но для "взял потетстить" оно прямо на топ-топ уровне.
https://youtu.be/mqtjsYAByEg

YouTube

Running AI on AMD NPU

00:00:00 - Intro. Is AMD - Edge device?
00:01:14 - What is this video about?
00:01:42 - General description of the framework / Ryzen AI / AMD Quark / Vitis AI
00:02:34 - Pros
00:03:41 - Cons
00:05:27 - Basic pipeline / Export / Quantization / NPU
00:08:00…

🔥32❤3💩1

7.01K views02:12

Заметки Computer Vision инженера

С одной стороны мне очень нравится современная робототехника. Очень много чего появилось нового. Явно расширились границы. Явно падают цены. Люди начинают смотреть на это не как на что-то из другого мира.
Но в то же время область сейчас супер перегрета. Хайп значит больше чем реальность. Люди не видят разницы между тем где реально AI и видео с вечеринки Теслы где был телеоп.
Решил в этом видео подсветить реальные проблемы роботов сегодня. А если зайдёт - сделаю продолжение на тему того что есть кроме хайпа:)
https://youtu.be/Fi7abF18pQ4

YouTube

AI in robotics. How real is it?

00:00:00 - Intro. Is robotics fake?
00:00:40 - Fake availability
00:01:42 - General description of the framework / Ryzen AI / AMD Quark / Vitis AI
00:04:11 - Fake: teleop and trajectories
00:05:16 - Real algorithm problems

My LinkedIn - https:/…

❤31🔥9💩1

7.08K viewsedited 00:52

Заметки Computer Vision инженера

Давно хотел добраться до VLM'ок на NPU.
У Рокчипа оно появилось ещё в декабре. Но из-за проблем с драйверами запустить было сложно без удаления системы с той борды которая мне была нужна. Но в какой-то момент вышло новое ядро - и я наконец смог проверить.
Кажется, что это первая плата за исключением Jetson где такое стало возможно.
https://youtu.be/iTq1m2ro6xg

YouTube

RKNN LLM - Running QWEN 2 VL (RK3588)

00:00:00 - Intro.
00:01:20 - How to prepare your RockChip board: drivers (Armbian or Core update)
00:02:48 - Qwen2-VL main guide
00:04:27 - Inference script
00:05:02 - Inference speed (current and how to optimize)
00:07:30 - How to use this in the real…

🔥31💩2❤1

6.46K views11:01

Заметки Computer Vision инженера

Как я и обещал в позапрошлом видео - видео о том что в роботах сегодня всё же хорошо:)
Краткий обзор почему это возможно будет следующей большой штукой. Ну, или по крайней мере почему это хорошо работает сейчас;)
https://youtu.be/QHKd-GYB6X4

YouTube

Where is the REAL progress in Robotics in 2025?

00:00:00 - Introduction.
00:00:27 - Robot Pricing in 2025
00:02:10 - Algorithms
00:05:21 - Summary: Where Everything Works Well.

My LinkedIn - https://www.linkedin.com/in/maltsevanton/
My Telegram channel - https://t.me/CVML_team
e-mail: anton@rembrain.ai…

🔥18❤3💩3

6.55K views02:03

Заметки Computer Vision инженера

1:16

Media is too big

VIEW IN TELEGRAM

Когда-то я тут рассказывал про наш стартап, RemBrain. Но давно не было апдейтов. Давайте немного покажу-расскажу.
Где-то года два с половиной назад мы поставили проект на паузу. Не полную, но активности свернули. Стало понятно что в прошлом варианте идея не будет работать, а на новый не хватало сил.
Но в конце прошлой весны он восстановился в другом виде - wyyt. Роботы стали ещё дешевле и доступнее, алгоритмы ещё лучше и проще. В проект пришло много новых людей, фокус сместился на US, все переформатировалось.
Я сейчас несколько уменьшил участие по сравнению с тем как было раньше, скорее консультирую и помогаю с разными мелочами. Но все равно хочу поделиться показать:)
На видео подборка того что мы умеем делать из наших демо роликов. Понятно что это все one-shot. Что-то обучено за 15 минут, что-то за пару часов. Accuracy зависит от времени обучения и сложности, но для хороших условий может быть идеальной.

🔥105❤4💩2😱1

7.32K views10:26

Заметки Computer Vision инженера

Банальное, но нужное видео. Очень часто я с удивлением узнаю что люди не используют DLA на Jetson'ах. При том что для некоторых моделей это 60% производительности с низким энергопотреблением. Но очень часто люди игнорируют его. В этом видео я рассказываю как экспортировать модель на DLA, почему его надо использовать и какие у него ограничения.
https://youtu.be/CRMI8gmOiOc

YouTube

Did you missed the Jetson DLA? A guide how to utilize.

00:00:00 - Intro
00:03:08 - trtexec approach - the classic one (and polygraphy)
00:08:42 - Torch-TensorRT approach

My LinkedIn - https://www.linkedin.com/in/maltsevanton/
My Telegram channel - https://t.me/CVML_team
e-mail: anton@rembrain.ai
Twitter…

🔥27❤5

7.52K views11:16

Заметки Computer Vision инженера

В последнее время я стал обращать внимание что все больше и больше людей под моими видео возмущаются "А почему на этой железке не работает моя LLM?!", "А что это за фейковая плата?!".
Тут я попробую разобрать текущую ситуацию, что сделать и куда надо смотреть если вы все же хотите запустить какую-то LLM с поддержкой железа.
https://youtu.be/OcHltzCBRY8

YouTube

Are NPUs capable of running LLMs today?

00:00:00 - Intro
00:00:40 - Usual pipeline, why it's not utilizing NPUs
00:01:24 - TensorRT, DLA
00:02:55 - AMD
00:03:43 - Intel
00:03:57 - Qualcomm
00:04:39 - RochChip
00:05:02 - Hailo, Sima ai, Axelera
00:05:32 - Google TPU, Tesla Dojo, Groq
00:06:07…

🔥19❤7💩1

6.94K views15:45

Заметки Computer Vision инженера

Видюшек давно не было. Но это потому что сейчас в процессе достаточно интересная, где долго собирал все доступы и тестировал. А пока небольшое видео про модный тренд этой зимы. Разберём где пока Вайб-кодинг хромает и вы можете быть сильно лучше стандартного GPT;)
Собрал интересные примеры и задачи где не достаточно пару раз запромптить.
https://youtu.be/M3xTcEm0qwA

YouTube

A list of open positions in ML where Vibe Coding can't solve a task

We are hiring now!
https://ats.rippling.com/artisight-open-roles/jobs/ddd390c7-b4c1-419d-b100-86ac7c0f961d - Senior Generative AI Scientist. We are searching for an expert in LLMs. The position is open not only in the US (EU preferable, but can discuss different…

🔥32💩9😱1

5.87K views08:26

Заметки Computer Vision инженера

Если вы внимательно смотрели видео, то могли там заметить что у нас открыта позиция для эксперта в VLM / LLM и.т.д. На эту позицию мы (Artisight, одна из самых быстрорастущих медицинских компаний) нанимаем по всему миру (кроме РФ/Белоруссии/Ирана/Кореи/Израиля/Китая и некоторых других). Зарплатную вилку не называю, она зависит от локации (вне/внутри США). Во вне США готовы платить больше чем в Европе. Но зарплата реально зависит от вашего опыта. Если поймем что вы можете закрыть те вопросы в которых у нас сейчас нет опыта - будем готовы платить много. Что надо: понимание как оптимально создавать и подготавливать дататсеты для VLM (что надо бы разметить, где можно нагенерить), выбор оптимальных подходов для тренировок (какие фреймворки быстрее и оптимальнее по памяти, как структурировать обучение). Практический опыт в реализации этого всего. И.т.д. Подаваться тут - https://ats.rippling.com/artisight-open-roles/jobs/ddd390c7-b4c1-419d-b100-86ac7c0f961d

Параллельно ищем AI бекенд инженера для создания систем и пайплайнов обработки аудио и видео с применением последних наработок в области распознавания речи, компьютерного зрения. Работа с одной из сильнейшех RnD-командой в отрасли.
Эта вакансия только для кандидатов за пределами США (кроме стран где запрещена работа с US медтехом), предполагается работа в европейском временной зоне (с пересечением с Chicago time)
https://ats.rippling.com/artisight-open-roles/jobs/dc5fdb7e-8774-49c5-a99a-d9b2b0f08f36

Сейчас в EC своего офиса у нас нет, большая часть как самозанятые. Но открывать планируем. Основной офис в США.

🔥34💩27❤4

6.21K views08:50

Заметки Computer Vision инженера

Да-да, я уже понял что трети читателей не нравиться вайбкодить или работать. Так что только хардкор.
Поговорим про него.
Я делаю сейчас статью про одну платформу. И хотел понять насколько она вообще популярна. Так что хочу сделать опрос на эту тему. Заодно пару вопросов давно любопытны. Платформу не называю пока, но картинка со спойлером для красоты и привлечения внимания.

❤27💔3💩1

5.94K views15:16

Заметки Computer Vision инженера

This media is not supported in your browser

VIEW IN TELEGRAM

Итак. Ответ на прошлую загадку - Sophon. Это не только злобный компьютер трисоляриан, но и современный лидер в производстве AI плат. Про них то и будет этот обзор. Так как вышел обзор большим (две платы, небольшая демка), то я решил сделать его на нескольких платформах:
Хабр
Medium
Ютуп
Не забывайте ставить плюсики/хлопочки/сердечки в зависимости от вашей религиозной ориентированности.

🔥47❤8💩5

6.27K viewsedited 07:41

Заметки Computer Vision инженера

Современный дебаг требует современных решений.

Отдебажили успешно:)

❤23🔥13💩1

6.8K views09:33

Заметки Computer Vision инженера

Наконец добрался до полноценного ARM NPU. Он достаточно прикольный. Умеет в FP16, умеет в TFlite. Достаточно низкое потребление и дешевый. Но, конечно, скорость не самая низкая из возможных. У меня есть некоторое подозрение что если ARM будет дальше пушить в эту сторону и ставить их по дефолту - рано или поздно они станут стандартом. Зачем ставить отдельный NPU, когда можно все от ARM сделать.
Так что любопытненько. Большие компании начинают догонять.
https://youtu.be/Fz33Tw5dwgA

YouTube

Running AI on Ethos NPU (NXP / Forlinx Embedded)

Development board I used - https://www.forlinx.net/product/i.mx9352-single-board-computer-136.html
Core part (NXP i.MX93) - https://www.forlinx.net/product/i.mx-9352-som-133.html

00:00:00 - Introduction
00:00:34 - The board - ARM Ethos-U65, NXP i.MX-93,…

🔥25❤1💩1

7.44K views18:28

Заметки Computer Vision инженера

Барев дзэс, и с праздничком!
Я тут на недельку в Ереване. Если вдруг кто-то хочет пересечься или лично познакомиться - я сделал канальчик чтобы обсудить детали. Скорее всего в среду утром пару часов будет свободно. По точной дате и локации - посмотрим сколько народу будет.

🔥43💩6❤4

6.83K views08:38

Заметки Computer Vision инженера

Ребята с YouTube-канала AI4Dev предложили сделать стрим/интервью и поговорить на тему современных железок. Мне показалось интересно, давно в таком формате не говорил. Так что завтра в 14:30 msk подключайтесь. Если вдруг не получится - то потом будет доступно в записи.

🔥47💩1

5.66K views15:08

Заметки Computer Vision инженера

Начинаем
https://www.youtube.com/live/WkdH7awF4PQ

YouTube

На чём работают нейросети? Железо на вес золота | Интервью с Антоном Мальцевым

Антон Мальцев — ML Lead в Artisight, фаундер RemBrain и создатель популярного YouTube-канала и Telegram-сообщества @cvml_team — раскрывает секреты "железного" мира искусственного интеллекта. От промышленных GPU-кластеров до революционных нейрочипов — узнайте…

❤17💩2

6.09K views11:30

Заметки Computer Vision инженера

Недавно я задумался. "А какого главного качества не хватает LLM-кам?" И тут меня осенило. Им не хватает лени.
Когда я занимался с репетитором перед поступлением в МФТИ, то классическим комментом было:
"В целом ты сделал нормально. Но если бы ты был немного более ленивым и подумал вместо того чтобы делать, тогда можно было бы сделать так - ...."

Когда я разговариваю с продактами, когда я консультирую стартапы, когда я придумываю архитектуру для нашего стартапа - 90% разговоров о том же. Мои обычные вопросы: "а зачем вы это делаете", "а нельзя ли сначала сделать проще", "а вам точно нужен тут алгоритм", "а зачем вам вообще использовать тут камеру".
Да, думать приходится больше, ещё больше бить по рукам, - но делать меньше.

То же самое с программистами. Кажется, что ещё Паскаль говорил что "Письмо это вышло более длинным только потому, что у меня не было свободного времени написать его короче". Хороший программист пишет кратко.

Это я к чему. Пока сетки на мои тупые вопросы пишет ответы, вместо того чтобы ответить "ты чо, долбоёб?!" - я спокоен за профессию. А вы?

🔥88❤21💩14😱3💔3

6.8K views15:28

About

Blog

Apps

Platform