Недавно я задумался. "А какого главного качества не хватает LLM-кам?" И тут меня осенило. Им не хватает лени.
Когда я занимался с репетитором перед поступлением в МФТИ, то классическим комментом было:
"В целом ты сделал нормально. Но если бы ты был немного более ленивым и подумал вместо того чтобы делать, тогда можно было бы сделать так - ...."
Когда я разговариваю с продактами, когда я консультирую стартапы, когда я придумываю архитектуру для нашего стартапа - 90% разговоров о том же. Мои обычные вопросы: "а зачем вы это делаете", "а нельзя ли сначала сделать проще", "а вам точно нужен тут алгоритм", "а зачем вам вообще использовать тут камеру".
Да, думать приходится больше, ещё больше бить по рукам, - но делать меньше.
То же самое с программистами. Кажется, что ещё Паскаль говорил что "Письмо это вышло более длинным только потому, что у меня не было свободного времени написать его короче". Хороший программист пишет кратко.
Это я к чему. Пока сетки на мои тупые вопросы пишет ответы, вместо того чтобы ответить "ты чо, долбоёб?!" - я спокоен за профессию. А вы?
Когда я занимался с репетитором перед поступлением в МФТИ, то классическим комментом было:
"В целом ты сделал нормально. Но если бы ты был немного более ленивым и подумал вместо того чтобы делать, тогда можно было бы сделать так - ...."
Когда я разговариваю с продактами, когда я консультирую стартапы, когда я придумываю архитектуру для нашего стартапа - 90% разговоров о том же. Мои обычные вопросы: "а зачем вы это делаете", "а нельзя ли сначала сделать проще", "а вам точно нужен тут алгоритм", "а зачем вам вообще использовать тут камеру".
Да, думать приходится больше, ещё больше бить по рукам, - но делать меньше.
То же самое с программистами. Кажется, что ещё Паскаль говорил что "Письмо это вышло более длинным только потому, что у меня не было свободного времени написать его короче". Хороший программист пишет кратко.
Это я к чему. Пока сетки на мои тупые вопросы пишет ответы, вместо того чтобы ответить "ты чо, долбоёб?!" - я спокоен за профессию. А вы?
🔥88❤21💩14😱3💔3
Поговорили с Иваном про то куда вообще Edge движется в 2025 году. Иван - один из лидирующих разработчиков в Edge Impulse. В своей платформе они поддерживают кажется половину из тех плат про которые я тут упоминал. А ещё недавно их поглотил Qualcomm. Обо всём этим собственно и поговорили.
Что сейчас можно делать на Edge, где максимальный прогресс, и.т.д.
https://youtu.be/XyaArB4q9X0
Что сейчас можно делать на Edge, где максимальный прогресс, и.т.д.
https://youtu.be/XyaArB4q9X0
YouTube
Edge AI Development in 2025: state and perspective with Ivan Turasov from Edge Impulse
Ivan - https://www.linkedin.com/in/ivan-turasov/
Edge impulse:
- Youtube @EdgeImpulse
- linkedin https://www.linkedin.com/company/edgeimpulse
- Site https://edgeimpulse.com/
00:00:00 - Intro
00:00:36 - About Ivan and Edge Impulse
00:02:53 - Progress…
Edge impulse:
- Youtube @EdgeImpulse
- linkedin https://www.linkedin.com/company/edgeimpulse
- Site https://edgeimpulse.com/
00:00:00 - Intro
00:00:36 - About Ivan and Edge Impulse
00:02:53 - Progress…
❤19🔥5💩2
Погнали. Axelera. Светились последние года три на всех выставках и наконец релизнулись.
Как думаете, оправдали ли ожидания? Ответы на эти и многие другие вопросы в видео:)
https://youtu.be/UYlBO4nEGSQ
Огромное спасибо Юрию за предоставление доступа к плате! Кстати, ребята из Axelera мне даже сами написали и предложили потестить, но так как был второй вариант - предпочел выбрать более независимый вариант.
Кстати. Решил попробовать расшифровывать видео в статьи через Whisper + ChatGPT. Посмотрим имеет ли смысл.
Как думаете, оправдали ли ожидания? Ответы на эти и многие другие вопросы в видео:)
https://youtu.be/UYlBO4nEGSQ
Огромное спасибо Юрию за предоставление доступа к плате! Кстати, ребята из Axelera мне даже сами написали и предложили потестить, но так как был второй вариант - предпочел выбрать более независимый вариант.
Кстати. Решил попробовать расшифровывать видео в статьи через Whisper + ChatGPT. Посмотрим имеет ли смысл.
YouTube
Axelera AI Metis M.2 – First Impressions
Huge thanks to Yuriy ( https://www.linkedin.com/in/yuriy-bukhtiyarov-74790b20/ ) for providing access to the board + measuring power consumption + connecting it to the different boards!
00:00:00 - Intro. Competitors: Hailo, SimaAI, Kneron, Google Coral…
00:00:00 - Intro. Competitors: Hailo, SimaAI, Kneron, Google Coral…
❤18🔥3💩1
Сначала хотел написать длинный и философский пост. А потом подумал что это и так ржака.
Как вы думаете, куда это всё заведёт через пару лет?:)
https://habr.com/ru/articles/914640/ - тут чувак воспринял галлюцинации сети за реальность и запустил большую статью на хабре. Куча плюсов и в топе.
https://habr.com/ru/news/915142/ - а это больше таких примеров
Кстати, а на хабре уже была какая-то статья в топе которая была бы на 100% сгенерированной галлюцинацией без помощи человека?
Как вы думаете, куда это всё заведёт через пару лет?:)
https://habr.com/ru/articles/914640/ - тут чувак воспринял галлюцинации сети за реальность и запустил большую статью на хабре. Куча плюсов и в топе.
https://habr.com/ru/news/915142/ - а это больше таких примеров
Кстати, а на хабре уже была какая-то статья в топе которая была бы на 100% сгенерированной галлюцинацией без помощи человека?
🔥20❤4💩4😱2
Продолжаем. На том же компе где была Axelera ещё был и Intel CPU. Последний год хотел его затестить. Ну и OpenVino тоже давно не добирался. Обзор будет достаточно поверхностный, так как Intel - это целый мир по софту. Но для Brief обзора по NPU кажется сойдёт.
https://youtu.be/BUvIeVn_HzY
И статья с полуавтоматической расшифровкой:
https://medium.com/@zlodeibaal/837ff5186423
Огромное спасибо Юрию за предоставление доступа к плате!
https://youtu.be/BUvIeVn_HzY
И статья с полуавтоматической расшифровкой:
https://medium.com/@zlodeibaal/837ff5186423
Огромное спасибо Юрию за предоставление доступа к плате!
YouTube
Intel NPU: Open Vino, Intel GenAI and other ways for utilization
Huge thanks to Yuriy ( https://www.linkedin.com/in/yuriy-bukhtiyarov-74790b20/ ) for providing access to the board!
00:00:00 - Intro.
00:00:39 - Open Vino, GenAI, and other ecosystems
00:02:49 - Different models' compatibility. What is working, what is…
00:00:00 - Intro.
00:00:39 - Open Vino, GenAI, and other ecosystems
00:02:49 - Different models' compatibility. What is working, what is…
❤7🔥4💩2
О, а я пропустил как ребята со мной интервью два месяца назад выпустили. Можно сказать что два месяца с текущей скоростью развития ML это достаточно чтобы уже рассматривать как исторические предсказания!
https://www.youtube.com/watch?v=VQ7iq6IlcBY
https://www.youtube.com/watch?v=VQ7iq6IlcBY
YouTube
Vision AI Future: VLMs, Robotics, Machine Vision & Real-World Design Challenges
In this episode of the ipXperience podcast, we sit down with Anton, a computer vision consultant with 15+ years of experience, to explore how transformers, edge AI, and visual language models (VLMs) are changing.
Want to future-proof your designs? Don’t…
Want to future-proof your designs? Don’t…
❤16🔥9💩3
Тэкс. OrangePi RV2. Эта плата меня немного заскамила. В целом, плата неплохая по комплектации и цене. В целом, думаю что скоро таких будет сильно больше. Хороший пример Risk-V. Но вот "AI" платой она точно не является.
Подробнее в видео - https://youtu.be/Qi4o30pHJHk
И статье - https://medium.com/@zlodeibaal/orange-pi-rv2-ai-board-scam-7c71a93d63f1
Подробнее в видео - https://youtu.be/Qi4o30pHJHk
И статье - https://medium.com/@zlodeibaal/orange-pi-rv2-ai-board-scam-7c71a93d63f1
YouTube
Is it the real AI board?! // Orange Pi RV2
Article version - https://medium.com/@zlodeibaal/orange-pi-rv2-ai-board-scam-7c71a93d63f1
00:00:00 - Intro
00:00:30 - Price, capabilities, what's onboard
00:03:00 - How to run everything
00:03:33 - Computer Vision tests
00:04:44 - LLM inference: qwen, etc…
00:00:00 - Intro
00:00:30 - Price, capabilities, what's onboard
00:03:00 - How to run everything
00:03:33 - Computer Vision tests
00:04:44 - LLM inference: qwen, etc…
🔥8😱3💩3❤1
Мне кажется что ChatGPT явно не прошёл проверку. Хотя, на реальную окрошку только одно похоже.
Ладно, считаю что картинка для привлечения внимания сработала.
А накидайте интересных плат на потестить. Может у кого какой интересный доступ есть?
У меня в планах есть ренисанс и квалком. Но это пока даже не в доставке. Может до конца лета обзаведусь.
Самую жесть про окрошку от Kling Ai прикреплю в комментариях.
Ладно, считаю что картинка для привлечения внимания сработала.
А накидайте интересных плат на потестить. Может у кого какой интересный доступ есть?
У меня в планах есть ренисанс и квалком. Но это пока даже не в доставке. Может до конца лета обзаведусь.
Самую жесть про окрошку от Kling Ai прикреплю в комментариях.
😱15❤9💩4
Всем привет. Давно хотел записать некоторые свои мысли про Норвегию. Меньше про ML, больше про страну. Выложил на втором канале, который более болтательный. Ну, а переезд в Германию - чем не повод записать?
https://youtu.be/T2jlLQZOyJs
В свете этого переезда. Я знаю что в Берлине есть датазавтраки. Кто-нибудь из подписчиков там бывает? Когда/где они проходят, куда надо вписаться? Часто не буду ходить, но познакомиться интересно.
Если вы делаете что-нибудь прикольное (роботов, какой-нибудь наглядный CV), то можно пообщаться и записать видео на мой основной канал, если интересно.
https://youtu.be/T2jlLQZOyJs
В свете этого переезда. Я знаю что в Берлине есть датазавтраки. Кто-нибудь из подписчиков там бывает? Когда/где они проходят, куда надо вписаться? Часто не буду ходить, но познакомиться интересно.
Если вы делаете что-нибудь прикольное (роботов, какой-нибудь наглядный CV), то можно пообщаться и записать видео на мой основной канал, если интересно.
YouTube
Впечатления о Норвегии после 1.5 года жизни (ML, CV, Роботы). И почему переезжаю в Германию.
Пара вещей которые забыл в видео:
1) Отношение норвегов к работе. В прошлый раз когда я записывал видео там было упоминание на эту тему. Работать 80% не хотят. И государство к этому подталкивает. Но когда что-то делают - делают ответственно. По крарйней мере…
1) Отношение норвегов к работе. В прошлый раз когда я записывал видео там было упоминание на эту тему. Работать 80% не хотят. И государство к этому подталкивает. Но когда что-то делают - делают ответственно. По крарйней мере…
🔥31💩4❤1
Сегодня небольшое видео на тему "какую Edge плату брать для роботов". Что-то меня часто на эту тему спрашивают в последнее время.
Лето немного загружено, но:
1) Есть пара видео в консервах, надо дооформить.
2) Есть пара плат которые медленно ко мне едут
3) Есть пара интервью которые я договорился
Но не знаю когда все прокнет.
https://youtu.be/dQPZK3CgcPs
Aх да, в формате статьи - https://medium.com/@zlodeibaal/choosing-ai-accelerators-for-robots-what-to-know-1fa10f930482
Лето немного загружено, но:
1) Есть пара видео в консервах, надо дооформить.
2) Есть пара плат которые медленно ко мне едут
3) Есть пара интервью которые я договорился
Но не знаю когда все прокнет.
https://youtu.be/dQPZK3CgcPs
Aх да, в формате статьи - https://medium.com/@zlodeibaal/choosing-ai-accelerators-for-robots-what-to-know-1fa10f930482
YouTube
What is the best AI-Edge board for robots?
This video is the form of an article - https://medium.com/@zlodeibaal/choosing-ai-accelerators-for-robots-what-to-know-1fa10f930482
00:00:00 - Intro
00:00:36 - The best edge board!
00:00:52 - Where do you need a real edge board?
00:02:06 - Jetson: nano,…
00:00:00 - Intro
00:00:36 - The best edge board!
00:00:52 - Where do you need a real edge board?
00:02:06 - Jetson: nano,…
❤16🔥9💩2
Как вам вайбпреза по GPT-5?
Кто смотрел?
Будущее уже тут?:)
Кто смотрел?
Будущее уже тут?:)
💩29🔥9😱3❤1
Тээкс. Попробовал платку RDK X5. Много народу предлагало потестить. В целом - интересная штука. Я бы, конечно, брал Рокчип или Сопфон лучше. Но очень неплохо. Чуваки реально понимают что надо для роботов - и пытаются давить в эту сторону.
Но хотелось бы не int8 и более прозрачный пайплай экспорта.
видео - https://youtu.be/PvDRyfpeGfo
статья - https://medium.com/@zlodeibaal/rdk-x5-review-ai-board-for-robotics-017454547bc8
Но хотелось бы не int8 и более прозрачный пайплай экспорта.
видео - https://youtu.be/PvDRyfpeGfo
статья - https://medium.com/@zlodeibaal/rdk-x5-review-ai-board-for-robotics-017454547bc8
YouTube
RDK-X5 — Affordable AI Board for Robotics? Review & Benchmarks
00:00:00 - Intro
00:01:25 - Board setup
00:03:45 - NPU and capabilities
00:04:25 - LLM support. Clip and Yolo-world?:)
00:06:45 - VLM support
00:07:44 - Export
00:13:12 - Strange networks: stereo, flow
00:16:21 - Inference speed
00:17:51 - Wrap up
My LinkedIn…
00:01:25 - Board setup
00:03:45 - NPU and capabilities
00:04:25 - LLM support. Clip and Yolo-world?:)
00:06:45 - VLM support
00:07:44 - Export
00:13:12 - Strange networks: stereo, flow
00:16:21 - Inference speed
00:17:51 - Wrap up
My LinkedIn…
🔥17❤4💩2
Сейчас в вялом режиме тестирую M.2 ускоритель от MemryX. Очень приятно впечатлен. Но главное - пока его тестировал осознал что частично не понимаю современной квантизации и трендов в ней. Любопытно послушать у кого с этим какой экспирианс, кто что использовал.
Короче.
В MemryX используется W8A16 квантизация для Computer Vision. Это когда веса квантуются в int8, а активации остаются в FP16 (или каком-то похожем формате типа BF16).
В LLM давно используются и W8A16 и W8A8 и W4A16 квантизации и даже некоторые другие. Но там даже для W8A8 калибровочного датасета не нужно, и я особо внимания не обращал на них. Просто понятно что этот трюк есть и какие у него ограничения.
А тут внезапно оказалось, что W8A16 снижает размер модели почти в 2 раза (от fp16), ускоряет инференс + не требует калибровочного датасета для Computer Vision. А ещё можно использовать W4A16, где все быстрее 😱😱😱
На этом месте я подумал: "а неужели это нигде никто больше не использует?!". Единственное что я нашёл - что в Nvidia поддержка всего этого есть в TensorRT-LLM. Для Computrer Vision и TensorRT в теории можно затащить, но муторно и нет простого способа.
Вопросы:
1) А кто-то использовал W8A16 для Edge Computer Vision? Может пробовал?
2) Кто-то видел это не на MemryX и не на Jetson?
3) Я что-то упускаю из виду, что-то забываю?
Короче.
В MemryX используется W8A16 квантизация для Computer Vision. Это когда веса квантуются в int8, а активации остаются в FP16 (или каком-то похожем формате типа BF16).
В LLM давно используются и W8A16 и W8A8 и W4A16 квантизации и даже некоторые другие. Но там даже для W8A8 калибровочного датасета не нужно, и я особо внимания не обращал на них. Просто понятно что этот трюк есть и какие у него ограничения.
А тут внезапно оказалось, что W8A16 снижает размер модели почти в 2 раза (от fp16), ускоряет инференс + не требует калибровочного датасета для Computer Vision. А ещё можно использовать W4A16, где все быстрее 😱😱😱
На этом месте я подумал: "а неужели это нигде никто больше не использует?!". Единственное что я нашёл - что в Nvidia поддержка всего этого есть в TensorRT-LLM. Для Computrer Vision и TensorRT в теории можно затащить, но муторно и нет простого способа.
Вопросы:
1) А кто-то использовал W8A16 для Edge Computer Vision? Может пробовал?
2) Кто-то видел это не на MemryX и не на Jetson?
3) Я что-то упускаю из виду, что-то забываю?
🔥31💩2
DINOv3 прикольная штука. Плюсы и минусы более-менее понятны. Но вкратце попробовал пройтись по ним в видео.
Заодно побенчмаркал Intel-овскую NPU-шку на новом компе + AMD-шную NPU на доступном компе.
Вообще DINOv3 на удивление везде хуже работает.
https://youtu.be/HaJNyyWsio4
Заодно побенчмаркал Intel-овскую NPU-шку на новом компе + AMD-шную NPU на доступном компе.
Вообще DINOv3 на удивление везде хуже работает.
https://youtu.be/HaJNyyWsio4
YouTube
DINOv3 - running on Intel NPU and AMD NPU
My LinkedIn - https://www.linkedin.com/in/maltsevanton/
My Telegram channel - https://t.me/CVML_team
e-mail: anton@rembrain.ai
Twitter - https://twitter.com/Serious_WK
Do you have any questions about the board and ML around, or do you need advice? Feel…
My Telegram channel - https://t.me/CVML_team
e-mail: anton@rembrain.ai
Twitter - https://twitter.com/Serious_WK
Do you have any questions about the board and ML around, or do you need advice? Feel…
❤25💩2
Раз в год стараюсь сделать обзор на то что нового в Computer Vision и какие перспективы. На мой взгляд за этот год поменялось очень много чего. И в первую очередь логика разработки. Я понимаю, что в видео много чего не стал даже затрагивать (генерацию датасетов например), так как говорил раньше. Почти не упомянул железки.
Но если соберётся много вопросов - просто сделаю ещё одно видео.
Решил выложить не на основной канал, а на второй.
https://youtu.be/Tn8m0MP3Df4
Но если соберётся много вопросов - просто сделаю ещё одно видео.
Решил выложить не на основной канал, а на второй.
https://youtu.be/Tn8m0MP3Df4
YouTube
Имеет ли смысл идти в Computer Vision и ML в 2025?
Основной канал - @AntonMaltsev
00:00:00 - Интро
00:01:53 - Что нового появилось за год
00:07:06 - Изменение процессов
00:11:00 - А надо ли вообще идти в Computer Vision
00:18:50 - Что будет дальше? Что перспективно?
Телега - https://t.me/CVML_team
2024…
00:00:00 - Интро
00:01:53 - Что нового появилось за год
00:07:06 - Изменение процессов
00:11:00 - А надо ли вообще идти в Computer Vision
00:18:50 - Что будет дальше? Что перспективно?
Телега - https://t.me/CVML_team
2024…
❤30🔥20💩4