CV muhandis kundaligi
250 subscribers
12 photos
13 videos
36 links
Download Telegram
Forwarded from Naxalov | AI Blog 🔥
This media is not supported in your browser
VIEW IN TELEGRAM
Vibe coding sabab ishsiz qolgan senior dasturchi

@naxalov
🤣9🔥2❤‍🔥1
Raqamli tasvir qanday hosil qilinadi?
Har safar telefoningizda suratga tushganingizda, aslida juda murakkab jarayon sodir bo‘ladi. Fizik nur raqamli piksellarga aylanadi.
Bu jarayonning nomi: Image Acquisition tasvirni qabul qilish.
Avval nur obyektga uriladi > Refleksiya (yoki o‘tish) yuz beradi > Sensor energiyani elektr signaliga aylantiradi > Signal raqamlashtiriladi, qarabsizki raqamli tasvir tayyor.
CCD yoki CMOS sensorlar kameraning yuragi. Tasvirda detallarning tiniqligi piksellar soni - resolution ga bog'liq.
Tasvirlarni siqish (Compression).
Tasvirda ortiqcha ma’lumot ko‘p bo‘ladi: takrorlanuvchi piksellar, kam farqli qiymatlar, inson sezmaydigan detallar va hk. Shular Huffman, RLE, JPEG kabi algoritmlar bilan siqiladi.
Shuning uchun 5 MB rasm 500 KB bo‘lishi mumkin, ko'zga sezilmasligi mumkin, lekin mashinalarga seziladi.
Raqamli tasvir — bu nur, elektronika va matematikaning mukammal uyg‘unligi.

Mavzu bo'yicha batafsil shu yerda.

Qiziq fakt: 1838-yilda olingan birinchi inson fotosurati hali ham Parijda saqlanadi.

Dunyo tarixidagi ilk fotosuratlar ekan.
#fundamentals #computer_vision
👍7🔥32
Nega "yuqori resolution” har doim ham eng yaxshi yechim emas?

Bir uyum mitti mushukchalarni suratga olishga uringan bo‘lsangiz, vaziyat tanish: eng yoqimli poza ko‘zingizga ilinadi, lekin u yarim soniya ham davom etmaydi. Siz fokusni, zoomni, burchakni sozlayotgan paytda, kadr allaqachon o‘zgargan bo‘ladi. Keyin qarasangiz, rasmlarning ko‘pi xira.

Bu oddiy misol real dunyoda tasvir bilan ishlashning asosiy muammolarini juda yaxshi ko‘rsatadi.

Real tasvirlashdagi muammolar nimada?
- Ssenariy (obyekt holati) kamera moslashishga ulguradigan tezlikdan tezroq o‘zgaradi
- Obyekt masofasi doim o‘zgaradi, fokus doim “qochadi”
- Linza va masofa distorsiya keltirib chiqaradi
- “Eng qiziq moment” yuzlab oddiy kadrlar orasida yo‘qolib ketadi

Ko‘p odam birinchi bo‘lib shuni o‘ylaydi: kamera kuchliroq bo‘lsa, model ham aniqroq bo‘ladi. Amalda esa yuqori resolution ko‘pincha yangi muammolar keltirib chiqaradi:
- CNN kabi model arxitekturalari odatda ma’lum o‘lchamdagi input kutadi
- Katta tasvir katta model degani
- Katta model ko‘proq vaqt, ko‘proq GPU, ko‘proq RAM talab qiladi
- Batch kichrayadi, trening sekinlashadi, infratuzilma xarajati oshadi
- Deploy masalasi yanada qiyinlashadi, ayniqsa model qurilmaning o‘zida ishlashi kerak bo‘lsa (nanny cam kabi)

Yana bir muhim nuqta: resolution oshishi faqat signalni emas, shovqinni ham ko‘paytiradi. Ba’zan past aniqlikdagi tasvirda o‘rganish osonroq bo‘ladi.

Eng to‘g‘ri yondashuv qanday?
Asosiy xulosa bitta:
Tasvir o‘lchamini “imkon qadar eng katta” emas, balki “muammo uchun yetarli va real infratuzilmaga mos” qilib tanlang.

Amaliy yo‘l-yo‘riq:
- Model qayerda ishlaydi? Cloudda yoki kameraning o‘zidami?
- Real ishchi muhitdagi tasvirlar bilan treningdagi tasvirlar bir xilmi?
- Past resolutionda ham vazifa yechiladimi? Avval shuni tekshirib ko‘ring

Tasvirning xususiyatlari faqat obyektga emas, uni olish usuliga ham bog‘liq:
- Ko‘rinadigan spektr, infraqizil, rentgen, ultratovush, elektron mikroskopiya kabi usullar bir xil ko‘rinmaydi
- Ba’zi sensorlar polar grid kabi koordinata tizimida ishlaydi, bu esa preprocessing va model inputini o‘zgartiradi
- Turli manbadan kelgan tasvirlarni birlashtirishda koordinatalarni moslashtirish (remap) kerak bo‘lishi mumkin

Bias va real hayot farqi
Model treningdagi datasetga o‘rganadi, lekin real hayotda boshqa sharoitni ko‘rsa, xatoliklar keskin oshishi mumkin. Bu holat measurement bias deb yuritiladi.

Masalan:
- Treningda yuqori aniqlikdagi “ideal” mushuk rasmlari
- Real hayotda esa arzon kamera, yomon yorug‘lik, distorsiya, shovqin

Natijada model “mushukni” emas, tasvir sharoitini o‘rganib qolishi ham mumkin.

Yakuniy fikr
Computer Vision tizimi qurishda birinchi qadam model tanlash emas. Birinchi qadam tasvir qanday olingani, qanday noise va bias olib kelishi, deploy infratuzilmasi qanday bo‘lishini tushunish.

Shundan keyingina:
- kerak bo‘lsa preprocessing qilasiz
- kerak bo‘lsa modelni moslaysiz (fine-tune yoki last layer change)
- va eng muhimi, real dunyoda ishlaydigan yechimga yaqinlashasiz

Mavzu bo'yicha batafsil shu yerda

#fundamentals #computer_vision
🔥102❤‍🔥1
Computer Vision
Oddiy ko'rinadigan “to'pni tepish”ning o'zi miyada bir nechta ishni bir zumda bajarishni talab qiladi: to'pni ko'rish, joylashuvini tushunish, harakatini kuzatish, qachon kelishini taxmin qilish, oyoq qayerda ekanini bilish va kerakli kuchni hisoblash. Computer Visionning markazidagi g'oya ham shu: tasvirdan mazmunli axborotni ajratib olish va uni tushunishga yaqinlashish.
Computer Vision ta'rifi
Computer Vision bu mashinalarni ko'ra oladigan qilish ilmi va texnologiyasi. Ya'ni, vizual ma'lumotni olish, qayta ishlash, tahlil qilish va tushunish, so'ng undan dunyo haqida mazmunli reprezentatsiya, tavsif va talqin (interpretation) chiqarish.

Nega Deep Learning CVni “uchirib yubordi”?
Oldinlari klassik yo'l:
1) image preprocessing orqali qo'lda features chiqarib olamiz
2) keyin shu featurelar ustida klassik ML ishlatamiz
Bu ishlaydi, lekin domain knowledge va feature engineeringga qattiq bog'liq.

Deep Learning (DL) esa xom tasvirdan (raw data) murakkab featurelarni o'zi o'rganadi. Katta dataset + DL birlashganda CV modellari ancha moslashuvchan va kuchli bo'lib ketdi. Shu sabab sohada renessans boshlanganini ko'ryapmiz.
Image understanding darajalari:
- Low-level: kontrastni o'zgartirish, sharpen qilish. Kirish ham chiqish ham tasvir
- Mid-level: segmentation, obyekt atributlari, object classification. Natija tasvirga bog'liq metadata chiqadi
- High-level: tasvirning to'liq mazmunini anglash, object recognition, scene reconstruction, image-to-text va hk.

Batafsil shu yerda
#fundamentals #computer_vision
🔥9❤‍🔥21
Bugun Computer Vision tizimlari shunchalik kuchayib ketdiki, ayrim vazifalarni odamdan ham yaxshi bajaryapti.

Masalan, Hindistonda 2 g‘ildirakli transportlar soni juda ko‘p. Hamda ko‘pchilik ‘kaska’ taqmasdan haydab yuradi. Natija oddiy: xavf oshadi, jarohatlar ko‘payadi.

Shu muammoni kamaytirish uchun ular qiziq yechim qilgan:
Kamera + Computer Vision
Kaskasiz haydovchini avtomatik aniqlaydi
Ustiga-ustak davlat raqamini (license plate) ham o‘qiydi
Va jarima avtomatik yoziladi

Bu degani, CV faqat “rasmni taniydi” emas, u real hayotda intizom va xavfsizlikga ham xizmat qilyapti.

Lekin bu faqat bitta misol. Computer Vision qayerlarda ishlaydi?

1) Avtonom mashinalar (Self-driving)

Tesla, Waymo kabi kompaniyalar yo‘lni “ko‘rish” uchun CV’dan foydalanadi:
• piyoda
• yo‘l belgilari
• lane chiziqlari
• boshqa harakatdagi mashinalar
hammasini kamera orqali aniqlab, real vaqtda qaror qabul qiladi.

2) Retail va e-commerce

Amazon, eBay, Walmart’da CV siz ko‘rgan mahsulotni tanib:
• o‘xshashlarini tavsiya qiladi
• do‘konda zaxirani kuzatadi
• mijoz harakatini tahlil qilib, layout va marketingni optimallashtiradi.

3) Zavodlarda sifat nazorati

Assembly line’da CV:
• defektni (tirnalish, noto‘g‘ri yig‘ilish) topadi
• inspeksiyani avtomatlashtiradi
• real vaqtli feedback beradi: nosoz mahsulotni ajratadi yoki operatorni ogohlantiradi.

4) Tibbiy tasvirlar (Medical Imaging)

X-ray, CT, MRI’da:
• o‘sma, sinish, anomaliyalarni topadi
• segmentatsiya qiladi (tumor ajratish kabi)

Computer Vision real hayotda xavfsizlik, ishlab chiqarish, tibbiyot va shu kabi ko’plab sohalarda ishlayapti. To‘g‘ri qurilgan CV tizimi vaqtni tejaydi, xatoni kamaytiradi va natijani yaxshilaydi.

#fundamentals #computer_vision
🔥12❤‍🔥31
CV muhandis kundaligi
https://www.youtube.com/watch?v=DiQlpiZT-go
Ozodbek aka 100% AI generated klip chiqaribdi😁
👍4🔥2🏆1
Forwarded from Naxalov | AI Blog 🔥
Vibe coding bilan 0 dan 1000$ gacha
Natija kafolatlanmaydi, vibe kafolatlangan 😎

Kurs dasturi:
📌 Hech narsa o‘rgatilmaydi
📌 Faqat vibe
📌 Natija — noma’lum
📌 Narx — 1000$

Shoshiling! Joylar cheklanmagan
✍️ Ro‘yxatdan o‘tish uchun izohga + qoldiring

⚠️ Barchasi reklama huquqi asosida.
😁7🔥2👍1
Tasvirni modelga berishdan oldin nima qilish kerak?
Ko‘p hollarda “pre-processing” va “data augmentation” model natijasini bevosita hal qiladi.

1) Digital Image Processing: tasvir ustidagi amallar nimalar?

Raqamli tasvir aslida sonlardan iborat matritsa. Demak biz uni turli yo‘llar bilan o‘zgartira olamiz:
• Mantiqiy (Logical): AND/OR/XOR, NOT (invert) masalan: mask bilan obyektni ajratish
• Statistik (Statistical): o‘rtacha (mean) filtrlash, median filtri, standart og‘ish (std) hisoblash
• Geometrik (Geometrical): aylantirish (rotate), masshtablash (resize/scale), ko‘chirish (translate), kesish (crop)
• Matematik (Mathematical): qo‘shish/ayirish (image add/subtract), ko‘paytirish (gain), bo‘lish (normalize)
• Transform (o‘zgartirish) amallari: Fourier transform (FFT), DCT, Wavelet transform, Hough transform va hk.
Amallar ham ikki xil:
Element-wise amallar: har bir piksel ustida amal bajariladi (masalan: darajaga ko‘tarish).
Matrix amallar: matritsa nazariyasiga tayangan holda tasvir manipulyatsiya qilinadi (konvolyutsiya, filterlash)

2) Data augmentation:
Model train/validation/test dataset’da yaxshi natija berishiga qaramay, real muhitda ko‘pincha performance tushib ketadi. Sabab: real data xilma-xil, dataset esa yetarlicha turfa bo‘lmasligi mumkin.

Data augmentation nima beradi?
• Dataset’ni qo‘shimcha data yig‘masdan kattalashtiradi.
• Variativlik kiritadi, generalization kuchayadi.
• Overfitting kamayadi.
• Labeling va cleaning xarajatlarini qisqartiradi.

Bu yerda ham ikki usuldan foydalanishimiz mumkin:
Augmented data: mavjud tasvirlardan transform bilan yangi variantlar hosil qilish (geometric va color space transformatsiyalar).
Synthetic data: noldan generatsiya qilingan data, masalan DNNs va GANs orqali.

Demak, pre-processing va data augmentation, real loyihada modelning amaliy natijasini ko‘taradigan asosiy tayanchlardan hisoblanar ekan.

#fundamentals #computer_vision
🔥5👍4❤‍🔥3
Forwarded from Adkham Zokhirov
"Xarita.ai" loyihasi...

Bu shunchaki kurs emas. Sun'iy intellekt olamida o'z yo'lingizni topish uchun interaktiv yo'l xaritasi.

Platformada 2 ta asosiy yo'nalish bor:
- Dasturchilar uchun
- Oddiy Foydalanuvchilar uchun

Eng muhimi — bu Community (Hamjamiyat) loyihasi va BEPUL!

Hozir kirib, o'z yo'lingizni tanlang va kelajak kasbini egallashni boshlang. 👇

Saytga o'tish: https://xarita.ai
Intro Video: https://www.youtube.com/watch?v=mowRFviNXDU

Postni ilmga chanqoq do'stlaringiz bilan ulashing!

(P.S. Sayt haqida fikringizni izohlarda kutaman, bu beta versiya!)

@adkham_zokhirov
🔥5🏆3👍1
FEATURE DESCRIPTION: Kompyuter ko‘radigan “belgilar tili” 👁📌

Kompyuterlar tasvirni, raqmlar, matritsalar shaklda "ko'rishini" oldingi postlarda gaplashgan edik. Tasvir va undagi obektlarni tanib olish uchun unga ishonchli "ishoralar" kerak. Ana shu ishoralar: features (xususiyatlar, atributlar) deyilad. Model avval feature’larni o‘rganadi, keyin yangi rasmlarda ham shu belgilar orqali tanib oladi.

1) Feature’larni data structure’larda qanday saqlaymiz?
Feature’lar turlicha: son, kategoriya, rasm, matn va hokazo. Ularni to‘g‘ri ko‘rinishda saqlash keyingi ishlov (processing) uchun juda muhim.

Numerical features (sonli feature’lar):
• Array/List: eng sodda ko‘rinish. Har bir element alohida feature.
• Tensor: ko‘p o‘lchovli massiv. Katta data bilan ML framework’larda juda ko‘p ishlatiladi.

Categorical features (kategoriya feature’lar):
• Dictionary/List: kategoriyani label qilib saqlash (yoki bevosita qiymat sifatida).
• One-hot encoding: kategoriya uchun binary vektor, har bir bit alohida kategoriyani bildiradi.

Image features (tasvir feature’lar):
• Pixel values: rasmni matritsa yoki multi-dimensional array sifatida saqlash.
• CNN features: pre-trained CNN orqali “tayyor” feature’larni ajratib olish.

2) Yaxshi descriptor nimasi bilan “yaxshi”?
Descriptor: Tasvir ichidagi obyekt yoki sahnaning muhim axborotini siqilgan, ammo mazmunli ko‘rinishda ifodalovchi feature to‘plami.

Yaxshi descriptor quyidagilarga ega bo‘ladi:
• Transformatsiyalarga moslashuvchan: rotation, translation, scaling, illumination o‘zgarsa ham “xulqini” yo‘qotmaydi.
• Distinctiveness: obyektni boshqasidan ajratib bera oladi.
• Dimensionality: juda katta bo‘lmasdan, yetarli axborotni saqlaydi.
• Locality: lokal nuqtalar yoki kichik regionlarni yaxshi tasvirlaydi.
• Repeatability: shovqin yoki kichik farqlarda ham barqaror chiqadi.
• Matching algoritmlariga mos: masofa metric’lari yoki ML asosidagi matching bilan yaxshi ishlaydi.
• Computational efficiency: tez hisoblanadi, real-time uchun muhim.
• Adaptability: data o‘zgarishlariga moslasha oladi.

3) Feature descriptor’lar: SIFT va SURF
Quyida 2ta klassik Descriptor lar bilan tanishamiz
• SIFT: aniqlik va robustlik tarafdori
• SURF: tezlik va samaradorlik tarafdori
Ikkalasi ham tasvirdan keypoint topadi va ularni taqqoslash uchun descriptor yaratadi.

🔹 SIFT (Scale-Invariant Feature Transform)
SIFT tasvirda turli scale’larda barqaror keypoint’larni topib, har biri uchun descriptor beradi.
Qanday ishlashi to'liqroq tushuntirilgan manbalar: manba1, manba2.

🔸 SURF (Speeded Up Robust Features)
SURF ham lokal feature topadi, lekin tezlik uchun optimizatsiya qilingan. Uning asosiy “quroli”: integral image va Haar wavelet’lar.

Qanday ishlashi to'liqroq tushuntirilgan manbalar: manba1, manba2

Qo‘llanishlari: object recognition, image stitching, 3D reconstruction.
Yakuniy takeaway
Feature descriptor: modelning “ko‘rish lug‘ati”. Lug‘at qanchalik aniq va barqaror bo‘lsa, tanib olish va matching shunchalik ishonchli bo‘ladi.

#fundamentals #computer_vision
🔥7👍1🏆1
4-yanvardan singulyarlik erasi boshlandi, buni Elon aka aytapti😁
AGI yaqinmi yoki Grok katta "update" bilan chiqadimi, nima deb o'ylaysizlar?

Singularity (texnologik singulyarlik):
AI va boshqa texnologiyalar juda tez, eksponent sur’atda rivojlanib ketadi, natijada yaqin kelajakdagi o‘zgarishlarni oldindan aniq bashorat qilish (expertlar uchun ham) qiyin bo‘lib qoladi.

https://t.me/learncvuz
🔥9👍2
Forwarded from Sariq Dev
This media is not supported in your browser
VIEW IN TELEGRAM
"Dasturiy ta'minot muhandisining maqsadi — mavjud muammolarni hal qilish va yangi yechim talab etadigan muammolarni topishdir. Kod yozish (coding) esa bu vazifalardan biri, xolos.
Shunday ekan, agar maqsadingiz muammoni hal qilish emas, shunchaki kod yozish bo‘lsa — ya'ni kimdir sizga nima qilishni aytadi va siz uni kodga aylantirsangiz... Unday holda, ha, sizning o‘rningizni Sun'iy Intellekt egallashi mumkin. Ammo bizning barcha muhandislarimizning asosiy maqsadi — muammolarga yechim topishdir.

Ma'lum bo‘lishicha, kompaniyada hali yechimini kutayotgan va hatto hali aniqlanmagan son-sanoqsiz muammolar mavjud. Muhandislar qancha ko‘p vaqtini hali aniqlanmagan muammolarni o‘rganishga sarflasa, kompaniyamiz uchun shunchalik yaxshi bo‘ladi.

Hech narsa menga ularning umuman kod yozmasliklaridan ko‘ra ko‘proq quvonch bag‘ishlamagan bo‘lar edi, agar ular faqat muammolarni hal qilish bilan band bo‘lishsa.
Menimcha, 'Maqsad' va 'Vazifa' o‘rtasidagi farqni anglash tamoyili hamma uchun qo‘llashga arziydigan foydali yondashuvdir."
— Jensen Huang
1🔥8
⚡️ Ultralytics YOLO26 rasman chiqdi (2026-01-14)!
Bu relizning markazida bitta g‘oya : edge va low-power qurilmalarda ham production’ga tez va og‘riqsiz chiqish. Men kutgan reliz😁

Nimalar o‘zgardi, asosiy yangiliklar
- End-to-end, NMS-free inference: endi klassik NMS post-processing bosqichi yo‘q. Natija: latency kamroq, export va deploy jarayoni soddaroq.
- CPU’da 43% gacha tezroq inference: ayniqsa edge senariylar uchun juda katta sakrash.
- DFL (Distribution Focal Loss) olib tashlandi: arxitektura soddalashdi, exportability va low-power hardware bilan moslashuvchanlik yaxshilandi.
- ProgLoss + STAL: trening barqarorroq, ayniqsa small object’larda aniqlikni oshirishga e'tibor qaratilgan.
- MuSGD optimizer: SGD + Muon gibrid yondashuv, treningni barqaror va samaraliroq qilish uchun.
- Task-specific yaxshilanishlar:
- Segmentation: semantic loss + multi-scale protos
- Pose: keypoint’lar uchun yuqori aniqlikda RLE
- OBB: angle loss bilan boundary discontinuity muammosi ustida ishlangan.
- YOLOE-26 (Open-Vocabulary): text prompt yoki visual prompt bilan zero-shot detect/segment qilish. Hatto prompt-free variantlar ham bor.
YOLO26 qaysi tasklarni qamrab oladi?
- Object Detection
- Instance Segmentation
- Image Classification
- Pose Estimation
- Oriented Object Detection (OBB)

GitHub, YOLO26

@learncvuz
🔥7
AI/ML intervyularga tayyorgarlik ko'ryapsizmi?
Quyida amalda eng ko‘p yordam beradigan 9 ta GitHub repo:

All algorithms implemented in Python (217k ⭐️)
https://github.com/TheAlgorithms/Python

Awesome Machine Learning (71.2k ⭐️)
https://github.com/josephmisiti/awesome-machine-learning

Machine Learning interviews from FAANG (11.9k ⭐️)
https://github.com/khangich/machine-learning-interview

Tech interview handbook (137k ⭐️)
https://github.com/yangshun/tech-interview-handbook

System Design Primer (322k ⭐️)
https://github.com/donnemartin/system-design-primer

Machine Learning interview questions (4.3k ⭐️)
https://github.com/andrewekhalel/MLQuestions

Machine Learning cheat sheet (8k ⭐️)
https://github.com/soulmachine/machine-learning-cheat-sheet

Guide for ML / AI technical interviews (7.4k ⭐️)
https://github.com/alirezadir/Machine-Learning-Interviews

Mathematics for Machine Learning (14.9k ⭐️)
https://github.com/mml-book/mml-book.github.io
🔥10👍2
Forwarded from JR TwitGram 🥂
ggwp
👍6👎1🔥1🏆1