Forwarded from Naxalov | AI Blog 🔥
This media is not supported in your browser
VIEW IN TELEGRAM
🤣9🔥2❤🔥1
Raqamli tasvir qanday hosil qilinadi?
Har safar telefoningizda suratga tushganingizda, aslida juda murakkab jarayon sodir bo‘ladi. Fizik nur raqamli piksellarga aylanadi.
Bu jarayonning nomi: Image Acquisition tasvirni qabul qilish.
Avval nur obyektga uriladi > Refleksiya (yoki o‘tish) yuz beradi > Sensor energiyani elektr signaliga aylantiradi > Signal raqamlashtiriladi, qarabsizki raqamli tasvir tayyor.
CCD yoki CMOS sensorlar kameraning yuragi. Tasvirda detallarning tiniqligi piksellar soni - resolution ga bog'liq.
Tasvirlarni siqish (Compression).
Tasvirda ortiqcha ma’lumot ko‘p bo‘ladi: takrorlanuvchi piksellar, kam farqli qiymatlar, inson sezmaydigan detallar va hk. Shular Huffman, RLE, JPEG kabi algoritmlar bilan siqiladi.
Shuning uchun 5 MB rasm 500 KB bo‘lishi mumkin, ko'zga sezilmasligi mumkin, lekin mashinalarga seziladi.
Mavzu bo'yicha batafsil shu yerda.
Qiziq fakt: 1838-yilda olingan birinchi inson fotosurati hali ham Parijda saqlanadi.
Dunyo tarixidagi ilk fotosuratlar ekan.
#fundamentals #computer_vision
Har safar telefoningizda suratga tushganingizda, aslida juda murakkab jarayon sodir bo‘ladi. Fizik nur raqamli piksellarga aylanadi.
Bu jarayonning nomi: Image Acquisition tasvirni qabul qilish.
Avval nur obyektga uriladi > Refleksiya (yoki o‘tish) yuz beradi > Sensor energiyani elektr signaliga aylantiradi > Signal raqamlashtiriladi, qarabsizki raqamli tasvir tayyor.
CCD yoki CMOS sensorlar kameraning yuragi. Tasvirda detallarning tiniqligi piksellar soni - resolution ga bog'liq.
Tasvirlarni siqish (Compression).
Tasvirda ortiqcha ma’lumot ko‘p bo‘ladi: takrorlanuvchi piksellar, kam farqli qiymatlar, inson sezmaydigan detallar va hk. Shular Huffman, RLE, JPEG kabi algoritmlar bilan siqiladi.
Shuning uchun 5 MB rasm 500 KB bo‘lishi mumkin, ko'zga sezilmasligi mumkin, lekin mashinalarga seziladi.
Raqamli tasvir — bu nur, elektronika va matematikaning mukammal uyg‘unligi.
Mavzu bo'yicha batafsil shu yerda.
Qiziq fakt: 1838-yilda olingan birinchi inson fotosurati hali ham Parijda saqlanadi.
Dunyo tarixidagi ilk fotosuratlar ekan.
#fundamentals #computer_vision
👍7🔥3❤2
Nega "yuqori resolution” har doim ham eng yaxshi yechim emas?
Bir uyum mitti mushukchalarni suratga olishga uringan bo‘lsangiz, vaziyat tanish: eng yoqimli poza ko‘zingizga ilinadi, lekin u yarim soniya ham davom etmaydi. Siz fokusni, zoomni, burchakni sozlayotgan paytda, kadr allaqachon o‘zgargan bo‘ladi. Keyin qarasangiz, rasmlarning ko‘pi xira.
Bu oddiy misol real dunyoda tasvir bilan ishlashning asosiy muammolarini juda yaxshi ko‘rsatadi.
Real tasvirlashdagi muammolar nimada?
- Ssenariy (obyekt holati) kamera moslashishga ulguradigan tezlikdan tezroq o‘zgaradi
- Obyekt masofasi doim o‘zgaradi, fokus doim “qochadi”
- Linza va masofa distorsiya keltirib chiqaradi
- “Eng qiziq moment” yuzlab oddiy kadrlar orasida yo‘qolib ketadi
Ko‘p odam birinchi bo‘lib shuni o‘ylaydi: kamera kuchliroq bo‘lsa, model ham aniqroq bo‘ladi. Amalda esa yuqori resolution ko‘pincha yangi muammolar keltirib chiqaradi:
- CNN kabi model arxitekturalari odatda ma’lum o‘lchamdagi input kutadi
- Katta tasvir katta model degani
- Katta model ko‘proq vaqt, ko‘proq GPU, ko‘proq RAM talab qiladi
- Batch kichrayadi, trening sekinlashadi, infratuzilma xarajati oshadi
- Deploy masalasi yanada qiyinlashadi, ayniqsa model qurilmaning o‘zida ishlashi kerak bo‘lsa (nanny cam kabi)
Yana bir muhim nuqta: resolution oshishi faqat signalni emas, shovqinni ham ko‘paytiradi. Ba’zan past aniqlikdagi tasvirda o‘rganish osonroq bo‘ladi.
Eng to‘g‘ri yondashuv qanday?
Asosiy xulosa bitta:
Tasvir o‘lchamini “imkon qadar eng katta” emas, balki “muammo uchun yetarli va real infratuzilmaga mos” qilib tanlang.
Amaliy yo‘l-yo‘riq:
- Model qayerda ishlaydi? Cloudda yoki kameraning o‘zidami?
- Real ishchi muhitdagi tasvirlar bilan treningdagi tasvirlar bir xilmi?
- Past resolutionda ham vazifa yechiladimi? Avval shuni tekshirib ko‘ring
Tasvirning xususiyatlari faqat obyektga emas, uni olish usuliga ham bog‘liq:
- Ko‘rinadigan spektr, infraqizil, rentgen, ultratovush, elektron mikroskopiya kabi usullar bir xil ko‘rinmaydi
- Ba’zi sensorlar polar grid kabi koordinata tizimida ishlaydi, bu esa preprocessing va model inputini o‘zgartiradi
- Turli manbadan kelgan tasvirlarni birlashtirishda koordinatalarni moslashtirish (remap) kerak bo‘lishi mumkin
Bias va real hayot farqi
Model treningdagi datasetga o‘rganadi, lekin real hayotda boshqa sharoitni ko‘rsa, xatoliklar keskin oshishi mumkin. Bu holat measurement bias deb yuritiladi.
Masalan:
- Treningda yuqori aniqlikdagi “ideal” mushuk rasmlari
- Real hayotda esa arzon kamera, yomon yorug‘lik, distorsiya, shovqin
Natijada model “mushukni” emas, tasvir sharoitini o‘rganib qolishi ham mumkin.
Yakuniy fikr
Computer Vision tizimi qurishda birinchi qadam model tanlash emas. Birinchi qadam tasvir qanday olingani, qanday noise va bias olib kelishi, deploy infratuzilmasi qanday bo‘lishini tushunish.
Shundan keyingina:
- kerak bo‘lsa preprocessing qilasiz
- kerak bo‘lsa modelni moslaysiz (fine-tune yoki last layer change)
- va eng muhimi, real dunyoda ishlaydigan yechimga yaqinlashasiz
Mavzu bo'yicha batafsil shu yerda
#fundamentals #computer_vision
Bir uyum mitti mushukchalarni suratga olishga uringan bo‘lsangiz, vaziyat tanish: eng yoqimli poza ko‘zingizga ilinadi, lekin u yarim soniya ham davom etmaydi. Siz fokusni, zoomni, burchakni sozlayotgan paytda, kadr allaqachon o‘zgargan bo‘ladi. Keyin qarasangiz, rasmlarning ko‘pi xira.
Bu oddiy misol real dunyoda tasvir bilan ishlashning asosiy muammolarini juda yaxshi ko‘rsatadi.
Real tasvirlashdagi muammolar nimada?
- Ssenariy (obyekt holati) kamera moslashishga ulguradigan tezlikdan tezroq o‘zgaradi
- Obyekt masofasi doim o‘zgaradi, fokus doim “qochadi”
- Linza va masofa distorsiya keltirib chiqaradi
- “Eng qiziq moment” yuzlab oddiy kadrlar orasida yo‘qolib ketadi
Ko‘p odam birinchi bo‘lib shuni o‘ylaydi: kamera kuchliroq bo‘lsa, model ham aniqroq bo‘ladi. Amalda esa yuqori resolution ko‘pincha yangi muammolar keltirib chiqaradi:
- CNN kabi model arxitekturalari odatda ma’lum o‘lchamdagi input kutadi
- Katta tasvir katta model degani
- Katta model ko‘proq vaqt, ko‘proq GPU, ko‘proq RAM talab qiladi
- Batch kichrayadi, trening sekinlashadi, infratuzilma xarajati oshadi
- Deploy masalasi yanada qiyinlashadi, ayniqsa model qurilmaning o‘zida ishlashi kerak bo‘lsa (nanny cam kabi)
Yana bir muhim nuqta: resolution oshishi faqat signalni emas, shovqinni ham ko‘paytiradi. Ba’zan past aniqlikdagi tasvirda o‘rganish osonroq bo‘ladi.
Eng to‘g‘ri yondashuv qanday?
Asosiy xulosa bitta:
Tasvir o‘lchamini “imkon qadar eng katta” emas, balki “muammo uchun yetarli va real infratuzilmaga mos” qilib tanlang.
Amaliy yo‘l-yo‘riq:
- Model qayerda ishlaydi? Cloudda yoki kameraning o‘zidami?
- Real ishchi muhitdagi tasvirlar bilan treningdagi tasvirlar bir xilmi?
- Past resolutionda ham vazifa yechiladimi? Avval shuni tekshirib ko‘ring
Tasvirning xususiyatlari faqat obyektga emas, uni olish usuliga ham bog‘liq:
- Ko‘rinadigan spektr, infraqizil, rentgen, ultratovush, elektron mikroskopiya kabi usullar bir xil ko‘rinmaydi
- Ba’zi sensorlar polar grid kabi koordinata tizimida ishlaydi, bu esa preprocessing va model inputini o‘zgartiradi
- Turli manbadan kelgan tasvirlarni birlashtirishda koordinatalarni moslashtirish (remap) kerak bo‘lishi mumkin
Bias va real hayot farqi
Model treningdagi datasetga o‘rganadi, lekin real hayotda boshqa sharoitni ko‘rsa, xatoliklar keskin oshishi mumkin. Bu holat measurement bias deb yuritiladi.
Masalan:
- Treningda yuqori aniqlikdagi “ideal” mushuk rasmlari
- Real hayotda esa arzon kamera, yomon yorug‘lik, distorsiya, shovqin
Natijada model “mushukni” emas, tasvir sharoitini o‘rganib qolishi ham mumkin.
Yakuniy fikr
Computer Vision tizimi qurishda birinchi qadam model tanlash emas. Birinchi qadam tasvir qanday olingani, qanday noise va bias olib kelishi, deploy infratuzilmasi qanday bo‘lishini tushunish.
Shundan keyingina:
- kerak bo‘lsa preprocessing qilasiz
- kerak bo‘lsa modelni moslaysiz (fine-tune yoki last layer change)
- va eng muhimi, real dunyoda ishlaydigan yechimga yaqinlashasiz
Mavzu bo'yicha batafsil shu yerda
#fundamentals #computer_vision
Inomjon's blog
Haqiqiy hayotda tasvirga olish
Yuqori aniqlik (high resolution) har doim ham Computer Vision uchun eng yaxshi yechim emas. Katta tasvirlar ko‘proq resurs talab qiladi, trening va deploy’ni qimmatlashtiradi, ba’zan esa shovqinni ham ko‘paytiradi. Ushbu postda tasvirni olish (acquisition)…
🔥10❤2❤🔥1
Computer Vision
Oddiy ko'rinadigan “to'pni tepish”ning o'zi miyada bir nechta ishni bir zumda bajarishni talab qiladi: to'pni ko'rish, joylashuvini tushunish, harakatini kuzatish, qachon kelishini taxmin qilish, oyoq qayerda ekanini bilish va kerakli kuchni hisoblash. Computer Visionning markazidagi g'oya ham shu: tasvirdan mazmunli axborotni ajratib olish va uni tushunishga yaqinlashish.
Computer Vision ta'rifi
Computer Vision bu mashinalarni ko'ra oladigan qilish ilmi va texnologiyasi. Ya'ni, vizual ma'lumotni olish, qayta ishlash, tahlil qilish va tushunish, so'ng undan dunyo haqida mazmunli reprezentatsiya, tavsif va talqin (interpretation) chiqarish.
Nega Deep Learning CVni “uchirib yubordi”?
Oldinlari klassik yo'l:
1) image preprocessing orqali qo'lda features chiqarib olamiz
2) keyin shu featurelar ustida klassik ML ishlatamiz
Bu ishlaydi, lekin domain knowledge va feature engineeringga qattiq bog'liq.
Deep Learning (DL) esa xom tasvirdan (raw data) murakkab featurelarni o'zi o'rganadi. Katta dataset + DL birlashganda CV modellari ancha moslashuvchan va kuchli bo'lib ketdi. Shu sabab sohada renessans boshlanganini ko'ryapmiz.
Image understanding darajalari:
- Low-level: kontrastni o'zgartirish, sharpen qilish. Kirish ham chiqish ham tasvir
- Mid-level: segmentation, obyekt atributlari, object classification. Natija tasvirga bog'liq metadata chiqadi
- High-level: tasvirning to'liq mazmunini anglash, object recognition, scene reconstruction, image-to-text va hk.
Batafsil shu yerda
#fundamentals #computer_vision
Oddiy ko'rinadigan “to'pni tepish”ning o'zi miyada bir nechta ishni bir zumda bajarishni talab qiladi: to'pni ko'rish, joylashuvini tushunish, harakatini kuzatish, qachon kelishini taxmin qilish, oyoq qayerda ekanini bilish va kerakli kuchni hisoblash. Computer Visionning markazidagi g'oya ham shu: tasvirdan mazmunli axborotni ajratib olish va uni tushunishga yaqinlashish.
Computer Vision ta'rifi
Computer Vision bu mashinalarni ko'ra oladigan qilish ilmi va texnologiyasi. Ya'ni, vizual ma'lumotni olish, qayta ishlash, tahlil qilish va tushunish, so'ng undan dunyo haqida mazmunli reprezentatsiya, tavsif va talqin (interpretation) chiqarish.
Nega Deep Learning CVni “uchirib yubordi”?
Oldinlari klassik yo'l:
1) image preprocessing orqali qo'lda features chiqarib olamiz
2) keyin shu featurelar ustida klassik ML ishlatamiz
Bu ishlaydi, lekin domain knowledge va feature engineeringga qattiq bog'liq.
Deep Learning (DL) esa xom tasvirdan (raw data) murakkab featurelarni o'zi o'rganadi. Katta dataset + DL birlashganda CV modellari ancha moslashuvchan va kuchli bo'lib ketdi. Shu sabab sohada renessans boshlanganini ko'ryapmiz.
Image understanding darajalari:
- Low-level: kontrastni o'zgartirish, sharpen qilish. Kirish ham chiqish ham tasvir
- Mid-level: segmentation, obyekt atributlari, object classification. Natija tasvirga bog'liq metadata chiqadi
- High-level: tasvirning to'liq mazmunini anglash, object recognition, scene reconstruction, image-to-text va hk.
Batafsil shu yerda
#fundamentals #computer_vision
Inomjon's blog
Computer Vision nima?
Computer Vision nima, u qanday vazifalarni bajaradi va nega deep learning bu sohaga renessans olib keldi? Ushbu postda image understanding darajalari, asosiy CV tasklar va amaliy qo’llanmalardagi muhim etik nuqtalar haqida tushunarli, texnik izoh beriladi.
🔥9❤🔥2❤1
Bugun Computer Vision tizimlari shunchalik kuchayib ketdiki, ayrim vazifalarni odamdan ham yaxshi bajaryapti.
Masalan, Hindistonda 2 g‘ildirakli transportlar soni juda ko‘p. Hamda ko‘pchilik ‘kaska’ taqmasdan haydab yuradi. Natija oddiy: xavf oshadi, jarohatlar ko‘payadi.
Shu muammoni kamaytirish uchun ular qiziq yechim qilgan:
✅ Kamera + Computer Vision
✅ Kaskasiz haydovchini avtomatik aniqlaydi
✅ Ustiga-ustak davlat raqamini (license plate) ham o‘qiydi
✅ Va jarima avtomatik yoziladi
Bu degani, CV faqat “rasmni taniydi” emas, u real hayotda intizom va xavfsizlikga ham xizmat qilyapti.
Lekin bu faqat bitta misol. Computer Vision qayerlarda ishlaydi?
1) Avtonom mashinalar (Self-driving)
Tesla, Waymo kabi kompaniyalar yo‘lni “ko‘rish” uchun CV’dan foydalanadi:
• piyoda
• yo‘l belgilari
• lane chiziqlari
• boshqa harakatdagi mashinalar
hammasini kamera orqali aniqlab, real vaqtda qaror qabul qiladi.
2) Retail va e-commerce
Amazon, eBay, Walmart’da CV siz ko‘rgan mahsulotni tanib:
• o‘xshashlarini tavsiya qiladi
• do‘konda zaxirani kuzatadi
• mijoz harakatini tahlil qilib, layout va marketingni optimallashtiradi.
3) Zavodlarda sifat nazorati
Assembly line’da CV:
• defektni (tirnalish, noto‘g‘ri yig‘ilish) topadi
• inspeksiyani avtomatlashtiradi
• real vaqtli feedback beradi: nosoz mahsulotni ajratadi yoki operatorni ogohlantiradi.
4) Tibbiy tasvirlar (Medical Imaging)
X-ray, CT, MRI’da:
• o‘sma, sinish, anomaliyalarni topadi
• segmentatsiya qiladi (tumor ajratish kabi)
Computer Vision real hayotda xavfsizlik, ishlab chiqarish, tibbiyot va shu kabi ko’plab sohalarda ishlayapti. To‘g‘ri qurilgan CV tizimi vaqtni tejaydi, xatoni kamaytiradi va natijani yaxshilaydi.
#fundamentals #computer_vision
Masalan, Hindistonda 2 g‘ildirakli transportlar soni juda ko‘p. Hamda ko‘pchilik ‘kaska’ taqmasdan haydab yuradi. Natija oddiy: xavf oshadi, jarohatlar ko‘payadi.
Shu muammoni kamaytirish uchun ular qiziq yechim qilgan:
✅ Kamera + Computer Vision
✅ Kaskasiz haydovchini avtomatik aniqlaydi
✅ Ustiga-ustak davlat raqamini (license plate) ham o‘qiydi
✅ Va jarima avtomatik yoziladi
Bu degani, CV faqat “rasmni taniydi” emas, u real hayotda intizom va xavfsizlikga ham xizmat qilyapti.
Lekin bu faqat bitta misol. Computer Vision qayerlarda ishlaydi?
1) Avtonom mashinalar (Self-driving)
Tesla, Waymo kabi kompaniyalar yo‘lni “ko‘rish” uchun CV’dan foydalanadi:
• piyoda
• yo‘l belgilari
• lane chiziqlari
• boshqa harakatdagi mashinalar
hammasini kamera orqali aniqlab, real vaqtda qaror qabul qiladi.
2) Retail va e-commerce
Amazon, eBay, Walmart’da CV siz ko‘rgan mahsulotni tanib:
• o‘xshashlarini tavsiya qiladi
• do‘konda zaxirani kuzatadi
• mijoz harakatini tahlil qilib, layout va marketingni optimallashtiradi.
3) Zavodlarda sifat nazorati
Assembly line’da CV:
• defektni (tirnalish, noto‘g‘ri yig‘ilish) topadi
• inspeksiyani avtomatlashtiradi
• real vaqtli feedback beradi: nosoz mahsulotni ajratadi yoki operatorni ogohlantiradi.
4) Tibbiy tasvirlar (Medical Imaging)
X-ray, CT, MRI’da:
• o‘sma, sinish, anomaliyalarni topadi
• segmentatsiya qiladi (tumor ajratish kabi)
Computer Vision real hayotda xavfsizlik, ishlab chiqarish, tibbiyot va shu kabi ko’plab sohalarda ishlayapti. To‘g‘ri qurilgan CV tizimi vaqtni tejaydi, xatoni kamaytiradi va natijani yaxshilaydi.
#fundamentals #computer_vision
🔥12❤🔥3❤1
CV muhandis kundaligi
https://www.youtube.com/watch?v=DiQlpiZT-go
Ozodbek aka 100% AI generated klip chiqaribdi😁
👍4🔥2🏆1
Forwarded from Naxalov | AI Blog 🔥
Vibe coding bilan 0 dan 1000$ gacha
Natija kafolatlanmaydi, vibe kafolatlangan 😎
Kurs dasturi:
📌 Hech narsa o‘rgatilmaydi
📌 Faqat vibe
📌 Natija — noma’lum
📌 Narx — 1000$
⏰ Shoshiling! Joylar cheklanmagan
✍️ Ro‘yxatdan o‘tish uchun izohga + qoldiring
⚠️ Barchasi reklama huquqi asosida.
Natija kafolatlanmaydi, vibe kafolatlangan 😎
Kurs dasturi:
📌 Hech narsa o‘rgatilmaydi
📌 Faqat vibe
📌 Natija — noma’lum
📌 Narx — 1000$
⏰ Shoshiling! Joylar cheklanmagan
✍️ Ro‘yxatdan o‘tish uchun izohga + qoldiring
⚠️ Barchasi reklama huquqi asosida.
😁7🔥2👍1
Tasvirni modelga berishdan oldin nima qilish kerak?
Ko‘p hollarda “pre-processing” va “data augmentation” model natijasini bevosita hal qiladi.
1) Digital Image Processing: tasvir ustidagi amallar nimalar?
Raqamli tasvir aslida sonlardan iborat matritsa. Demak biz uni turli yo‘llar bilan o‘zgartira olamiz:
• Mantiqiy (Logical): AND/OR/XOR, NOT (invert) masalan: mask bilan obyektni ajratish
• Statistik (Statistical): o‘rtacha (mean) filtrlash, median filtri, standart og‘ish (std) hisoblash
• Geometrik (Geometrical): aylantirish (rotate), masshtablash (resize/scale), ko‘chirish (translate), kesish (crop)
• Matematik (Mathematical): qo‘shish/ayirish (image add/subtract), ko‘paytirish (gain), bo‘lish (normalize)
• Transform (o‘zgartirish) amallari: Fourier transform (FFT), DCT, Wavelet transform, Hough transform va hk.
Amallar ham ikki xil:
• Element-wise amallar: har bir piksel ustida amal bajariladi (masalan: darajaga ko‘tarish).
• Matrix amallar: matritsa nazariyasiga tayangan holda tasvir manipulyatsiya qilinadi (konvolyutsiya, filterlash)
2) Data augmentation:
Model train/validation/test dataset’da yaxshi natija berishiga qaramay, real muhitda ko‘pincha performance tushib ketadi. Sabab: real data xilma-xil, dataset esa yetarlicha turfa bo‘lmasligi mumkin.
Data augmentation nima beradi?
• Dataset’ni qo‘shimcha data yig‘masdan kattalashtiradi.
• Variativlik kiritadi, generalization kuchayadi.
• Overfitting kamayadi.
• Labeling va cleaning xarajatlarini qisqartiradi.
Bu yerda ham ikki usuldan foydalanishimiz mumkin:
• Augmented data: mavjud tasvirlardan transform bilan yangi variantlar hosil qilish (geometric va color space transformatsiyalar).
• Synthetic data: noldan generatsiya qilingan data, masalan DNNs va GANs orqali.
Demak, pre-processing va data augmentation, real loyihada modelning amaliy natijasini ko‘taradigan asosiy tayanchlardan hisoblanar ekan.
#fundamentals #computer_vision
Ko‘p hollarda “pre-processing” va “data augmentation” model natijasini bevosita hal qiladi.
1) Digital Image Processing: tasvir ustidagi amallar nimalar?
Raqamli tasvir aslida sonlardan iborat matritsa. Demak biz uni turli yo‘llar bilan o‘zgartira olamiz:
• Mantiqiy (Logical): AND/OR/XOR, NOT (invert) masalan: mask bilan obyektni ajratish
• Statistik (Statistical): o‘rtacha (mean) filtrlash, median filtri, standart og‘ish (std) hisoblash
• Geometrik (Geometrical): aylantirish (rotate), masshtablash (resize/scale), ko‘chirish (translate), kesish (crop)
• Matematik (Mathematical): qo‘shish/ayirish (image add/subtract), ko‘paytirish (gain), bo‘lish (normalize)
• Transform (o‘zgartirish) amallari: Fourier transform (FFT), DCT, Wavelet transform, Hough transform va hk.
Amallar ham ikki xil:
• Element-wise amallar: har bir piksel ustida amal bajariladi (masalan: darajaga ko‘tarish).
• Matrix amallar: matritsa nazariyasiga tayangan holda tasvir manipulyatsiya qilinadi (konvolyutsiya, filterlash)
2) Data augmentation:
Model train/validation/test dataset’da yaxshi natija berishiga qaramay, real muhitda ko‘pincha performance tushib ketadi. Sabab: real data xilma-xil, dataset esa yetarlicha turfa bo‘lmasligi mumkin.
Data augmentation nima beradi?
• Dataset’ni qo‘shimcha data yig‘masdan kattalashtiradi.
• Variativlik kiritadi, generalization kuchayadi.
• Overfitting kamayadi.
• Labeling va cleaning xarajatlarini qisqartiradi.
Bu yerda ham ikki usuldan foydalanishimiz mumkin:
• Augmented data: mavjud tasvirlardan transform bilan yangi variantlar hosil qilish (geometric va color space transformatsiyalar).
• Synthetic data: noldan generatsiya qilingan data, masalan DNNs va GANs orqali.
Demak, pre-processing va data augmentation, real loyihada modelning amaliy natijasini ko‘taradigan asosiy tayanchlardan hisoblanar ekan.
#fundamentals #computer_vision
🔥5👍4❤🔥3
Forwarded from Adkham Zokhirov
"Xarita.ai" loyihasi...
Bu shunchaki kurs emas. Sun'iy intellekt olamida o'z yo'lingizni topish uchun interaktiv yo'l xaritasi.
Platformada 2 ta asosiy yo'nalish bor:
- Dasturchilar uchun
- Oddiy Foydalanuvchilar uchun
Eng muhimi — bu Community (Hamjamiyat) loyihasi va BEPUL!
Hozir kirib, o'z yo'lingizni tanlang va kelajak kasbini egallashni boshlang. 👇
Saytga o'tish: https://xarita.ai
Intro Video: https://www.youtube.com/watch?v=mowRFviNXDU
Postni ilmga chanqoq do'stlaringiz bilan ulashing!
(P.S. Sayt haqida fikringizni izohlarda kutaman, bu beta versiya!)
@adkham_zokhirov
Bu shunchaki kurs emas. Sun'iy intellekt olamida o'z yo'lingizni topish uchun interaktiv yo'l xaritasi.
Platformada 2 ta asosiy yo'nalish bor:
- Dasturchilar uchun
- Oddiy Foydalanuvchilar uchun
Eng muhimi — bu Community (Hamjamiyat) loyihasi va BEPUL!
Hozir kirib, o'z yo'lingizni tanlang va kelajak kasbini egallashni boshlang. 👇
Saytga o'tish: https://xarita.ai
Intro Video: https://www.youtube.com/watch?v=mowRFviNXDU
Postni ilmga chanqoq do'stlaringiz bilan ulashing!
(P.S. Sayt haqida fikringizni izohlarda kutaman, bu beta versiya!)
@adkham_zokhirov
YouTube
Sun'iy Intellektni Qayerdan O'rganish Kerak? | Bepul Xarita.ai Platformasi
Sun'iy intellekt (AI) rivojlanib bormoqda, lekin uni qayerdan va qanday o'rganishni bilmayapsizmi? 🤔
Bugungi videoda biz sizga Xarita.ai platformasini taqdim etamiz — bu AI dunyosiga kirib borish uchun mukammal yo'l xaritasi!
Platformaga kirish: https://xarita.ai…
Bugungi videoda biz sizga Xarita.ai platformasini taqdim etamiz — bu AI dunyosiga kirib borish uchun mukammal yo'l xaritasi!
Platformaga kirish: https://xarita.ai…
🔥5🏆3👍1
FEATURE DESCRIPTION: Kompyuter ko‘radigan “belgilar tili” 👁📌
Kompyuterlar tasvirni, raqmlar, matritsalar shaklda "ko'rishini" oldingi postlarda gaplashgan edik. Tasvir va undagi obektlarni tanib olish uchun unga ishonchli "ishoralar" kerak. Ana shu ishoralar: features (xususiyatlar, atributlar) deyilad. Model avval feature’larni o‘rganadi, keyin yangi rasmlarda ham shu belgilar orqali tanib oladi.
1) Feature’larni data structure’larda qanday saqlaymiz?
Feature’lar turlicha: son, kategoriya, rasm, matn va hokazo. Ularni to‘g‘ri ko‘rinishda saqlash keyingi ishlov (processing) uchun juda muhim.
Numerical features (sonli feature’lar):
• Array/List: eng sodda ko‘rinish. Har bir element alohida feature.
• Tensor: ko‘p o‘lchovli massiv. Katta data bilan ML framework’larda juda ko‘p ishlatiladi.
Categorical features (kategoriya feature’lar):
• Dictionary/List: kategoriyani label qilib saqlash (yoki bevosita qiymat sifatida).
• One-hot encoding: kategoriya uchun binary vektor, har bir bit alohida kategoriyani bildiradi.
Image features (tasvir feature’lar):
• Pixel values: rasmni matritsa yoki multi-dimensional array sifatida saqlash.
• CNN features: pre-trained CNN orqali “tayyor” feature’larni ajratib olish.
2) Yaxshi descriptor nimasi bilan “yaxshi”?
Descriptor: Tasvir ichidagi obyekt yoki sahnaning muhim axborotini siqilgan, ammo mazmunli ko‘rinishda ifodalovchi feature to‘plami.
Yaxshi descriptor quyidagilarga ega bo‘ladi:
• Transformatsiyalarga moslashuvchan: rotation, translation, scaling, illumination o‘zgarsa ham “xulqini” yo‘qotmaydi.
• Distinctiveness: obyektni boshqasidan ajratib bera oladi.
• Dimensionality: juda katta bo‘lmasdan, yetarli axborotni saqlaydi.
• Locality: lokal nuqtalar yoki kichik regionlarni yaxshi tasvirlaydi.
• Repeatability: shovqin yoki kichik farqlarda ham barqaror chiqadi.
• Matching algoritmlariga mos: masofa metric’lari yoki ML asosidagi matching bilan yaxshi ishlaydi.
• Computational efficiency: tez hisoblanadi, real-time uchun muhim.
• Adaptability: data o‘zgarishlariga moslasha oladi.
3) Feature descriptor’lar: SIFT va SURF
Quyida 2ta klassik Descriptor lar bilan tanishamiz
• SIFT: aniqlik va robustlik tarafdori
• SURF: tezlik va samaradorlik tarafdori
Ikkalasi ham tasvirdan keypoint topadi va ularni taqqoslash uchun descriptor yaratadi.
🔹 SIFT (Scale-Invariant Feature Transform)
SIFT tasvirda turli scale’larda barqaror keypoint’larni topib, har biri uchun descriptor beradi.
Qanday ishlashi to'liqroq tushuntirilgan manbalar: manba1, manba2.
🔸 SURF (Speeded Up Robust Features)
SURF ham lokal feature topadi, lekin tezlik uchun optimizatsiya qilingan. Uning asosiy “quroli”: integral image va Haar wavelet’lar.
Qanday ishlashi to'liqroq tushuntirilgan manbalar: manba1, manba2
Qo‘llanishlari: object recognition, image stitching, 3D reconstruction.
✅ Yakuniy takeaway
Feature descriptor: modelning “ko‘rish lug‘ati”. Lug‘at qanchalik aniq va barqaror bo‘lsa, tanib olish va matching shunchalik ishonchli bo‘ladi.
#fundamentals #computer_vision
Kompyuterlar tasvirni, raqmlar, matritsalar shaklda "ko'rishini" oldingi postlarda gaplashgan edik. Tasvir va undagi obektlarni tanib olish uchun unga ishonchli "ishoralar" kerak. Ana shu ishoralar: features (xususiyatlar, atributlar) deyilad. Model avval feature’larni o‘rganadi, keyin yangi rasmlarda ham shu belgilar orqali tanib oladi.
1) Feature’larni data structure’larda qanday saqlaymiz?
Feature’lar turlicha: son, kategoriya, rasm, matn va hokazo. Ularni to‘g‘ri ko‘rinishda saqlash keyingi ishlov (processing) uchun juda muhim.
Numerical features (sonli feature’lar):
• Array/List: eng sodda ko‘rinish. Har bir element alohida feature.
• Tensor: ko‘p o‘lchovli massiv. Katta data bilan ML framework’larda juda ko‘p ishlatiladi.
Categorical features (kategoriya feature’lar):
• Dictionary/List: kategoriyani label qilib saqlash (yoki bevosita qiymat sifatida).
• One-hot encoding: kategoriya uchun binary vektor, har bir bit alohida kategoriyani bildiradi.
Image features (tasvir feature’lar):
• Pixel values: rasmni matritsa yoki multi-dimensional array sifatida saqlash.
• CNN features: pre-trained CNN orqali “tayyor” feature’larni ajratib olish.
2) Yaxshi descriptor nimasi bilan “yaxshi”?
Descriptor: Tasvir ichidagi obyekt yoki sahnaning muhim axborotini siqilgan, ammo mazmunli ko‘rinishda ifodalovchi feature to‘plami.
Yaxshi descriptor quyidagilarga ega bo‘ladi:
• Transformatsiyalarga moslashuvchan: rotation, translation, scaling, illumination o‘zgarsa ham “xulqini” yo‘qotmaydi.
• Distinctiveness: obyektni boshqasidan ajratib bera oladi.
• Dimensionality: juda katta bo‘lmasdan, yetarli axborotni saqlaydi.
• Locality: lokal nuqtalar yoki kichik regionlarni yaxshi tasvirlaydi.
• Repeatability: shovqin yoki kichik farqlarda ham barqaror chiqadi.
• Matching algoritmlariga mos: masofa metric’lari yoki ML asosidagi matching bilan yaxshi ishlaydi.
• Computational efficiency: tez hisoblanadi, real-time uchun muhim.
• Adaptability: data o‘zgarishlariga moslasha oladi.
3) Feature descriptor’lar: SIFT va SURF
Quyida 2ta klassik Descriptor lar bilan tanishamiz
• SIFT: aniqlik va robustlik tarafdori
• SURF: tezlik va samaradorlik tarafdori
Ikkalasi ham tasvirdan keypoint topadi va ularni taqqoslash uchun descriptor yaratadi.
🔹 SIFT (Scale-Invariant Feature Transform)
SIFT tasvirda turli scale’larda barqaror keypoint’larni topib, har biri uchun descriptor beradi.
Qanday ishlashi to'liqroq tushuntirilgan manbalar: manba1, manba2.
🔸 SURF (Speeded Up Robust Features)
SURF ham lokal feature topadi, lekin tezlik uchun optimizatsiya qilingan. Uning asosiy “quroli”: integral image va Haar wavelet’lar.
Qanday ishlashi to'liqroq tushuntirilgan manbalar: manba1, manba2
Qo‘llanishlari: object recognition, image stitching, 3D reconstruction.
✅ Yakuniy takeaway
Feature descriptor: modelning “ko‘rish lug‘ati”. Lug‘at qanchalik aniq va barqaror bo‘lsa, tanib olish va matching shunchalik ishonchli bo‘ladi.
#fundamentals #computer_vision
🔥7👍1🏆1
AI/ML o'rganuvchilar uchun mashhur YouTube kanallar📚.
1️⃣ Andrey Karapty – Learn deep learning straight from a legend
2️⃣ Sebastian Raschka – Clear explanations on ML, PyTorch & research
3️⃣ sentdex – Hands-on Python, ML & practical coding
4️⃣ StatQuest with Josh Starmer – ML & stats made ridiculously simple
5️⃣ Jeremy Howard – Practical deep learning & fast. ai insights
6️⃣ Krish Naik – End-to-end AI, ML & career-focused content
7️⃣ CampusX – Structured data science & ML learning paths
8️⃣ 3Blue1Brown – Math intuition behind ML like never before
9️⃣ MIT OpenCourseWare – World-class AI & ML courses for free
🔟 Stanford Online – Learn AI from the pioneers shaping the field
💡Istalgan birini tanlang, o'rganing! Davomiy o'rganish, muvaffaqiyat kaliti!
@learncvuz
1️⃣ Andrey Karapty – Learn deep learning straight from a legend
2️⃣ Sebastian Raschka – Clear explanations on ML, PyTorch & research
3️⃣ sentdex – Hands-on Python, ML & practical coding
4️⃣ StatQuest with Josh Starmer – ML & stats made ridiculously simple
5️⃣ Jeremy Howard – Practical deep learning & fast. ai insights
6️⃣ Krish Naik – End-to-end AI, ML & career-focused content
7️⃣ CampusX – Structured data science & ML learning paths
8️⃣ 3Blue1Brown – Math intuition behind ML like never before
9️⃣ MIT OpenCourseWare – World-class AI & ML courses for free
🔟 Stanford Online – Learn AI from the pioneers shaping the field
💡Istalgan birini tanlang, o'rganing! Davomiy o'rganish, muvaffaqiyat kaliti!
@learncvuz
🔥6👍5
4-yanvardan singulyarlik erasi boshlandi, buni Elon aka aytapti😁
AGI yaqinmi yoki Grok katta "update" bilan chiqadimi, nima deb o'ylaysizlar?
Singularity (texnologik singulyarlik):
AI va boshqa texnologiyalar juda tez, eksponent sur’atda rivojlanib ketadi, natijada yaqin kelajakdagi o‘zgarishlarni oldindan aniq bashorat qilish (expertlar uchun ham) qiyin bo‘lib qoladi.
https://t.me/learncvuz
AGI yaqinmi yoki Grok katta "update" bilan chiqadimi, nima deb o'ylaysizlar?
Singularity (texnologik singulyarlik):
AI va boshqa texnologiyalar juda tez, eksponent sur’atda rivojlanib ketadi, natijada yaqin kelajakdagi o‘zgarishlarni oldindan aniq bashorat qilish (expertlar uchun ham) qiyin bo‘lib qoladi.
https://t.me/learncvuz
🔥9👍2
Forwarded from Sariq Dev
This media is not supported in your browser
VIEW IN TELEGRAM
"Dasturiy ta'minot muhandisining maqsadi — mavjud muammolarni hal qilish va yangi yechim talab etadigan muammolarni topishdir. Kod yozish (coding) esa bu vazifalardan biri, xolos.
Shunday ekan, agar maqsadingiz muammoni hal qilish emas, shunchaki kod yozish bo‘lsa — ya'ni kimdir sizga nima qilishni aytadi va siz uni kodga aylantirsangiz... Unday holda, ha, sizning o‘rningizni Sun'iy Intellekt egallashi mumkin. Ammo bizning barcha muhandislarimizning asosiy maqsadi — muammolarga yechim topishdir.
Ma'lum bo‘lishicha, kompaniyada hali yechimini kutayotgan va hatto hali aniqlanmagan son-sanoqsiz muammolar mavjud. Muhandislar qancha ko‘p vaqtini hali aniqlanmagan muammolarni o‘rganishga sarflasa, kompaniyamiz uchun shunchalik yaxshi bo‘ladi.
Hech narsa menga ularning umuman kod yozmasliklaridan ko‘ra ko‘proq quvonch bag‘ishlamagan bo‘lar edi, agar ular faqat muammolarni hal qilish bilan band bo‘lishsa.
Menimcha, 'Maqsad' va 'Vazifa' o‘rtasidagi farqni anglash tamoyili hamma uchun qo‘llashga arziydigan foydali yondashuvdir."
— Jensen Huang
Shunday ekan, agar maqsadingiz muammoni hal qilish emas, shunchaki kod yozish bo‘lsa — ya'ni kimdir sizga nima qilishni aytadi va siz uni kodga aylantirsangiz... Unday holda, ha, sizning o‘rningizni Sun'iy Intellekt egallashi mumkin. Ammo bizning barcha muhandislarimizning asosiy maqsadi — muammolarga yechim topishdir.
Ma'lum bo‘lishicha, kompaniyada hali yechimini kutayotgan va hatto hali aniqlanmagan son-sanoqsiz muammolar mavjud. Muhandislar qancha ko‘p vaqtini hali aniqlanmagan muammolarni o‘rganishga sarflasa, kompaniyamiz uchun shunchalik yaxshi bo‘ladi.
Hech narsa menga ularning umuman kod yozmasliklaridan ko‘ra ko‘proq quvonch bag‘ishlamagan bo‘lar edi, agar ular faqat muammolarni hal qilish bilan band bo‘lishsa.
Menimcha, 'Maqsad' va 'Vazifa' o‘rtasidagi farqni anglash tamoyili hamma uchun qo‘llashga arziydigan foydali yondashuvdir."
— Jensen Huang
1🔥8
⚡️ Ultralytics YOLO26 rasman chiqdi (2026-01-14)!
Bu relizning markazida bitta g‘oya : edge va low-power qurilmalarda ham production’ga tez va og‘riqsiz chiqish. Men kutgan reliz😁
Nimalar o‘zgardi, asosiy yangiliklar
- End-to-end, NMS-free inference: endi klassik NMS post-processing bosqichi yo‘q. Natija: latency kamroq, export va deploy jarayoni soddaroq.
- CPU’da 43% gacha tezroq inference: ayniqsa edge senariylar uchun juda katta sakrash.
- DFL (Distribution Focal Loss) olib tashlandi: arxitektura soddalashdi, exportability va low-power hardware bilan moslashuvchanlik yaxshilandi.
- ProgLoss + STAL: trening barqarorroq, ayniqsa small object’larda aniqlikni oshirishga e'tibor qaratilgan.
- MuSGD optimizer: SGD + Muon gibrid yondashuv, treningni barqaror va samaraliroq qilish uchun.
- Task-specific yaxshilanishlar:
- Segmentation: semantic loss + multi-scale protos
- Pose: keypoint’lar uchun yuqori aniqlikda RLE
- OBB: angle loss bilan boundary discontinuity muammosi ustida ishlangan.
- YOLOE-26 (Open-Vocabulary): text prompt yoki visual prompt bilan zero-shot detect/segment qilish. Hatto prompt-free variantlar ham bor.
YOLO26 qaysi tasklarni qamrab oladi?
- Object Detection
- Instance Segmentation
- Image Classification
- Pose Estimation
- Oriented Object Detection (OBB)
GitHub, YOLO26
@learncvuz
Bu relizning markazida bitta g‘oya : edge va low-power qurilmalarda ham production’ga tez va og‘riqsiz chiqish. Men kutgan reliz😁
Nimalar o‘zgardi, asosiy yangiliklar
- End-to-end, NMS-free inference: endi klassik NMS post-processing bosqichi yo‘q. Natija: latency kamroq, export va deploy jarayoni soddaroq.
- CPU’da 43% gacha tezroq inference: ayniqsa edge senariylar uchun juda katta sakrash.
- DFL (Distribution Focal Loss) olib tashlandi: arxitektura soddalashdi, exportability va low-power hardware bilan moslashuvchanlik yaxshilandi.
- ProgLoss + STAL: trening barqarorroq, ayniqsa small object’larda aniqlikni oshirishga e'tibor qaratilgan.
- MuSGD optimizer: SGD + Muon gibrid yondashuv, treningni barqaror va samaraliroq qilish uchun.
- Task-specific yaxshilanishlar:
- Segmentation: semantic loss + multi-scale protos
- Pose: keypoint’lar uchun yuqori aniqlikda RLE
- OBB: angle loss bilan boundary discontinuity muammosi ustida ishlangan.
- YOLOE-26 (Open-Vocabulary): text prompt yoki visual prompt bilan zero-shot detect/segment qilish. Hatto prompt-free variantlar ham bor.
YOLO26 qaysi tasklarni qamrab oladi?
- Object Detection
- Instance Segmentation
- Image Classification
- Pose Estimation
- Oriented Object Detection (OBB)
GitHub, YOLO26
@learncvuz
GitHub
GitHub - ultralytics/ultralytics: Ultralytics YOLO 🚀
Ultralytics YOLO 🚀. Contribute to ultralytics/ultralytics development by creating an account on GitHub.
🔥7
AI/ML intervyularga tayyorgarlik ko'ryapsizmi?
Quyida amalda eng ko‘p yordam beradigan 9 ta GitHub repo:
All algorithms implemented in Python (217k ⭐️)
https://github.com/TheAlgorithms/Python
Awesome Machine Learning (71.2k ⭐️)
https://github.com/josephmisiti/awesome-machine-learning
Machine Learning interviews from FAANG (11.9k ⭐️)
https://github.com/khangich/machine-learning-interview
Tech interview handbook (137k ⭐️)
https://github.com/yangshun/tech-interview-handbook
System Design Primer (322k ⭐️)
https://github.com/donnemartin/system-design-primer
Machine Learning interview questions (4.3k ⭐️)
https://github.com/andrewekhalel/MLQuestions
Machine Learning cheat sheet (8k ⭐️)
https://github.com/soulmachine/machine-learning-cheat-sheet
Guide for ML / AI technical interviews (7.4k ⭐️)
https://github.com/alirezadir/Machine-Learning-Interviews
Mathematics for Machine Learning (14.9k ⭐️)
https://github.com/mml-book/mml-book.github.io
Quyida amalda eng ko‘p yordam beradigan 9 ta GitHub repo:
All algorithms implemented in Python (217k ⭐️)
https://github.com/TheAlgorithms/Python
Awesome Machine Learning (71.2k ⭐️)
https://github.com/josephmisiti/awesome-machine-learning
Machine Learning interviews from FAANG (11.9k ⭐️)
https://github.com/khangich/machine-learning-interview
Tech interview handbook (137k ⭐️)
https://github.com/yangshun/tech-interview-handbook
System Design Primer (322k ⭐️)
https://github.com/donnemartin/system-design-primer
Machine Learning interview questions (4.3k ⭐️)
https://github.com/andrewekhalel/MLQuestions
Machine Learning cheat sheet (8k ⭐️)
https://github.com/soulmachine/machine-learning-cheat-sheet
Guide for ML / AI technical interviews (7.4k ⭐️)
https://github.com/alirezadir/Machine-Learning-Interviews
Mathematics for Machine Learning (14.9k ⭐️)
https://github.com/mml-book/mml-book.github.io
🔥10👍2