CV muhandis kundaligi
250 subscribers
12 photos
13 videos
36 links
Download Telegram
Forwarded from maroon bells🪐
📌 ChatGPT qanday ishlaydi? Matematik asos bilan tushuntiramiz!

Bugun ChatGPT, Google Bard, Claude kabi sun’iy intellektlar har bir so‘zimizga mantiqiy, hatto ijodiy javob qaytara olmoqda. Bular ortida nima turibdi?

🔍 Javob: Transformer modeli, ya’ni zamonaviy AI’ning asosi.

🎯 Uning yuragida yotgan formulani bilasizmi?

👆🏻Rasmga qarang

Bu formula self-attention deb ataladi — u har bir so‘zning boshqa so‘zlarga nisbatan qanchalik muhimligini ehtimollar asosida hisoblab beradi.

🧠 Oddiy qilib aytganda:

Q = so‘rov (query)

K = kalit (key)

V = qiymat (value)

Softmax esa – sonlarni ehtimollikka aylantiruvchi matematik funksiya.

Masalan:

> "Men bugun maktabga bordim, chunki..."
Bu yerda "chunki" degan so‘z oldingi gapdagi “bordim” bilan bog‘liqligini AI aynan shu model yordamida anglaydi.

-

Shunday qilib, matematika nafaqat sonlar bilan ishlash, balki sun’iy intellektni yaratuvchi fikrlash qurolidir.
👍10
🎓 “Sun’iy intellekt davrida dasturlash”
© Andrey Karpaty

San-Fransiskoda taniqli Y Combinator venchur fondi tomonidan katta AI Startup School tadbiri o‘tkazildi.

Unda mashhur mutaxassis – Andrey Karpaty so'zga chiqdi.
To'liq video bu yerda.
Mavzu quyidagilarni qamrab oladi:
Software (Dasturiy ta’minot) kelajagi va yaqin 2–3 yil ichida qanday o‘zgarishlar bo‘lishi kutilmoqda
"Vayb-koding" nima? Va bugungi “sog‘lom” dasturchi bu jarayonga qanday yondashadi – partial autonomy apps tushunchasi.
LLM (katta til modellari) asosidagi operatsion tizimlar qanday ishlaydi va ular ochadigan imkoniyatlar.
Zamonaviy LLM’lar nega ba’zan ishlamaydi – bu texnik muammolarning asl sabablari nimalarda?
Bugungi dasturchi nimalarni o‘rganishi zarur
P.S: Karpaty har doimgidek yuqori saviyadagi fikrlari bilan bo'lishgan, tavsiya qilaman, vaqt topib albatta ko‘ring. Ma’ruza qisqa, ammo mazmunli.
7👍3
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
OpenAI’ning asosiy olimlaridan biri Noam Braun bilan qiziqarli intervyu chiqdi.

Bu o‘sha Braun — Ilon Mask, Sergey Brin va boshqa “katta baliqlar” "hunting" qilishga harakat qilgan yigit. Hozirda u Altmanning research reasoning jamoasida ishlaydi, va aynan uning ishi tufayli bizda o1 va boshqa "thinking" modellari paydo bo‘ldi.

Intervyuda u qiziq bir fikrni aytdi:
Zamonaviy modellar – bu “AI g‘or odamlari”. Agar milliardlab agentlar uzoq vaqt davomida bir-biri bilan hamkorlik va raqobat qilsa, bu bir sivilizatsiyaga aylanadi.
Bizning ajdodlarimizda ham biznikidek miya bo‘lgan, ammo ular bizning dunyomizda yashamagan. Inson intellektini keng miqyosda ishlatish uchun ming yillik tarix kerak bo‘ldi.

AI ham xuddi shuni talab qiladi. Faqat bu sivilizatsiyani u ancha tezroq qurishi mumkin.

To‘liq intervyuni ko‘rishni tavsiya qilaman: olim reasoning, OpenAI ichki maqsadlari, agentlar va, albatta, AI kelajagi haqida fikrlari bilan bo'lishgan.
👍7🔥21
Forwarded from Jakhongir Rakhmonov - IT
Salom, mening ismim ChatGPT

Men LLM (Large Language Model) oilasidanman. Men internetda mavjud bo‘lgan juda ko‘p textlarni uzoq vaqt davomida juda kuchli kompyuterlarda o‘qib chiqqanman. Ulardan o‘rganganlarimni maxsus ma’lumotlar bazasiga mahsus formatda saqlab qo‘yganman.

Mening qiladigan ishim juda ham sodda. Oson emas, lekin sodda. U quyidagicha:

1. Menga kimdir text jo‘natadi. Deylik, 6 ta so‘zdan iborat.

2. Men bu textni o‘qiyman.

3. Shu berilgan textdan keyin qaysi so‘z kelishini ma’lumotlar bazasidan qarab olib foydalanuvchiga jo‘nataman. Endi text 6 ta emas, 7 ta so‘zdan iborat.

4. Shu 7 ta so‘zni o‘qiyman va shu textdan keyin qaysi so‘z kelishini ma’lumotlar bazasidan qarab olib foydalanuvchiga jo‘nataman. Endi text 7 ta emas, 8 ta so‘zdan iborat.

5. Shu 8 ta so‘zni o‘qiyman va shu textdan keyin qaysi so‘z kelishini ma’lumotlar bazasidan qarab olib foydalanuvchiga jo‘nataman. Endi text 8 ta emas, 9 ta so‘zdan iborat.

6. Shu 9 ta so‘zni o‘qiyman…..

Ko‘rib turganingizdek, menda hech qanday “fikrlash” yo‘q. Men shunchaki qaysi so‘zdan keyin qaysi so‘z kelishini internetdagi ma’lumotlar orqali juda yaxshi o‘rganib olganman. Va shunchaki “popugay” kabi foydalanuvchiga qaytarib beraman. Shuning uchun ham javobni birdaniga jo’nata olmayman. So’zlarni birma bir alohida jo’nata olaman holos.

Tanishganimdan xursandman.

P.S. bu albatta LLMlarning qilayotgan asosiy ishini tushuntirish maqsadida yozilgan, juda soddalashtirilgan kichik post.

@jakhonrakhmonov
👍73🔥1
So‘nggi 8 yilda Computer Vision’ga qiziqishim ortib, sohaga doir ko‘p narsani chuqurroq o‘rganib boryapman. Ayniqsa, ma'lum bir muammo uchun mos arxitektura yaratish, datasetlarni avtomatlashtirilgan tarzda — ground truth yoki synthetic usulda — generatsiya qilish bo‘yicha yaxshi tajriba to‘pladim.

Vaqt o‘tib, odamlar bilan muloqot ham menga modelni tahlil qilishga o‘xshab tuyula boshladi. Ko‘z qarashi, intonatsiyasi, ibora tanlovi — bular orqali inson nima demoqchiligi, qanday savolga javob qidirayotgani taxmin qilaman. Ba’zida esa kulgili bo‘lsa-da, o‘z-o‘zidan savol tug‘iladi: “Siz qaysi datasetda o‘qitilgansiz?” 😄

Gapirish uslubi, fikrlash yo‘li ko‘pincha odamning "qaysi muhitda pretrain bo‘lganini" ochib beradi. Ijtimoiy tarmoqlarda esa ko‘pchilik o‘z pozitsiyasini qat’iy e’tiqod emas, balki "hozirgi trend"ga moslashgan bir turdagi bias orqali bildiradi. Va natijada — ular boshqa "model"lardan eshitgan gap-so‘zlarni o‘z parametrlariga moslab qayta aytib beradi.

Odamlar, aslidа, til modellari bilan ko‘p jihatdan o‘xshashdek. Ular atrofidan olgan bilimni ichki “tokenizer” orqali filtrlab, soddalashtirib yoki murakkablashtirib, o‘zlariga mos shaklda yetkazishga harakat qiladi.

Ijodkor va reflektiv odamlar esa retelling bilan cheklanmaydi — ular o‘z “dataset”ini o‘zi yaratadi, biror g‘oyani kontekstga qo‘yib, tajriba, kuzatuv va hissiyot bilan boyitadi. Bu esa mutlaqo yangi “knowledge universe”ning tug‘ilishiga olib keladi.

Menimcha, kimdir tayyor skriptda yashayapdi, kimdir esa o‘zining “transfer learning” bosqichidan o‘tyapti.

Bu balki kasbiy deformatsiyadir. Sizda ham shunday holat kuzatilganmi? 😉
😁9👍2
Forwarded from Naxalov | AI Blog 🔥
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Gemini CLI: Open-Source AI in Your Terminal

Gemini CLI — bu Gemini 2.5 Pro kuchini to‘g‘ridan-to‘g‘ri terminalingizga olib keluvchi, bepul va ochiq manbali AI agentidir.

👨‍💻 GitHub: https://github.com/google-gemini/gemini-cli

@naxalov
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Forwarded from Naxalov | AI Blog 🔥
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Warp 2.0: Agentik Dasturlash Muhiti bilan tanishing

Avval terminalda AI bilan ishlashi bilan mashhur bo‘lgan Warp, endilikda o‘zini oddiy terminal yoki IDE emas, balki to‘liq Agentik Dasturlash Muhiti sifatida qayta taqdim etdi.


@naxalov
👍61🔥1
😁11👍5
Sebastian Raschka Machine Learning Q and AI nomli kitobini onlayn, tekin o'qishga ochib qo'yibdi. Marhamat bahra oling😁
👍10
Forwarded from Naxalov | AI Blog 🔥
Biz hozirda kelajakda yashayapmiz.

Odatda inson kelajak haqida xayol qiladi, orzu qiladi, tasavvur qiladi yoki bashorat qiladi. Bunday paytlarda kelajak hali kelmagan, u faqat tasavvurlarda mavjud bo‘ladi.
Ammo so‘nggi yillarda texnologik taraqqiyot, ayniqsa sun’iy intellekt sohasidagi yutuqlar shunchalik tezlashib ketdiki, biz o‘zimiz sezmagan holda kelajakning o‘zida yashay boshladik.

@naxalov
👍9
Forwarded from Naxalov | AI Blog 🔥
O‘zbekistonda “AI” deganda ko‘pchilikning xayoliga, afsuski, birinchi bo‘lib faqat ChatGPT keladi. Shaxsiy kuzatuvlarimga asoslanib aytadigan bo‘lsam, hozircha sun’iy intellektdan asosan ta’lim sohasidagilar va dasturchilar keng foydalanishmoqda.

Ta’lim sohasida, ayniqsa, talabalar turli mustaqil ishlar va uy vazifalarini AI yordamida bajarishadi(Yana men emasman demanglar). O‘z navbatida o‘qituvchilar ham bu texnologiyadan chetda qolmayapti, oddiy test tuzishdan tortib, hisobotlar yozish(xil-xil hujjatlar) va hatto ilmiy ishlar (ilmiy maqolalar) tayyorlashgacha sun’iy intellektdan keng foydalanilmoqda. Ayniqsa, axborot texnologiyalariga yaqin bo‘lganlar orasida bu holat keng tarqalgan (uyatda endi).

Dasturchilar masalasiga keladigan bo‘lsak, bu yerda bir narsani aniq tushunib olishimiz kerak: kim o‘zini qanday darajada dasturchi deb hisoblaydi? Dasturlashni endigina boshlagan ayrimlar ikki qator kod yozmasdan turib, savolni to‘g‘ridan-to‘g‘ri ChatGPT ga ko‘chirib, natijani “katta yutuq” deb bilishadi. Hali harakat qilmaganlar esa shunchaki dasturlash haqidagi videolarni ko‘rib yurishadi, lekin o‘zlari amalda hech narsa qilmaydi.

Keyingi toifa bu - junior dasturchilar. Ular kam maosh evaziga ishlashadi, ammo o‘z ustida ishlab o‘sishni o‘rniga o‘rniga ChatGPT ga bog‘liq bo‘lib qolishgan. Natijada ular mustaqil fikrlay olmaydigan darajaga yetib qolishadi.

Yana bir xavfli toifa bor: ular dasturlashni yetarli darajada tushunmaydi, lekin ChatGPT yordamida unicorn startup( milliard dollarlik) yaratish mumkin deb ishonib, 50-100 ming dollar sarmoya kiritishadi. Afsuski, oradan ko‘p vaqt o‘tmay xatoga yo‘l qo‘yganliklarini tushunib yetishadi lekin kech bo‘ladi. Natijada nafaqat o‘zlari pulsiz qolishadi, balki qo‘lidan ish keladigan iqtidorlarni ham ishsiz qoldirishadi.

Xullas, hozircha O‘zbekistonda sun’iy intellekt shunday “yordam” bermoqda. Yaxshi yangiliklarga endi shu yergacha boshidan o‘qib kelgan bo‘lsangiz, yaqinda ChatGPT ga ishonib kelayotgan butun bir avlodni ko‘ramiz ularni qo‘lida hech ish kelmaydi siz chalg‘imasdan o‘zingizni yo‘lingizdan ketavering xoli sizga ish ko‘p.

Bu bilan men ChatGPT ishlatmanglar demoqchi masman.

Agar qandaydir imlo xato topsangiz izolarda qoldiring sababiki ChatGPT bilan yozilmagan.

@naxalov
👍6🔥5
Katta til modellari (LLM)ni mustaqil “mavjudot” deb emas, simulyator deb tushungan ma’qul. Shuning uchun “xyz haqida sen nima deb o‘ylaysan?” deb so‘rash unchalik to‘g‘ri emas — bu yerda “sen” degan narsa yo‘q. Yaxshisi: “xyz mavzusini qaysi odamlar guruhi muhokama qilsa to‘g‘ri bo‘ladi va ular nima der edi?” deb so‘rang.

Model shunchaki turli nuqtayi nazarlarni taqlid qiladi, lekin odam kabi o‘tirib fikr yuritib, shaxsiy xulosa chiqarmaydi.
👍9
Computer vision, mashinalarga ko‘rishni o‘rgatish haqida.
Quyosh katta ne’mat! U bizga nafaqat issiqlik, balki ko‘rish qobiliyatini shakllanishida ham muhim o’rin tutgan. Deyarli barcha tirik mavjudotlar qandaydir tarzda yorug‘likni sezadi. Inson esa uni elektr signallarga aylantirib, miyaga yuboradi, u yerda bu signal “haqiqiy dunyo”ga aylanadi. Shu oddiy jarayon ko’rish evolyutsiyamizdagi eng muhim qadam bo‘lgan. Olimlar hatto markaziy nerv tizimi (miyamiz) aynan ko‘rish tufayli rivojlangan deb hisoblaydi. Endi koptok tepayotganingizni tasavvur qiling. Miyangiz bir soniyada: koptokni aniqlaydi, harakatini kuzatadi, traektoriyasini hisoblaydi, va hk. Siz buni o‘ylamay ham bajarasiz. Bu inson “vision”ining kuchi.
Lekin kompyuter uchun bu jarayon aaaancha murakkab. Dasturchi sifatida siz “koptok sferik obyekt” deb qoidalar(if/else) yozishingiz mumkin, lekin Yer ham sferik, apelsin ham sferik. Boshqacha aytganda, qoidalar ishlamaydi, kontekst kerak. Biz esa kontekstni instinktiv bilamiz, yani yillar davomida shakllangan mental model orqali. Kompyuter ham shunday o‘rganishi kerak.
Farq shunda:
Dasturlash: qat’iy qoida.
ML: moslashuvchan tushunish.
Shuning uchun ham vision bu faqat obyekt aniqlash emas, balki kontekstni tushunish.
“Kompyuterga ko‘rishni o‘rgatish, unga fikrlashni o‘rgatishda birinchi qadamdir”

Nega mashinalarga “ko‘rish”ni o‘rgatyapmiz?
Maqsad inson qilolmaydigan yoki juda sekin bajaradigan ishlarni avtomatlashtirish.
Masalan, koptokni kuzatadigan model hakamga tez va adolatli qaror chiqarishda yordam beradi yoki ko‘zi ojiz tomoshabinlarga o‘yinni ovoz bilan tasvirlab beradi. Oddiy misol katta ta’sir.
Bugun esa model biz ko‘rmagan narsani ham ko‘radi: rasmda yashirin detallarni topadi, videodan harakatni aniqlaydi, hatto matndan rasm yaratadi. Demak, computer vision bu endi faqat ko‘rish emas, tushunish, ta’sir qilish, va imkoniyat yaratish.
#fundamentals #computer_vision
👍12🔥62
This media is not supported in your browser
VIEW IN TELEGRAM
"Men va Claude code" nomli video😁
😁132🔥2
Tasvir nima?
Ko‘pchilik uchun bu savol oddiy tuyuladi: “Rasm bu rasm-da!”
Lekin kompyuter uchun tasvir, bu raqamlar to‘plami, matritsa yoki funksiya. Har bir piksel yorqinlik (intensivlik) darajasi, yani kompyuter “ko‘radigan” narsa.
Tasvir qanday ifodalanadi?
Tasvirni matematik tarzda quyidagicha ifodalash mumkin:
F(X,Y) — bu fazodagi har bir nuqtaning yorqinlik qiymati, piksellar (picture element). Agar 3D bo‘lsa, bu F(X,Y,Z) ga aylanadi, har bir nuqta esa voxel deb ataladi. Ya’ni, 2D tasvirda biz piksellarni ko‘ramiz, 3D tasvirda esa “hajmiy nuqtalar”, voxellarni.
Rang va kanallar
Rangli tasvirlar uchta asosiy kanal orqali ifodalanadi:
🔴 R — Qizil
🟢 G — Yashil
🔵 B — Ko‘k
Har bir kanal 0–255 oralig‘ida qiymat oladi.
Masalan, (255,0,0) — to‘liq qizil piksel.
Computer Vision modellarini o‘qitishdan oldin,
tasvir qanday yaratilishini, qanday o‘lchovlarda saqlanishini bilish zarur.

Bu tushuncha obyekt aniqlash, segmentatsiya, tasvir klassifikatsiyasi kabi sohalarning asosini tashkil qiladi.
Har bir piksel — bu ma’lumot. Har bir tasvir — bu hikoya.


#fundamentals #computer_vision
🔥8👍31💘1
Forwarded from Naxalov | AI Blog 🔥
This media is not supported in your browser
VIEW IN TELEGRAM
Vibe coding sabab ishsiz qolgan senior dasturchi

@naxalov
🤣9🔥2❤‍🔥1
Raqamli tasvir qanday hosil qilinadi?
Har safar telefoningizda suratga tushganingizda, aslida juda murakkab jarayon sodir bo‘ladi. Fizik nur raqamli piksellarga aylanadi.
Bu jarayonning nomi: Image Acquisition tasvirni qabul qilish.
Avval nur obyektga uriladi > Refleksiya (yoki o‘tish) yuz beradi > Sensor energiyani elektr signaliga aylantiradi > Signal raqamlashtiriladi, qarabsizki raqamli tasvir tayyor.
CCD yoki CMOS sensorlar kameraning yuragi. Tasvirda detallarning tiniqligi piksellar soni - resolution ga bog'liq.
Tasvirlarni siqish (Compression).
Tasvirda ortiqcha ma’lumot ko‘p bo‘ladi: takrorlanuvchi piksellar, kam farqli qiymatlar, inson sezmaydigan detallar va hk. Shular Huffman, RLE, JPEG kabi algoritmlar bilan siqiladi.
Shuning uchun 5 MB rasm 500 KB bo‘lishi mumkin, ko'zga sezilmasligi mumkin, lekin mashinalarga seziladi.
Raqamli tasvir — bu nur, elektronika va matematikaning mukammal uyg‘unligi.

Mavzu bo'yicha batafsil shu yerda.

Qiziq fakt: 1838-yilda olingan birinchi inson fotosurati hali ham Parijda saqlanadi.

Dunyo tarixidagi ilk fotosuratlar ekan.
#fundamentals #computer_vision
👍7🔥32
Nega "yuqori resolution” har doim ham eng yaxshi yechim emas?

Bir uyum mitti mushukchalarni suratga olishga uringan bo‘lsangiz, vaziyat tanish: eng yoqimli poza ko‘zingizga ilinadi, lekin u yarim soniya ham davom etmaydi. Siz fokusni, zoomni, burchakni sozlayotgan paytda, kadr allaqachon o‘zgargan bo‘ladi. Keyin qarasangiz, rasmlarning ko‘pi xira.

Bu oddiy misol real dunyoda tasvir bilan ishlashning asosiy muammolarini juda yaxshi ko‘rsatadi.

Real tasvirlashdagi muammolar nimada?
- Ssenariy (obyekt holati) kamera moslashishga ulguradigan tezlikdan tezroq o‘zgaradi
- Obyekt masofasi doim o‘zgaradi, fokus doim “qochadi”
- Linza va masofa distorsiya keltirib chiqaradi
- “Eng qiziq moment” yuzlab oddiy kadrlar orasida yo‘qolib ketadi

Ko‘p odam birinchi bo‘lib shuni o‘ylaydi: kamera kuchliroq bo‘lsa, model ham aniqroq bo‘ladi. Amalda esa yuqori resolution ko‘pincha yangi muammolar keltirib chiqaradi:
- CNN kabi model arxitekturalari odatda ma’lum o‘lchamdagi input kutadi
- Katta tasvir katta model degani
- Katta model ko‘proq vaqt, ko‘proq GPU, ko‘proq RAM talab qiladi
- Batch kichrayadi, trening sekinlashadi, infratuzilma xarajati oshadi
- Deploy masalasi yanada qiyinlashadi, ayniqsa model qurilmaning o‘zida ishlashi kerak bo‘lsa (nanny cam kabi)

Yana bir muhim nuqta: resolution oshishi faqat signalni emas, shovqinni ham ko‘paytiradi. Ba’zan past aniqlikdagi tasvirda o‘rganish osonroq bo‘ladi.

Eng to‘g‘ri yondashuv qanday?
Asosiy xulosa bitta:
Tasvir o‘lchamini “imkon qadar eng katta” emas, balki “muammo uchun yetarli va real infratuzilmaga mos” qilib tanlang.

Amaliy yo‘l-yo‘riq:
- Model qayerda ishlaydi? Cloudda yoki kameraning o‘zidami?
- Real ishchi muhitdagi tasvirlar bilan treningdagi tasvirlar bir xilmi?
- Past resolutionda ham vazifa yechiladimi? Avval shuni tekshirib ko‘ring

Tasvirning xususiyatlari faqat obyektga emas, uni olish usuliga ham bog‘liq:
- Ko‘rinadigan spektr, infraqizil, rentgen, ultratovush, elektron mikroskopiya kabi usullar bir xil ko‘rinmaydi
- Ba’zi sensorlar polar grid kabi koordinata tizimida ishlaydi, bu esa preprocessing va model inputini o‘zgartiradi
- Turli manbadan kelgan tasvirlarni birlashtirishda koordinatalarni moslashtirish (remap) kerak bo‘lishi mumkin

Bias va real hayot farqi
Model treningdagi datasetga o‘rganadi, lekin real hayotda boshqa sharoitni ko‘rsa, xatoliklar keskin oshishi mumkin. Bu holat measurement bias deb yuritiladi.

Masalan:
- Treningda yuqori aniqlikdagi “ideal” mushuk rasmlari
- Real hayotda esa arzon kamera, yomon yorug‘lik, distorsiya, shovqin

Natijada model “mushukni” emas, tasvir sharoitini o‘rganib qolishi ham mumkin.

Yakuniy fikr
Computer Vision tizimi qurishda birinchi qadam model tanlash emas. Birinchi qadam tasvir qanday olingani, qanday noise va bias olib kelishi, deploy infratuzilmasi qanday bo‘lishini tushunish.

Shundan keyingina:
- kerak bo‘lsa preprocessing qilasiz
- kerak bo‘lsa modelni moslaysiz (fine-tune yoki last layer change)
- va eng muhimi, real dunyoda ishlaydigan yechimga yaqinlashasiz

Mavzu bo'yicha batafsil shu yerda

#fundamentals #computer_vision
🔥102❤‍🔥1
Computer Vision
Oddiy ko'rinadigan “to'pni tepish”ning o'zi miyada bir nechta ishni bir zumda bajarishni talab qiladi: to'pni ko'rish, joylashuvini tushunish, harakatini kuzatish, qachon kelishini taxmin qilish, oyoq qayerda ekanini bilish va kerakli kuchni hisoblash. Computer Visionning markazidagi g'oya ham shu: tasvirdan mazmunli axborotni ajratib olish va uni tushunishga yaqinlashish.
Computer Vision ta'rifi
Computer Vision bu mashinalarni ko'ra oladigan qilish ilmi va texnologiyasi. Ya'ni, vizual ma'lumotni olish, qayta ishlash, tahlil qilish va tushunish, so'ng undan dunyo haqida mazmunli reprezentatsiya, tavsif va talqin (interpretation) chiqarish.

Nega Deep Learning CVni “uchirib yubordi”?
Oldinlari klassik yo'l:
1) image preprocessing orqali qo'lda features chiqarib olamiz
2) keyin shu featurelar ustida klassik ML ishlatamiz
Bu ishlaydi, lekin domain knowledge va feature engineeringga qattiq bog'liq.

Deep Learning (DL) esa xom tasvirdan (raw data) murakkab featurelarni o'zi o'rganadi. Katta dataset + DL birlashganda CV modellari ancha moslashuvchan va kuchli bo'lib ketdi. Shu sabab sohada renessans boshlanganini ko'ryapmiz.
Image understanding darajalari:
- Low-level: kontrastni o'zgartirish, sharpen qilish. Kirish ham chiqish ham tasvir
- Mid-level: segmentation, obyekt atributlari, object classification. Natija tasvirga bog'liq metadata chiqadi
- High-level: tasvirning to'liq mazmunini anglash, object recognition, scene reconstruction, image-to-text va hk.

Batafsil shu yerda
#fundamentals #computer_vision
🔥9❤‍🔥21
Bugun Computer Vision tizimlari shunchalik kuchayib ketdiki, ayrim vazifalarni odamdan ham yaxshi bajaryapti.

Masalan, Hindistonda 2 g‘ildirakli transportlar soni juda ko‘p. Hamda ko‘pchilik ‘kaska’ taqmasdan haydab yuradi. Natija oddiy: xavf oshadi, jarohatlar ko‘payadi.

Shu muammoni kamaytirish uchun ular qiziq yechim qilgan:
Kamera + Computer Vision
Kaskasiz haydovchini avtomatik aniqlaydi
Ustiga-ustak davlat raqamini (license plate) ham o‘qiydi
Va jarima avtomatik yoziladi

Bu degani, CV faqat “rasmni taniydi” emas, u real hayotda intizom va xavfsizlikga ham xizmat qilyapti.

Lekin bu faqat bitta misol. Computer Vision qayerlarda ishlaydi?

1) Avtonom mashinalar (Self-driving)

Tesla, Waymo kabi kompaniyalar yo‘lni “ko‘rish” uchun CV’dan foydalanadi:
• piyoda
• yo‘l belgilari
• lane chiziqlari
• boshqa harakatdagi mashinalar
hammasini kamera orqali aniqlab, real vaqtda qaror qabul qiladi.

2) Retail va e-commerce

Amazon, eBay, Walmart’da CV siz ko‘rgan mahsulotni tanib:
• o‘xshashlarini tavsiya qiladi
• do‘konda zaxirani kuzatadi
• mijoz harakatini tahlil qilib, layout va marketingni optimallashtiradi.

3) Zavodlarda sifat nazorati

Assembly line’da CV:
• defektni (tirnalish, noto‘g‘ri yig‘ilish) topadi
• inspeksiyani avtomatlashtiradi
• real vaqtli feedback beradi: nosoz mahsulotni ajratadi yoki operatorni ogohlantiradi.

4) Tibbiy tasvirlar (Medical Imaging)

X-ray, CT, MRI’da:
• o‘sma, sinish, anomaliyalarni topadi
• segmentatsiya qiladi (tumor ajratish kabi)

Computer Vision real hayotda xavfsizlik, ishlab chiqarish, tibbiyot va shu kabi ko’plab sohalarda ishlayapti. To‘g‘ri qurilgan CV tizimi vaqtni tejaydi, xatoni kamaytiradi va natijani yaxshilaydi.

#fundamentals #computer_vision
🔥12❤‍🔥31