Intellimage ( intelligent image processing )
1.21K subscribers
320 photos
70 videos
31 files
536 links
پردازش تصویر هوشمندIntellimage

📚پژوهشگر و فناور در زمینه ی پردازش تصویر

📞 ارتباط با ما: @Intellimage_a
Download Telegram
👨‍💻 معرفی ماژول های پرکاربرد پایتون در پردازش تصویر

2️⃣ ماژول Open-Cv

▪️کتابخانه ی OpenCV یا همان Open Computer Vision Library مجموعه ای از کتابخانه‌های برنامه‌نویسی پردازش تصویر و یادگیری ماشین است. 

▪️این مجموعه بیشتر روی پردازش تصویر Real Time- تمرکز دارد.

▪️کتابخانه Open-Cv در ابتدا توسط اینتل ساخته و پشتیبانی می‌شد و هم اکنون توسط Willow Garage و Itseez نیز پشتیبانی می‌گردد.

🔍 منبع برای مطالعه بیشتر: virgool.io

🆔️ telegram channel:
https://t.me/Intellimage
#image_processing
#python
#programming
#OpenCv
#module
1👌1
👨‍💻 معرفی ماژول های پرکاربرد پایتون در پردازش تصویر

🔘 کاربرد های OpenCV :

▪️فیلتر تصویر

▪️سیستم تشخیص صورت

▪️تشخیص حرکت

▪️تعامل انسان و رایانه ( HCI )

▪️رباتیک موبایل

▪️درک حرکت

▪️شناسایی شی

▪️تقسیم‌بندی و تشخیص

▪️چشم انداز عمق استریو : ادراک عمق از ۲ دوربین

▪️ساختار از حرکت ( SFM )

▪️ردیابی حرکت

▪️واقعیت افزوده

🔍 منبع برای مطالعه بیشتر: virgool.io

🆔️ telegram channel:
https://t.me/Intellimage
#image_processing
#python
#programming
#OpenCv
#module
👌2
👨‍🏫 اهمیت Gray scale (مقیاس خاکستری) تصاویر

🗨 در رایج ترین مدل رنگ گرافیک کامپیوتری، رنگ ها از ترکیب سه رنگ قرمز، سبز و آبی به وجود می آیند که در مجموع 16581375 رنگ متفاوت توسط این سه مولفه می توان تولید کرد.

🗨 این مدل رنگ در گرافیک کامپیوتری با نام RGB شناخته می شود. در کنار مدل رنگ RGB مدل های دیگری همچون CMYK ، HSI ، HSV و Grayscale نیز وجود دارد که هریک از آن ها به روش متفاوتی به نمایش رنگ ها می پردازند.

🗨 در این بین مدل رنگ Grayscale از اهمیت ویژه ای برای ما برخوردار است. چرا که در بیشتر کاربردها نیازی به یک تصویر رنگی نمی باشد و داشتن تنها یک تصویر خاکستری کافی خواهد بود. 
🔍 منبع برای مطالعه بیشتر: eye-tea.blogfa.com

🆔️ telegram channel:
https://t.me/Intellimage
#image_processing
#python
#programming
#OpenCv
#module
3
📌معرفی #ماژول CBAM

🖇بهبود عملکرد مدل‌های یادگیری ماشین با تمرکز بر ویژگی‌های مهم تصویر

🔬ماژول CBAM که مخفف عبارت Convolutional Block Attention Moduleمی باشد ؛ یک مکانیزم توجه در شبکه‌های عصبی کانولوشنی است که بهبود عملکرد مدل‌ها را با تمرکز بر ویژگی‌های مهم تصویر امکان‌پذیر می‌سازد.

🔬ماژول CBAM به طور معمول از دو بخش اصلی تشکیل شده است:

۱. توجه فضایی (Spatial Attention): در این بخش، ماژول به نقاط مهم در فضای تصویر توجه بیشتری می‌کند و نقاطی که باعث بهبود دقت پیش‌بینی می‌شوند را شناسایی می‌کند.

۲. توجه کانالی (Channel Attention): در این بخش، ماژول توجه خود را به ویژگی‌های کانالی مختلف تصویر متمرکز می‌کند و کانال‌هایی که اطلاعات مفیدتری دارند را تقویت می‌کند.

🔬با ترکیب این دو نوع توجه، CBAM می‌تواند به مدل‌های عصبی کمک کند تا درک بهتری از ساختار تصویر داشته باشند و عملکرد بهتری را در وظایف بینایی کامپیوتری مانند شناسایی اشیا،تقسیم‌بندی و شناسایی چهره ارائه دهند.

🆔️ telegram channel :
https://t.me/Intellimage
#module
#CBAM
#artificial_network
#image_processing
#python
3
📌معرفی #ماژول Grad-CAM

💭 ماژول Grad-CAM که مخفف عبارت Gradient-weighted Class Activation Mapping می‌باشد ؛ یک تکنیک بصری‌سازی در یادگیری عمیق است که به کمک آن می‌توان تشخیص داد که مدل‌های شبکه عصبی در چه نواحی از تصویر بیشتر تمرکز کرده‌اند تا یک پیش‌بینی خاص را انجام دهند. این روش به ویژه در کاربردهای بینایی کامپیوتری (Computer Vision) مفید است.

💭 چگونگی کارکرد Grad-CAM:
۱. محاسبه گرادیان
۲. وزن‌دهی ویژگی‌ها
۳. تولید نقشه حرارتی

💭 ماژول Grad-CAM معمولاً به عنوان یک نقشه حرارتی روی تصویر اصلی نمایش داده می‌شود و می‌تواند درک بهتری از نحوه عملکرد مدل و قابلیت‌های آن در تشخیص فراهم کند. این تکنیک به محققان و توسعه‌دهندگان کمک می‌کند تا بیشتر بفهمند که مدل‌ها چه نواحی از تصویر را برای تصمیم‌گیری‌های خود به کار می‌برند.
🆔️ telegram channel:
https://t.me/Intellimage
#module
#Grad_Cam
#python
4👌1
🔗معرفی Manifold Learning

🧭 تکنیک Manifold Learning یک نوع تکنیک در زمینه یادگیری ماشین است که به تحلیل داده‌های با ابعاد بالا و کاهش ابعاد آن‌ها می‌پردازد.

🧭 در این تکنیک، فرض می‌شود که داده‌ها در یک فضای با ابعاد بالا قرار دارند که در واقع به یک فضای با ابعاد پایین‌تر (مانفولد) متصل شده‌اند.

🧭 هدف ترکیب مانفولد، شناسایی و استخراج ساختار داخلی داده‌ها به منظور کاهش ابعاد و نمایش آن‌ها در یک فضای قابل فهم‌تر است.

با ما همراه باشید 🌱

🆔️ telegram channel:
https://t.me/Intellimage
#deep_learning
#image_processing
#module
1👏1
🔗معرفی Manifold Learning

▪️الگوریتم‌های متداول در حوزه Manifold Learning  شامل موارد زیر هستند:

۱. تحلیل مؤلفه‌های اصلی (PCA): با استفاده از این روش، ابعاد داده‌ها کاهش می‌یابد و به سمت کمینه‌سازی واریانس حرکت می‌کند.

۲. تنظیم چندبعدی (MDS): این روش سعی می‌کند تا فاصله‌های بین نقاط در فضای اصلی را حفظ کند.

۳. خزانه نمایان (LLE): روشی که به صورت محلی به تحلیل ساختار داده‌ها می‌پردازد و سعی می‌کند ساختار همسایگی هر نقطه را حفظ کند.

۴. تحلیل لاپلسین (Laplace Eigenmaps): این تکنیک بر روی ساختار گراف داده‌ها عمل می‌کند و سعی در کاهش ابعاد بدون از دست دادن اطلاعات ساختاری دارد.

▪️تکنیک Manifold Learning به خصوص در زمینه‌هایی مثل شناسایی الگو، پردازش تصویر، و بینایی کامپیوتری بسیار مورد استفاده قرار می‌گیرد و به بهبود دقت طبقه‌بندی و تحلیل داده‌ها کمک می‌کند.

🆔️ telegram channel:
https://t.me/Intellimage
#deep_learning
#image_processing
#module
4
🔗معرفی یادگیری انتقالی (Transfer Learning)

🔘 یادگیری انتقالی یک روش در یادگیری ماشین و یادگیری عمیق است که در آن مدل‌های پیش‌آموزش دیده‌شده بر روی یک مجموعه داده بزرگ، برای حل مسئله‌های جدید با استفاده از داده‌های کمتر، به‌کار می‌روند.

🔘 پس از بارگذاری مدل پیش‌آموزش دیده، تنها لایه‌های نهایی مدل یا تمامی لایه‌ها بر روی داده‌های جدید تنظیم می‌شوند تا به هدف خاصی دست یابند.

🔘 یادگیری انتقالی به ما این امکان را می‌دهد که بدون نیاز به آموزش مدل از ابتدا، در زمان و منابع محاسباتی صرفه‌جویی کنیم.

🔘 به‌طور کلی، یادگیری انتقالی یک روش مؤثر برای به‌کارگیری دانش به دست آمده از مشکلات مشابه و بهبود نتایج در مشکلات جدید است.

🆔️  telegram channel:
https://t.me/Intellimage
#deep_learning
#module
#Transfer_Learning
👏1
🔗 معرفی شبکه عصبی U-Net

▪️شبکه U-Net به طور گسترده در پردازش تصاویر پزشکی استفاده می شود.این شبکه قابلیت انجام segmentation وتشخیص نواحی مختلف را در تصویر دارد.

▪️شبکه U-Net می تواند برای شناسایی و برچسب گذاری ناحیه های مختلف مانند زخم ها، پلیپ ها و غیره در تصاویر آندوسکوپی استفاده شود.

باماهمراه باشید🌱

🆔️ telegram channel:
https://t.me/Intellimage
#module
#deep_learning
#U_net
2👏1
🔗 ساختار شبکه عصبی U-Net

▪️بخش Encoder : بخش انکودر که در بالای "U" قرار دارد، وظیفه استخراج ویژگی‌های تصویر را بر عهده دارد. این بخش شبیه به شبکه‌های کانولوشنی استاندارد (مانند VGG یا ResNet) عمل می‌کند و ویژگی‌های محلی را استخراج می‌کند.

▪️بخش Bottleneck : بعد از بخش انکودر، داده‌ها وارد یک لایه مانند "گردن بطری" می‌شوند که در آن ویژگی‌های عمیق‌تری از تصویر استخراج می‌شود.

▪️بخش Decoder : بخش دیکدر که در پایین "U" قرار دارد، وظیفه بازسازی تصویر را بر عهده دارد. این بخش با استفاده از ویژگی‌های استخراج شده توسط انکودر و همچنین اتصالات جانبی (skip connections) بین انکودر و دیکدر، تصویر سگمنت شده را تولید می‌کند.

💡مزیت اصلی U-Net در این است که با استفاده از اتصالات جانبی بین انکودر و دیکدر، اطلاعات محلی و جزئی تصویر را در طول فرایند دیکدینگ حفظ می‌کند. این امر باعث می‌شود که شبکه قادر به ایجاد نتایج دقیق‌تر و با جزئیات بیشتری برای وظایف سگمنتاسیون باشد.

🆔️ telegram channel:
https://t.me/Intellimage
#module
#deep_learning
#U_net
👏21