onlinebme
winter1516_lecture7.pdf
✅ شبکه عصبی کانولوشن
💡 بخش دوم: خلاصه معماری
نویسنده: محمد نوری زاده چرلو (عضو ارشد گروه تخصصی و آموزشی دانشجویان دانشگاه علم و صنعت تهران)
✍️ همانطور که ما میدانیم، شبکه های عصبی یک ورودی در قالب یک بردار ویژگی دریافت میکنند و سپس آنرا از تعدادی لایه مخفی (Hidden layer) عبور میدهند و نهایتا یک خروجی که نتیجه پردازش لایه های مخفی است در لایه خروجی شبکه ظاهر میشود.
هر لایه مخفی از تعدادی نورون تشکیل شده که این نورونها به تمام نورونهای لایه قبل از خود متصل می-شوند. نورونهای هر لایه بصورت مستقل عمل کرده و هیچ ارتباطی با یکدیگر ندارند. آخرین لایه تماما متصل (fully connected layer) به لایه خروجی (output layer) معروف است و معمولا نقش نمایش دهنده امتیاز هر دسته(class) را ایفا میکند.
شبکههای عصبی معمولی برای تصاویر معمول(full images) بخوبی عمل نمی کنند زیرا که حجم بردار ورودی بالاست و نمیتواند مسئله را با دقت مناسبی حل کند.
بعنوان مثال اگر یک تصویر به اندازه 32*32 باشد (۳۲ پیکسل عرض، ۳۲ پیکسل ارتفاع و ۳ کانال رنگ ). بنابراین یک نورون با اتصال کامل (fully connected) در لایه مخفی اول یک شبکه عصبی معمولی 32*32*3=3072 وزن خواهد داشت . این مقدار شاید در نظر اول مقدار قابل توجهی بنظر نیاید اما بطور واضح مشخص است که این معماری تماما مرتبط قابل استفاده برای تصاویر بزرگتر نخواهد بود. برای مثال یک تصویر با اندازه متعارف تر مثل 200*200*3 باعث میشود که یک نورون120000 وزن داشته باشد! علاوه بر این ما قطعا خواهان تعداد بیشتری از این نورون ها خواهیم بود، پس تعداد پارامترها بسرعت افزایش پیدا میکند. مشخص است این اتصال کامل (Full connectivity) باعث اتلاف (wasteful) بوده و تعداد بسیار زیاد پارامترها هم بسرعت باعث overfitting خواهد شد.
برای حل این مشکل، از تصاویر ویژگیهای مهم وکلیدی را که نماینده خوبی برای تصویر باشند را استخراج میکنند و به صورت یک بردار ویژگی به شبکه اعمال میکنند.
مثال2: فرض کنید که میخواهیم توسط شبکه عصبی تشخیص چهره را انجام دهیم:
به دو دلیل نمیتوانیم مستقیما از پیسکلهای خود تصویر استفاده کنیم:
- سایز تصویر بزرگ هست و نمیتوان به درستی شبکه را آموزش داد و مشکلاتی که توضیح دادیم پیش میاد.
- تصاویر در شرایط مختلف گرفته می شود و ممکن است ویژگی های تصویر تغییر کند. برای مثال شخص یکبار با ریش و سیبیل باشد و در عکس دیگر بدون ریش و سیبیل. یا اینکه تصویر از یک زاویه دیگه ای گرفته شود. سایز تصویر تغییر کند، شدت روشنایی تصویر تغییر کند! وووو
🔺 خلاصه شرایط خیلی تاثیر گذار هستند و عملا زمانی که یکی از شرایط گفته شده اتفاق بیافتد شبکه نمیتواند مسئله رو حل کند، چون مقادیر پیکسلها در تصاویر مختلف تغییر خواهند کرد.
در استخراج ویژگی باید چند مسئله در نظر گرفته شود:
- ویژگیای که استخراج میشود باید discriminant (مجزا) باشد، یعنی مقدار متفاوتی بین کلاسهای مختلف داشته باشد.
- به تغییراتی مثل چرخش، شدت روشنایی و غیره حساس نباشد، یعنی با تغییر شرایط، ویژگیها تغییر نکنند.
استخراج ویژگی یه سری مشکلات دارد و معمولا ما در استخراج ویژگی به مشکل میخوریم و به همین خاطر هر روز روشهای جدیدی برای استخراج ویژگی توسط محققین ارائه میشود.
شبکه های عصبی کانولوشنال یجورایی حالت تعمیم یافته شبکه های عصبی هستند، که در آنها دیگر نیازی نیست که ویژگی استخراج شود، خود تصویر به طور مستقیم به شبکه اعمال میشود و شبکه خودش در پروسه یادگیری، در لایه های مختلف از تصویر ویژگی استخراج میکند.
http://cs231n.github.io/convolutional-networks/
#شبکه_عصبی_کانولوشن
#شبکه_عصبی_عمیق
🌀 کاری از گروه تخصصی و آموزشی دانشجویان دانشگاه علم و صنعت تهران
✅ برگزار کننده دوره های #تخصصی و #پروژه_محور مهندسی پزشکی و برق
🌐 مطالب و ویدیوهای آموزشی #رایگان ما را از #سایت متلبخونه هم میتونید دنبال کنید:👇👇
http://matlabkhoone.ir/
➖➖➖➖➖
@IUST_Bioelecteric
💡 بخش دوم: خلاصه معماری
نویسنده: محمد نوری زاده چرلو (عضو ارشد گروه تخصصی و آموزشی دانشجویان دانشگاه علم و صنعت تهران)
✍️ همانطور که ما میدانیم، شبکه های عصبی یک ورودی در قالب یک بردار ویژگی دریافت میکنند و سپس آنرا از تعدادی لایه مخفی (Hidden layer) عبور میدهند و نهایتا یک خروجی که نتیجه پردازش لایه های مخفی است در لایه خروجی شبکه ظاهر میشود.
هر لایه مخفی از تعدادی نورون تشکیل شده که این نورونها به تمام نورونهای لایه قبل از خود متصل می-شوند. نورونهای هر لایه بصورت مستقل عمل کرده و هیچ ارتباطی با یکدیگر ندارند. آخرین لایه تماما متصل (fully connected layer) به لایه خروجی (output layer) معروف است و معمولا نقش نمایش دهنده امتیاز هر دسته(class) را ایفا میکند.
شبکههای عصبی معمولی برای تصاویر معمول(full images) بخوبی عمل نمی کنند زیرا که حجم بردار ورودی بالاست و نمیتواند مسئله را با دقت مناسبی حل کند.
بعنوان مثال اگر یک تصویر به اندازه 32*32 باشد (۳۲ پیکسل عرض، ۳۲ پیکسل ارتفاع و ۳ کانال رنگ ). بنابراین یک نورون با اتصال کامل (fully connected) در لایه مخفی اول یک شبکه عصبی معمولی 32*32*3=3072 وزن خواهد داشت . این مقدار شاید در نظر اول مقدار قابل توجهی بنظر نیاید اما بطور واضح مشخص است که این معماری تماما مرتبط قابل استفاده برای تصاویر بزرگتر نخواهد بود. برای مثال یک تصویر با اندازه متعارف تر مثل 200*200*3 باعث میشود که یک نورون120000 وزن داشته باشد! علاوه بر این ما قطعا خواهان تعداد بیشتری از این نورون ها خواهیم بود، پس تعداد پارامترها بسرعت افزایش پیدا میکند. مشخص است این اتصال کامل (Full connectivity) باعث اتلاف (wasteful) بوده و تعداد بسیار زیاد پارامترها هم بسرعت باعث overfitting خواهد شد.
برای حل این مشکل، از تصاویر ویژگیهای مهم وکلیدی را که نماینده خوبی برای تصویر باشند را استخراج میکنند و به صورت یک بردار ویژگی به شبکه اعمال میکنند.
مثال2: فرض کنید که میخواهیم توسط شبکه عصبی تشخیص چهره را انجام دهیم:
به دو دلیل نمیتوانیم مستقیما از پیسکلهای خود تصویر استفاده کنیم:
- سایز تصویر بزرگ هست و نمیتوان به درستی شبکه را آموزش داد و مشکلاتی که توضیح دادیم پیش میاد.
- تصاویر در شرایط مختلف گرفته می شود و ممکن است ویژگی های تصویر تغییر کند. برای مثال شخص یکبار با ریش و سیبیل باشد و در عکس دیگر بدون ریش و سیبیل. یا اینکه تصویر از یک زاویه دیگه ای گرفته شود. سایز تصویر تغییر کند، شدت روشنایی تصویر تغییر کند! وووو
🔺 خلاصه شرایط خیلی تاثیر گذار هستند و عملا زمانی که یکی از شرایط گفته شده اتفاق بیافتد شبکه نمیتواند مسئله رو حل کند، چون مقادیر پیکسلها در تصاویر مختلف تغییر خواهند کرد.
در استخراج ویژگی باید چند مسئله در نظر گرفته شود:
- ویژگیای که استخراج میشود باید discriminant (مجزا) باشد، یعنی مقدار متفاوتی بین کلاسهای مختلف داشته باشد.
- به تغییراتی مثل چرخش، شدت روشنایی و غیره حساس نباشد، یعنی با تغییر شرایط، ویژگیها تغییر نکنند.
استخراج ویژگی یه سری مشکلات دارد و معمولا ما در استخراج ویژگی به مشکل میخوریم و به همین خاطر هر روز روشهای جدیدی برای استخراج ویژگی توسط محققین ارائه میشود.
شبکه های عصبی کانولوشنال یجورایی حالت تعمیم یافته شبکه های عصبی هستند، که در آنها دیگر نیازی نیست که ویژگی استخراج شود، خود تصویر به طور مستقیم به شبکه اعمال میشود و شبکه خودش در پروسه یادگیری، در لایه های مختلف از تصویر ویژگی استخراج میکند.
http://cs231n.github.io/convolutional-networks/
#شبکه_عصبی_کانولوشن
#شبکه_عصبی_عمیق
🌀 کاری از گروه تخصصی و آموزشی دانشجویان دانشگاه علم و صنعت تهران
✅ برگزار کننده دوره های #تخصصی و #پروژه_محور مهندسی پزشکی و برق
🌐 مطالب و ویدیوهای آموزشی #رایگان ما را از #سایت متلبخونه هم میتونید دنبال کنید:👇👇
http://matlabkhoone.ir/
➖➖➖➖➖
@IUST_Bioelecteric
cs231n.github.io
CS231n Convolutional Neural Networks for Visual Recognition
Course materials and notes for Stanford class CS231n: Convolutional Neural Networks for Visual Recognition.
🌐 کلاه التراسوندی که تصاویر زمان حقیقی فراهم می کند، و ارتباط بین مغز و کامپیوتر را ممکن خواهد ساخت!
👨💻نویسنده: محمد نوری زاده چرلو
✍️ تکنولوژی التراسوند برای مغز به این معنی است که در طول جراحی میتوان تصاویر زمان حقیقی داشت، یک ایده بهتر از اینکه کدام مناطق مغزی توسط اقدامی یا احساسی تحریک شده است و در نهایت یک راه موثر برای کنترل نرم افزار یا رباتیک توسط افکار فرد خواهد بود.
آقای Brett Byram استادیار مهندسی پزشکی می گوید که: " پزشکان و دانشمندان علوم اعصاب چندین دهه امیدوار بودند که چنین پیشرفتی به وجود بیاید، اما تا امروز این عمل امکان پذیر نبود! " امواج التوراسوند در داخل مغز برگشت داده میشوند و پروپوپ التراسوند نمیتواند موج ها را دریافت کند.
برت قصد دارد از یادگیری ماشین استفاده کند تا به تدریچ بتواند اعوجاج را در نظر گرفته و تصاویر قابل اجرا ارائه دهد. علاوهبراین، او میخواهد تکنولوژِی الکتروانسفالوگرام را نیز به این پروژه ادغام کند تا پزشکان علاوه بر دیدن پرفیوژن مغز(جریان خون چه ارتباطی با تغییرات در افکار دارد)، بتوانند نواحی مرتبط با تحریک احساسات و حرکات را نیز ببیند.
ادامه در سایت: 👇👇👇
http://onlinebme.ir/ultrasound-helmet-would-make-live-images-brain-machine-interface-possible/
#شبکه_عصبی_عمیق #واسط_مغز_کامپیوتر #یادگیری_ماشین #التراسوند #eeg
#مهندسی_پزشکی
#هوش_مصنوعی
🏢آکادمی آنلاین مهندسی پزشکی و هوش مصنوعی
✔️ @OnlineBME
👨💻نویسنده: محمد نوری زاده چرلو
✍️ تکنولوژی التراسوند برای مغز به این معنی است که در طول جراحی میتوان تصاویر زمان حقیقی داشت، یک ایده بهتر از اینکه کدام مناطق مغزی توسط اقدامی یا احساسی تحریک شده است و در نهایت یک راه موثر برای کنترل نرم افزار یا رباتیک توسط افکار فرد خواهد بود.
آقای Brett Byram استادیار مهندسی پزشکی می گوید که: " پزشکان و دانشمندان علوم اعصاب چندین دهه امیدوار بودند که چنین پیشرفتی به وجود بیاید، اما تا امروز این عمل امکان پذیر نبود! " امواج التوراسوند در داخل مغز برگشت داده میشوند و پروپوپ التراسوند نمیتواند موج ها را دریافت کند.
برت قصد دارد از یادگیری ماشین استفاده کند تا به تدریچ بتواند اعوجاج را در نظر گرفته و تصاویر قابل اجرا ارائه دهد. علاوهبراین، او میخواهد تکنولوژِی الکتروانسفالوگرام را نیز به این پروژه ادغام کند تا پزشکان علاوه بر دیدن پرفیوژن مغز(جریان خون چه ارتباطی با تغییرات در افکار دارد)، بتوانند نواحی مرتبط با تحریک احساسات و حرکات را نیز ببیند.
ادامه در سایت: 👇👇👇
http://onlinebme.ir/ultrasound-helmet-would-make-live-images-brain-machine-interface-possible/
#شبکه_عصبی_عمیق #واسط_مغز_کامپیوتر #یادگیری_ماشین #التراسوند #eeg
#مهندسی_پزشکی
#هوش_مصنوعی
🏢آکادمی آنلاین مهندسی پزشکی و هوش مصنوعی
✔️ @OnlineBME