Tensorflow(@CVision)
13.9K subscribers
1.17K photos
239 videos
68 files
2.23K links
اخبار حوزه یادگیری عمیق و هوش مصنوعی
مقالات و یافته های جدید یادگیری عمیق
بینایی ماشین و پردازش تصویر

TensorFlow, Keras, Deep Learning, Computer Vision

سایت دوره
http://class.vision

👨‍💻👩‍💻پشتیبان دوره ها:
@classvision_support
Download Telegram
#مقاله #سورس_کد

Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks
pic: http://bit.ly/2srFGOS
(Submitted on 11 Apr 2016)
#MTCNN

در الگوریتمهای قدیمی تشخیص چهره, موقعیت سر, حالات چهره، نور و ... تاثیر گذار بود و الگوریتم های موجود را با مشکل مواجه میکرد.
الگوریتمهایی نظیر Viola and Jones - Haar-cascade که در opencv پیاده سازی شده برای چهر های رو به رو و نزدیک رو به رو خوب کار میکند اما برای چهره هادر موقعیت ای دیگر کارایی ندارد!
تیم تحقیقاتی ماکروسافت با ارائه مقاله ای در سال 2014 با عنوان
Joint Cascade Face Detection and Alignment
با جنگل تصادفی این مشکل را تا حد زیادی برطرف کرد و سرعت هم تا حدود 30 میلی ثانیه برای تصاویر VGA بهبود داد، اما انتخاب ویژگی های دستی پرفورمنس را محدود کرده بود.

اما در این مقاله با کمک یادگیری عمیق دقت تا حد خوبی افزایش یافته و همانن مقاله ماکروسافت علاوه بر تشخیص کار face alignment هم انجام میشود.
در این روش 3 شبکه عصبی کانولوشنالی پشت سر هم و به صورت آبشاری قرار گرفته است
شبکه اول: بسیار سبک برای پیدا کردن تمامی نواحی مشکوک به وجود چهره.
شبکه دوم : این شبکه از از خروجی شبکه اول ورودی میگیرد؛ نواحی اشتباه پیدا شده را حذف میکند.
شبکه سوم: کاری شبیه یه شبکه دوم بر روی نواحی باقی مانده, همچنین پیدا کردن landmark های چهره نظیر چشم ها و بینی و alignment نقاط.



🕐Runtime efficiency:
It takes 16fps on a 2.60GHz CPU and 99fps on GPU (Nvidia Titan Black)

🔗abstract:
https://arxiv.org/abs/1604.02878

🔗Paper:
https://arxiv.org/pdf/1604.02878

🔗Project Page:
https://kpzhang93.github.io/MTCNN_face_detection_alignment/

🔗codes:
⚙️#Matlab / #Caffe implementation :
http://bit.ly/2rvkr9Q
⚙️#Python / #Tensorflow implementation :
http://bit.ly/2t1fB6e

#face #face_detection #face_alignment #MTCNN
#deep_learning #cnn #convolutional_neutral_network
#مجموعه_داده‌ی چالشی برای تشخیص چهره در تغییرات مختلف
WIDER FACE: A Face Detection Benchmark

http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/


#dataset #face #face_detection #Benchmark
#مقاله
در برخی از ویژگی های مربوط به چهره، دیتاست بزرگ برای آموزش کامل شبکه های عمیق در دسترس نیست، با توجه به شباهت ویژگیها در تسکهای مرتبط با چهره، این مقاله یک شبکه واحد برای آموزش تمام این تسکها در نظر گرفته و در نتیجه با افزایش داده حاصل از ترکیب دیتاست های مختلف در این حوزه شبکه در بسیاری از موارد به کارایی بالاتر از مدلهای مشابه شبکه تک کاربرده دست یافته است. بدین صورت لایه های پایینتر شبکه به خوبی برای استخراج ویژگیهای چهره آموزش میبینند.
[مرتبط با: https://t.me/cvision/446]


An All-In-One Convolutional Neural Network for Face Analysis
http://ieeexplore.ieee.org/abstract/document/7961718/

در این مقاله تسک های مرتبط با چهره انسان را به دو دسته‌ی مستقل از سوژه و مرتبط با سوژه تقسیم کرده است.

1) وظایف مستقل، شامل تشخیص چهره، نقطه های کلیدی چهره، محلی سازی، پیش بینی لبخند،
2) وظایف وابسته، شامل برآورد سن، پیش بینی جنسیت و بازشناسی چهره.
در این شبکه وظایف مستقل از سوژه از لایه های پایین تر این شبکه کانولوشنال ورودی گرفته و وظایف وابسته به سوژه از آخرین لایه شبکه ورودی خود را برای محاسبه خروجی و تابع هزینه هر تسک استفاده کرده اند.

#multitask_learning #face #convolutional_neutral_network #deep_learning
#مقاله #سورس_کد

Finding Tiny Faces (CVPR 2017)

pic: https://github.com/cydonia999/Tiny_Faces_in_Tensorflow/raw/master/images/selfie.jpg

🕐Runtime efficiency:
Resnet101-based detector runs at 1.4FPS on
1080p resolution and 3.1FPS on 720p resolution.

🔗abstract:
https://arxiv.org/abs/1612.04402

🔗Paper:
https://arxiv.org/pdf/1612.04402

🔗Project Page:
https://www.cs.cmu.edu/~peiyunh/tiny/

🔗codes:
⚙️#Matlab / #matconvnet implementation :
https://github.com/peiyunh/tiny
⚙️#Python / #Tensorflow implementation :
https://github.com/cydonia999/Tiny_Faces_in_Tensorflow


مرتبط با مقاله mtcnn
https://t.me/cvision/249

#face #face_detection
#deep_learning #cnn #convolutional_neutral_network
#مقاله

این مقاله در حال حاضر بهترین الگوریتم تشخیص چهره در چالش WIDER است.

PyramidBox: A Context-assisted Single Shot Face Detector

https://arxiv.org/abs/1803.07737

#PyramidBox achieves superior performance among the state-of-the-art on the two common face detection benchmarks, #FDDB and #WIDER FACE.

#face #face_detection #deep_learning #cnn #convolutional_neutral_network
#سورس_کد
MTCNN C++ implementation with NVIDIA TensorRT Inference accelerator SDK
https://github.com/PKUZHOU/MTCNN_TensorRT

This project can run Pnet and Rnet, the speed is very fast. Just using cmake to build this project

مرتبط با https://t.me/cvision/249

#face #face_detection #face_alignment #MTCNN
#deep_learning #cnn #convolutional_neutral_network
#tensortRT
#مقاله #سورس_کد
تشخیص چهره با دقت خیره کننده!

DSFD: Dual Shot Face Detector!

دقت:
نتایج این پیاده سازی واقعا خیره کننده است، توصیه میکنم تصاویر نمونه مقاله را ببینید. در حال حاضر جزو بهترین مدلها در بنچ مارک چالش wider است.
زمان:
زمان inference برای تصاویر ورودی با رزولوشن VGA و شبکه بر مبنای Res50 روی کارت گرافیک P40 معادل ۲۲ فریم بر ثانیه بوده است.

مقاله:
https://arxiv.org/abs/1810.10220
سورس کد پیاده سازی با پایتورچ:
https://github.com/TencentYoutuResearch/FaceDetection-DSFD

___
پست های مرتبط:
MTCNN
https://t.me/cvision/249

Finding Tiny Faces (CVPR 2017)
https://t.me/cvision/569

اسلایدها، نوت بوک ها و ویدیوهای فارسی بازشناسی و تطبیق چهره با یادگیری عمیق

https://t.me/cvision/1070

#face #face_detection #dsfd
#مقاله #سورس_کد
تشخیص چهره با دقت خیره کننده ۲!

RetinaFace

پیاده سازی نفر اول چالش Wider منتشر شد.
مهمترین ویژگی این مدل این است که همچون MTCNN پنج landmark را بر میگرداند که همان طور که در این ارائه مرتبط با چهره گفتم میتواند در افزایش دقت تطبیق و بازشناسی چهره میتواند بسیار موثر باشد.

پیاده سازی:
کمتر از ۲ هفته است که سورس کد مقاله با فریم ورک MXNet منتشر شده است.

دقت:
در حال حاضر این مدل بالاترین دقت را در چالش wider دارد و از تمام مقالات و مدلهای قبلی از جمله MTCNN و DSFD بالاتر است.

سرعت:
RetinaFaceResNet-152
is designed for highly accurate face localisation,
running at 13 FPS for VGA images (640 × 480).
By contrast, RetinaFace-MobileNet-0.25 is designed for
highly efficient face localisation which demonstrates considerable
real-time speed of 40 FPS at GPU for 4K images
(4096 × 2160), 20 FPS at multi-thread CPU for HD images
(1920 × 1080), and 60 FPS at single-thread CPU for VGA
images (640 × 480). Even more impressively, 16 FPS at
ARM for VGA images (640 × 480) allows for a fast system
on mobile devices.

مقاله:
https://arxiv.org/pdf/1905.00641.pdf

سورس کد پیاده سازی:
https://github.com/deepinsight/insightface/tree/master/RetinaFace


__
پست های مرتبط:
تشخیص چهره با دقت خیره کننده!


DSFD: Dual Shot Face Detector!
https://t.me/cvision/1167

MTCNN
https://t.me/cvision/249

Finding Tiny Faces (CVPR 2017)
https://t.me/cvision/569

اسلایدها، نوت بوک ها و ویدیوهای فارسی بازشناسی و تطبیق چهره با یادگیری عمیق

https://t.me/cvision/1070

#face #face_detection #RetinaFace
BlazeFace: Sub-millisecond Neural Face Detection on Mobile GPUs

فریم
ورکی که محققین گوگل برای تشخیص چهره ارایه دادند که میتواند با دقت و سرعت بالایی بر روی موبایل عمل کند.

BlazeFace is a new face detection framework adapted from the Single Shot Multibox Detector (SSD) framework and optimized for inference on mobile GPUs. The lightweight face detector runs at an impressive speed of 200–1000+ FPS on flagship smartphones.

مقاله:
https://arxiv.org/abs/1907.05047

#face_detection #face