Tensorflow(@CVision)
14K subscribers
1.17K photos
240 videos
68 files
2.24K links
اخبار حوزه یادگیری عمیق و هوش مصنوعی
مقالات و یافته های جدید یادگیری عمیق
بینایی ماشین و پردازش تصویر

TensorFlow, Keras, Deep Learning, Computer Vision

سایت دوره
http://class.vision

👨‍💻👩‍💻پشتیبان دوره ها:
@classvision_support
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
تبدیل اسب به گورخر!
ایجاد نگاشت تصویر به تصویر توسط هوش مصنوعی...

اطلاعات بیشتر:
https://t.me/cvision/214

#CycleGAN #GAN #Generative #CNN #Convolutional #deep_learning #adversarial #generative
This media is not supported in your browser
VIEW IN TELEGRAM
Computer learns to #recognize sounds by watching video
با 26 ترابایت ویدیو آموزش دیده و میتواند با گوش دادن به صدا، صحنه آن را تشخیص دهد
http://bit.ly/2r4dpwb

#sound_recognition #deep_learning #CNN
#مقاله #سورس #کد

IMDB-WIKI – 500k+ face images with age and gender labels
pic: http://bit.ly/2rZNDJx

دیتاست سن و جنسیت افراد؛ جمع آوری شده از صفحات ویکی پدیا
+
مقاله و مدل در Caffe , و وزنهای آموزش دیده شده شبکه



https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

#Gender_prediction #age #Deep_Learning #dataset #model
#CNN #convolutional_neutral_network
#مقاله #سورس_کد

Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks
pic: http://bit.ly/2srFGOS
(Submitted on 11 Apr 2016)
#MTCNN

در الگوریتمهای قدیمی تشخیص چهره, موقعیت سر, حالات چهره، نور و ... تاثیر گذار بود و الگوریتم های موجود را با مشکل مواجه میکرد.
الگوریتمهایی نظیر Viola and Jones - Haar-cascade که در opencv پیاده سازی شده برای چهر های رو به رو و نزدیک رو به رو خوب کار میکند اما برای چهره هادر موقعیت ای دیگر کارایی ندارد!
تیم تحقیقاتی ماکروسافت با ارائه مقاله ای در سال 2014 با عنوان
Joint Cascade Face Detection and Alignment
با جنگل تصادفی این مشکل را تا حد زیادی برطرف کرد و سرعت هم تا حدود 30 میلی ثانیه برای تصاویر VGA بهبود داد، اما انتخاب ویژگی های دستی پرفورمنس را محدود کرده بود.

اما در این مقاله با کمک یادگیری عمیق دقت تا حد خوبی افزایش یافته و همانن مقاله ماکروسافت علاوه بر تشخیص کار face alignment هم انجام میشود.
در این روش 3 شبکه عصبی کانولوشنالی پشت سر هم و به صورت آبشاری قرار گرفته است
شبکه اول: بسیار سبک برای پیدا کردن تمامی نواحی مشکوک به وجود چهره.
شبکه دوم : این شبکه از از خروجی شبکه اول ورودی میگیرد؛ نواحی اشتباه پیدا شده را حذف میکند.
شبکه سوم: کاری شبیه یه شبکه دوم بر روی نواحی باقی مانده, همچنین پیدا کردن landmark های چهره نظیر چشم ها و بینی و alignment نقاط.



🕐Runtime efficiency:
It takes 16fps on a 2.60GHz CPU and 99fps on GPU (Nvidia Titan Black)

🔗abstract:
https://arxiv.org/abs/1604.02878

🔗Paper:
https://arxiv.org/pdf/1604.02878

🔗Project Page:
https://kpzhang93.github.io/MTCNN_face_detection_alignment/

🔗codes:
⚙️#Matlab / #Caffe implementation :
http://bit.ly/2rvkr9Q
⚙️#Python / #Tensorflow implementation :
http://bit.ly/2t1fB6e

#face #face_detection #face_alignment #MTCNN
#deep_learning #cnn #convolutional_neutral_network
#مقاله منتشر شده توسط گوگل

#MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications
(Submitted on 17 Apr 2017)

We present a class of efficient models called MobileNets for #mobile and embedded #vision applications. MobileNets are based on a streamlined architecture that uses depth-wise separable convolutions to build light weight deep neural networks. We introduce two simple global hyper-parameters that efficiently trade off between #latency and #accuracy. These hyper-parameters allow the model builder to choose the right sized model for their application based on the constraints of the problem. We present extensive experiments on resource and accuracy tradeoffs and show strong performance compared to other popular models on ImageNet classification. We then demonstrate the effectiveness of MobileNets across a wide range of applications and use cases including object detection, finegrain classification, face attributes and large scale geo-localization.

🔗 https://arxiv.org/pdf/1704.04861.pdf

#deep_learning #cnn #convolutional_neutral_network
#مقاله

Network Dissection: Quantifying Interpretability of Deep Visual Representations
(Submitted on 19 Apr 2017)
pic: http://bit.ly/2tlfHbv

✔️Our paper investigates three questions:

-What is a disentangled representation, and how can its factors be quantified and detected?
-Do interpretable hidden units reflect a special alignment of feature space, or are interpretations a chimera?
-What conditions in state-of-the-art training lead to representations with greater or lesser entanglement?

🔗abstract:
https://arxiv.org/abs/1704.05796

🔗Paper:
http://netdissect.csail.mit.edu/final-network-dissection.pdf

🔗Project Page (code + data):
http://netdissect.csail.mit.edu/

#deep_learning #CNN