Tensorflow(@CVision)
13.6K subscribers
1.15K photos
221 videos
67 files
2.19K links
اخبار حوزه یادگیری عمیق و هوش مصنوعی
مقالات و یافته های جدید یادگیری عمیق
بینایی ماشین و پردازش تصویر

TensorFlow, Keras, Deep Learning, Computer Vision

سایت دوره
http://class.vision

👨‍💻👩‍💻پشتیبان دوره ها:
@classvision_support
Download Telegram
Mask R-CNN
https://arxiv.org/abs/1703.06870

detects objects in an image while simultaneously
generating a high-quality #segmentation mask for each instance.
#CNN #Convolutional #deep_learning
هوش مصنوعی ای که تشخیص میدهد به کجا نگاه میکنید!

Where are they looking?

online demo:
http://gazefollow.csail.mit.edu/demo.html

#NIPS_2015 #GazeFollow #Deep_learning #CNN
#convolutional
Who is Mistaken?
img: http://bit.ly/2qc1jhj

🔗abstract:
https://arxiv.org/abs/1612.01175

🔗Paper:
https://arxiv.org/pdf/1612.01175.pdf

🔗Project Page (code + data):
http://people.csail.mit.edu/bce/mistaken/


چه کسی اشتباه فکر میکند؟!
بر روی انیمیشن هایی در حد 6 یا 7 فریم آموزش دیده و تشخیص میدهد چه فردی در تصویر اشتباه فکر میکند و چه چیزی را اشتباه میکند.
برای مثال اگر فردی پشت سر خودش را نبیند، و فرد دوم صندلی را قبلش از نشستنش بکشد، فردی که به اشتباه فکر میکند که صندلی هنوز در جای خودش قرار دارد و می افتد را شناسایی میکند.

#deep_learning #cnn #Convolutional
#مقاله
✔️ایجاد یک نگاشت از تصور به تصویر:
در این کار شبکه های شرطی در مقابل حریف (GAN) آموزش دیده اند که یک نگاشت از تصویر ورودی به تصویر خروجی بیابند...


Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks
[UC Berkeley] pic: http://bit.ly/2s2OTsm

🔗abstract:
https://arxiv.org/abs/1703.10593

🔗Paper:
https://arxiv.org/pdf/1703.10593.pdf

🔗Project Page:
https://junyanz.github.io/CycleGAN/

🔗codes:
https://github.com/junyanz/CycleGAN
https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix


Our goal is to learn a mapping G: X → Y such that the distribution of images from G(X) is indistinguishable from the distribution Y using an adversarial loss.

مرتیط به مقاله ی:
https://t.me/cvision/171

#CycleGAN #GAN #Generative #CNN #Convolutional #deep_learning #adversarial #Generative_Models #Generative
This media is not supported in your browser
VIEW IN TELEGRAM
تبدیل اسب به گورخر!
ایجاد نگاشت تصویر به تصویر توسط هوش مصنوعی...

اطلاعات بیشتر:
https://t.me/cvision/214

#CycleGAN #GAN #Generative #CNN #Convolutional #deep_learning #adversarial #generative
#مقاله #سورس #کد

IMDB-WIKI – 500k+ face images with age and gender labels
pic: http://bit.ly/2rZNDJx

دیتاست سن و جنسیت افراد؛ جمع آوری شده از صفحات ویکی پدیا
+
مقاله و مدل در Caffe , و وزنهای آموزش دیده شده شبکه



https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

#Gender_prediction #age #Deep_Learning #dataset #model
#CNN #convolutional_neutral_network
#مقاله #سورس_کد

Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks
pic: http://bit.ly/2srFGOS
(Submitted on 11 Apr 2016)
#MTCNN

در الگوریتمهای قدیمی تشخیص چهره, موقعیت سر, حالات چهره، نور و ... تاثیر گذار بود و الگوریتم های موجود را با مشکل مواجه میکرد.
الگوریتمهایی نظیر Viola and Jones - Haar-cascade که در opencv پیاده سازی شده برای چهر های رو به رو و نزدیک رو به رو خوب کار میکند اما برای چهره هادر موقعیت ای دیگر کارایی ندارد!
تیم تحقیقاتی ماکروسافت با ارائه مقاله ای در سال 2014 با عنوان
Joint Cascade Face Detection and Alignment
با جنگل تصادفی این مشکل را تا حد زیادی برطرف کرد و سرعت هم تا حدود 30 میلی ثانیه برای تصاویر VGA بهبود داد، اما انتخاب ویژگی های دستی پرفورمنس را محدود کرده بود.

اما در این مقاله با کمک یادگیری عمیق دقت تا حد خوبی افزایش یافته و همانن مقاله ماکروسافت علاوه بر تشخیص کار face alignment هم انجام میشود.
در این روش 3 شبکه عصبی کانولوشنالی پشت سر هم و به صورت آبشاری قرار گرفته است
شبکه اول: بسیار سبک برای پیدا کردن تمامی نواحی مشکوک به وجود چهره.
شبکه دوم : این شبکه از از خروجی شبکه اول ورودی میگیرد؛ نواحی اشتباه پیدا شده را حذف میکند.
شبکه سوم: کاری شبیه یه شبکه دوم بر روی نواحی باقی مانده, همچنین پیدا کردن landmark های چهره نظیر چشم ها و بینی و alignment نقاط.



🕐Runtime efficiency:
It takes 16fps on a 2.60GHz CPU and 99fps on GPU (Nvidia Titan Black)

🔗abstract:
https://arxiv.org/abs/1604.02878

🔗Paper:
https://arxiv.org/pdf/1604.02878

🔗Project Page:
https://kpzhang93.github.io/MTCNN_face_detection_alignment/

🔗codes:
⚙️#Matlab / #Caffe implementation :
http://bit.ly/2rvkr9Q
⚙️#Python / #Tensorflow implementation :
http://bit.ly/2t1fB6e

#face #face_detection #face_alignment #MTCNN
#deep_learning #cnn #convolutional_neutral_network
#مقاله منتشر شده توسط گوگل

#MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications
(Submitted on 17 Apr 2017)

We present a class of efficient models called MobileNets for #mobile and embedded #vision applications. MobileNets are based on a streamlined architecture that uses depth-wise separable convolutions to build light weight deep neural networks. We introduce two simple global hyper-parameters that efficiently trade off between #latency and #accuracy. These hyper-parameters allow the model builder to choose the right sized model for their application based on the constraints of the problem. We present extensive experiments on resource and accuracy tradeoffs and show strong performance compared to other popular models on ImageNet classification. We then demonstrate the effectiveness of MobileNets across a wide range of applications and use cases including object detection, finegrain classification, face attributes and large scale geo-localization.

🔗 https://arxiv.org/pdf/1704.04861.pdf

#deep_learning #cnn #convolutional_neutral_network