Tensorflow(@CVision)
13.2K subscribers
1.13K photos
202 videos
67 files
2.13K links
اخبار حوزه یادگیری عمیق و هوش مصنوعی
مقالات و یافته های جدید یادگیری عمیق
بینایی ماشین و پردازش تصویر

TensorFlow, Keras, Deep Learning, Computer Vision

سایت دوره
http://class.vision

👨‍💻👩‍💻پشتیبان دوره ها:
@classvision_support
Download Telegram
Tensorflow(@CVision)
VQABQ: Visual Question Answering by Basic Questions 🔗 https://arxiv.org/abs/1703.06492 #VQA #deep_learning #computer_vision #NLP #Image_captioning #GRU #LSTM #CNN
مرتبط با مقاله: https://t.me/cvision/198

نمونه سوالات:
i. طبقه بندی صحنه: آیا این یک روز بارانی است؟
ii. بازشناسی شیء: چه چیزی بر روی میز است.
iii. طبقه بندی ویژگی: زمین چه رنگی است؟
iv. شمارش: چند نفر در اتاق هستند؟
v. تشخیص شی: آیا سیبی در تصویر وجود دارد؟
vi. تشخیص فعالیت: مرد در حال انجام چه نوع ورزشی است ؟

مقالات مشابه:
https://t.me/cvision/196

#VQA #deep_learning #computer_vision #NLP #Image_captioning
#GRU #LSTM #CNN
🌺🌺🌺🌺
میلاد با سعادت امام زمان مبارک باد
🌺🌺🌺🌺
صبحی گره از زمانه وا خواهد شد
راز شب تار بر ملا خواهد شد
در راه، عزیزی‌ست که با آمدنش
هر قطب‌نما،قبله‌نما خواهد شد

(میلاد عرفان پور)
#خبر #خبر_عمومی
pic: http://bit.ly/2pJvMSY
حل مشکل مصرف بیش از حد #دستمال_توالت در چین با الگوریتم #بازشناسی_چهره!🚽

کاسه ی صبر چینی ها از مواجه با رول های خالی دستمال توالت به دلیل مصرف بی رویه و یا دزدیده شدن آن‌ها لب‌ریز شده بود!
به همین دلیل در نهایت برای حل این مشکل دست به تولید دستگاه های هوشمند با استفاده از هوش مصنوعی و الگوریتم های بازشناسی چهره زدند!

در این روش در هر بار درخواست، چهره ی فرد #اسکن شده و سپس قطعه دستمالی به طول 60 سانتیمتر توسط دستگاه به وی داده میشود. دستگاه تصویر چهره فرد را برای 9 دقیقه ذخیره میکند و در طول این 9 دقیقه با استفاده از تطبیق چهره از ارائه مجدد دستمال به فرد خود داری میکند!!!

🔗 http://www.cbc.ca/news/technology/china-facial-recognition-toilet-paper-1.4052888
#Camera_Relocalization #PoseNet
pic:http://bit.ly/2rBqhaR

استنتاج این که شما الان کجا هستید؛ برای ربات‌های متحرک، ناوبری و واقعیت افزوده بسیار مهم است. این روش برای رفع مشکل رباتهای گم شده یا دزدیده شده معرفی شده است.
در این پروژه با تنها داشتن یک تصویر رنگی از محیط, تا 6 درجه و 2 متر، که در محیط های باز معادل 50.000 متر مربع است تصویر دیگر از آن محیط را می‌توان تخمین زد.
در پیاده سازی انجام شده توسط محققان دانشگاه کمبریج؛ تنها با آپلود یک تصویر, و استفاده از این الگوریتم, محل آن تصویر بر روی نقشه را یافته و مکان تصویر را بر روی نقشه پیدا می‌کند.

🔗 دموی آنلاین این پیاد سازی:
http://mi.eng.cam.ac.uk/projects/relocalisation/
🔗 سورس کد با فریم ورک #Caffe
https://github.com/alexgkendall/caffe-posenet

🔗 مقاله مربوط به این پیاده سازی:
https://arxiv.org/abs/1505.07427

#CNN #Deep_Learning #relocalization
پیش بینی صحنه‌ی بعدی فیلم
( میتواند برای سانسور خودکار فیلم در پخش زنده استفاده شود)

Anticipating Visual Representations with Unlabeled Video
http://web.mit.edu/vondrick/prediction/

#CNN
Generating Videos with Scene Dynamics
video: http://bit.ly/2q6THM9

تبدیل تصویر به فیلم.
هوش مصنوعی ای که قادر است تنها با یک تصویر ثابت، فیلم چند ثانیه ای حاوی حرکت خروجی دهد...

در این روش به صورت بدون ناظر دو سال ویدیوی جمع آوری از فلیکر به شبکه آموزش داده شده است، سپس شبکه توانسته که نگاشتی از تصاویر به فیلم های چند ثانیه ای ایجاد کند.

🔗 http://web.mit.edu/vondrick/tinyvideo/

#generative #adversarial #GAN #deep_learning
بهره گیری از کتابخانه قدرتمند یادگیری ماشین #تنسرفلو در نسخه جدید #اندروید
img: http://bit.ly/2r8BeDM

گوگل در جریان کنفرانس I/O 2017، از ویژگی‌های سیستم عامل #اندروید O رونمایی کرد.
...
#تنسورفلو_لایت

قابلیت نوآورانه‌ی #تنسورفلو لایت، نسخه‌ی ویژه‌ای از کتابخانه‌ی یادگیری ماشین منبع باز TensorFlow است که به سریع‌تر بودن و جای‌گیری کمتر نرم‌افزارها کمک خواهد کرد. در حقیقت شرکت گوگل با استفاده از کتابخانه‌ی یادگیری ماشین تنسورفلو لایت، هوش مصنوعی را به گوشی هوشمند هر کاربر خواهد آورد. شرکت گوگل در حال توسعه‌ی API #شبکه‌ی_عصبی جدیدی است که تنسورفلو لایت می‌تواند با بهره‌گیری از مزایای آن باعث شتاب دادن به پردازش‌ها و محاسبات شود.

http://www.zoomit.ir/2017/5/19/156625/android-o-new-features-overview/

https://techcrunch.com/2017/05/17/googles-tensorflow-lite-brings-machine-learning-to-android-devices/
هوش مصنوعی ای که تشخیص میدهد به کجا نگاه میکنید!

Where are they looking?

online demo:
http://gazefollow.csail.mit.edu/demo.html

#NIPS_2015 #GazeFollow #Deep_learning #CNN
#convolutional
This media is not supported in your browser
VIEW IN TELEGRAM
Following Gaze Across Views

🔗 http://web.mit.edu/vondrick/videogaze.pdf

Given one view with a person in it and
a second view of the scene, our model estimates a density for #gaze location...
Who is Mistaken?
img: http://bit.ly/2qc1jhj

🔗abstract:
https://arxiv.org/abs/1612.01175

🔗Paper:
https://arxiv.org/pdf/1612.01175.pdf

🔗Project Page (code + data):
http://people.csail.mit.edu/bce/mistaken/


چه کسی اشتباه فکر میکند؟!
بر روی انیمیشن هایی در حد 6 یا 7 فریم آموزش دیده و تشخیص میدهد چه فردی در تصویر اشتباه فکر میکند و چه چیزی را اشتباه میکند.
برای مثال اگر فردی پشت سر خودش را نبیند، و فرد دوم صندلی را قبلش از نشستنش بکشد، فردی که به اشتباه فکر میکند که صندلی هنوز در جای خودش قرار دارد و می افتد را شناسایی میکند.

#deep_learning #cnn #Convolutional
Media is too big
VIEW IN TELEGRAM
تایپ مستقیم تنها با فکر کردن به کلمه ! پروژه جدید فیس‌بوک.
هدف این پروژه رسیدن به سرعت تایپی با سرعت 100 کلمه در هر دقیقه (معادل 5 برابر تایپ عادی) با فرمان مستقیم به گوشی از مغز انسان است.
#مقاله
✔️ایجاد یک نگاشت از تصور به تصویر:
در این کار شبکه های شرطی در مقابل حریف (GAN) آموزش دیده اند که یک نگاشت از تصویر ورودی به تصویر خروجی بیابند...


Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks
[UC Berkeley] pic: http://bit.ly/2s2OTsm

🔗abstract:
https://arxiv.org/abs/1703.10593

🔗Paper:
https://arxiv.org/pdf/1703.10593.pdf

🔗Project Page:
https://junyanz.github.io/CycleGAN/

🔗codes:
https://github.com/junyanz/CycleGAN
https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix


Our goal is to learn a mapping G: X → Y such that the distribution of images from G(X) is indistinguishable from the distribution Y using an adversarial loss.

مرتیط به مقاله ی:
https://t.me/cvision/171

#CycleGAN #GAN #Generative #CNN #Convolutional #deep_learning #adversarial #Generative_Models #Generative
This media is not supported in your browser
VIEW IN TELEGRAM
تبدیل اسب به گورخر!
ایجاد نگاشت تصویر به تصویر توسط هوش مصنوعی...

اطلاعات بیشتر:
https://t.me/cvision/214

#CycleGAN #GAN #Generative #CNN #Convolutional #deep_learning #adversarial #generative
#مقاله
Age invariant face recognition and retrieval by coupled auto-encoder networks

🔗 http://bit.ly/2r4dpwb

#Neurocomputing, 2017
#Face_recognition #Age_invariant #Auto_encoder #deep_learning
This media is not supported in your browser
VIEW IN TELEGRAM
Computer learns to #recognize sounds by watching video
با 26 ترابایت ویدیو آموزش دیده و میتواند با گوش دادن به صدا، صحنه آن را تشخیص دهد
http://bit.ly/2r4dpwb

#sound_recognition #deep_learning #CNN