#مقاله
مقاله ی جدید و جالب Google Brain + کد #تنسرفلو
آموزش یک شبکه عصبی برای چندین کار مختلف همزمان!
One Model To Learn Them All
(Submitted on 16 Jun 2017)
pic: http://deepnn.ir/tensorflow-telegram-files/tensor2tensor.PNG
🔗abstract:
https://arxiv.org/abs/1706.05137
🔗Paper:
https://arxiv.org/pdf/1706.05137.pdf
🔗Code:
https://github.com/tensorflow/tensor2tensor
یادگیری عمیق در بسیاری از زمینه ها نظیر تشخیص گفتار، طبقه بندی تصویر، ترجمه و ... استفاده میشود.
اما تا کنون بدین نحو بوده که برای هر مساله، یک مدل عمیق با یک معماری خاص انتخاب میشد و با تنظیم پارامترها و با فرآیند یادگیری و تنظیم اوزان شبکه برای آن مساله به خوبی کار میکرد اما برای مسائل دیگر قابل استفاده نبود.
در این مقاله یک مدل واحد که در حوزه های مختلف نتایج خوبی داشته استفاده شده و چندین کار را آموزش دیده است. به طور خاص، این مدل تنها به صورت همزمان در ImageNet، وظایف مختلف ترجمه، شرح تصویر، تشخیص گفتار، و کار تجزیه زبان انگلیسی آموزش داده است.
این مدل در بسیاری از مسائل با مدلهای state-of-the-art هر حوزه که فقط برای آن کار آموزش دیده اند قابل مقایسه بوده و در برخی از حوزه ها کارایی بهتری نسبت به زمانی که فقط برای همان حوزه آموزش دیده شده گزارش شده است.
# Google_Brain #tensor2tensor
#deep_learning
#speech_recognition, #image_classification, #translation
مقاله ی جدید و جالب Google Brain + کد #تنسرفلو
آموزش یک شبکه عصبی برای چندین کار مختلف همزمان!
One Model To Learn Them All
(Submitted on 16 Jun 2017)
pic: http://deepnn.ir/tensorflow-telegram-files/tensor2tensor.PNG
🔗abstract:
https://arxiv.org/abs/1706.05137
🔗Paper:
https://arxiv.org/pdf/1706.05137.pdf
🔗Code:
https://github.com/tensorflow/tensor2tensor
یادگیری عمیق در بسیاری از زمینه ها نظیر تشخیص گفتار، طبقه بندی تصویر، ترجمه و ... استفاده میشود.
اما تا کنون بدین نحو بوده که برای هر مساله، یک مدل عمیق با یک معماری خاص انتخاب میشد و با تنظیم پارامترها و با فرآیند یادگیری و تنظیم اوزان شبکه برای آن مساله به خوبی کار میکرد اما برای مسائل دیگر قابل استفاده نبود.
در این مقاله یک مدل واحد که در حوزه های مختلف نتایج خوبی داشته استفاده شده و چندین کار را آموزش دیده است. به طور خاص، این مدل تنها به صورت همزمان در ImageNet، وظایف مختلف ترجمه، شرح تصویر، تشخیص گفتار، و کار تجزیه زبان انگلیسی آموزش داده است.
این مدل در بسیاری از مسائل با مدلهای state-of-the-art هر حوزه که فقط برای آن کار آموزش دیده اند قابل مقایسه بوده و در برخی از حوزه ها کارایی بهتری نسبت به زمانی که فقط برای همان حوزه آموزش دیده شده گزارش شده است.
# Google_Brain #tensor2tensor
#deep_learning
#speech_recognition, #image_classification, #translation
#مقاله جدید از فیسبوک، برای آموزش بدون ناظر شبکه برای ترجمه متون!
Unsupervised Machine Translation Using Monolingual Corpora Only
در روشهای قبلی آموزش یک شبکه بازگشتی برای ترجمه متون، مجبور بودیم جفت جملات هم معنی بسیاری از زبان های مبدا و مقصد به شبکه نشان دهیم. در این مقاله روشی مطرح گردیده که نیازی به هیچ ترجمه متناظری از جملات نبوده و شبکه بدون ناظر میتواند برای ترجمه از زبانی به زبان دیگر آموزش ببیند.
این روش جملات را از زبانهای مختلف می گیرد و آنها را در یک فضای دیگر تبدیل میکند. با یادگیری برای بازسازی هر زبان از این فضای ویژگی مشترک، مدل به طور موثر یاد می گیرد بدون ناظر و label زبان مبدا را به زبان مقصد ترجمه کند.
https://arxiv.org/abs/1711.00043
#deep_learning #unsupervised #NLP #Translator #Translation
Unsupervised Machine Translation Using Monolingual Corpora Only
در روشهای قبلی آموزش یک شبکه بازگشتی برای ترجمه متون، مجبور بودیم جفت جملات هم معنی بسیاری از زبان های مبدا و مقصد به شبکه نشان دهیم. در این مقاله روشی مطرح گردیده که نیازی به هیچ ترجمه متناظری از جملات نبوده و شبکه بدون ناظر میتواند برای ترجمه از زبانی به زبان دیگر آموزش ببیند.
این روش جملات را از زبانهای مختلف می گیرد و آنها را در یک فضای دیگر تبدیل میکند. با یادگیری برای بازسازی هر زبان از این فضای ویژگی مشترک، مدل به طور موثر یاد می گیرد بدون ناظر و label زبان مبدا را به زبان مقصد ترجمه کند.
https://arxiv.org/abs/1711.00043
#deep_learning #unsupervised #NLP #Translator #Translation