Silicon Brain | جامعه هوش مصنوعی
7.04K subscribers
1.03K photos
117 videos
60 files
499 links
مغز سیلیکونی|جامعه هوش مصنوعی و یادگیری ماشین

گروه بحث و تبادل نظر:
https://t.me/+SWbgmMZt0XU0MGY0

مطالب و بحث های بیشتر در اینستاگرام:
https://www.instagram.com/silicon_brain/

ارتباط با ادمین:
@silicon_brain_admin
Download Telegram
🟣سری نهم از یادگیری ماشین در مورد الگوریتم KNN
#یادگیری_ماشین
#machine_learning #knn
👍1
بیشترین تقاضا برای مهارت های مختلف دانشمندان داده در سال 2021

نتایج حاصل از طریق Scrap کردن بیش از 15000 آگهی برای عنوان شغلی Data Scientist جمع آوری شده است.

#datascience
@silicon_brain
پیش بینی هوش مصنوعی برای قهرمان فوتبال لیگ های مختلف

مرکز تحقیقات سایس (CIES) در شرایطی که دوره جدید لیگ‌های فوتبال در اکثر کشورهای دنیا به تازگی آغاز شده‌اند، با استفاده از آمار مربوط به بازی‌های اول و فناوری هوش مصنوعی، اقدام به پیش‌بینی قهرمان لیگ های معتبر فوتبال اروپا کرده است.

بر اساس پیش‌بینی هوش مصنوعی در لالیگا رئال مادرید قهرمان شده و در لیگ برتر انگلیس، منچستر سیتی قهرمان خواهد شد. در سری آ ایتالیا به پیش بینی هوش مصنوعی اینترمیلان به مقام قهرمانی خواهد رسید و در بوندسلیگا آلمان، بایرن مونیخ. برای لوشامپیونه فرانسه هم حدس زدن کار دشواری به نظر نمی‌رسد و پاری‌سن ژرمن که به تازگی مسی را هم خریده قرار است قهرمان شود.

@silicon_brain
بنچمارک GLUE
(General Language Understanding Evaluation)
معیاری برای آموزش، ارزیابی و تجزیه و تحلیل مدل های NLP است.
این بنچمارک از 9 تسک کاری تشکیل شده است که لیست آن را در شکل بالا مشاهده میکنید.
لینک
#nlp
@silicon_brain
انواع مختلف مسائل طبقه بندی با مثال ساده
در اینستاگرام ما بخوانید:
https://www.instagram.com/p/CUh1cnrtrBK/?utm_medium=copy_link
AutoML چیست؟

یادگیری ماشین خودکار (AutoML) با تولید راه حل های یادگیری ماشینی برای مواردی مانند: آماده سازی داده، انتخاب مدل، پارامتر بندی مدل کمک میکند. این موضوع باعث میشود تا کد کمتری تولید شود و همینطور باعث جلوگیری از تنظیم بیش از حد دستی مدل های یادگیری توسط متخصصان میشود.
پکیج های اوپن سورس در دسترس برای AutoML:
- Auto Sklearn
- Auto Weka
- Auto Keras

در تصویر این پست، بصورت کلی شکلی در مورد نحوه عملکرد سیستم Google AutoML نمایش داده شده است.
#automl
@silicon_brain
🔥1
types of Machine Learning Algorithms - Silicon_Brain.pdf
747.5 KB
در ۷ صفحه انواع مختلف الگوریتم های یادگیری را مرور کنید.

types of Machine Learning Algorithms

#cheatsheet
@silicon_brain
👍3
در این پست میخوام یک کتابخانه پایتون برای #ارزیابی_کیفیت_داده‌ها معرفی کنم که میتونه کمک خوبی به تحلیلگران داده کنه.
🔵ریپازیتوری ydata_quality یک موتور ارزیابی کیفیت داده است که به‌صورت ماژولار می‌توانید کارهای زیر رو انجام بدهید

سوگیری و عدالت را در داده‌های خود تضمین کنید
چه انتظاری از داده‌ها دارید، برای داده‌هایی که دارای ویژگی خاص هستند یونیت تست رو انجام دهید.
ارتباط بین ویژگی‌ها را بررسی کنید .
مفهوم رانش (پایداری ویژگی‌ها و تارگت هنگام بررسی چانک‌های مختلف داده ) را در داده‌ها تجزیه و تحلیل کنید .
موارد تکراری را کنترل کنید.
برچسبهای پرت و نامتعادل را تشخیص می‌دهد.
داده‌های از دست رفته را کنترل کنید.
داده‌های حاوی مقادیر معنی و اشتباه را تشخیص دهید

@silicon_brain
در مورد Siamese Network چه میدانید؟

شبکه Siamese بر اساس یک تابع شباهت عمل میکند. از نظر معماری، دو شبکه عصبی موازی وجود دارد که هر کدام ورودی متفاوتی دارند و خروجی های آنها برای ارائه پیش بینی ترکیب شده است.

به طور خاص، آنچه ما از این شبکه عصبی میخواهیم یادگیری تابع d (در تصویر نمایش داده شده) است. که دو تصویر را وارد می کند یکی واقعی و دیگری تصویر نامزد است و شباهت بین این دو را خروجی می دهد.

اصلی ترین کاربرد این شبکه در یادگیری one shot است که قبلا در کانال در این مورد توضیح داده شده است. (جهت مطالعه در این مورد هشتگ #one_shot را جستجو کنید)
#siamese_network
@silicon_brain
👍2
دیتاست MRPC برای تشخیص هم معنی بودن دو جمله
#معرفی_دیتاست

دیتاست MRPC
(Microsoft Research Paraphrase Corpus)
شامل 5800 جفت جمله است که از منابع خبری آنلاین استخراج شده و برچسب گذاری های این دیتاست کاملا به دست انسان انجام شده است.
این دیتاست نشان دهنده اینست که آیا دو جمله مشخص رابطه ای برابر/معنی دار دارند یا نه. در جمع آوری این دیتاست فقط یک جمله از هر یک از مقالات خبری استخراج شده.
دانلود مسقیم دیتاست | هاگینگ فیس
لود مستقیم به کد، در تصویر نمایش داده شده است.
@silicon_brain
آموزش همزمان روی متن و تصویر با استفاده از ترنسفورمر

بسیاری از محتوای تولید شده در شبکه های اجتماعی بصورت #multi_modal تولید میشوند، تصاویر تولید شده در اینستاگرام و خیلی از شبکه های اجتماعی دیگر، هم بصورت متن و هم بصورت تصویر منتشر میشوند، پس طراحی و آموزش مدل های مبتنی بر متن و تصویر بسیار کاربردی میتواند باشد.

سال 2019 مدلی مبتنی بر معماری ترنسفورمر، به اسم #vilbert یا (Vision and Language BERT)معرفی شد که داده ورودی آن متن و تصویر است. این مدل معماری محبوب #bert را به مدل چند حالته با دو جریان داده ورودی (متن و تصویر) تبدیل کرده و از طریق لایه های مختلف ترنسفورمر به هم اثر میدهد.

لینک مقاله | پیپرویدکد

#transformer
@silicon_brain
1
الگوریتمی ساده برای تشخیص شباهت بین متون در اینستاگرام "سیلیکون برین" بخوانید:

https://www.instagram.com/p/CVBNtUxgNvU/?utm_medium=copy_link