وقتی موضوع تحقیقات پردازش زبان باشه دوتا چیز خیلی مهمه:
۱- دیتاست
(این لینک دیتاستهای مشهور
https://huggingface.co/datasets )
۲- متریک های ارزیابی
(اینم لینک متریک های ارزیابی
https://huggingface.co/metrics )
#دیتا
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python_EN
۱- دیتاست
(این لینک دیتاستهای مشهور
https://huggingface.co/datasets )
۲- متریک های ارزیابی
(اینم لینک متریک های ارزیابی
https://huggingface.co/metrics )
#دیتا
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python_EN
دیتاستی از توییتهای جو بایدن از ۲۰۰۷ تا ۲۰۲۰:
https://www.kaggle.com/rohanrao/joe-biden-tweets/tasks?taskId=2527&utm_medium=social&utm_source=twitter.com&utm_campaign=task+published
#دیتاست #دیتا
#dataset
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python
https://www.kaggle.com/rohanrao/joe-biden-tweets/tasks?taskId=2527&utm_medium=social&utm_source=twitter.com&utm_campaign=task+published
#دیتاست #دیتا
#dataset
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python
Kaggle
Joe Biden Tweets (2007 - 2020)
Tweets of Joe Biden's official Twitter handle @JoeBiden
انتشار دیتاست objectron گوگل
https://github.com/google-research-datasets/objectron
#دیتاست #دیتا
#dataset
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python_EN
https://github.com/google-research-datasets/objectron
#دیتاست #دیتا
#dataset
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python_EN
GitHub
GitHub - google-research-datasets/Objectron: Objectron is a dataset of short, object-centric video clips. In addition, the videos…
Objectron is a dataset of short, object-centric video clips. In addition, the videos also contain AR session metadata including camera poses, sparse point-clouds and planes. In each video, the came...
مقاله داغ روز برای علاقمندان به خلاصه سازی و پردازش متن در این مقاله به خلاصهسازی رفرنسهای مقالات وکیپدیا پرداخته شده است
WikiAsp: A Dataset for Multi-domain Aspect-based Summarization
Paper:
https://arxiv.org/abs/2011.07832
Data:
https://github.com/neulab/wikiasp
#مقاله #خلاصه_سازی #پردازش_زبان_طبیعی #دیتا #دیتاست
#NLP
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python_EN
WikiAsp: A Dataset for Multi-domain Aspect-based Summarization
Paper:
https://arxiv.org/abs/2011.07832
Data:
https://github.com/neulab/wikiasp
#مقاله #خلاصه_سازی #پردازش_زبان_طبیعی #دیتا #دیتاست
#NLP
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python_EN
A dataset of 14M articles (CSV file ~ 14.12 GB) for medical NLP pretraining, via abbreviation disambiguation.
appearing in EMNLP's Clinical NLP workshop.
Details: https://redd.it/jx63fd
https://www.aclweb.org/anthology/2020.clinicalnlp-1.15/
Details: https://github.com/BruceWen120/medal
#دیتا #دیتاست #پردازش_زبان_طبیعی
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Pytho
appearing in EMNLP's Clinical NLP workshop.
Details: https://redd.it/jx63fd
https://www.aclweb.org/anthology/2020.clinicalnlp-1.15/
Details: https://github.com/BruceWen120/medal
#دیتا #دیتاست #پردازش_زبان_طبیعی
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Pytho
reddit
[R] A 14M articles dataset for medical NLP pretraining
Posted in r/MachineLearning by u/bruce_wen • 290 points and 5 comments
multilingual dataset for common-sense reasoning.
https://github.com/cambridgeltl/xcopa
#دیتا #دیتاست
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python_En
https://github.com/cambridgeltl/xcopa
#دیتا #دیتاست
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python_En
GitHub
GitHub - cambridgeltl/xcopa: XCOPA: A Multilingual Dataset for Causal Commonsense Reasoning
XCOPA: A Multilingual Dataset for Causal Commonsense Reasoning - GitHub - cambridgeltl/xcopa: XCOPA: A Multilingual Dataset for Causal Commonsense Reasoning
Apple publicly releases its first large image #dataset for #AI #research 74K high-resolution HDR computer-generated images of realistic indoor scenes with 1.9TB of pixel-perfect labels
Dataset download link:
http://github.com/apple/ml-hypersim
#دیتاست #دیتا #هوش_مصنوعی
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python_En
Dataset download link:
http://github.com/apple/ml-hypersim
#دیتاست #دیتا #هوش_مصنوعی
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python_En
GitHub
GitHub - apple/ml-hypersim: Hypersim: A Photorealistic Synthetic Dataset for Holistic Indoor Scene Understanding
Hypersim: A Photorealistic Synthetic Dataset for Holistic Indoor Scene Understanding - apple/ml-hypersim
MeDAL: Medical Abbreviation Disambiguation Dataset for NLU Pretraining
Github: https://github.com/BruceWen120/medal
Paper: https://arxiv.org/abs/2012.13978v1
Dataset: https://www.kaggle.com/xhlulu/medal-emnlp
Pre-trained: https://huggingface.co/xhlu/electra-medal
#هوش_مصنوعی #منابع #مقاله #پردازش_زبان_طبیعی #فهم_زبان_طبیعی #دیتا #دیتاست
#NLP #NLU
🗣 @AI_Python_arXiv
✴️ @AI_Python_EN
❇️ @AI_Python
Github: https://github.com/BruceWen120/medal
Paper: https://arxiv.org/abs/2012.13978v1
Dataset: https://www.kaggle.com/xhlulu/medal-emnlp
Pre-trained: https://huggingface.co/xhlu/electra-medal
#هوش_مصنوعی #منابع #مقاله #پردازش_زبان_طبیعی #فهم_زبان_طبیعی #دیتا #دیتاست
#NLP #NLU
🗣 @AI_Python_arXiv
✴️ @AI_Python_EN
❇️ @AI_Python
GitHub
GitHub - BruceWen120/medal: A large medical text dataset curated for abbreviation disambiguation
A large medical text dataset curated for abbreviation disambiguation - GitHub - BruceWen120/medal: A large medical text dataset curated for abbreviation disambiguation
مقاله داغ روز
Learning from the Worst: Dynamically Generated Datasets to Improve Online Hate Detection
- A first-of-its-kind large synthetic training dataset for online hate classification, created from scratch with trained annotators over multiple rounds of dynamic data collection.
Paper:
https://arxiv.org/abs/2012.15761
Dataset:
https://github.com/bvidgen/Dynamically-Generated-Hate-Speech-Dataset
#مقاله #هوش_مصنوعی #دیتا #دیتاست
🗣 @AI_Python_arXiv
✴️ @AI_Python_EN
❇️ @AI_Python
Learning from the Worst: Dynamically Generated Datasets to Improve Online Hate Detection
- A first-of-its-kind large synthetic training dataset for online hate classification, created from scratch with trained annotators over multiple rounds of dynamic data collection.
Paper:
https://arxiv.org/abs/2012.15761
Dataset:
https://github.com/bvidgen/Dynamically-Generated-Hate-Speech-Dataset
#مقاله #هوش_مصنوعی #دیتا #دیتاست
🗣 @AI_Python_arXiv
✴️ @AI_Python_EN
❇️ @AI_Python
GitHub
GitHub - bvidgen/Dynamically-Generated-Hate-Speech-Dataset: Repository for the Dynamically Generated Hate Speech Dataset by Vidgen…
Repository for the Dynamically Generated Hate Speech Dataset by Vidgen et al. (2021). - bvidgen/Dynamically-Generated-Hate-Speech-Dataset
دیتا مربوط به واکنشهای ناسازگار به واکسن کووید در این پیج در سایت CDC است.
https://wonder.cdc.gov/vaers.html
#دیتا #دیتاست
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python_EN
https://wonder.cdc.gov/vaers.html
#دیتا #دیتاست
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python_EN
Learning from the Worst: Dynamically Generated Datasets to Improve Online Hate Detection
- A first-of-its-kind large synthetic training dataset for online hate classification, created from scratch with trained annotators over multiple rounds of dynamic data collection.
Paper:
https://arxiv.org/abs/2012.15761
Dataset:
https://github.com/bvidgen/Dynamically-Generated-Hate-Speech-Dataset
#مقاله #پردازش_زبان_طبیعی #دیتا #دیتاست
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python_EN
- A first-of-its-kind large synthetic training dataset for online hate classification, created from scratch with trained annotators over multiple rounds of dynamic data collection.
Paper:
https://arxiv.org/abs/2012.15761
Dataset:
https://github.com/bvidgen/Dynamically-Generated-Hate-Speech-Dataset
#مقاله #پردازش_زبان_طبیعی #دیتا #دیتاست
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python_EN
یک دیتاست بسیار ارزشمندبرای کارهای پژوهشی و...
https://github.com/Helsinki-NLP/Tatoeba-Challenge/blob/master/Backtranslations.md
#دیتا #دیتاست #منابع #پردازش_زبان_طبیعی
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python_EN
https://github.com/Helsinki-NLP/Tatoeba-Challenge/blob/master/Backtranslations.md
#دیتا #دیتاست #منابع #پردازش_زبان_طبیعی
❇️ @AI_Python
🗣 @AI_Python_arXiv
✴️ @AI_Python_EN
Indian Datasets for DS/ML!
Indian startup funding -
https://www.kaggle.com/sudalairajkumar/indian-startup-funding
6000+ Indian Food Recipes -
https://www.kaggle.com/kanishk307/6000-indian-food-recipes-dataset
Covid19 in India -
https://www.kaggle.com/sudalairajkumar/covid19-in-india
Indian Literacy -
https://www.kaggle.com/satyampd/india-literacy-data-district-wise
News Summary -
https://www.kaggle.com/sunnysai12345/news-summary
Education in India -
https://www.kaggle.com/rajanand/education-in-india
Graduate Admissions - https://www.kaggle.com/mohansacharya/graduate-admissions
Nifty Indices -
https://www.kaggle.com/sudalairajkumar/nifty-indices-dataset
e-Commerce -
https://www.kaggle.com/benroshan/ecommerce-data
Income Classification -
https://www.kaggle.com/lodetomasi1995/income-classification
NSE Listed 1000+ companies' Historical Data -
https://www.kaggle.com/abhishekyana/nse-listed-1384-companies-data
#دیتا #یادگیری_ماشین #منابع
Indian startup funding -
https://www.kaggle.com/sudalairajkumar/indian-startup-funding
6000+ Indian Food Recipes -
https://www.kaggle.com/kanishk307/6000-indian-food-recipes-dataset
Covid19 in India -
https://www.kaggle.com/sudalairajkumar/covid19-in-india
Indian Literacy -
https://www.kaggle.com/satyampd/india-literacy-data-district-wise
News Summary -
https://www.kaggle.com/sunnysai12345/news-summary
Education in India -
https://www.kaggle.com/rajanand/education-in-india
Graduate Admissions - https://www.kaggle.com/mohansacharya/graduate-admissions
Nifty Indices -
https://www.kaggle.com/sudalairajkumar/nifty-indices-dataset
e-Commerce -
https://www.kaggle.com/benroshan/ecommerce-data
Income Classification -
https://www.kaggle.com/lodetomasi1995/income-classification
NSE Listed 1000+ companies' Historical Data -
https://www.kaggle.com/abhishekyana/nse-listed-1384-companies-data
#دیتا #یادگیری_ماشین #منابع
Kaggle
Indian Startup Funding
Funding details of the startups in India
ConditionalQA is a question answering dataset that contains complex questions with conditional answers, i.e. the answers are only true when certain conditions apply.
It can motivate doing research for complex question answering over long documents.
ConditionalQA: A Complex Reading Comprehension Dataset with Conditional Answers
https://paperswithcode.com/dataset/conditionalqa
#مقاله #دیتا #دیتاست
❇️ @AI_Python
It can motivate doing research for complex question answering over long documents.
ConditionalQA: A Complex Reading Comprehension Dataset with Conditional Answers
https://paperswithcode.com/dataset/conditionalqa
#مقاله #دیتا #دیتاست
❇️ @AI_Python
Forwarded from DLeX: AI Python (Farzad🦅)
✅ مقالات , دیتا و آموزش های گام به گام بینایی ماشین و کامپیوتر با مقالات براساس پروژه های انجام شده
#بینایی_ماشین #منابع #بینایی_کامپیوتر #آموزش #دیتا #dataset #پردازش_تصویر #پردازش_فیلم #شناسایی_اشیا
🌎 Link Review
❇️ @AI_Python
✴️ @AI_Python_EN
#بینایی_ماشین #منابع #بینایی_کامپیوتر #آموزش #دیتا #dataset #پردازش_تصویر #پردازش_فیلم #شناسایی_اشیا
🌎 Link Review
❇️ @AI_Python
✴️ @AI_Python_EN
Forwarded from DLeX: AI Python (Farzad🦅)
✅ منابع شروع یادگیری بینایی ماشین
🔸 دیتاست
📣 آموزش بینایی کامپیوتر از دانشگاه امپریال کالج لندن
🔸 آموزش
📣 منابع آموزشی بینایی کامپیوتر دانشگاه استنفورد از دکتر Andrew Ng
🔸 مطالب آموزشی
🔸 کدها
📣 منابع آموزشی بینایی کامپیوتر (Computer Vision) از دانشگاه های برکلی , استنفورد و MIT
🔸 مطالب آموزشی
📣 منابعی ترکیبی از بینایی ماشین برای دسترسی به دیتاست ها
🔸 دیتاها
📣 منبعی از یادگیری عمیق برای بینایی ماشین (Computer Vision)
🔸 مطالب آموزشی
#منابع #بینایی_ماشین #بینایی_کامپیوتر #آموزش #دیتا #dataset ✔️#لینک_گروه
❇️ @AI_Python
✴️ @AI_Python_EN
🔸 دیتاست
📣 آموزش بینایی کامپیوتر از دانشگاه امپریال کالج لندن
🔸 آموزش
📣 منابع آموزشی بینایی کامپیوتر دانشگاه استنفورد از دکتر Andrew Ng
🔸 مطالب آموزشی
🔸 کدها
📣 منابع آموزشی بینایی کامپیوتر (Computer Vision) از دانشگاه های برکلی , استنفورد و MIT
🔸 مطالب آموزشی
📣 منابعی ترکیبی از بینایی ماشین برای دسترسی به دیتاست ها
🔸 دیتاها
📣 منبعی از یادگیری عمیق برای بینایی ماشین (Computer Vision)
🔸 مطالب آموزشی
#منابع #بینایی_ماشین #بینایی_کامپیوتر #آموزش #دیتا #dataset ✔️#لینک_گروه
❇️ @AI_Python
✴️ @AI_Python_EN
Forwarded from DLeX: AI Python (Farzad🦅)
✅ منابع و آموزش های گام به گام الگوریتمهای
#یادگیری_ماشین #بینایی_ماشین #یادگیری_نظارتی #انتقال_یادگیری #هوش_مصنوعی #آموزش #فیلم #مقاله #منابع #طبقه_بندی_تصاویر #تشخیص_صدا #منابع #سخنرانی #شناسایی_اشیا #طبقه_بندی_فیلم #رباتیک #دیتا #dataset #کتاب #book
🔸 Adversarial Machine Learning
🔸 Deep Vision
🔸 Self-Supervised Learning
🔸 Transfer Learning
🔸 Artificial Intelligence (AI)
❇️ @AI_Python
✴️ @AI_Python_EN
#یادگیری_ماشین #بینایی_ماشین #یادگیری_نظارتی #انتقال_یادگیری #هوش_مصنوعی #آموزش #فیلم #مقاله #منابع #طبقه_بندی_تصاویر #تشخیص_صدا #منابع #سخنرانی #شناسایی_اشیا #طبقه_بندی_فیلم #رباتیک #دیتا #dataset #کتاب #book
🔸 Adversarial Machine Learning
🔸 Deep Vision
🔸 Self-Supervised Learning
🔸 Transfer Learning
🔸 Artificial Intelligence (AI)
❇️ @AI_Python
✴️ @AI_Python_EN
دیتاست کلمات رکیک
https://github.com/mohamad-dehghani/Persian-Abusive-Words
#دیتاست #دیتا
❇️ @AI_Python
https://github.com/mohamad-dehghani/Persian-Abusive-Words
#دیتاست #دیتا
❇️ @AI_Python
✅ آموزش با نرم افزارها و زبــانهای R، Python و SQL
🔬 آموزش #آنلاین به همراه انجام پروژه و موردکاویهای واقعی
🏛 موسسه آموزش عالی آزاد توسعه
Please open Telegram to view this post
VIEW IN TELEGRAM
💥 دوره آموزشی «علـــــم داده (Data Science)»
🟢 اهداف دوره:
⏺ تربیت متخصص #دیتا_ساینس و تحلیل داده
⏺ پیادهسازی علم داده به صورت کاربردی
⏺ آمادهسازی و تقویت دانشجویان برای اشتغــال یا تحصیل
⏺ ارتقاء رزومه دانشپذیران
✅ آموزش با نرم افزارها و زبــانهای R، Python و SQL
🔥 نیاز روز بــــازار کــــار ایــــــران و خـــارج
🔬 آموزش #آنلاین به همراه انجام پروژه و موردکاویهای واقعی
🏛 موسسه آموزش عالی آزاد توسعه
✅ با گواهینامه مورد تایید وزارت علوم، تحقیقات و فناوری
📌 مشاوره رایگان و مشاهده جزئیات دوره:
➡️ httb.ir/cfG6F
➡️ httb.ir/cfG6F
➡️ httb.ir/cfG6F
➖➖➖➖
🟢 اهداف دوره:
⏺ تربیت متخصص #دیتا_ساینس و تحلیل داده
⏺ پیادهسازی علم داده به صورت کاربردی
⏺ آمادهسازی و تقویت دانشجویان برای اشتغــال یا تحصیل
⏺ ارتقاء رزومه دانشپذیران
✅ آموزش با نرم افزارها و زبــانهای R، Python و SQL
🔥 نیاز روز بــــازار کــــار ایــــــران و خـــارج
🔬 آموزش #آنلاین به همراه انجام پروژه و موردکاویهای واقعی
🏛 موسسه آموزش عالی آزاد توسعه
✅ با گواهینامه مورد تایید وزارت علوم، تحقیقات و فناوری
➖➖➖➖
Please open Telegram to view this post
VIEW IN TELEGRAM