Forwarded from کانال عباس اویسی
🔸یک رشته توییت کوتاه به همراه یک خواهش - نویسنده حامد سعیدی
▫️دقایقی پیش، یکی از هیجانانگیزترین پروژههای crowdsource جامعه نرمافزاری ایران لانچ شد: بهبود برچسبهای پیکره متنی موجودیتهای نامی #فارسی به صورت #اپنسورس
این پیکره با ۲۵ میلیون توکن در قالب حدود یک میلیون جمله، نیازمند کمک شماست.
▫️همین اول بگم، کلیه فایلهای پیکره در مخزن گیتهاب https://github.com/text-mining/persian-ner … در دسترس هستند و بعد از اصلاحات و بهبود و کمک شما، برچسبهای بهروز شده هم به صورت اپنسورس منتشر میشن.اما داستان چیه؟
▫️همه ما (چه برنامهنویسها، چه پژوهشگران) برای اینکه ابزارهای مربوط به پردازش متن فارسی با دقت بالاتری کار کنند یک سری دادههای اولیه نیاز داریم. این پیکره که از دیتای #ویکیپدیا فارسی گرفته شده و به صورت استاندارد برچسبگذاری شده، نیاز داره که برچسبهاش اصلاح و بهتر بشن.
▫️کافیه به آدرس http://app.text-mining.ir برید و ثبتنام کنید و وارد بشید و بعد به قسمت «برچسب متون NER» برید. یک جمله رندوم بهتون نشون داده میشه که طبق راهنما میتونید اصلاحش کنید. اسم شما در لیست مشارکتکنندگان نهایی پروژه خواهد بود ولو با یک برچسب :)
▫️من این افتخار رو داشتم که در کنار دوستان تیم متنکاوی باشم. بچههایی از دانشگاههای شریف و تربیت مدرس و فردوسی که برای توسعه این ابزارها وقت گذاشتند. این سایت API های پردازش متن فارسی هم ارائه میکنه و به زودی ابزارهایی هم در دسترس علاقمندان خواهد بود
▫️متن اطلاعیه فراخوان مشارکت عمومی اینجاست. خواهشم اینه که بخونیدش و اگر فرصت و علاقه دارید مشارکت کنید. کاری که اینجا انجام میشه و اپن سورس در اختیار بقیه قرار میگیره میتونه پایه خیلی از ابزارهای کاربردی به زبان فارسی باشه.
http://text-mining.ir/ner-crowdsourcing/
▫️دو توضیح دیگه هم باید بدم. 1️⃣ اینکه ارائه لیست موجودیتها به صورت جداگانه چندان مفید نیست. مثلاً “صیاد شیرازی” میتونه در جملهای به یک خیابان (رده مکان) و در جملهای دیگه به نام یک شخص (رده اشخاص) اشاره کنه و این پیکره با تگهای استاندارد قابل استفاده در الگوریتمها آماده شده. 2️⃣ اینکه مشارکت همه شما در این پروژه crowdsource شده به رشد و بهبود دقت سریعترش کمک میکنه. خواهش میکنم ضمن معرفی، فیدبک ارائه بدید و اگر سوالی دارید بپرسید.
▫️اگر در کار تولید #پلاگین #مرورگر هستید یا کسی رو میشناسید که فرصت ساخت پلاگین اپنسورس برای پروژه رو داره، منشن کنید
▫️لینک رشته توییت:
https://twitter.com/Hamed/status/1068198803797241856
◀️ عضویت در کانال @aoveissi
▫️دقایقی پیش، یکی از هیجانانگیزترین پروژههای crowdsource جامعه نرمافزاری ایران لانچ شد: بهبود برچسبهای پیکره متنی موجودیتهای نامی #فارسی به صورت #اپنسورس
این پیکره با ۲۵ میلیون توکن در قالب حدود یک میلیون جمله، نیازمند کمک شماست.
▫️همین اول بگم، کلیه فایلهای پیکره در مخزن گیتهاب https://github.com/text-mining/persian-ner … در دسترس هستند و بعد از اصلاحات و بهبود و کمک شما، برچسبهای بهروز شده هم به صورت اپنسورس منتشر میشن.اما داستان چیه؟
▫️همه ما (چه برنامهنویسها، چه پژوهشگران) برای اینکه ابزارهای مربوط به پردازش متن فارسی با دقت بالاتری کار کنند یک سری دادههای اولیه نیاز داریم. این پیکره که از دیتای #ویکیپدیا فارسی گرفته شده و به صورت استاندارد برچسبگذاری شده، نیاز داره که برچسبهاش اصلاح و بهتر بشن.
▫️کافیه به آدرس http://app.text-mining.ir برید و ثبتنام کنید و وارد بشید و بعد به قسمت «برچسب متون NER» برید. یک جمله رندوم بهتون نشون داده میشه که طبق راهنما میتونید اصلاحش کنید. اسم شما در لیست مشارکتکنندگان نهایی پروژه خواهد بود ولو با یک برچسب :)
▫️من این افتخار رو داشتم که در کنار دوستان تیم متنکاوی باشم. بچههایی از دانشگاههای شریف و تربیت مدرس و فردوسی که برای توسعه این ابزارها وقت گذاشتند. این سایت API های پردازش متن فارسی هم ارائه میکنه و به زودی ابزارهایی هم در دسترس علاقمندان خواهد بود
▫️متن اطلاعیه فراخوان مشارکت عمومی اینجاست. خواهشم اینه که بخونیدش و اگر فرصت و علاقه دارید مشارکت کنید. کاری که اینجا انجام میشه و اپن سورس در اختیار بقیه قرار میگیره میتونه پایه خیلی از ابزارهای کاربردی به زبان فارسی باشه.
http://text-mining.ir/ner-crowdsourcing/
▫️دو توضیح دیگه هم باید بدم. 1️⃣ اینکه ارائه لیست موجودیتها به صورت جداگانه چندان مفید نیست. مثلاً “صیاد شیرازی” میتونه در جملهای به یک خیابان (رده مکان) و در جملهای دیگه به نام یک شخص (رده اشخاص) اشاره کنه و این پیکره با تگهای استاندارد قابل استفاده در الگوریتمها آماده شده. 2️⃣ اینکه مشارکت همه شما در این پروژه crowdsource شده به رشد و بهبود دقت سریعترش کمک میکنه. خواهش میکنم ضمن معرفی، فیدبک ارائه بدید و اگر سوالی دارید بپرسید.
▫️اگر در کار تولید #پلاگین #مرورگر هستید یا کسی رو میشناسید که فرصت ساخت پلاگین اپنسورس برای پروژه رو داره، منشن کنید
▫️لینک رشته توییت:
https://twitter.com/Hamed/status/1068198803797241856
◀️ عضویت در کانال @aoveissi