🌃 پردازش متن فارسی در R Markdown
عدم پردازش متون فارسی یکی از نواقص مهم در R Studio برای کاربران فارسی زبان به حساب می آید. در این بین پکیج هایی برای رفع این مشکل ارائه شده اند اما هیچ یک از آن ها هنوز به طور کامل این مشکل را برطرف نکرده است. محیط R Studio تا به امروز از زبان فارسی پشتیبانی نکرده است. با این اوصاف، پکیج PersianStemmer یکی از ابزارهای مناسب برای #پردازش_متن_فارسی در محیط این نرم افزار است.
💥 نصب و فراخوانی این بسته:
💥مثال: پردازش یک متن ساده در محیط R Studio
help(PerStem)
از نحوه کارکرد ورودی های آن اطلاعات کافی را کسب کنید.
💥 لازم به ذکر است که شما حتی با به کارگیری این بسته همچنان محدودیت های چشمگیری در مقایسه با زبان LaTeX خواهید داشت بنابراین نباید انتظار زیادی از آن داشته باشید. از هم خانواده های این پکیج می توان به پکیج tm و پکیج NLP اشاره کرد.
💥💥💥 برای مشاهده کدها و خروجی ها کلیک کنید 💥💥💥
#معرفی_پکیج
#فارسی_نویسی_در_مارکدان
#افشین_متولی
#PersianStemmer #markdown #text_processing
|@RStudio_ir|
عدم پردازش متون فارسی یکی از نواقص مهم در R Studio برای کاربران فارسی زبان به حساب می آید. در این بین پکیج هایی برای رفع این مشکل ارائه شده اند اما هیچ یک از آن ها هنوز به طور کامل این مشکل را برطرف نکرده است. محیط R Studio تا به امروز از زبان فارسی پشتیبانی نکرده است. با این اوصاف، پکیج PersianStemmer یکی از ابزارهای مناسب برای #پردازش_متن_فارسی در محیط این نرم افزار است.
💥 نصب و فراخوانی این بسته:
install.packages("PersianStemmer")برای استفاده از این بسته کافیست یک یا چند متن را به صورت کاراکتر در محیط نرم افزار تعریف کنید (یعنی داخل " " یا ' ' متن را بنویسید) و سپس با یک دستور ساده آن را به نرم افزار معرفی کنید.
library(PersianStemmer)
💥مثال: پردازش یک متن ساده در محیط R Studio
txt = "یکی از عمده ترین مشکلاتی که کاربران فارسی زبان آر همواره با آن مواجه بوده اند، فارسی نویسی در این زبان برنامه نویسی خصوصاً در تهیه گزارشات علمی و تحلیلی می باشد. به همین منظور در این پست قصد داریم روش صحیح فارسی نویسی در این زبان را به شما معرفی کنیم. دقت داشته باشید که این مثال تنها بخشی از توانمندی های بسته های معرفی شده می باشد. برای آموزش بیشتر به کانال ما مراجعه کنید"برای دریافت اطلاعات کامل تر در مورد نحوه عملکرد این پکیج می توانید مستندات آن را مطالعه کنید. پیشنهاد می کنیم قبل از استفاده از دستور، با مطالعه
cleaned = PerStem(txt, NoEnglish = T,
NoNumbers = T, NoStopwords = F,
NoPunctuation = T,StemVerbs = T,
NoPreSuffix = T, Context = T,
StemBrokenPlurals = T, Transliteration = F)
cleaned
help(PerStem)
از نحوه کارکرد ورودی های آن اطلاعات کافی را کسب کنید.
💥 لازم به ذکر است که شما حتی با به کارگیری این بسته همچنان محدودیت های چشمگیری در مقایسه با زبان LaTeX خواهید داشت بنابراین نباید انتظار زیادی از آن داشته باشید. از هم خانواده های این پکیج می توان به پکیج tm و پکیج NLP اشاره کرد.
💥💥💥 برای مشاهده کدها و خروجی ها کلیک کنید 💥💥💥
#معرفی_پکیج
#فارسی_نویسی_در_مارکدان
#افشین_متولی
#PersianStemmer #markdown #text_processing
|@RStudio_ir|