221 subscribers
149 photos
14 videos
56 files
120 links
درباره کانال:
این کانال به منظور ایجاد مطالبی در حوزه آموزش یادگیری آماری، آموزش ابزارهای مورد نیاز در این حیطه و البته به اشتراک گذاری تجارب کار در این زمینه و کمی هم مطالب متفرقه ایجاد شده هست.

ارتباط با ادمین:
@stats9
Download Telegram
ULTRA
Photo
هوش مصنوعی جدید OpenAI یعنی GPT-5 منتشر شد | جهشی بزرگ در مسیر هوش عمومی مصنوعی (AGI)

کمپانی OpenAI رسماً از مدل جدید خود، GPT-5 رونمایی کرد؛ مدلی که به گفته‌ی سم آلتمن، «برای اولین بار حس صحبت با یک متخصص واقعی را منتقل می‌کند». این مدل نسبت به نسخه‌های قبلی، در چندین زمینه بهبود چشم‌گیر داشته است:

ویژگی‌های برجسته GPT-5:
- کاهش نرخ توهم و تولید پاسخ‌های نادرست
- توانایی انجام وظایف چندمرحله‌ای و بازیابی از اشتباهات
- تعامل مؤثر با ابزارهای خارجی و حفظ انسجام در جریان‌های کاری پیچیده
- عملکرد بهتر در برنامه‌نویسی و ریاضیات کاربردی
- معرفی سیستم جدید Safe Completions برای پاسخ‌گویی ایمن به سوالات حساس

این مدل برای کاربران رایگان ChatGPT نیز در دسترس خواهد بود (با محدودیت مصرف)، و همچنین از طریق API برای توسعه‌دهندگان و کسب‌وکارها قابل استفاده است.

تحولات هم‌زمان در اکوسیستم OpenAI:
- عرضه دو مدل Open-weight برای اجرا روی دستگاه‌های نسبتا معمولی
- پیشنهاد ارائه ChatGPT به نهادهای دولتی با هزینه‌ی ۱ دلار برای هر سازمان
- معرفی قابلیت‌های جدید مرتبط با سلامت روان دیجیتال
- رشد چشم‌گیر کاربران هفتگی ChatGPT تا ۷۰۰ میلیون نفر
- جذب سرمایه‌ی ۸.۳ میلیارد دلاری با ارزش‌گذاری ۳۰۰ میلیارد دلار و احتمال فروش ثانویه با ارزش‌گذاری ۵۰۰ میلیارد دلار


مسیر به سوی AGI

آلتمن تأکید کرده که GPT-5 گامی مهم در مسیر دستیابی به هوش عمومی مصنوعی (AGI) است، هرچند هنوز برخی ویژگی‌های کلیدی مانند یادگیری پیوسته در حین استفاده، در این مدل وجود ندارد.


رقابت داغ در حوزه هوش مصنوعی

در کنار OpenAI، شرکت‌هایی مانند Google، Anthropic، Cohere و Apple نیز با معرفی مدل‌ها و پلتفرم‌های جدید، رقابت را به شدت افزایش داده‌اند. از جمله:

- Google با سرمایه‌گذاری ۱ میلیارد دلاری برای آموزش AI در دانشگاه‌ها
- Anthropic با عرضه Claude Opus 4.1
- Apple با توسعه موتور پاسخ‌گو برای Siri و Safari
- Cohere با پلتفرم عامل‌محور North

هم‌زمان با رونمایی عمومی GPT-5 توسط OpenAI، شرکت مایکروسافت نیز اعلام کرده که این مدل از امروز در پلتفرم‌های اصلی خود در دسترس قرار گرفته است. این پلتفرم‌ها شامل موارد زیر هستند:
• Microsoft 365 Copilot
• Copilot (دستیار هوشمند مایکروسافت)
• GitHub Copilot
• Azure AI Foundry
به گفته‌ی مایکروسافت، GPT-5 قدرتمندترین مدل تولیدشده توسط OpenAI تا به امروز است و پیشرفت‌های قابل توجهی در زمینه‌های استدلال، کدنویسی و تعاملات گفت‌وگویی دارد. این مدل به‌طور کامل روی زیرساخت ابری Azure آموزش دیده است.
مایکروسافت همچنین به نقطه‌ی عطفی در تاریخ همکاری خود با OpenAI اشاره کرده: معرفی GPT-4 در مقر ردموند تنها دو سال و نیم پیش، و حالا با گذشت این مدت کوتاه، GPT-5 به‌عنوان یک جهش بزرگ در مسیر توسعه هوش مصنوعی معرفی شده است.
این خبر نشان‌دهنده‌ی هم‌گرایی راهبردی میان OpenAI و مایکروسافت در جهت ارائه مدل‌های پیشرفته‌تر به کاربران نهایی، توسعه‌دهندگان و سازمان‌هاست. با توجه به سرعت فزاینده‌ی پیشرفت‌ها، انتظار می‌رود GPT-5 نقش مهمی در تحول ابزارهای هوشمند، اتوماسیون سازمانی و تجربه‌ی کاربری ایفا کند.
👍1🔥1
ULTRA
Ultra_stats9_ASA_Awards.pdf
وقتی از آزمون MANOVA برای تحلیل آنالیز واریانس در داده‌های چند متغیره استفاده می‌کنیم، قطعا آزمون ویلکس و آماره این آزمون یکی از رویکردها می‌تونه باشه. ساموئل ویلکس استاد جان توکی افسانه‌ای خالق این آزمون است. نکته‌ای که در مورد ساموئل ویلکس وجود داره کمک فراوانی است که این دانشمند برجسته آمار در بهبود صنعت کنترل کیفیت چه در رده نظامی و جه صنعتی به دولت آمریکا کرده است.

ویلفرد جوزف دیکسون از اولین آماردانانی بود که بر اهمیت مشاوره آماری تأکید داشت او که دکترای آمار ریاضی خود را از پرینستون گرفته و استاد دانشگاه UCLA بود در دهه ۶۰ میلادی یکی از اولین نرم‌افزارهای آماری BMDP را برای تحلیل داده‌های زیست پزشکی خلق کرد. اولین کتاب آماری به زبان غیر ریاضی را برای مخاطبان عام نوشت و اواخر عمرش را وقف ترویج مشاوره آماری و اهمیت آن پرداخت.

رویداد JSM بزرگ‌ترین گردهمایی آمارشناسان در آمریکای شمالی از دهه ۱۹۷۰ تاکنون، توسط انجمن‌های ASA، IMS، SSC و COPSS برگزار می‌شود. در این مراسم جوایزی مانند COPSS Presidents’ Award، ASA Founders Award و David Cox Medal برای تقدیر از نوآوری و تأثیر علمی اهدا خواهد شد.

دو تا از برترین جوایز این رویداد به افتخار دانشمندانی است که در بالا از آن‌ها نام برده شد.
👏2
ML_Courses.pdf
78.5 KB
دکتر فرهاد پورکمالی استاد دانشگاه کلرادو، یک کتاب آنلاین با #ژوپیتر_نوت‌بوک طراحی کردند برای دوره #یادگیری_ماشین که شامل #شبکه‌‌_عصبی هم میشه.
این کتاب هم شامل روابط ریاضی است و هم کدهای برنامه نویسی.

این دوره شامل: یک شمایل کلی از #یادگیری_ماشین و الگوریتم‌های آن و البته نگاهی پایه به برنامه‌نویسی #پایتون، الگوریتم‌های یادگیری با نظارت و بدون نظارت مفاهیم ریاضی پشت هر کدام و البته ایجاد شبکه‌های عصبی MLP در کراس همراه با آموزش مقدماتی کار با کراس.



[ لینک کتاب ]
2🔥1
ULTRA
Photo
مدل LUNAR: گامی نو در پیش‌بینی بازگشت گلیوما با یادگیری عمیق چندمنبعی

در مقاله‌ای تازه منتشرشده در Nature Communications Medicine، پژوهشگران مدلی چندمنبعی با نام LUNAR معرفی کرده‌اند که با بهره‌گیری از داده‌های بالینی، جهش‌های ژنتیکی و بیان ژن‌ها، زمان بازگشت تومور مغزی گلیوما را با دقت بالا پیش‌بینی می‌کند.

دستاوردهای کلیدی:
- عملکرد قابل‌اتکا در دو پایگاه داده مستقل TCGA و GLASS با AUROC حدود 82 درصد
- تحلیل ویژگی‌های مؤثر با روش‌های قابل تفسیر
- طراحی معماری attention-based برای ترکیب داده‌های ناهمگون

روش‌های آماری و یادگیری ماشین به‌کاررفته:
- یادگیری عمیق با مکانیزم‌های توجه (Attention Mechanisms)
- تطبیق دامنه با تابع زیان CORAL Loss برای افزایش تعمیم‌پذیری
- انتخاب ویژگی با منظم‌سازی L1 Regularization
- تحلیل اهمیت ویژگی‌ها با SHAP و توجه مبتنی بر پرسش‌های یادگرفته‌شده (Learned Query Attention)
- مقایسه با مدل‌های کلاسیک مانند رگرسیون لجستیک، KNN، SVM و Xgboost.

[ مطالعه کامل مقاله ]

این پژوهش نمونه‌ای برجسته از تلفیق آمار زیستی، یادگیری ماشین و پزشکی شخصی در مسیر توسعه مدل‌های پیش‌بینی‌گر بالینی است.

واژه‌نامه:
- Attention Mechanisms: الگوریتم‌هایی که به مدل اجازه می‌دهند روی بخش‌های مهم داده تمرکز کند
- CORAL Loss: تابع زیان تطبیق هم‌پراکندگی؛ برای کاهش تفاوت آماری بین دو مجموعه داده
- L1 Regularization: روشی برای انتخاب ویژگی‌های مهم با صفر کردن ضرایب غیرضروری
- SHAP: روشی برای تحلیل سهم هر ویژگی در خروجی مدل
- Learned Query Attention: مکانیزمی برای تمرکز مدل روی اطلاعات کلیدی در داده‌های پیچیده

#معرفی_مقاله
👍1👏1
وقتی دولت با اعداد بازی می‌کند/ درآمد روزانه ۳۳۳ هزار تومان، یعنی دهک بالا و حذف یارانه!
[ لینک خبر ]

وقتی معیار حذف یارانه با آمار بازی می‌کند


وزارت رفاه اعلام کرده خانوارهایی که سرانه درآمد ماهانه بالای ۱۰ میلیون تومان بعد از کسر اجاره داشته باشند، جزو دهک‌های پردرآمد هستند و یارانه آن‌ها قطع می‌شود.

این معیار جدید با شرایطی که در سال ۱۴۰۳ از طریق منابع رسمی گزارش می‌شد، فرق دارد. طبق منابع در آن زمان، ملاک مجموع درآمد خانوار متناسب با تعداد اعضا بود. برای مثال برای یک خانوار چهار نفره، سقف درآمد حدود ۵۲ و نیم میلیون تومان تعیین شده بود.

تفاوت این دو روش باعث سردرگمی شده است. در روش جدید اگر خانواده‌ای در شهری با اجاره سنگین زندگی کند، با وجود درآمد بالا همچنان تحت فشار است اما یارانه‌اش حذف می‌شود. در حالی که خانواده‌ای با همان درآمد در شهری کوچک و بدون اجاره، شرایط بهتری دارد.

از نظر آماری، شاخص سرانه درآمد معیار دقیقی برای رفاه نیست. در سیاست‌گذاری درست باید به توزیع درآمد، نسبت هزینه مسکن به درآمد و خط فقر منطقه‌ای توجه شود.

جمع‌بندی این است که استفاده از معیارهای ساده و یک‌بعدی می‌تواند به حذف ناعادلانه یارانه منجر شود و اعتماد عمومی را کاهش دهد. سیاست‌های حمایتی نیازمند شفافیت و استفاده از شاخص‌های علمی و عادلانه هست.
👍1
امتیاز CiteScore یک شاخص مبتنی بر اسکوپوس برای سنجش تاثیر علمی مجلات است که به صورت سالانه منتشر می‌شود. این شاخص از تقسیم تعداد استنادهای دریافت‌شده به مدارک منتشرشده در یک بازه ۴ ساله به دست می‌آید. به طور مشخص:
- محاسبه: تعداد کل استنادهای دریافتی در سال‌های ۲۰۲۱ تا ۲۰۲۴ به مقالات، مرورها، مقالات کنفرانس، فصل‌های کتاب و مقالات داده‌ای منتشرشده در همان بازه (۲۰۲۱–۲۰۲۴) تقسیم بر تعداد کل این مدارک منتشرشده.
این شاخص به صورت سالانه به روز می‌شود و معیاری برای مقایسه مجلات در یک حوزه موضوعی فراهم می‌کند.
خلاصه‌ای از گزارش مجلات علوم پزشکی ایران در Scopus بر اساس CiteScore 2024
در این گزارش، ۲۰۶ مجله علوم پزشکی ایران نمایه‌شده در Scopus مورد بررسی قرار گرفته‌اند. امتیاز CiteScore، تغییرات نسبت به سال قبل، چارک مجله و درصد مقالات مورد استناد قرار گرفته از جمله معیارهای گزارش هستند.

ده مجله برتر بر اساس CiteScore 2024:

1. Asian Journal of Social Health and Behavior
ناشر: MedKnow
مقدار CiteScore در سال ۲۰۲۴: 9.7

2. Journal of Environmental Health Science and Engineering
ناشر: Springer
مقدار CiteScore در سال ۲۰۲۴: 8.2

3. International Journal of Health Policy and Management
ناشر: دانشگاه علوم پزشکی کرمان
مقدار CiteScore در سال ۲۰۲۴: 7.1
4. Advanced Pharmaceutical Bulletin
ناشر: دانشگاه علوم پزشکی تبریز
مقدار CiteScore در سال ۲۰۲۴: 6.4
5. Health Promotion Perspectives
ناشر: دانشگاه علوم پزشکی تبریز
مقدار CiteScore در سال ۲۰۲۴: 6.1
6. BioImpacts
ناشر: دانشگاه علوم پزشکی تبریز
مقدار CiteScore در سال ۲۰۲۴: 4.7
7. DARU: Journal of Pharmaceutical Sciences
ناشر: Springer –
مقدار CiteScore در سال ۲۰۲۴: 4.2
8. Iranian Journal of Basic Medical Sciences
ناشر: دانشگاه علوم پزشکی مشهد
مقدار CiteScore در سال ۲۰۲۴: 4.2
9. Avicenna Journal of Phytomedicine
ناشر: دانشگاه علوم پزشکی مشهد
مقدار CiteScore در سال ۲۰۲۴: 4.1
10. Research in Pharmaceutical Sciences
ناشر: دانشگاه علوم پزشکی اصفهان
مقدار CiteScore در سال ۲۰۲۴: 3.9

وضعیت مجلات انتشارات دانشگاه علوم پزشکی شیراز:
رتبه ۱۵: Journal of Advances in Medical Education and Professionalism
امتیاز CiteScore: 3.6
رتبه ۲۱: International Journal of Community Based Nursing and Midwifery
امتیاز CiteScore: 3.3
رتبه ۲۵: Journal of Biomedical Physics and Engineering
امتیاز CiteScore: 3
رتبه ۵۳:‌ Iranian Journal of Immunology
امتیاز CiteScore: 2.2
رتبه ۸۳: International Journal of School Health
امتیاز CiteScore: 1.4
رتبه ۸۵: International Journal of Nutrition Sciences
امتیاز CiteScore: 1.4
رتبه ۸۹: Journal of Dentistry, Shiraz University of Medical Science
امتیاز CiteScore: 1.4
رتبه ۱۲۲: Journal of Health Sciences and Surveillance System
امتیاز CiteScore: 0.9
رتبه ۱۵۰: International Journal of Organ Transplantation Medicine
امتیاز CiteScore: 0.7
رتبه ۱۶۲: Journal of Rehabilitation Sciences and Research
امتیاز CiteScore: 0.6
رتبه ۱۸۰: International Cardiovasculaire
امتیاز CiteScore: 0.4
رتبه ۲۰۵: Sadra Medical Sciences Journal
امتیاز CiteScore: 0.1
این مجلات در حوزه‌های مختلف پزشکی فعال هستند و نقش موثری در تولید علم کشور ایفا می‌کنند.
1👏1
RSF_Stats9.pdf
68.6 KB
جنگل تصادفی بقا (RSF)

مدل Random Survival Forest روشی قدرتمند و غیرپارامتری برای تحلیل داده‌های بقا با سانسور است که با گسترش ایده جنگل تصادفی، امکان پیش‌بینی زمان وقوع رویداد و شناسایی عوامل مهم را بدون نیاز به فرض‌های محدودکننده فراهم می‌کند.

در این سند، مراحل اصلی الگوریتم، مزایا، چالش‌ها و تفاوت پیاده‌سازی آن در R و Python مرور شده است.
اگر به تحلیل بقا، یادگیری ماشین و کاربردهای عملی آن در داده‌های واقعی علاقه‌مندید، این فایل می‌تواند نقطه شروعی دقیق و کاربردی برای شما باشد.

[ لینک پیاده‌سازی و کدها ]
1👍1
Suicide_Stats9.pdf
141.7 KB
چرا خودکشی به لحاظ آماری باید برای یک کشور اهمیت داشته باشد؟



در این سند مروری بر آخرین آمار ارائه شده خودکشی در ایران خواهیم داشت و اشاره‌ای کوتاه به این موضوع که اصولا چرا آمار خودکشی باید اهمیت داشته باشد، خواهیم کرد.
👍1👏1
positron_stats9.pdf
71.7 KB
معرفی Positron: محیط توسعه یکپارچه علوم داده از Posit

حدود ۱۴ سال از انتشار اولین نسخه #Rstudio و ۲ سال از تغییر نام شرکت RStudio به #Posit می‌گذرد. Posit مدت‌ها پیش نسخه‌ای سفارشی‌شده از #IDE محبوب #vscode را با نام #Positron برای تحلیل‌گران داده معرفی کرد. این ابزار با پشتیبانی یکپارچه از زبان‌های #R و #Python، مجموعه‌ای متنوع از ابزارها را برای بهبود جریان کاری علوم داده ارائه می‌دهد.

ادیتور Positron که تا پیش از این در مرحله بتا بود، اکنون در کنفرانس اخیر Posit به‌صورت نسخه نهایی و رایگان برای عموم منتشر شده است. این IDE با ویژگی‌هایی مانند اجرای خط‌به‌خط کد، پنل‌های تخصصی برای تجسم داده و ادغام هوش مصنوعی، تجربه‌ای کارآمد و مدرن را برای کاربران فراهم می‌کند.

برای دانلود و تجربه Positron، از لینک زیر بازدید کنید:

https://positron.posit.co/
👏31
ChatGptUsers_stats9.pdf
534.3 KB
بر اساس نخستین گزارش رسمی OpenAI درباره‌ی الگوهای استفاده ازChatGPT

این فایل شامل چند نمودار آماری منتخب از مطالعه‌ای است که با همکاری تیم تحقیقاتی OpenAI و دانشگاه هاروارد انجام شده است. داده‌ها حاصل تحلیل بیش از ۲/۶ میلیارد پیام روزانه از ۷۰۰ میلیون کاربر فعال در بازه‌ی ژوئن ۲۰۲۴ تا ژوئن ۲۰۲۵ هستند. برخی یافته‌های قابل توجه عبارت‌اند از:

- ۷۲/۲ درصد از پیام‌ها ماهیت غیرکاری داشته‌اند، در حالی که این نسبت در سال قبل ۵۳ درصد بوده است.

- ۴۶ درصد از کاربران در بازه‌ی سنی ۱۸ تا ۲۵ سال قرار دارند.

- استفاده از ChatGPT برای کمک در نگارش، ۲۸ درصد از کل مکالمات را شامل می‌شود و در میان کاربران شاغل در حوزه‌ی مدیریت، این نسبت به ۵۲ درصد می‌رسد.

- سهم مکالمات مرتبط با جستجوی اطلاعات از ۱۴ درصد در ژوئن ۲۰۲۴ به ۲۴/۴ درصد در ژوئن ۲۰۲۵ افزایش یافته است.

- استفاده از مدل‌های GPT برای تصمیم‌گیری و حل مسئله در محیط‌های کاری، ۱۴/۹ درصد از مکالمات کاری را تشکیل داده است.
👍1🔥1
👌1
ULTRA
Photo
وقتی #مدل‌های_آمیخته، منطق #بالینی را با عدد روایت می‌کنند

در #مطالعات_بالینی با #اندازه‌گیری‌های_مکرر، مثل بررسی فشار داخلی چشم (IOP) در بیماران تحت جراحی، استفاده از مدل‌های آمیخته خطی (LMM)‌ به ما اجازه می‌ده نا هم تغییرات درون‌فردی رو لحاظ کنیم، هم‌ روند‌های بین‌گروهی رو با دقت آماری بررسی کنیم.

در قسمتی از یک تحلیل که جدول آن در بالا آمده است، داده‌های دو گروه (درمان و کنترل) از زمان قبل از جراحی (Pre-op) تا ماه بیست و چهارم بعد از جراحی، مدل‌سازی شدن. هدف این بود که ببینیم آیا نوع جراحی تأثیر متفاوتی در کاهش فشار چشمی داشته یا نه.

(Intercept):
اشاره به میانگین پیش‌بینی شده فشار چشمی بیماران در گروه مرجع (درمان) در زمان صفر (Pre-op) دارد. باید این نکته اشاره شود که این مقدار برازش داده شده مدل است، نه مقدار ثبت شده در داده‌ها! معناداری آن اشاره به این دارد که میانگین فشار چشمی در گروه مرجع، قبل از جراحی، با صفر به لحاظ آماری اختلاف معناداری دارد و البته با توجه به این‌که به لحاظ بالینی اصولا فشار چشمی صفر هم تعریف نمی‌شود، یک امر بدیهی است.

GROUP-CONTROL = -2.3:
گروه کنترل در زمان صفر حدود ۲/۳ واحد فشار کمتر از گروه درمانی داشته، این تفاوت پایه در تحلیل با توجه به این‌که pمقدار ثبت شده برای آن در حدود سه‌صدم است، می‌تواند در سطح پنج‌صدم، به لحاظ آماری معنادار باشد. یعنی قبل از جراحی گروه کنترل به طور متوسط فشار چشم کمتری از گروه درمان داشته است.

Time = -1.67:
فشار چشم به‌طور متوسط، در گروه درمان به ازای هر مرحله زمانی، حدود ۱/۶۷ واحد کاهش یافته، این روند کاهش بسیار معنی‌دار و به لحاظ بالینی قابل توجه است با توجه به pمقدار ثبت شده آن که در حدود صفر است.

GROUP-CONTROL:Time = +1.21
ولی نکته جذاب بالینی در این‌جا این ضریب است که به ما نشان‌ می‌دهد، نوع جراحی اعمال شده برای گروه مرجع، مؤثرتر بوده است در کاهش فشار داخلی چشم بیماران. این اثر تعاملی بین گروه و زمان که در این‌جا سطح مرجع گروه درمان است، نشان می‌دهد روند کاهش فشار در گروه کنترل حدود ۱/۲۱ واحد کمتر از گروه درمانی بوده. این یعنی نوع جراحی در گروه درمانی تأثیر بیشتری در کاهش فشار چشم داشته است.

مدل‌های آمیخته می‌توانند از روش‌های کلاسیک‌تر مثل Repeated Measure Anova، در باز‌نمایی بدیهیات بالینی، با ساختارهای آماری خیلی بهتر عمل کنند. مثل انتظار کاهش فشار چشم بعد از جراحی.

در این‌جا مدل نه‌تنها کاهش فشار رو در طول زمان تأیید کرده، بلکه تفاوت روند بین دو گروه را هم به صورت عددی و معنی‌دار نشان داده است.
👏2👍1
ULTRA
Photo
مدل APW: ترکیبی از یادگیری در سطح جزء و کل

اختصار APW که از عبارت کامل Aggregated Probability Weighted گرفته شده و به معنای «مدل تجمیع شده وزنی بر پایه احتمال» می‌باشد، یک مدل مرکب برای پیش‌بینی چه از نوع کیفی و چه از نوع کمی است.
در بسیاری از مسائل یادگیری ماشین، داده‌ها به‌صورت «کیسه‌ای از نمونه‌ها گردآوری می‌شوند.
برای مثال، ممکن است هر «بیمار» (به‌عنوان یک کیسه) شامل مجموعه‌ای از «اندازه‌گیری‌های سلولی» (به‌عنوان نمونه‌ها) باشد و پاسخ نهایی تنها در سطح بیمار مشخص باشد، نه برای هر سلول.
در چنین شرایطی، مدل‌های سنتی رگرسیونی قادر به تشخیص نقش هر نمونه در پاسخ کل نیستند.
مدل APW برای حل همین مسئله طراحی شده است.


ایدهٔ اصلی مدل


مدل APW دو گام کلیدی دارد:
۱-‌ در گام نخست، با استفاده از یک مدل رگرسیون لجستیک، احتمال «اهمیت» یا «مشارکت واقعی» هر نمونه در پاسخ نهایی برآورد می‌شود (البته اخیرا از روش‌های دیگه‌ای برای وزن‌دهی به نمونه‌ها در یادگیری‌های چند نمونه‌ای استفاده می‌شود، مانند مقاله یادگیری چند نمونه‌ای عمیق بر پایه توجه که از ایده APW برای پیاده‌‌سازی یک مدل یادگیری چند‌نمونه‌ای و البته استفاده از شبکه‌های عصبی برای وزن‌دهی به نمونه‌ها بهره برده‌ است)*.

۲-‌ سپس، ویژگی‌های هر کیسه با میانگین‌گیری وزنی (بر اساس همان احتمال‌ها) تجمیع شده و وارد یک مدل رگرسیونی در سطح کل (مثلاً یک مدل خطی ساده) می‌شود.

به این ترتیب، APW ارتباط بین ساختار درونی نمونه‌ها و پاسخ نهایی را به‌طور انعطاف‌پذیر مدل می‌کند.


* Ilse, Maximilian; Tomczak, Jakub M.; Welling, Max. Attention-based Deep Multiple Instance Learning. Proceedings of the 35th International Conference on Machine Learning (ICML 2018), PMLR 80: 2127–2136
👍2👏1
ULTRA
Photo
اطلاع‌رسانی رسمی ششمین همایش ملی ریاضی و آمار

دانشگاه گنبد کاووس در بهمن‌ماه ۱۴۰۴ میزبان ششمین دوره همایش ملی ریاضی و آمار خواهد بود. این رویداد با تأییدیه رسمی ISC و حمایت علمی گروه‌های تخصصی، فرصتی ارزشمند برای ارائه دستاوردهای پژوهشی در حوزه‌های ریاضی محض، ریاضی کاربردی، آمار کلاسیک و بیزی، آموزش ریاضی و تحلیل داده‌ها فراهم می‌کند.

ارسال مقاله به‌صورت کامل یا خلاصه یک‌صفحه‌ای امکان‌پذیر است. همچنین کمیته اجرایی امکان صدور گواهی علمی پیش از برگزاری همایش را برای شرکت‌کنندگان فراهم کرده است.

مقالات منتخب در Scopus چاپ می‌شود.

اطلاعات تکمیلی، محورهای همایش، و نحوه ثبت‌نام از طریق وب‌سایت رسمی همایش در دسترس است:
www.conf.gonbad.ac.ir/msc1404
👍1👏1
StatisticsDay_Stats9.pdf
1.6 MB
به مناسبت اول آبان و روز آمار!
5👏2