انجمن علمی آمار دانشگاه گلستان
260 subscribers
581 photos
29 videos
53 files
327 links
✾ ـ﷽ـ ✾

کانال رسمی انجمن علمی آمار دانشگاه گلستان

🔷دبیر انجمن علمی آمار:

@amir_nazeriiiii

🔷روابط عمومی:

@farnazforozande

🌐لینک صفحه اینستاگرام:
https://instagram.com/statistics_golestan?igshid=NmNmNjAwNzg=
Download Telegram
♻️#رگرسیون و انواع آن♻️

شکل‌گیری و ابداع روش‌های #رگرسیونی به دهه پایانی قرن نوزدهم برمی‌گردد.
در سال ۱۸۸۶ #کارل_پیرسون توانست فرمولی برای محاسبه ضریب همبستگی ارائه دهد که علاوه بر نوآورانه بودن، مسیر جدیدی را در علم آمار فراهم کرد. این فرمول مبنای شکل‌گیری نظریه #رگرسیون regression بوده است.
اگر که فرمول #پیرسون، همبستگی بین دو متغیر را نشان می‌دهد در نظریه رگرسیون تغییرپذیری متغیر وابسته به دلیل تغییرپذیری متغیر مستقل نشان داده می‌شود. مهمترین کارکرد #رگرسیون پیش‌بینی آینده است. تحلیل مسیر یکی از تکنیک‌هائی است که بر پایه مفهوم رگرسیون توسط سول رایت در اویل قرن بیستم معرفی شد.
در پژوهش‌های #رگرسیون هدف پیش‌بینی یک یا چند متغیر وابسته (ملاک) براساس یک یا چند متغیر مستقل (پیش‌بین) است. در رگرسیون چندگانه هدف پیدا کردن متغیرهای پیش بینی است که تغییرات متغیر وابسته را چه به تنهائی و چه مشترکاً پیش بینی کند.
ورود متغیرهای مستقل در #رگرسیون به روش‌های متعددی صورت می‌گیرد. روش همزمان، روش گام به گام و روش سلسله‌مراتبی سه روش اساسی در این تکنیک است.
تحلیل مسیر یا path analysis روش آماری کاربرد ضرایب بتای استاندارد #رگرسیون چند متغیری در مدل‌های ساختاری است. هدف تحلیل مسیر به دست آوردن برآوردهای کمی روابط علّی ( همکنشی یکجانبه یا کواریته) بین مجموعه‌ای از متغیرهاست. ساختن یک مدل علّی لزوماً به معنای وجود روابط علّی در بین متغیرهای مدل نیست بلکه این علیت بر اساس مفروضات #همبستگی و نظر و پیشینه تحقیق استوار است.

🔴انواع روش #رگرسیون regression

#رگرسیون_خطی_ساده : پیش بینی یک متغیر وابسته براساس یک یا چند متغیر مستقل
#رگرسیون_چندگانه (Multiple) : پیش‌بینی یک یا چند متغیر وابسته براساس چندمتغیر مستقل

رگرسیون_چندگانه_تک_عاملی (Univariate Multiple Regression) : پیش‌بینی یک متغیر وابسته براساس چند متغیر مستقل
#رگرسیون_چندگانه چند عاملی (Multivariate Multiple Regression): پیش‌بینی چند متغیر وابسته براساس چند متغیر مستقل
👇👇👇
@gu_stat
هفته پیش رو هفته #فرد است.
👇👇👇
@gu_stat
〽️توزیع بتا〽️

#تابع_توزیع_بتا یکی از توزیع‌های احتمالی است که روی فاصله #صفر تا #یک تعریف شده است. این توزیع بخصوص در بحث مربوط به #آماره‌های_ترتیبی و توزیع آن‌ها برای #متغیرهای_تصادفی_یکنواخت اهمیت پیدا می‌کند.

🔶🔸🔸🔸کاربرد توزیع بتا🔸🔸🔸🔶

🔸در بسیاری از موارد بخصوص در #استنباط_آماری بر پایه #بیز از توزیع بتا به عنوان #توزیع_پیشین_توزیع_دوجمله‌ای برای برآورد بیزی پارامتر #احتمال_موفقیت استفاده می‌شود.

🔸کاربرد دیگر آن در #آنالیز_موجکی می باشد.

پارامترهای این توزیع با  و  به عنوان #پارامترهای_شکل مشخص می‌شود. در بسیاری از موارد که باید مقدار متغیر تصادفی در فاصله ۰ تا ۱ باشد از توزیع بتا استفاده می‌شود. البته توزیع‌های دیگری مانند #توزیع_یکنواخت در فاصله ۰ و ۱ نیز به کار می‌آیند.


@gu_stat
🔶وظایف یک کارشناس بیـمه🔶


1️⃣تحلیل اطلاعات متقاضیان بیمه – کارشناس بیمه با دریافت اطلاعات متقاضیان و بیمه گذاران، به بررسی دقیق آنها می پردازد به عنوان مثال برای شخصی که درخواست بیمه عمر می کند، به صورت دقیق سن، سوابق بیماری و وضعیت مالی فرد را بررسی می کند.

2️⃣تعیین میزان ریسک بیمه هر متقاضی بر مبنای تحلیل اطلاعات او – بیمه گر در تصمیمات خود باید منافع شرکت بیمه و بیمه گذار را در نظر بگیرد. او باید در تصمیمات خود ریسک معقولی کند. به این معنی که اگر در تعیین مقدار بیمه ریسک بالایی کرده و میزان پوشش بیمه را بالا اعلام کند، این کار ممکن است به شرکت بیمه صدمه زده و آن در آینده از عهده جبران بیمه ها بر نیاید. از طرفی اگر ریسک خیلی کمی کرده و درخواست بسیاری از متقاضیان را رد کند، شرکت بیمه با کمبود مشتری و سرمایه و در نتیجه آن با مشکلات اقتصادی روبرو خواهد شد.

3️⃣استفاده از نرم افزارهای بیمه برای انجام ارزیابی – با توجه به نفوذ کامپیوتر در بخش بیمه و تولید نرم افزارهای مرتبط با آن، کارشناس بیمه تمامی اطلاعات بدست آمده از متقاضی یا بیمه گذار را در سیستم های کامپیوتری وارد کرده و برای انجام محاسبات و ارزیابی نهایی از آن کمک می گیرد.

4️⃣ تصمیم در مورد نوع بیمه، تعیین مقدار پوشش و حق بیمه – در مرحله آخر بیمه گر پس از ارزیابی های مختلف تصمیم می گیرد که فرد متقاضی با توجه به شرایطش تا چه میزان تحت پوشش بیمه قرار می گیرد و چه میزان حق بیمه باید پرداخت کند. به عنوان مثال اگر فردی درخواست بیمه تکمیلی درمان دارد، با بررسی مشخصات و سوابق بیماری وی، کارشناس بیمه تعیین می کند تا چه سقفی شرکت بیمه هزینه های بیمارستانی و دارویی فرد را پوشش می دهد و فرد متقاضی هر ماه چه مقدار باید حق بیمه بپردازد.



#وظایف_آماری
#آمار_بیمه
#مقاله
منبع
@gu_stat
🛎️ اطلاعیه مهم اموزشی
در خصوص نیمسال دوم سال تحصیلی ۹۹-۱۳۹۸

👇👇👇
@gu_stat
🔸ضریب همبستگی پیرسون

@gu_stat
#تفاوت_آمار_پارامتریک_و_ناپارامتریک

#آمار_پارامتریک. آزمون‌های آماری با دو رویکرد کلی ساخته شده و ساخته می‌شوند. یک رویکرد این است که بر اساس توزیع‌های آماری موجود آزمون‌های آمار ساخته شوند. مثلا آزمونی بر مبنای توزیع نرمال، پواسون و ... ساخته شود. در این موارد آزمون ساخته شده در شرایطی که داده‌ها توزیع مفروض آزمون آماری را داشته باشند، نتایج دقیقی ایجاد خواهد کرد. اما در شرایطی که داده‌ها دارای توزیع مفروض نباشند، دیگر نمی‌توان بر درستی نتایج بدست آمده بوسیله آن آزمون اعتماد کرد.
به آزمون‌هایی از این جنس که بر مبنای توزیع‌های آماری ساخته می‌شوند، آزمون‌های پارامتریک می‌گویند. در کل نیز این شاخه آمار پارامتریک نام دارد.


#آمار_ناپارامتریک. رویکرد دیگر در ساخت آزمون‌های آماری این است که آزمون‌ها بر مبنای توزیع آماری خاصی ساخته نمی‌شوند. یعنی توزیع خاصی را مفروضه کار قرار نمی‌دهند و نیازی نیست که داده‌ها دارای توزیع خاصی باشند. به این نوع آزمون‌ها، آزمون‌ها ناپارامتریک یا آزاد-توزیع می‌گویند. این شاخه علم آمار نیز، آمار ناپارامتریک نام
دارد.
چه زمانی بایستی از آمار #پارامتریک و چه زمانی از آمار #ناپارامتریک استفاده کنیم؟
زمانی که از روایی و اعتبار داده‌های بدست آمده از ابزارهای اندازه‌گیری اطمینان داشته باشیم و داده‌ها دارای توزیع مفروض آزمون آماری مد نظر باشند، آنگاه مجاز به استفاده از آزمون پارامتریک مد نظر هستیم. اما زمانی که داده‌ها دارای توزیع مفروض نباشند و یا داده‌های به دست آمده بوسیله ابزار اندازه‌گیری روایی و اعتبار بالایی نداشته باشند (به صورتی که نتوان حداقل فاصله‌ای بودن مقیاس داده‌ها را تأیید کرد. نه اینکه روایی و اعتبار پایین داشته باشند) آنگاه ما مجاز به استفاده از آزمون‌ها پارامتریک نیستیم و بایستی از آزمون‌ها ناپارامتریک استفاده کنیم.


در شرایطی که از روایی و اعتبار داده‌های بدست آمده از ابزارهای اندازه‌گیری اطمینان داشته باشیم اما توزیع مفروض داده‌ها برقرار نباشد آنگاه اگر امکانش باشد که با یک تبدیل‌های غیرخطی توزیع داده‌ها را به توزیع مد نظر تبدیل کرد، در این شرایط نیز می‌توان از آزمون‌های پارامتریک استفاده کرد.
👇👇👇
@gu_stat
〽️توزیع کای۲〽️

شناخت توزیع احتمال برای پدیده‌های تصادفی، پیش‌بینی رخداد پیشامدها را امکان‌پذیر می‌سازد. یکی از توزیع‌های مهم آماری، توزیع کای۲ است که بخصوص در #آزمون_نیکویی_برازش به کار می‌رود.

▫️اولین بار این توزیع توسط دانشمند آلمانی آمار #رابرت_هلمرت در مقاله‌ای در سال 1875 معرفی شد. ولی بعدها #کارل_پیرسن از آن برای انجام آزمون‌های برازش استفاده کرد. هرچند نام کای۲  را آماردان بزرگ #رونالد_فیشر در سال ۱۹۲۰ برای آن انتخاب کرد. این توزیع را گاهی با نام‌های #کای_مربع، #خی_۲ یا #خی_اسکور نیز به کار می‌برند.

▫️این توزیع دارای یک پارامتر به نام #درجه_آزادی است که مقدار آن #مثبت است. گاهی درجه آزادی را با #df نیز نشان می‌دهند.

▫️همانطور که در نمودار دیده می‌شود، این توزیع، #نامتقارن و #چوله_به_راست است. با افزایش مقدار درجه آزادی (k)، چولگی کاهش یافته و نمودار تابع احتمال به صورت یک نمودار متقارن درخواهد آمد. همچنین با توجه به #قضیه_حد_مرکزی، می‌توان نتیجه گرفت که با افزایش k، این توزیع به سمت #نرمال میل خواهد کرد.

@gu_stat
🔶 بررسی شغل آمار زیستی در ابعاد مختلف🔶

#وظایف_آماری
#آمار_زیستی

منبع
@gu_stat
دستور آزمون های میانگین در R

@gu_stat
#ضریب_همبستگی:
#ضریب-همبستگی شاخصی است ریاضی که جهت و مقدار رابطه ی بین دو متغیر را توصیف می‌کند.
#ضریب_همبستگی درمورد توزیع های دویا چند متغیره به کار می رود.
اگر مقادیر دو متغیر شبیه هم تغییر کند یعنی با کم یا زیاد شدن یکی دیگری هم کم یا زیاد شود به گونه‌ای که بتوان رابطه آنها را به صورت یک معادله بیان کرد گوییم بین این دو متغیرهمبستگی وجود دارد. ضریب همبستگی پیرسون، #ضریب_همبستگی اسپیرمن و ضریب همبستگی تاو کندال از مهمترین روش‌های محاسبه همبستگی میان متغیرها هستند. بطور کلی:
1- اگر هر دو متغیر با مقیاس رتبه‌ای باشند از شاخص تاوکندال استفاده می‌شود.
2- اگر هر دو متغیر با مقیاس نسبتی و پیوسته باشند از #ضریب_همبستگی پیرسون استفاده می‌شود.
3- اگر هر دو متغیر با مقیاس نسبتی و گسسته باشند از #ضریب_همبستگی اسپیرمن استفاده می‌شود.
👇👇👇
@gu_stat
〽️توزیع کوشی〽️

این توزیع به افتخار دانشمند و ریاضیدان بزرگ فرانسوی، #اگوستین_کوشی نام‌گذاری شده است. او در قرن ۱۷، به بررسی توابع ریاضیاتی پرداخت که از لحاظ شکل تابعی شبیه تابع احتمال کوشی هستند.
🔸توزیع کوشی، یکی از انواع #توزیع‌_های_پایدار است که تابع چگالی احتمال آن #فرم_بسته دارد. قابل ذکر است که توزیع نرمال نیز از گروه توزیع‌های پایدار است، به این معنی که ترکیب خطی از دو متغیر تصادفی با توزیع نرمال با پارامترهای مختلف، باز هم دارای توزیع نرمال و برحسب ترکیبی از پارامترهای آن‌ها است.
در بین توزیع‌های پایدار، توزیع #نرمال، توزیع #کوشی، توزیع #هولتس_مارک و توزیع #لوی دارای فرم بسته برای تابع چگالی احتمال هستند.

🔸خصوصیات توزیع کوشی
با توجه به فرم تابع چگالی احتمال، #امید_ریاضی و #واریانس برای متغیر تصادفی با توزیع کوشی وجود ندارد. بنابراین #قضیه_حد_مرکزی را نمی‌توان برای این متغیر تصادفی به کار برد. به این معنی که مجموع n متغیر تصادفی مستقل و هم‌توزیع کوشی، نمی‌توانند برای #مقدار‌های_بزرگ_n، دارای توزیع نرمال باشد.
@gu_stat
#انتخاب_رشته_کارشناسی_ارشد
#آمار_رسمی
#وظایف_آماری

🔶آمار رسـمی 🔶

این گرایش به تازگی ایجاد شده و فعلاً فقط در دانشگاه علامه طباطبایی دانشجو می‌پذیرد. آمار رسمی در مورد اطلاعات و آماری است که توسط دولت یا مراجع ذیصلاح در چارچوب قوانین کشور تولید و منتشر می‌شوند و از آن‌ها در امور مدیریتی کشور بهره می‌گیرند. آمار رسمی بر جمع‌آوری اطلاعات و تولید اطلاعات متکی است و مواردی مثل بی‌پاسخی در آن تحلیل می‌شود.


آمارهاي رسمي، آمارهاي كه توسط نظام‌آماري كشور توليد و منتشر مي شوند.
اصول اساسي آمارهاي رسمي
اصل1 ـ ارتباط، بي‌طرفي و دسترسي برابر
اصل2 ـ موازين و اخلاق حرفه‌اي
اصل3 ـ پاسخ‌گويي و شفافيت
اصل4 ـ پيشگيري از استفاده‌ي نادرست
اصل5 ـ صرفه‌جويي
اصل6 ـ حفظ محرمانگي
اصل7 ـ قانون آمار
اصل8- هماهنگي درسطح ملي
اصل9 ـ استانداردهاي بين‌المللي
اصل10 ـ همكاري بين‌المللي

منابع:
درگاه ملی مرکز آمار ایران
فرادرس
تابع legend در نرم افزار R:
از تابع ()legend براي وارد کردن یک نوشته درقسمتی از نمودار استفاده می کنیم. در این تابع بایـد مختـصات
نقطه مورد نظر و نوشته مورد نظر را وارد کنیم.
مثال :
> x <- rnorm(30)
> hist(x)
> legend(-3,2.3,"first ")
در این تابع می توان آرگومان هایی نیز وارد کرد. برخی از این آرگومان ها به شرح زیر هستند:

=fill :
با وارد کردن نام یا شماره رنگ مربعی با آن رنگ وارد نمودار می کند.
=lty :
با وارد کردن شماره خط مورد نظر خطی با آن نوع روي نمودار رسم می کند.
=lwd :
با وارد کردن اندازه ضخامت خطی با آن ضخامت روي نمودار رسم می کند.
=pch :
با وارد کردن شماره یا کاراکتر مورد نظر آن کاراکتر را وارد نمودار می کند.


@gu_stat
❇️متغیر میانجی (M)، متغیری است که واجد شرایط زیر باشد:

1.متغیر مستقل باید همبستگی معناداری با متغیر میانجی داشته باشد.

2.متغیر میانجی باید همبستگی معناداری با متغیر وابسته داشته باشد.

3.هرگاه مسیرهای a و b کنترل شوند؛ رابطه بین متغیر مستقل و وابسته که پیشتر معنادار بوده؛ دیگر معنادار نباشد؛ ضمن اینکه هرگاه مسیر c صفر باشد؛ قوی‌ترین رابطه‌ی میانجی نمایان خواهد شد.
👇👇👇
@gu_stat
هفته پیش رو هفته #زوج است.
👇👇👇
@gu_stat
〽️توزیع فیشر〽️

▫️توزیع F یا #توزیع_فیشر_سندکور یک توزیع احتمال پیوسته است که بیشتر برای آزمون‌های فرض مربوط به #تحلیل_واریانس_ANOVA به کار می‌رود. این توزیع براساس تحقیقات #رونالد_فیشر و #جورج_سندکور ابداع و خصوصیات آن بررسی و ارائه شد.

▫️اگر X دارای توزیع F باپارامترهایd1 و d2 باشد، می‌نویسیم X∼F(d1,d2) در این حالت تابع احتمال این متغیر تصادفی X با مقدارهای #مثبت (x>0) به صورت بالا خواهد بود:
که منظور از B همان #تابع_بتا است. مقدار پارامترهای d1 و d2 نیز اغلب صحیح و نامنفی هستند. ولی در بعضی از مواقع ممکن است که به جای اعداد صحیح، پارامترهای توزیع مقدارهای حقیقی مثبت باشند. اغلب این پارامترها را #درجه_آزادی_توزیع_F می‌نامند.

▫️در تصویر بالا نمودار مربوط به تابع چگالی این توزیع ترسیم شده است. همانطور که در تصویر مشخص است تابع چگالی احتمال این متغیر تصادفی برای درجه‌های آزادی #کوچک، دارای میزان #چولگی زیادی است ولی با #افزایش_درجه آزادیd1 وd2، منحنی تابع چگالی به شکل #توزیع_نرمال با میانگین و واریانس که در بالا معرفی شده، نزدیک می‌شود.
@gu_stat