♻️#رگرسیون و انواع آن♻️
شکلگیری و ابداع روشهای #رگرسیونی به دهه پایانی قرن نوزدهم برمیگردد.
در سال ۱۸۸۶ #کارل_پیرسون توانست فرمولی برای محاسبه ضریب همبستگی ارائه دهد که علاوه بر نوآورانه بودن، مسیر جدیدی را در علم آمار فراهم کرد. این فرمول مبنای شکلگیری نظریه #رگرسیون regression بوده است.
اگر که فرمول #پیرسون، همبستگی بین دو متغیر را نشان میدهد در نظریه رگرسیون تغییرپذیری متغیر وابسته به دلیل تغییرپذیری متغیر مستقل نشان داده میشود. مهمترین کارکرد #رگرسیون پیشبینی آینده است. تحلیل مسیر یکی از تکنیکهائی است که بر پایه مفهوم رگرسیون توسط سول رایت در اویل قرن بیستم معرفی شد.
در پژوهشهای #رگرسیون هدف پیشبینی یک یا چند متغیر وابسته (ملاک) براساس یک یا چند متغیر مستقل (پیشبین) است. در رگرسیون چندگانه هدف پیدا کردن متغیرهای پیش بینی است که تغییرات متغیر وابسته را چه به تنهائی و چه مشترکاً پیش بینی کند.
ورود متغیرهای مستقل در #رگرسیون به روشهای متعددی صورت میگیرد. روش همزمان، روش گام به گام و روش سلسلهمراتبی سه روش اساسی در این تکنیک است.
تحلیل مسیر یا path analysis روش آماری کاربرد ضرایب بتای استاندارد #رگرسیون چند متغیری در مدلهای ساختاری است. هدف تحلیل مسیر به دست آوردن برآوردهای کمی روابط علّی ( همکنشی یکجانبه یا کواریته) بین مجموعهای از متغیرهاست. ساختن یک مدل علّی لزوماً به معنای وجود روابط علّی در بین متغیرهای مدل نیست بلکه این علیت بر اساس مفروضات #همبستگی و نظر و پیشینه تحقیق استوار است.
🔴انواع روش #رگرسیون regression
#رگرسیون_خطی_ساده : پیش بینی یک متغیر وابسته براساس یک یا چند متغیر مستقل
#رگرسیون_چندگانه (Multiple) : پیشبینی یک یا چند متغیر وابسته براساس چندمتغیر مستقل
رگرسیون_چندگانه_تک_عاملی (Univariate Multiple Regression) : پیشبینی یک متغیر وابسته براساس چند متغیر مستقل
#رگرسیون_چندگانه چند عاملی (Multivariate Multiple Regression): پیشبینی چند متغیر وابسته براساس چند متغیر مستقل
👇👇👇
@gu_stat
شکلگیری و ابداع روشهای #رگرسیونی به دهه پایانی قرن نوزدهم برمیگردد.
در سال ۱۸۸۶ #کارل_پیرسون توانست فرمولی برای محاسبه ضریب همبستگی ارائه دهد که علاوه بر نوآورانه بودن، مسیر جدیدی را در علم آمار فراهم کرد. این فرمول مبنای شکلگیری نظریه #رگرسیون regression بوده است.
اگر که فرمول #پیرسون، همبستگی بین دو متغیر را نشان میدهد در نظریه رگرسیون تغییرپذیری متغیر وابسته به دلیل تغییرپذیری متغیر مستقل نشان داده میشود. مهمترین کارکرد #رگرسیون پیشبینی آینده است. تحلیل مسیر یکی از تکنیکهائی است که بر پایه مفهوم رگرسیون توسط سول رایت در اویل قرن بیستم معرفی شد.
در پژوهشهای #رگرسیون هدف پیشبینی یک یا چند متغیر وابسته (ملاک) براساس یک یا چند متغیر مستقل (پیشبین) است. در رگرسیون چندگانه هدف پیدا کردن متغیرهای پیش بینی است که تغییرات متغیر وابسته را چه به تنهائی و چه مشترکاً پیش بینی کند.
ورود متغیرهای مستقل در #رگرسیون به روشهای متعددی صورت میگیرد. روش همزمان، روش گام به گام و روش سلسلهمراتبی سه روش اساسی در این تکنیک است.
تحلیل مسیر یا path analysis روش آماری کاربرد ضرایب بتای استاندارد #رگرسیون چند متغیری در مدلهای ساختاری است. هدف تحلیل مسیر به دست آوردن برآوردهای کمی روابط علّی ( همکنشی یکجانبه یا کواریته) بین مجموعهای از متغیرهاست. ساختن یک مدل علّی لزوماً به معنای وجود روابط علّی در بین متغیرهای مدل نیست بلکه این علیت بر اساس مفروضات #همبستگی و نظر و پیشینه تحقیق استوار است.
🔴انواع روش #رگرسیون regression
#رگرسیون_خطی_ساده : پیش بینی یک متغیر وابسته براساس یک یا چند متغیر مستقل
#رگرسیون_چندگانه (Multiple) : پیشبینی یک یا چند متغیر وابسته براساس چندمتغیر مستقل
رگرسیون_چندگانه_تک_عاملی (Univariate Multiple Regression) : پیشبینی یک متغیر وابسته براساس چند متغیر مستقل
#رگرسیون_چندگانه چند عاملی (Multivariate Multiple Regression): پیشبینی چند متغیر وابسته براساس چند متغیر مستقل
👇👇👇
@gu_stat
〽️توزیع بتا〽️
#تابع_توزیع_بتا یکی از توزیعهای احتمالی است که روی فاصله #صفر تا #یک تعریف شده است. این توزیع بخصوص در بحث مربوط به #آمارههای_ترتیبی و توزیع آنها برای #متغیرهای_تصادفی_یکنواخت اهمیت پیدا میکند.
🔶🔸🔸🔸کاربرد توزیع بتا🔸🔸🔸🔶
🔸در بسیاری از موارد بخصوص در #استنباط_آماری بر پایه #بیز از توزیع بتا به عنوان #توزیع_پیشین_توزیع_دوجملهای برای برآورد بیزی پارامتر #احتمال_موفقیت استفاده میشود.
🔸کاربرد دیگر آن در #آنالیز_موجکی می باشد.
پارامترهای این توزیع با #α و #β به عنوان #پارامترهای_شکل مشخص میشود. در بسیاری از موارد که باید مقدار متغیر تصادفی در فاصله ۰ تا ۱ باشد از توزیع بتا استفاده میشود. البته توزیعهای دیگری مانند #توزیع_یکنواخت در فاصله ۰ و ۱ نیز به کار میآیند.
@gu_stat
#تابع_توزیع_بتا یکی از توزیعهای احتمالی است که روی فاصله #صفر تا #یک تعریف شده است. این توزیع بخصوص در بحث مربوط به #آمارههای_ترتیبی و توزیع آنها برای #متغیرهای_تصادفی_یکنواخت اهمیت پیدا میکند.
🔶🔸🔸🔸کاربرد توزیع بتا🔸🔸🔸🔶
🔸در بسیاری از موارد بخصوص در #استنباط_آماری بر پایه #بیز از توزیع بتا به عنوان #توزیع_پیشین_توزیع_دوجملهای برای برآورد بیزی پارامتر #احتمال_موفقیت استفاده میشود.
🔸کاربرد دیگر آن در #آنالیز_موجکی می باشد.
پارامترهای این توزیع با #α و #β به عنوان #پارامترهای_شکل مشخص میشود. در بسیاری از موارد که باید مقدار متغیر تصادفی در فاصله ۰ تا ۱ باشد از توزیع بتا استفاده میشود. البته توزیعهای دیگری مانند #توزیع_یکنواخت در فاصله ۰ و ۱ نیز به کار میآیند.
@gu_stat
🔶وظایف یک کارشناس بیـمه🔶
1️⃣تحلیل اطلاعات متقاضیان بیمه – کارشناس بیمه با دریافت اطلاعات متقاضیان و بیمه گذاران، به بررسی دقیق آنها می پردازد به عنوان مثال برای شخصی که درخواست بیمه عمر می کند، به صورت دقیق سن، سوابق بیماری و وضعیت مالی فرد را بررسی می کند.
2️⃣تعیین میزان ریسک بیمه هر متقاضی بر مبنای تحلیل اطلاعات او – بیمه گر در تصمیمات خود باید منافع شرکت بیمه و بیمه گذار را در نظر بگیرد. او باید در تصمیمات خود ریسک معقولی کند. به این معنی که اگر در تعیین مقدار بیمه ریسک بالایی کرده و میزان پوشش بیمه را بالا اعلام کند، این کار ممکن است به شرکت بیمه صدمه زده و آن در آینده از عهده جبران بیمه ها بر نیاید. از طرفی اگر ریسک خیلی کمی کرده و درخواست بسیاری از متقاضیان را رد کند، شرکت بیمه با کمبود مشتری و سرمایه و در نتیجه آن با مشکلات اقتصادی روبرو خواهد شد.
3️⃣استفاده از نرم افزارهای بیمه برای انجام ارزیابی – با توجه به نفوذ کامپیوتر در بخش بیمه و تولید نرم افزارهای مرتبط با آن، کارشناس بیمه تمامی اطلاعات بدست آمده از متقاضی یا بیمه گذار را در سیستم های کامپیوتری وارد کرده و برای انجام محاسبات و ارزیابی نهایی از آن کمک می گیرد.
4️⃣ تصمیم در مورد نوع بیمه، تعیین مقدار پوشش و حق بیمه – در مرحله آخر بیمه گر پس از ارزیابی های مختلف تصمیم می گیرد که فرد متقاضی با توجه به شرایطش تا چه میزان تحت پوشش بیمه قرار می گیرد و چه میزان حق بیمه باید پرداخت کند. به عنوان مثال اگر فردی درخواست بیمه تکمیلی درمان دارد، با بررسی مشخصات و سوابق بیماری وی، کارشناس بیمه تعیین می کند تا چه سقفی شرکت بیمه هزینه های بیمارستانی و دارویی فرد را پوشش می دهد و فرد متقاضی هر ماه چه مقدار باید حق بیمه بپردازد.
#وظایف_آماری
#آمار_بیمه
#مقاله
منبع
@gu_stat
1️⃣تحلیل اطلاعات متقاضیان بیمه – کارشناس بیمه با دریافت اطلاعات متقاضیان و بیمه گذاران، به بررسی دقیق آنها می پردازد به عنوان مثال برای شخصی که درخواست بیمه عمر می کند، به صورت دقیق سن، سوابق بیماری و وضعیت مالی فرد را بررسی می کند.
2️⃣تعیین میزان ریسک بیمه هر متقاضی بر مبنای تحلیل اطلاعات او – بیمه گر در تصمیمات خود باید منافع شرکت بیمه و بیمه گذار را در نظر بگیرد. او باید در تصمیمات خود ریسک معقولی کند. به این معنی که اگر در تعیین مقدار بیمه ریسک بالایی کرده و میزان پوشش بیمه را بالا اعلام کند، این کار ممکن است به شرکت بیمه صدمه زده و آن در آینده از عهده جبران بیمه ها بر نیاید. از طرفی اگر ریسک خیلی کمی کرده و درخواست بسیاری از متقاضیان را رد کند، شرکت بیمه با کمبود مشتری و سرمایه و در نتیجه آن با مشکلات اقتصادی روبرو خواهد شد.
3️⃣استفاده از نرم افزارهای بیمه برای انجام ارزیابی – با توجه به نفوذ کامپیوتر در بخش بیمه و تولید نرم افزارهای مرتبط با آن، کارشناس بیمه تمامی اطلاعات بدست آمده از متقاضی یا بیمه گذار را در سیستم های کامپیوتری وارد کرده و برای انجام محاسبات و ارزیابی نهایی از آن کمک می گیرد.
4️⃣ تصمیم در مورد نوع بیمه، تعیین مقدار پوشش و حق بیمه – در مرحله آخر بیمه گر پس از ارزیابی های مختلف تصمیم می گیرد که فرد متقاضی با توجه به شرایطش تا چه میزان تحت پوشش بیمه قرار می گیرد و چه میزان حق بیمه باید پرداخت کند. به عنوان مثال اگر فردی درخواست بیمه تکمیلی درمان دارد، با بررسی مشخصات و سوابق بیماری وی، کارشناس بیمه تعیین می کند تا چه سقفی شرکت بیمه هزینه های بیمارستانی و دارویی فرد را پوشش می دهد و فرد متقاضی هر ماه چه مقدار باید حق بیمه بپردازد.
#وظایف_آماری
#آمار_بیمه
#مقاله
منبع
@gu_stat
#تفاوت_آمار_پارامتریک_و_ناپارامتریک
✅#آمار_پارامتریک. آزمونهای آماری با دو رویکرد کلی ساخته شده و ساخته میشوند. یک رویکرد این است که بر اساس توزیعهای آماری موجود آزمونهای آمار ساخته شوند. مثلا آزمونی بر مبنای توزیع نرمال، پواسون و ... ساخته شود. در این موارد آزمون ساخته شده در شرایطی که دادهها توزیع مفروض آزمون آماری را داشته باشند، نتایج دقیقی ایجاد خواهد کرد. اما در شرایطی که دادهها دارای توزیع مفروض نباشند، دیگر نمیتوان بر درستی نتایج بدست آمده بوسیله آن آزمون اعتماد کرد.
به آزمونهایی از این جنس که بر مبنای توزیعهای آماری ساخته میشوند، آزمونهای پارامتریک میگویند. در کل نیز این شاخه آمار پارامتریک نام دارد.
✅ #آمار_ناپارامتریک. رویکرد دیگر در ساخت آزمونهای آماری این است که آزمونها بر مبنای توزیع آماری خاصی ساخته نمیشوند. یعنی توزیع خاصی را مفروضه کار قرار نمیدهند و نیازی نیست که دادهها دارای توزیع خاصی باشند. به این نوع آزمونها، آزمونها ناپارامتریک یا آزاد-توزیع میگویند. این شاخه علم آمار نیز، آمار ناپارامتریک نام
دارد.
✅ چه زمانی بایستی از آمار #پارامتریک و چه زمانی از آمار #ناپارامتریک استفاده کنیم؟
زمانی که از روایی و اعتبار دادههای بدست آمده از ابزارهای اندازهگیری اطمینان داشته باشیم و دادهها دارای توزیع مفروض آزمون آماری مد نظر باشند، آنگاه مجاز به استفاده از آزمون پارامتریک مد نظر هستیم. اما زمانی که دادهها دارای توزیع مفروض نباشند و یا دادههای به دست آمده بوسیله ابزار اندازهگیری روایی و اعتبار بالایی نداشته باشند (به صورتی که نتوان حداقل فاصلهای بودن مقیاس دادهها را تأیید کرد. نه اینکه روایی و اعتبار پایین داشته باشند) آنگاه ما مجاز به استفاده از آزمونها پارامتریک نیستیم و بایستی از آزمونها ناپارامتریک استفاده کنیم.
✅ در شرایطی که از روایی و اعتبار دادههای بدست آمده از ابزارهای اندازهگیری اطمینان داشته باشیم اما توزیع مفروض دادهها برقرار نباشد آنگاه اگر امکانش باشد که با یک تبدیلهای غیرخطی توزیع دادهها را به توزیع مد نظر تبدیل کرد، در این شرایط نیز میتوان از آزمونهای پارامتریک استفاده کرد.
👇👇👇
@gu_stat
✅#آمار_پارامتریک. آزمونهای آماری با دو رویکرد کلی ساخته شده و ساخته میشوند. یک رویکرد این است که بر اساس توزیعهای آماری موجود آزمونهای آمار ساخته شوند. مثلا آزمونی بر مبنای توزیع نرمال، پواسون و ... ساخته شود. در این موارد آزمون ساخته شده در شرایطی که دادهها توزیع مفروض آزمون آماری را داشته باشند، نتایج دقیقی ایجاد خواهد کرد. اما در شرایطی که دادهها دارای توزیع مفروض نباشند، دیگر نمیتوان بر درستی نتایج بدست آمده بوسیله آن آزمون اعتماد کرد.
به آزمونهایی از این جنس که بر مبنای توزیعهای آماری ساخته میشوند، آزمونهای پارامتریک میگویند. در کل نیز این شاخه آمار پارامتریک نام دارد.
✅ #آمار_ناپارامتریک. رویکرد دیگر در ساخت آزمونهای آماری این است که آزمونها بر مبنای توزیع آماری خاصی ساخته نمیشوند. یعنی توزیع خاصی را مفروضه کار قرار نمیدهند و نیازی نیست که دادهها دارای توزیع خاصی باشند. به این نوع آزمونها، آزمونها ناپارامتریک یا آزاد-توزیع میگویند. این شاخه علم آمار نیز، آمار ناپارامتریک نام
دارد.
✅ چه زمانی بایستی از آمار #پارامتریک و چه زمانی از آمار #ناپارامتریک استفاده کنیم؟
زمانی که از روایی و اعتبار دادههای بدست آمده از ابزارهای اندازهگیری اطمینان داشته باشیم و دادهها دارای توزیع مفروض آزمون آماری مد نظر باشند، آنگاه مجاز به استفاده از آزمون پارامتریک مد نظر هستیم. اما زمانی که دادهها دارای توزیع مفروض نباشند و یا دادههای به دست آمده بوسیله ابزار اندازهگیری روایی و اعتبار بالایی نداشته باشند (به صورتی که نتوان حداقل فاصلهای بودن مقیاس دادهها را تأیید کرد. نه اینکه روایی و اعتبار پایین داشته باشند) آنگاه ما مجاز به استفاده از آزمونها پارامتریک نیستیم و بایستی از آزمونها ناپارامتریک استفاده کنیم.
✅ در شرایطی که از روایی و اعتبار دادههای بدست آمده از ابزارهای اندازهگیری اطمینان داشته باشیم اما توزیع مفروض دادهها برقرار نباشد آنگاه اگر امکانش باشد که با یک تبدیلهای غیرخطی توزیع دادهها را به توزیع مد نظر تبدیل کرد، در این شرایط نیز میتوان از آزمونهای پارامتریک استفاده کرد.
👇👇👇
@gu_stat
〽️توزیع کای۲〽️
شناخت توزیع احتمال برای پدیدههای تصادفی، پیشبینی رخداد پیشامدها را امکانپذیر میسازد. یکی از توزیعهای مهم آماری، توزیع کای۲ است که بخصوص در #آزمون_نیکویی_برازش به کار میرود.
▫️اولین بار این توزیع توسط دانشمند آلمانی آمار #رابرت_هلمرت در مقالهای در سال 1875 معرفی شد. ولی بعدها #کارل_پیرسن از آن برای انجام آزمونهای برازش استفاده کرد. هرچند نام کای۲ را آماردان بزرگ #رونالد_فیشر در سال ۱۹۲۰ برای آن انتخاب کرد. این توزیع را گاهی با نامهای #کای_مربع، #خی_۲ یا #خی_اسکور نیز به کار میبرند.
▫️این توزیع دارای یک پارامتر به نام #درجه_آزادی است که مقدار آن #مثبت است. گاهی درجه آزادی را با #df نیز نشان میدهند.
▫️همانطور که در نمودار دیده میشود، این توزیع، #نامتقارن و #چوله_به_راست است. با افزایش مقدار درجه آزادی (k)، چولگی کاهش یافته و نمودار تابع احتمال به صورت یک نمودار متقارن درخواهد آمد. همچنین با توجه به #قضیه_حد_مرکزی، میتوان نتیجه گرفت که با افزایش k، این توزیع به سمت #نرمال میل خواهد کرد.
@gu_stat
شناخت توزیع احتمال برای پدیدههای تصادفی، پیشبینی رخداد پیشامدها را امکانپذیر میسازد. یکی از توزیعهای مهم آماری، توزیع کای۲ است که بخصوص در #آزمون_نیکویی_برازش به کار میرود.
▫️اولین بار این توزیع توسط دانشمند آلمانی آمار #رابرت_هلمرت در مقالهای در سال 1875 معرفی شد. ولی بعدها #کارل_پیرسن از آن برای انجام آزمونهای برازش استفاده کرد. هرچند نام کای۲ را آماردان بزرگ #رونالد_فیشر در سال ۱۹۲۰ برای آن انتخاب کرد. این توزیع را گاهی با نامهای #کای_مربع، #خی_۲ یا #خی_اسکور نیز به کار میبرند.
▫️این توزیع دارای یک پارامتر به نام #درجه_آزادی است که مقدار آن #مثبت است. گاهی درجه آزادی را با #df نیز نشان میدهند.
▫️همانطور که در نمودار دیده میشود، این توزیع، #نامتقارن و #چوله_به_راست است. با افزایش مقدار درجه آزادی (k)، چولگی کاهش یافته و نمودار تابع احتمال به صورت یک نمودار متقارن درخواهد آمد. همچنین با توجه به #قضیه_حد_مرکزی، میتوان نتیجه گرفت که با افزایش k، این توزیع به سمت #نرمال میل خواهد کرد.
@gu_stat
#ضریب_همبستگی:
#ضریب-همبستگی شاخصی است ریاضی که جهت و مقدار رابطه ی بین دو متغیر را توصیف میکند.
#ضریب_همبستگی درمورد توزیع های دویا چند متغیره به کار می رود.
اگر مقادیر دو متغیر شبیه هم تغییر کند یعنی با کم یا زیاد شدن یکی دیگری هم کم یا زیاد شود به گونهای که بتوان رابطه آنها را به صورت یک معادله بیان کرد گوییم بین این دو متغیرهمبستگی وجود دارد. ضریب همبستگی پیرسون، #ضریب_همبستگی اسپیرمن و ضریب همبستگی تاو کندال از مهمترین روشهای محاسبه همبستگی میان متغیرها هستند. بطور کلی:
1- اگر هر دو متغیر با مقیاس رتبهای باشند از شاخص تاوکندال استفاده میشود.
2- اگر هر دو متغیر با مقیاس نسبتی و پیوسته باشند از #ضریب_همبستگی پیرسون استفاده میشود.
3- اگر هر دو متغیر با مقیاس نسبتی و گسسته باشند از #ضریب_همبستگی اسپیرمن استفاده میشود.
👇👇👇
@gu_stat
#ضریب-همبستگی شاخصی است ریاضی که جهت و مقدار رابطه ی بین دو متغیر را توصیف میکند.
#ضریب_همبستگی درمورد توزیع های دویا چند متغیره به کار می رود.
اگر مقادیر دو متغیر شبیه هم تغییر کند یعنی با کم یا زیاد شدن یکی دیگری هم کم یا زیاد شود به گونهای که بتوان رابطه آنها را به صورت یک معادله بیان کرد گوییم بین این دو متغیرهمبستگی وجود دارد. ضریب همبستگی پیرسون، #ضریب_همبستگی اسپیرمن و ضریب همبستگی تاو کندال از مهمترین روشهای محاسبه همبستگی میان متغیرها هستند. بطور کلی:
1- اگر هر دو متغیر با مقیاس رتبهای باشند از شاخص تاوکندال استفاده میشود.
2- اگر هر دو متغیر با مقیاس نسبتی و پیوسته باشند از #ضریب_همبستگی پیرسون استفاده میشود.
3- اگر هر دو متغیر با مقیاس نسبتی و گسسته باشند از #ضریب_همبستگی اسپیرمن استفاده میشود.
👇👇👇
@gu_stat
〽️توزیع کوشی〽️
این توزیع به افتخار دانشمند و ریاضیدان بزرگ فرانسوی، #اگوستین_کوشی نامگذاری شده است. او در قرن ۱۷، به بررسی توابع ریاضیاتی پرداخت که از لحاظ شکل تابعی شبیه تابع احتمال کوشی هستند.
🔸توزیع کوشی، یکی از انواع #توزیع_های_پایدار است که تابع چگالی احتمال آن #فرم_بسته دارد. قابل ذکر است که توزیع نرمال نیز از گروه توزیعهای پایدار است، به این معنی که ترکیب خطی از دو متغیر تصادفی با توزیع نرمال با پارامترهای مختلف، باز هم دارای توزیع نرمال و برحسب ترکیبی از پارامترهای آنها است.
در بین توزیعهای پایدار، توزیع #نرمال، توزیع #کوشی، توزیع #هولتس_مارک و توزیع #لوی دارای فرم بسته برای تابع چگالی احتمال هستند.
🔸خصوصیات توزیع کوشی
با توجه به فرم تابع چگالی احتمال، #امید_ریاضی و #واریانس برای متغیر تصادفی با توزیع کوشی وجود ندارد. بنابراین #قضیه_حد_مرکزی را نمیتوان برای این متغیر تصادفی به کار برد. به این معنی که مجموع n متغیر تصادفی مستقل و همتوزیع کوشی، نمیتوانند برای #مقدارهای_بزرگ_n، دارای توزیع نرمال باشد.
@gu_stat
این توزیع به افتخار دانشمند و ریاضیدان بزرگ فرانسوی، #اگوستین_کوشی نامگذاری شده است. او در قرن ۱۷، به بررسی توابع ریاضیاتی پرداخت که از لحاظ شکل تابعی شبیه تابع احتمال کوشی هستند.
🔸توزیع کوشی، یکی از انواع #توزیع_های_پایدار است که تابع چگالی احتمال آن #فرم_بسته دارد. قابل ذکر است که توزیع نرمال نیز از گروه توزیعهای پایدار است، به این معنی که ترکیب خطی از دو متغیر تصادفی با توزیع نرمال با پارامترهای مختلف، باز هم دارای توزیع نرمال و برحسب ترکیبی از پارامترهای آنها است.
در بین توزیعهای پایدار، توزیع #نرمال، توزیع #کوشی، توزیع #هولتس_مارک و توزیع #لوی دارای فرم بسته برای تابع چگالی احتمال هستند.
🔸خصوصیات توزیع کوشی
با توجه به فرم تابع چگالی احتمال، #امید_ریاضی و #واریانس برای متغیر تصادفی با توزیع کوشی وجود ندارد. بنابراین #قضیه_حد_مرکزی را نمیتوان برای این متغیر تصادفی به کار برد. به این معنی که مجموع n متغیر تصادفی مستقل و همتوزیع کوشی، نمیتوانند برای #مقدارهای_بزرگ_n، دارای توزیع نرمال باشد.
@gu_stat
#انتخاب_رشته_کارشناسی_ارشد
#آمار_رسمی
#وظایف_آماری
🔶آمار رسـمی 🔶
این گرایش به تازگی ایجاد شده و فعلاً فقط در دانشگاه علامه طباطبایی دانشجو میپذیرد. آمار رسمی در مورد اطلاعات و آماری است که توسط دولت یا مراجع ذیصلاح در چارچوب قوانین کشور تولید و منتشر میشوند و از آنها در امور مدیریتی کشور بهره میگیرند. آمار رسمی بر جمعآوری اطلاعات و تولید اطلاعات متکی است و مواردی مثل بیپاسخی در آن تحلیل میشود.
آمارهاي رسمي، آمارهاي كه توسط نظامآماري كشور توليد و منتشر مي شوند.
اصول اساسي آمارهاي رسمي
اصل1 ـ ارتباط، بيطرفي و دسترسي برابر
اصل2 ـ موازين و اخلاق حرفهاي
اصل3 ـ پاسخگويي و شفافيت
اصل4 ـ پيشگيري از استفادهي نادرست
اصل5 ـ صرفهجويي
اصل6 ـ حفظ محرمانگي
اصل7 ـ قانون آمار
اصل8- هماهنگي درسطح ملي
اصل9 ـ استانداردهاي بينالمللي
اصل10 ـ همكاري بينالمللي
منابع:
درگاه ملی مرکز آمار ایران
فرادرس
#آمار_رسمی
#وظایف_آماری
🔶آمار رسـمی 🔶
این گرایش به تازگی ایجاد شده و فعلاً فقط در دانشگاه علامه طباطبایی دانشجو میپذیرد. آمار رسمی در مورد اطلاعات و آماری است که توسط دولت یا مراجع ذیصلاح در چارچوب قوانین کشور تولید و منتشر میشوند و از آنها در امور مدیریتی کشور بهره میگیرند. آمار رسمی بر جمعآوری اطلاعات و تولید اطلاعات متکی است و مواردی مثل بیپاسخی در آن تحلیل میشود.
آمارهاي رسمي، آمارهاي كه توسط نظامآماري كشور توليد و منتشر مي شوند.
اصول اساسي آمارهاي رسمي
اصل1 ـ ارتباط، بيطرفي و دسترسي برابر
اصل2 ـ موازين و اخلاق حرفهاي
اصل3 ـ پاسخگويي و شفافيت
اصل4 ـ پيشگيري از استفادهي نادرست
اصل5 ـ صرفهجويي
اصل6 ـ حفظ محرمانگي
اصل7 ـ قانون آمار
اصل8- هماهنگي درسطح ملي
اصل9 ـ استانداردهاي بينالمللي
اصل10 ـ همكاري بينالمللي
منابع:
درگاه ملی مرکز آمار ایران
فرادرس
تابع legend در نرم افزار R:
از تابع ()legend براي وارد کردن یک نوشته درقسمتی از نمودار استفاده می کنیم. در این تابع بایـد مختـصات
نقطه مورد نظر و نوشته مورد نظر را وارد کنیم.
مثال :
> x <- rnorm(30)
> hist(x)
> legend(-3,2.3,"first ")
در این تابع می توان آرگومان هایی نیز وارد کرد. برخی از این آرگومان ها به شرح زیر هستند:
=fill :
با وارد کردن نام یا شماره رنگ مربعی با آن رنگ وارد نمودار می کند.
=lty :
با وارد کردن شماره خط مورد نظر خطی با آن نوع روي نمودار رسم می کند.
=lwd :
با وارد کردن اندازه ضخامت خطی با آن ضخامت روي نمودار رسم می کند.
=pch :
با وارد کردن شماره یا کاراکتر مورد نظر آن کاراکتر را وارد نمودار می کند.
@gu_stat
از تابع ()legend براي وارد کردن یک نوشته درقسمتی از نمودار استفاده می کنیم. در این تابع بایـد مختـصات
نقطه مورد نظر و نوشته مورد نظر را وارد کنیم.
مثال :
> x <- rnorm(30)
> hist(x)
> legend(-3,2.3,"first ")
در این تابع می توان آرگومان هایی نیز وارد کرد. برخی از این آرگومان ها به شرح زیر هستند:
=fill :
با وارد کردن نام یا شماره رنگ مربعی با آن رنگ وارد نمودار می کند.
=lty :
با وارد کردن شماره خط مورد نظر خطی با آن نوع روي نمودار رسم می کند.
=lwd :
با وارد کردن اندازه ضخامت خطی با آن ضخامت روي نمودار رسم می کند.
=pch :
با وارد کردن شماره یا کاراکتر مورد نظر آن کاراکتر را وارد نمودار می کند.
@gu_stat
❇️متغیر میانجی (M)، متغیری است که واجد شرایط زیر باشد:
1.متغیر مستقل باید همبستگی معناداری با متغیر میانجی داشته باشد.
2.متغیر میانجی باید همبستگی معناداری با متغیر وابسته داشته باشد.
3.هرگاه مسیرهای a و b کنترل شوند؛ رابطه بین متغیر مستقل و وابسته که پیشتر معنادار بوده؛ دیگر معنادار نباشد؛ ضمن اینکه هرگاه مسیر c صفر باشد؛ قویترین رابطهی میانجی نمایان خواهد شد.
👇👇👇
@gu_stat
1.متغیر مستقل باید همبستگی معناداری با متغیر میانجی داشته باشد.
2.متغیر میانجی باید همبستگی معناداری با متغیر وابسته داشته باشد.
3.هرگاه مسیرهای a و b کنترل شوند؛ رابطه بین متغیر مستقل و وابسته که پیشتر معنادار بوده؛ دیگر معنادار نباشد؛ ضمن اینکه هرگاه مسیر c صفر باشد؛ قویترین رابطهی میانجی نمایان خواهد شد.
👇👇👇
@gu_stat
〽️توزیع فیشر〽️
▫️توزیع F یا #توزیع_فیشر_سندکور یک توزیع احتمال پیوسته است که بیشتر برای آزمونهای فرض مربوط به #تحلیل_واریانس_ANOVA به کار میرود. این توزیع براساس تحقیقات #رونالد_فیشر و #جورج_سندکور ابداع و خصوصیات آن بررسی و ارائه شد.
▫️اگر X دارای توزیع F باپارامترهایd1 و d2 باشد، مینویسیم X∼F(d1,d2) در این حالت تابع احتمال این متغیر تصادفی X با مقدارهای #مثبت (x>0) به صورت بالا خواهد بود:
که منظور از B همان #تابع_بتا است. مقدار پارامترهای d1 و d2 نیز اغلب صحیح و نامنفی هستند. ولی در بعضی از مواقع ممکن است که به جای اعداد صحیح، پارامترهای توزیع مقدارهای حقیقی مثبت باشند. اغلب این پارامترها را #درجه_آزادی_توزیع_F مینامند.
▫️در تصویر بالا نمودار مربوط به تابع چگالی این توزیع ترسیم شده است. همانطور که در تصویر مشخص است تابع چگالی احتمال این متغیر تصادفی برای درجههای آزادی #کوچک، دارای میزان #چولگی زیادی است ولی با #افزایش_درجه آزادیd1 وd2، منحنی تابع چگالی به شکل #توزیع_نرمال با میانگین و واریانس که در بالا معرفی شده، نزدیک میشود.
@gu_stat
▫️توزیع F یا #توزیع_فیشر_سندکور یک توزیع احتمال پیوسته است که بیشتر برای آزمونهای فرض مربوط به #تحلیل_واریانس_ANOVA به کار میرود. این توزیع براساس تحقیقات #رونالد_فیشر و #جورج_سندکور ابداع و خصوصیات آن بررسی و ارائه شد.
▫️اگر X دارای توزیع F باپارامترهایd1 و d2 باشد، مینویسیم X∼F(d1,d2) در این حالت تابع احتمال این متغیر تصادفی X با مقدارهای #مثبت (x>0) به صورت بالا خواهد بود:
که منظور از B همان #تابع_بتا است. مقدار پارامترهای d1 و d2 نیز اغلب صحیح و نامنفی هستند. ولی در بعضی از مواقع ممکن است که به جای اعداد صحیح، پارامترهای توزیع مقدارهای حقیقی مثبت باشند. اغلب این پارامترها را #درجه_آزادی_توزیع_F مینامند.
▫️در تصویر بالا نمودار مربوط به تابع چگالی این توزیع ترسیم شده است. همانطور که در تصویر مشخص است تابع چگالی احتمال این متغیر تصادفی برای درجههای آزادی #کوچک، دارای میزان #چولگی زیادی است ولی با #افزایش_درجه آزادیd1 وd2، منحنی تابع چگالی به شکل #توزیع_نرمال با میانگین و واریانس که در بالا معرفی شده، نزدیک میشود.
@gu_stat