#دانستنی_آماری
مختصری از ابتدای تاريخ علم آمار
واژه آمار از كلمه لاتين Status سرچشمه گرفته است كه به معني حالت، وضع يا موقعيت مي باشد. از اين کلمه به عنوان ريشه واژه Statistics (آمار) به وجود آماده است.
با پيدايش نخستين دولتها در تاريخ، آمار پا به عرصه گذارده است. تاريخ نشان می دهد که چند هزار سال پيش از ميلاد مسيح در چين، هندوستان، مصر و ايران سرشماری نفوس و آمارگيری از اراضی و اموال و دارائی صورت می گرفته است. بديهی است که اينگونه سرشماريهاي بسيار ابتدايي كه به هيچ رو با آمار و دموگرافي امروز قياس شدني نيست، بناي آمار كنوني را پي ريزي كرده و آغاز نموده است. با ظهور سرمايه داري و گسترش تجارت، آمار در مقابل مسائل پيچيده تري قرار مي گيرد و حجم اطلاعات جمع آوري شده افزايش مي يابد و در نتيجه كارهاي آماري نيز توسعه مي يابد، بطوريكه از نظر ماهيت عميق تر، از نظر موضوع مورد مطالعه وسيع تر و از نظر وسائلي كه به كار گرفته مي شود كاملتر ميگردد.
در تحقيق هاي علمي بيش از همه اين فكر كه آمار در قرن هفدهم به خود شكل يك علم مي گيرد طرفدار پيدا كرده است. در اواسط قرن هفدهم در انگلستان ويليام پتي و جان گرانت جريان علمي را آغاز نمودند كه نام” حساب سياسي“ به خود گرفت. اين دانشمندان در برسي هاي خود از كميت هاي نسبي و متوسط استفاده مي كردند. همزمان با اين رخداد در آلمان نيز مكتب ” آمار توصيفي “ ظهور يافت. دانشمندان اين مكتب با استفاده از اعداد، دولتها و كشورها را تشريح و تفسير می نمودند. بين داشمندان دولت شناس، بيش از همه ” آخن وال“ جلب نظر ميكند. بعضي از آمار دانان وی را پدر علم آمار مي دانند.
@gu_stat
مختصری از ابتدای تاريخ علم آمار
واژه آمار از كلمه لاتين Status سرچشمه گرفته است كه به معني حالت، وضع يا موقعيت مي باشد. از اين کلمه به عنوان ريشه واژه Statistics (آمار) به وجود آماده است.
با پيدايش نخستين دولتها در تاريخ، آمار پا به عرصه گذارده است. تاريخ نشان می دهد که چند هزار سال پيش از ميلاد مسيح در چين، هندوستان، مصر و ايران سرشماری نفوس و آمارگيری از اراضی و اموال و دارائی صورت می گرفته است. بديهی است که اينگونه سرشماريهاي بسيار ابتدايي كه به هيچ رو با آمار و دموگرافي امروز قياس شدني نيست، بناي آمار كنوني را پي ريزي كرده و آغاز نموده است. با ظهور سرمايه داري و گسترش تجارت، آمار در مقابل مسائل پيچيده تري قرار مي گيرد و حجم اطلاعات جمع آوري شده افزايش مي يابد و در نتيجه كارهاي آماري نيز توسعه مي يابد، بطوريكه از نظر ماهيت عميق تر، از نظر موضوع مورد مطالعه وسيع تر و از نظر وسائلي كه به كار گرفته مي شود كاملتر ميگردد.
در تحقيق هاي علمي بيش از همه اين فكر كه آمار در قرن هفدهم به خود شكل يك علم مي گيرد طرفدار پيدا كرده است. در اواسط قرن هفدهم در انگلستان ويليام پتي و جان گرانت جريان علمي را آغاز نمودند كه نام” حساب سياسي“ به خود گرفت. اين دانشمندان در برسي هاي خود از كميت هاي نسبي و متوسط استفاده مي كردند. همزمان با اين رخداد در آلمان نيز مكتب ” آمار توصيفي “ ظهور يافت. دانشمندان اين مكتب با استفاده از اعداد، دولتها و كشورها را تشريح و تفسير می نمودند. بين داشمندان دولت شناس، بيش از همه ” آخن وال“ جلب نظر ميكند. بعضي از آمار دانان وی را پدر علم آمار مي دانند.
@gu_stat
#معرفی_دانشمند
سر رونالد المر فیشر آمارشناس و زیست شناس بزرگ متولد انگلستان بود که در سال ۱۸۹۰ در شهر لندن دیده به جهان گشود.
همواره به عنوان یکی از بزرگترین دانشمندان عصر خویش شناخته شده وبه پدر علم آمار مشهور میباشد.
سال ۱۹۰۹ تحصیلات خود را در رشتهی ریاضیات و نجوم در دانشگاه کمبریج آغاز کرد و در سال ۱۹۱۲ با شرایط نامطلوب اقتصادی و بدون حمایت مالی از دانشگاه فارغ التحصیل شد. از سال ۱۹۱۳ تا ۱۹۱۹ به تدریس ریاضیات و فیزیک در دانشگاه بردفیلد مشغول شد. او در همان سالها، با توجه به علاقهاش به زیست شناسی، مقالات متعدد میان رشتهای از جمله «همبستگی بین خویشاوندان با فرض قوانین مندل» که در آن مفهوم تحلیل واریانس (ANOVA) برای اولین بار استفاده شد را به ثبت رساند. در سال ۱۹۲۱، مفهوم درستنمایی (likelihood) را معرفی کرد. به این منظور، مقالات و کتب متعددی را نوشت که از جملهی آن ها میتوان به «روشهای آماری برای محققان»، «طراحی آزمایشات» و «جداول آماری» اشاره کرد.
ریاست دانشکدهی یوژنیک دانشگاه لندن و تدریس ژنتیک در دانشگاه کمبریج بخشی از زندگی کاری وی است.
فیشر از جانب مراکز علمی و دانشگاهی زیادی از جمله دانشگاههای هاروارد (۱۹۳۶)، کلکته (۱۹۳۸)، لندن (۱۹۴۶)، گلسگو (۱۹۴۷)، آدلاید (۱۹۵۹) و لیدز (۱۹۶۱) مورد تقدیر واقع شد.
وی در سال ۱۹۶۲، پس از سال ها تلاش بی وقفه در عرصه های مختلف علمی از جمله آمار، دار فانی را وداع گفت.
#Sir_Ronald_Aylmer_Fisher
👇👇👇
@gu_stat
سر رونالد المر فیشر آمارشناس و زیست شناس بزرگ متولد انگلستان بود که در سال ۱۸۹۰ در شهر لندن دیده به جهان گشود.
همواره به عنوان یکی از بزرگترین دانشمندان عصر خویش شناخته شده وبه پدر علم آمار مشهور میباشد.
سال ۱۹۰۹ تحصیلات خود را در رشتهی ریاضیات و نجوم در دانشگاه کمبریج آغاز کرد و در سال ۱۹۱۲ با شرایط نامطلوب اقتصادی و بدون حمایت مالی از دانشگاه فارغ التحصیل شد. از سال ۱۹۱۳ تا ۱۹۱۹ به تدریس ریاضیات و فیزیک در دانشگاه بردفیلد مشغول شد. او در همان سالها، با توجه به علاقهاش به زیست شناسی، مقالات متعدد میان رشتهای از جمله «همبستگی بین خویشاوندان با فرض قوانین مندل» که در آن مفهوم تحلیل واریانس (ANOVA) برای اولین بار استفاده شد را به ثبت رساند. در سال ۱۹۲۱، مفهوم درستنمایی (likelihood) را معرفی کرد. به این منظور، مقالات و کتب متعددی را نوشت که از جملهی آن ها میتوان به «روشهای آماری برای محققان»، «طراحی آزمایشات» و «جداول آماری» اشاره کرد.
ریاست دانشکدهی یوژنیک دانشگاه لندن و تدریس ژنتیک در دانشگاه کمبریج بخشی از زندگی کاری وی است.
فیشر از جانب مراکز علمی و دانشگاهی زیادی از جمله دانشگاههای هاروارد (۱۹۳۶)، کلکته (۱۹۳۸)، لندن (۱۹۴۶)، گلسگو (۱۹۴۷)، آدلاید (۱۹۵۹) و لیدز (۱۹۶۱) مورد تقدیر واقع شد.
وی در سال ۱۹۶۲، پس از سال ها تلاش بی وقفه در عرصه های مختلف علمی از جمله آمار، دار فانی را وداع گفت.
#Sir_Ronald_Aylmer_Fisher
👇👇👇
@gu_stat
#فراخوان📢📢
♦️انجمن علمی امار دانشگاه گلستان برگزار میکند:
🖊🖋 مسابقه طراحی لوگو✏️✏️
🖋طراحی لوگوی انجمن علمی امار دانشگاه گلستان(ویژه دانشجویانِ رشته آمار📊)
✒به اثر برتر علاوه بر ماندگار شدن اثر هدیه نفیس و ارزنده ای نیز تقدیم می شود🎁.
📅 مهلت ارسال آثار
دومِ اسفند ماه
🗓زمان اعلام نتایج
نیمه اول اسفند ماه
🎷برای شرکت در مسابقه فایل PNG اثر و شماره دانشجویی خود را به آیدی تلگرامی زیر بفرستید
@Sir_Mmadkh
@gu_stat
♦️انجمن علمی امار دانشگاه گلستان برگزار میکند:
🖊🖋 مسابقه طراحی لوگو✏️✏️
🖋طراحی لوگوی انجمن علمی امار دانشگاه گلستان(ویژه دانشجویانِ رشته آمار📊)
✒به اثر برتر علاوه بر ماندگار شدن اثر هدیه نفیس و ارزنده ای نیز تقدیم می شود🎁.
📅 مهلت ارسال آثار
دومِ اسفند ماه
🗓زمان اعلام نتایج
نیمه اول اسفند ماه
🎷برای شرکت در مسابقه فایل PNG اثر و شماره دانشجویی خود را به آیدی تلگرامی زیر بفرستید
@Sir_Mmadkh
@gu_stat
🔸داده کــــاوی🔸
#بخش_4
🔸یادگیری عمـیق🔸
یکی از معروفترین تکنیک هایی که توی Data science استفاده میشه و گل سرسبد این حوزه هست، AI (هوش مصنوعی) یا دقیقترش Machine learning و دقیقترش Deep learning هست.
به طور خلاصه، هوش مصنوعی عبارت است از شبیهسازی هوش انسان در سیستمهای کامپیوتری و نخستین بار که پژوهشها در زمینهٔ هوش مصنوعی آغاز شد، تلاش پژوهشگران بر این بود تا با توانمندسازی کامپیوترها آنها را قادر سازند تا وظایف تعریفشدهای مانند بازی کردن را انجام دهند
یک تعریف ساده از یادگیری ماشینی هم عبارت است از توانایی ماشین برای یادگیری با استفاده از مجموعهای از دادهها و عمل بر اساس آنها و نه صرفاً بر اساس قوانین تعریفشده و ثابتی که از قبل کدنویسی شدهاند. به زبان سادهتر، یادگیری ماشینی این امکان را برای ماشین (سیستم) فراهم میآورد تا خود به تنهایی بتواند چیزی را بیاموزد به طوری که در یادگیری ماشینی از قدرت پردازش کامپیوترهای مدرن به منظور تحلیل مجموعههای بزرگ دیتا استفاده میشود
درواقع Deep learning یکی از روشهای یادگیری ماشینی است که این امکان را برای یک سرویس مبتنی بر هوش مصنوعی فراهم میسازد تا هم از طریق یادگیری نظارتشده و یادگیری نظارتنشده آموزش ببیند.
🔹مثالهایی از کاربرد یادگیری عمیق🔹
⭐️الکسا، سیری یا کورتانا، دستیارهای مجازی هوشمندی هستند که از یادگیری عمیق جهت فهمیدن صحبت و زبان انسانها، وقتی با آنها در تعامل هستند استفاده میکنند.
⭐️یادگیری ماشین برای تشخیص چهره نیز استفاده میشود، اما نه الزاماً برای مسائل امنیتی. به عنوان مثال در فرآیند تگ کردن افراد روی پست های Face book، یا پرداخت مبلغ خرید هر شخص با شناسایی چهره آن در آیندهای نزدیک.
چالش مهم در این زمینه زمانی است که فرض کنید مدل مو یا ریش شخص تغییر کند. یا تصویری که گرفته شده است به دلیل نور کم محیط، کیفیت مناسبی نداشته باشد(‼️)
⭐️نتفلیکس چگونه ویدئو بعدی را به شما پیشنهاد میدهد؟ یا آمازون چطور محصولات مرتبط با سلیقهتان را به شما ارائه میکند؟ آن هم محصولاتی که به آنها احتیاج دارید ولی تا قبل از این نمیدانستید؟
🔹 5 تا از کاربردی ترین نرم افزار های یادگیری عمیق در سال 2020🔹
🔹 Neural Designer
🔹 H2O.ai
🔹 DeepLearningKit
🔹 Microsoft Cognitive Toolkit
🔹 Keras
#داده_کاوی
#مقاله
#هوش_مصنوعی
#یادگیری_عمیق
#یادگیری_ماشین
#AI #Artificial_Intelligence
#Machine_learning
#Deep_learning
منابع :
upgrad.com
aminaramesh.ir
sokanacademy.com
@gu_stat
#بخش_4
🔸یادگیری عمـیق🔸
یکی از معروفترین تکنیک هایی که توی Data science استفاده میشه و گل سرسبد این حوزه هست، AI (هوش مصنوعی) یا دقیقترش Machine learning و دقیقترش Deep learning هست.
به طور خلاصه، هوش مصنوعی عبارت است از شبیهسازی هوش انسان در سیستمهای کامپیوتری و نخستین بار که پژوهشها در زمینهٔ هوش مصنوعی آغاز شد، تلاش پژوهشگران بر این بود تا با توانمندسازی کامپیوترها آنها را قادر سازند تا وظایف تعریفشدهای مانند بازی کردن را انجام دهند
یک تعریف ساده از یادگیری ماشینی هم عبارت است از توانایی ماشین برای یادگیری با استفاده از مجموعهای از دادهها و عمل بر اساس آنها و نه صرفاً بر اساس قوانین تعریفشده و ثابتی که از قبل کدنویسی شدهاند. به زبان سادهتر، یادگیری ماشینی این امکان را برای ماشین (سیستم) فراهم میآورد تا خود به تنهایی بتواند چیزی را بیاموزد به طوری که در یادگیری ماشینی از قدرت پردازش کامپیوترهای مدرن به منظور تحلیل مجموعههای بزرگ دیتا استفاده میشود
درواقع Deep learning یکی از روشهای یادگیری ماشینی است که این امکان را برای یک سرویس مبتنی بر هوش مصنوعی فراهم میسازد تا هم از طریق یادگیری نظارتشده و یادگیری نظارتنشده آموزش ببیند.
🔹مثالهایی از کاربرد یادگیری عمیق🔹
⭐️الکسا، سیری یا کورتانا، دستیارهای مجازی هوشمندی هستند که از یادگیری عمیق جهت فهمیدن صحبت و زبان انسانها، وقتی با آنها در تعامل هستند استفاده میکنند.
⭐️یادگیری ماشین برای تشخیص چهره نیز استفاده میشود، اما نه الزاماً برای مسائل امنیتی. به عنوان مثال در فرآیند تگ کردن افراد روی پست های Face book، یا پرداخت مبلغ خرید هر شخص با شناسایی چهره آن در آیندهای نزدیک.
چالش مهم در این زمینه زمانی است که فرض کنید مدل مو یا ریش شخص تغییر کند. یا تصویری که گرفته شده است به دلیل نور کم محیط، کیفیت مناسبی نداشته باشد(‼️)
⭐️نتفلیکس چگونه ویدئو بعدی را به شما پیشنهاد میدهد؟ یا آمازون چطور محصولات مرتبط با سلیقهتان را به شما ارائه میکند؟ آن هم محصولاتی که به آنها احتیاج دارید ولی تا قبل از این نمیدانستید؟
🔹 5 تا از کاربردی ترین نرم افزار های یادگیری عمیق در سال 2020🔹
🔹 Neural Designer
🔹 H2O.ai
🔹 DeepLearningKit
🔹 Microsoft Cognitive Toolkit
🔹 Keras
#داده_کاوی
#مقاله
#هوش_مصنوعی
#یادگیری_عمیق
#یادگیری_ماشین
#AI #Artificial_Intelligence
#Machine_learning
#Deep_learning
منابع :
upgrad.com
aminaramesh.ir
sokanacademy.com
@gu_stat
#آمارریاضی
#قضیه_باسو
در بسیاری از مسایل آماری مثل نظریه برآورد و آزمون فرض ها نیاز به وجود اثبات استقلال دو آماره داریم.با استفاده از قضیه باسو بدون این که توزیع توام دو آماره محاسبه شوند٫با داشتن شرایط لازم وجود این استقلال ثابت می شود.
نتایج ساده در علم آمار که اهمیت آنها در طول زمان پایدار باشد خیلی کم هستند. قضیه باسو یکی از این استثناهاست.قضیه باسو مثل لم نیمن-پیرسن٫نامساوی کرامر-رائو و قضیه رائو بلاکول هسته اصلی استنباط آمار کلاسیک را تشکیل می دهد.این قضیه یکی از قضیه های مشهور آمار است که در سال 1955 توسط باسو اثبات شد و سال ها پس از اثباتش مشهور و کارا باقی ماند.شور و اشتیاق راجع به این قضیه و همچنین کاربردهای متنوع آن گواه این امر است.در واقع این قضیه در بیشتر کتاب های مهم استنباط آماری از جمله لهمن٫ماخوپادیای و کلا و برگر بیان شده است.قضیه باسو به صورت یک نتیجه کاملا کاربردی ظاهر می شود و این جنبه آن باعث شده که کاربردهای فراوانی در زمینه های مختلف داشته باشد.این قضیه باعث کشف ارتباط بین بسندگی٫آماره های کمکی و استقلال می شود که البته قبل از آن چنین ارتباطی تصور نمی شد.
به نظر می رسد ایده ای که باسو را به فکر مطرح کردن این قضیه انداخت به شرح زیر باشد:
(چنانچه آماره بسنده ای٫کامل باشد علاوه بر داشتن همه اطلاعات لازم درباره پارامتر هیچ اطلاع بیشتری درباره آن ندارد.پس چنین آماره ای نمی تواند ارتباطی با یک آماره کمکی که شامل هیچ اطلاعی در باره پارامتر نیست (چون توزیع آن پارامتر بستگی ندارد)داشته باشد.از این رو طبیعی به نظر می رسد که هر آماره کمکی مستقل از آماره بسنده کامل باشد).
@gu_stat
#قضیه_باسو
در بسیاری از مسایل آماری مثل نظریه برآورد و آزمون فرض ها نیاز به وجود اثبات استقلال دو آماره داریم.با استفاده از قضیه باسو بدون این که توزیع توام دو آماره محاسبه شوند٫با داشتن شرایط لازم وجود این استقلال ثابت می شود.
نتایج ساده در علم آمار که اهمیت آنها در طول زمان پایدار باشد خیلی کم هستند. قضیه باسو یکی از این استثناهاست.قضیه باسو مثل لم نیمن-پیرسن٫نامساوی کرامر-رائو و قضیه رائو بلاکول هسته اصلی استنباط آمار کلاسیک را تشکیل می دهد.این قضیه یکی از قضیه های مشهور آمار است که در سال 1955 توسط باسو اثبات شد و سال ها پس از اثباتش مشهور و کارا باقی ماند.شور و اشتیاق راجع به این قضیه و همچنین کاربردهای متنوع آن گواه این امر است.در واقع این قضیه در بیشتر کتاب های مهم استنباط آماری از جمله لهمن٫ماخوپادیای و کلا و برگر بیان شده است.قضیه باسو به صورت یک نتیجه کاملا کاربردی ظاهر می شود و این جنبه آن باعث شده که کاربردهای فراوانی در زمینه های مختلف داشته باشد.این قضیه باعث کشف ارتباط بین بسندگی٫آماره های کمکی و استقلال می شود که البته قبل از آن چنین ارتباطی تصور نمی شد.
به نظر می رسد ایده ای که باسو را به فکر مطرح کردن این قضیه انداخت به شرح زیر باشد:
(چنانچه آماره بسنده ای٫کامل باشد علاوه بر داشتن همه اطلاعات لازم درباره پارامتر هیچ اطلاع بیشتری درباره آن ندارد.پس چنین آماره ای نمی تواند ارتباطی با یک آماره کمکی که شامل هیچ اطلاعی در باره پارامتر نیست (چون توزیع آن پارامتر بستگی ندارد)داشته باشد.از این رو طبیعی به نظر می رسد که هر آماره کمکی مستقل از آماره بسنده کامل باشد).
@gu_stat
〽️آزمایش برنولی〽️
#آزمایش_تصادفی که فقط #دو_مقدار داشته باشد و نتایج آن از قبل قابل پیشبینی باشد، یک «آزمایش برنولی» است. معمولا نتایج #آزمایش_برنولی را با «موفقیت»یا «شکست» مشخص میکنند.
برای مثال پرتاب یک سکه به منظور مشاهده شیر، یک آزمایش برنولی است. زیرا اگر #موفقیت را مشاهده شیر و #شکست را مشاهده خط در نظر بگیریم، نتایج این آزمایش تصادفی، فقط دو مقدار موفقیت یا شکست را خواهد داشت.
یکی از شرایط مهم آزمایش برنولی،#ثابت_بودن احتمال موفقیت یا شکست است. به این معنی که با تکرار این آزمایش در شرایط یکسان، احتمال موفقیت تغییر نمیکند. باید توجه داشت که این تکرارها باید #مستقل از یکدیگر باشند.
نام برنولی برای این نوع آزمایش براساس نام ریاضیدان سوئیسی #جاکوب_برنولی که در این زمینه تحقیقات زیادی داشته، انتخاب شده است.
♦️کابردهای متغیر تصادفی برنولی♦️
اغلب از متغیر و توزیع برنولی در #علوم_پزشکی استفاده میکنند تا وضعیت #سالم یا #ناسالم بودن فرد را نشان دهند. در #رگرسیون_لجستیک از توزیع برنولی برای #مدلسازی وقوع بیماری استفاده میشود. همچنین براساس مجموع چند متغیر تصادفی برنولی مستقل و با پارامتر یکسان،
میتوان متغیر تصادفی #دو_جملهای ایجاد کرد.
@gu_stat
#آزمایش_تصادفی که فقط #دو_مقدار داشته باشد و نتایج آن از قبل قابل پیشبینی باشد، یک «آزمایش برنولی» است. معمولا نتایج #آزمایش_برنولی را با «موفقیت»یا «شکست» مشخص میکنند.
برای مثال پرتاب یک سکه به منظور مشاهده شیر، یک آزمایش برنولی است. زیرا اگر #موفقیت را مشاهده شیر و #شکست را مشاهده خط در نظر بگیریم، نتایج این آزمایش تصادفی، فقط دو مقدار موفقیت یا شکست را خواهد داشت.
یکی از شرایط مهم آزمایش برنولی،#ثابت_بودن احتمال موفقیت یا شکست است. به این معنی که با تکرار این آزمایش در شرایط یکسان، احتمال موفقیت تغییر نمیکند. باید توجه داشت که این تکرارها باید #مستقل از یکدیگر باشند.
نام برنولی برای این نوع آزمایش براساس نام ریاضیدان سوئیسی #جاکوب_برنولی که در این زمینه تحقیقات زیادی داشته، انتخاب شده است.
♦️کابردهای متغیر تصادفی برنولی♦️
اغلب از متغیر و توزیع برنولی در #علوم_پزشکی استفاده میکنند تا وضعیت #سالم یا #ناسالم بودن فرد را نشان دهند. در #رگرسیون_لجستیک از توزیع برنولی برای #مدلسازی وقوع بیماری استفاده میشود. همچنین براساس مجموع چند متغیر تصادفی برنولی مستقل و با پارامتر یکسان،
میتوان متغیر تصادفی #دو_جملهای ایجاد کرد.
@gu_stat
Media is too big
VIEW IN TELEGRAM
🔸How to Become a Data Analyst in 2020🔸
🔸چطور در سال 2020 تبدیل به یک تحلیلگر داده شویم؟🔸
#بخش_1
🔹تحلیلگر داده کیست؟
🔹چه کار میکند؟
🔹چقدر حقوق میگیرد؟
🔹چه مهارت ها و چه پیشینه ای نیاز دارد؟
#تحلیلگر_داده
#آنالیز_داده
منبع:
365 Data Science
@gu_stat
🔸چطور در سال 2020 تبدیل به یک تحلیلگر داده شویم؟🔸
#بخش_1
🔹تحلیلگر داده کیست؟
🔹چه کار میکند؟
🔹چقدر حقوق میگیرد؟
🔹چه مهارت ها و چه پیشینه ای نیاز دارد؟
#تحلیلگر_داده
#آنالیز_داده
منبع:
365 Data Science
@gu_stat
#دانستنی_آماری
#کاربرد_رگرسیون
مدل های رگرسیون برای مقاصد چند مشتمل برموارد زیر مورد استفاده قرار میگیرند:
1) توصیف داده ها
2) برآورد پارامترها
3) پیشگویی و برآورد
4) کنترل
مهندسین و دانشمندان برای خلاصه کردن و توصیف مجموعه ای از داده ها مکرراً از معادلات استفاده میکنند. تحلیل رگرسیونی برای گسترش چنین معادلاتی مؤثر و کمک کننده میباشد. گاهی اوقات مسائل برآورد پارامترها میتواند از طریق روش های رگرسیونی حل شوند.
از کاربردهای دیگر رگرسیون پیشگویی متغیر پاسخ است. پیش بینی ها ممکن است درطراحی عملیات مربوطه به تحویل همچون تنظیم و تهیه برنامه یا ارزیابی به انجام رساندن عملیات تحویل مفید واقع شود. هنگامی که مدل رگرسیونی برای پیش گویی بکار میرود خطرات برون بینی ناشی از مدل یا خطای معادله مورد بحث قرار گرفته است. درحالی که حتی وقتی که مشکل مدل دقیق است برآورد ضعیف پارامترهای مدل هنوزممکن است موجب ضعف پیشگویی دراجرا شود.
مدل های رگرسیونی ممکن است به منظور کنترل نیز مورد استفاده قرارگیرند. وقتی که یک معادله رگرسیونی برای اهداف و مقاصد کنترل بکار میرود نکتۀ مهم این است که متغیرها به طوراتفاقی با هم ارتباط داشته باشند. باید توجه داشته باشیم هنگامی که معادله فقط برای پیش بینی بکارمیرود ممکن است یک رابطه علت و معلولی لازم نباشد. دراین حالت تنها لازم است که رابطه ای که در داده ها برای ساختن معادله رگرسیون وجود داشت هنوز اعتبار داشته باشد.
@gu_stat
#کاربرد_رگرسیون
مدل های رگرسیون برای مقاصد چند مشتمل برموارد زیر مورد استفاده قرار میگیرند:
1) توصیف داده ها
2) برآورد پارامترها
3) پیشگویی و برآورد
4) کنترل
مهندسین و دانشمندان برای خلاصه کردن و توصیف مجموعه ای از داده ها مکرراً از معادلات استفاده میکنند. تحلیل رگرسیونی برای گسترش چنین معادلاتی مؤثر و کمک کننده میباشد. گاهی اوقات مسائل برآورد پارامترها میتواند از طریق روش های رگرسیونی حل شوند.
از کاربردهای دیگر رگرسیون پیشگویی متغیر پاسخ است. پیش بینی ها ممکن است درطراحی عملیات مربوطه به تحویل همچون تنظیم و تهیه برنامه یا ارزیابی به انجام رساندن عملیات تحویل مفید واقع شود. هنگامی که مدل رگرسیونی برای پیش گویی بکار میرود خطرات برون بینی ناشی از مدل یا خطای معادله مورد بحث قرار گرفته است. درحالی که حتی وقتی که مشکل مدل دقیق است برآورد ضعیف پارامترهای مدل هنوزممکن است موجب ضعف پیشگویی دراجرا شود.
مدل های رگرسیونی ممکن است به منظور کنترل نیز مورد استفاده قرارگیرند. وقتی که یک معادله رگرسیونی برای اهداف و مقاصد کنترل بکار میرود نکتۀ مهم این است که متغیرها به طوراتفاقی با هم ارتباط داشته باشند. باید توجه داشته باشیم هنگامی که معادله فقط برای پیش بینی بکارمیرود ممکن است یک رابطه علت و معلولی لازم نباشد. دراین حالت تنها لازم است که رابطه ای که در داده ها برای ساختن معادله رگرسیون وجود داشت هنوز اعتبار داشته باشد.
@gu_stat
❇️ چگونه شکل بالا را در R رسم کنیم؟!
library(ggplot2)
df <- data.frame(x=1, y=1)
for (i in 2:180)
{df[i,1]<-df[i-1,1]-sin((i%%4)*3*pi/2-ceiling((i-1)/4)*pi/90)*.977^i
df[i,2]<-df[i-1,2]+cos((i%%4)*3*pi/2-ceiling((i-1)/4)*pi/90)*.977^i}
ggplot(df,aes(x,y))+geom_polygon()+coord_fixed()+theme_void()
توجه:
🔴ابتدا بسته ی ggplot2 را دانلود نمایید.
#R
👇👇👇
@gu_stat
library(ggplot2)
df <- data.frame(x=1, y=1)
for (i in 2:180)
{df[i,1]<-df[i-1,1]-sin((i%%4)*3*pi/2-ceiling((i-1)/4)*pi/90)*.977^i
df[i,2]<-df[i-1,2]+cos((i%%4)*3*pi/2-ceiling((i-1)/4)*pi/90)*.977^i}
ggplot(df,aes(x,y))+geom_polygon()+coord_fixed()+theme_void()
توجه:
🔴ابتدا بسته ی ggplot2 را دانلود نمایید.
#R
👇👇👇
@gu_stat
〽️توزیع دوجمله ای〽️
#متغیر_تصادفی_دوجملهای مرتبط با #آزمایش_تصادفی_برنولی است. اگر یک آزمایش برنولی با #پارامتر_ثابت_p را n بار بطور #مستقل #تکرار کنید، جمع متغیرهای تصادفی برنولی ایجاد شده، یک متغیر تصادفی با توزیع دو جملهای را میسازد.از آنجایی که ضرایب بسط دو جمله ای a+b)^n)که به #ضرایب_خیام_پاسکال نیز مشهور است، با تابع احتمال این متغیر تصادفی مرتبط است، نام این نوع متغیر تصادفی، دو جملهای انتخاب شده.
از متغیرتصادفی و توزیع دوجملهای برای #مدلسازی تعداد موفقیتها در nبار #نمونهگیری_باجایگذاری از جمعیت با حجم N بهره گرفته میشود.
زیرا اگر نمونهگیری #بدون_جایگذاری باشد، احتمال موفقیت در هر نوبت از نمونهگیری #متفاوت خواهد بود و تعداد موفقیتها دارای توزیع #فوقهندسی خواهند شد.
برای مثال اگر یک سکه نااریب را ۱۰ بار پرتاب کنیم، تعداد شیرهای مشاهده شده دارای توزیع دو جملهای با پارامترهای ۱۰ و ۱/۲ است.
توزیع دوجملهای نوعی توزیع پرکاربرد در #آمار، #اقتصاد، و #علوم_تجربی است.
@gu_stat
#متغیر_تصادفی_دوجملهای مرتبط با #آزمایش_تصادفی_برنولی است. اگر یک آزمایش برنولی با #پارامتر_ثابت_p را n بار بطور #مستقل #تکرار کنید، جمع متغیرهای تصادفی برنولی ایجاد شده، یک متغیر تصادفی با توزیع دو جملهای را میسازد.از آنجایی که ضرایب بسط دو جمله ای a+b)^n)که به #ضرایب_خیام_پاسکال نیز مشهور است، با تابع احتمال این متغیر تصادفی مرتبط است، نام این نوع متغیر تصادفی، دو جملهای انتخاب شده.
از متغیرتصادفی و توزیع دوجملهای برای #مدلسازی تعداد موفقیتها در nبار #نمونهگیری_باجایگذاری از جمعیت با حجم N بهره گرفته میشود.
زیرا اگر نمونهگیری #بدون_جایگذاری باشد، احتمال موفقیت در هر نوبت از نمونهگیری #متفاوت خواهد بود و تعداد موفقیتها دارای توزیع #فوقهندسی خواهند شد.
برای مثال اگر یک سکه نااریب را ۱۰ بار پرتاب کنیم، تعداد شیرهای مشاهده شده دارای توزیع دو جملهای با پارامترهای ۱۰ و ۱/۲ است.
توزیع دوجملهای نوعی توزیع پرکاربرد در #آمار، #اقتصاد، و #علوم_تجربی است.
@gu_stat