Знайдзі расіста з дапамогай статыстыкі і філасофіі навукі
#statistics
Даследаванне пра расавую дыскрымінацыю ў амерыканскай судовай сістэме. Дадзеныя пра 1116 суддзяў і 380000 прысудаў. Замяраецца тое, колькі год у сярэднім атрымліваюць чорныя, белыя, лацінасы і іншыя. Аналіз кантралюецца на тып злачынства, крымінальную гісторыю падсудных і іншыя фактары, якія могуць уплываць на прысуд.
Праз гэты аналіз знайшлі самых расісцкіх суддзяў - тых, хто выносіць больш жорсткія прысуды чорным ці лацінасам, але не белым. Напрыклад, у цябе было 100 чорных, 40 з іх ты апраўдаў. А са 100 белых, якія ў цябе былі, ты апраўдаў 60. Выбарка вялікая, вынік падазроны, вынік кансістэнтны з дэфініцыяй расізму. А значыць ты расіст. Гучыць лагічна.
Цяпер сачыце за рукамі. Дакладней, рукамі падлічваць мне лянота, таму я проста напісаў сімуляцыю: 1116 суддзяў, у кожнага па 380000/1116 спраў, палова падсудных - чорныя, палова - белыя. Шанец вынесці апраўдальны прысуд заўсёды 50%. Максімальная роўнасць. Таксама прыкруціў ім рандомны генератар імёнаў (інакш неяк непрыгожа).
Атрымаў наступных таварышаў:
Abeyta, Jazmin: 35.3% апраўдальных прысудаў чорным супраць 54% белым
al-Soliman, Mawdood: 38.2% супраць 55.8%
Houge, Charrdonnay: 40.1% супраць 57%
І г.д.
Што гэта значыць? Гэта значыць, што інтэрпрэтацыя дадзеных крытычна залежыць ад гіпотэзы, якую мы правяраем, ад пытання, якое мы задаём.
Калі правяраць гіпотэзу “сярод нас ёсць суддзі-расісты, хто яны?” (“сярод 1116 манет ёсць падкручаная манета, якая з іх?”), натуральна, што Jazmin, Mawdood і Charrdonnay - першыя кандыдаты на тое, каб быць названымі расістамі.
Калі правяраць гіпотэзу “ці ёсць сярод нас суддзі-расісты?” (“ці ёсць сярод 1116 манет падкручаная?”), дадзеныя абсалютна кансістэнтныя з тым, што ў кожнай манеты 50% шанец выпасці на любы бок. Проста калі падкінуць 1116 манет па 340 разоў кожную, рана ці позна мы пабачым анамальныя вынікі.
Паперу яны па выніку перапісалі, адзін з аўтараў нават выдаліў твітэр.
#statistics
Даследаванне пра расавую дыскрымінацыю ў амерыканскай судовай сістэме. Дадзеныя пра 1116 суддзяў і 380000 прысудаў. Замяраецца тое, колькі год у сярэднім атрымліваюць чорныя, белыя, лацінасы і іншыя. Аналіз кантралюецца на тып злачынства, крымінальную гісторыю падсудных і іншыя фактары, якія могуць уплываць на прысуд.
Праз гэты аналіз знайшлі самых расісцкіх суддзяў - тых, хто выносіць больш жорсткія прысуды чорным ці лацінасам, але не белым. Напрыклад, у цябе было 100 чорных, 40 з іх ты апраўдаў. А са 100 белых, якія ў цябе былі, ты апраўдаў 60. Выбарка вялікая, вынік падазроны, вынік кансістэнтны з дэфініцыяй расізму. А значыць ты расіст. Гучыць лагічна.
Цяпер сачыце за рукамі. Дакладней, рукамі падлічваць мне лянота, таму я проста напісаў сімуляцыю: 1116 суддзяў, у кожнага па 380000/1116 спраў, палова падсудных - чорныя, палова - белыя. Шанец вынесці апраўдальны прысуд заўсёды 50%. Максімальная роўнасць. Таксама прыкруціў ім рандомны генератар імёнаў (інакш неяк непрыгожа).
Атрымаў наступных таварышаў:
Abeyta, Jazmin: 35.3% апраўдальных прысудаў чорным супраць 54% белым
al-Soliman, Mawdood: 38.2% супраць 55.8%
Houge, Charrdonnay: 40.1% супраць 57%
І г.д.
Што гэта значыць? Гэта значыць, што інтэрпрэтацыя дадзеных крытычна залежыць ад гіпотэзы, якую мы правяраем, ад пытання, якое мы задаём.
Калі правяраць гіпотэзу “сярод нас ёсць суддзі-расісты, хто яны?” (“сярод 1116 манет ёсць падкручаная манета, якая з іх?”), натуральна, што Jazmin, Mawdood і Charrdonnay - першыя кандыдаты на тое, каб быць названымі расістамі.
Калі правяраць гіпотэзу “ці ёсць сярод нас суддзі-расісты?” (“ці ёсць сярод 1116 манет падкручаная?”), дадзеныя абсалютна кансістэнтныя з тым, што ў кожнай манеты 50% шанец выпасці на любы бок. Проста калі падкінуць 1116 манет па 340 разоў кожную, рана ці позна мы пабачым анамальныя вынікі.
Паперу яны па выніку перапісалі, адзін з аўтараў нават выдаліў твітэр.
Самы расісцкі суддзя таксама не сышоў непакараны. На ягонай старонцы ў вікі (https://en.wikipedia.org/w/index.php?title=C._Darnell_Jones_II&oldid=1036140457) пэўны час была інфармацыя, што ён - самы расісцкі суддзя ў адпаведнасці з навукай. Прычым, у дачыненні да чорных. Выглядае ён вось так. Памятайце: trust the science!
#everyday #finance
Час ад часу чую, што мае калегі, знаёмыя ці знаёмыя знаёмых займаюцца тым, што называецца active trading ці там day trading - набываюць, прадаюць, сочаць за рынкамі ўсялякай крыпты, акцый, валют і іншага, з надзеяй зарабіць бабло.
Мне, канешне, зрабілася цікавым, наколькі гэта асэнсаваная актыўнасць.
Я знайшоў дзве паперы: адна аналізуе дадзеныя з тайваньскай фондавай біржы за 1992 - 2006. Другая аналізуе дадзеныя з бразільскага “Comissão de Valores Mobiliários” за 2012-2017. Абедзве паперы добрыя тым, што стараюцца паглядзець на індывідуальных трэйдараў на доўгай дыстанцыі, каб зразумець, ці існуюць сістэматычна добрыя стратэгіі, навыкі і г.д.
У першай паперы знайшлі, што менш 1% трэйдараў прадказальна і надзейна зарабляюць на доўгай дыстанцыі. Другая папера знайшла, што толькі 1.1% зарабляе больш, чым мінімальны заробак у Бразіліі. Самы паспяховы трэйдар зарабляў у сярэднім 310$ у дзень, са стандартнай дэвіяцыяй у 2.560$. Ну, тобок - заробак добрага праграміста ў беларускім айці + гіганцкія рызыкі.
Дарэчы, існуе даволі папулярны канал пра фінансы з кантэнтам пра Беларусь і месцамі па-беларуску. Натуральна, не магу не падзяліцца
Час ад часу чую, што мае калегі, знаёмыя ці знаёмыя знаёмых займаюцца тым, што называецца active trading ці там day trading - набываюць, прадаюць, сочаць за рынкамі ўсялякай крыпты, акцый, валют і іншага, з надзеяй зарабіць бабло.
Мне, канешне, зрабілася цікавым, наколькі гэта асэнсаваная актыўнасць.
Я знайшоў дзве паперы: адна аналізуе дадзеныя з тайваньскай фондавай біржы за 1992 - 2006. Другая аналізуе дадзеныя з бразільскага “Comissão de Valores Mobiliários” за 2012-2017. Абедзве паперы добрыя тым, што стараюцца паглядзець на індывідуальных трэйдараў на доўгай дыстанцыі, каб зразумець, ці існуюць сістэматычна добрыя стратэгіі, навыкі і г.д.
У першай паперы знайшлі, што менш 1% трэйдараў прадказальна і надзейна зарабляюць на доўгай дыстанцыі. Другая папера знайшла, што толькі 1.1% зарабляе больш, чым мінімальны заробак у Бразіліі. Самы паспяховы трэйдар зарабляў у сярэднім 310$ у дзень, са стандартнай дэвіяцыяй у 2.560$. Ну, тобок - заробак добрага праграміста ў беларускім айці + гіганцкія рызыкі.
Дарэчы, існуе даволі папулярны канал пра фінансы з кантэнтам пра Беларусь і месцамі па-беларуску. Натуральна, не магу не падзяліцца
#science
Псіхалогія - дысцыпліна правальная, у якой большасць (60-80%, у залежнасці ад таго, як лічыць) даследаванняў не праходзяць незалежную праверку. Я прыводзіў некалькі прыкладаў.
Тут зрабілі спіс вядомых і папулярных тэорый, эксперыментаў, даследаванняў, якія не прайшлі незалежную праверку. Ліст вельмі доўгі, я сканцэнтруюся на тым, што яны пазначаюць як “no good evidence” - адсутнасць добрых доказаў:
• “Стэнфардскі (турэмны) эксперымент” і ўсе ягоныя высновы. Калі сказаць адным, што яны цяпер назіральнікі, яны не пачнуць хутка здзекавацца над тымі, каму сказалі быць вязнямі
• “Эксперымент Мілгрэма”. Калі навуковец у белым халаце будзе казаць людзям біць іншых людзей токам, людзі звычайна гэтага не робяць
• Не, ураганы, якія называюцца жаночымі імёнамі, не забіваюць больш людзей, бо людзі менш баяцца жанчын
• Не выглядае, што сіла волі абмежаваная ў тым сэнсе, што і фізіялагічныя магчымасці чалавека - людзі не стамляюцца ад таго, што практыкуюць сілу волі, гэта не рэсурс
• Эфекту Даннінга — Кругера таксама верагодна не існуе. Хвіліна маўчання па тых, хто вакол гэтага мема пабудаваў сабе ідэнтычнасць
• “Множны інтэлект”, як набор статыстычна незалежных "інтэлектаў", напрыклад “эмацыйны інтэлект” vs той інтэлект, які мераецца тэстамі IQ
• Гены якія “адказваюць” за дэпрэсію. Пераправерка 18 даследаванняў з генамі-кандыдатамі паказала 0 станоўчых рэзультатаў
Псіхалогія - дысцыпліна правальная, у якой большасць (60-80%, у залежнасці ад таго, як лічыць) даследаванняў не праходзяць незалежную праверку. Я прыводзіў некалькі прыкладаў.
Тут зрабілі спіс вядомых і папулярных тэорый, эксперыментаў, даследаванняў, якія не прайшлі незалежную праверку. Ліст вельмі доўгі, я сканцэнтруюся на тым, што яны пазначаюць як “no good evidence” - адсутнасць добрых доказаў:
• “Стэнфардскі (турэмны) эксперымент” і ўсе ягоныя высновы. Калі сказаць адным, што яны цяпер назіральнікі, яны не пачнуць хутка здзекавацца над тымі, каму сказалі быць вязнямі
• “Эксперымент Мілгрэма”. Калі навуковец у белым халаце будзе казаць людзям біць іншых людзей токам, людзі звычайна гэтага не робяць
• Не, ураганы, якія называюцца жаночымі імёнамі, не забіваюць больш людзей, бо людзі менш баяцца жанчын
• Не выглядае, што сіла волі абмежаваная ў тым сэнсе, што і фізіялагічныя магчымасці чалавека - людзі не стамляюцца ад таго, што практыкуюць сілу волі, гэта не рэсурс
• Эфекту Даннінга — Кругера таксама верагодна не існуе. Хвіліна маўчання па тых, хто вакол гэтага мема пабудаваў сабе ідэнтычнасць
• “Множны інтэлект”, як набор статыстычна незалежных "інтэлектаў", напрыклад “эмацыйны інтэлект” vs той інтэлект, які мераецца тэстамі IQ
• Гены якія “адказваюць” за дэпрэсію. Пераправерка 18 даследаванняў з генамі-кандыдатамі паказала 0 станоўчых рэзультатаў
Wikipedia
Replication crisis
The replication crisis is an ongoing methodological crisis in which the results of many scientific studies are difficult or impossible to reproduce. Because the reproducibility of empirical results is an essential part of the scientific method, such failures…
#war #statistics
Часта чую аргумент, што апытанням у расіі наконт вайны давяраць нельга, бо людзі баяцца ўдзельнічаць у гульнях сацыёлагаў.
Аргумент будуецца наступным чынам: пасля пачатку вайны растуць рэпрэсіі -> нават вайну нельга называць вайной -> людзі, якія не падтрымліваюць пуцінскі рэжым, залягаюць на дно = рост падтрымкі пуціна і вайны, які мы бачыў у апытаннях, выкліканы структурным скосам выбаркі - там засталіся толькі ватнікі і пуцінойды
Левада вырашыла праверыць гэта простым спосабам: 1) узялі людзей, якія праходзілі іхнія апытанні ў 2021 2) падзялілі іх на групы ў залежнасці ад таго, падтрымлівалі яны тады пуціна ці не 3) праверылі, ці можна да іх датэлефанавацца ў 2022 і правесці з імі апытанне.
Адказ: Падтрымліваў ты пуціна ў 2021 ці не - верагоднасць прайсці апытанне аднолькавая. Тобок, ніякіх структурных скосаў выбаркі не назіраецца. Тобок, расіяне падтрымліваюць вайну і пуціна.
Часта чую аргумент, што апытанням у расіі наконт вайны давяраць нельга, бо людзі баяцца ўдзельнічаць у гульнях сацыёлагаў.
Аргумент будуецца наступным чынам: пасля пачатку вайны растуць рэпрэсіі -> нават вайну нельга называць вайной -> людзі, якія не падтрымліваюць пуцінскі рэжым, залягаюць на дно = рост падтрымкі пуціна і вайны, які мы бачыў у апытаннях, выкліканы структурным скосам выбаркі - там засталіся толькі ватнікі і пуцінойды
Левада вырашыла праверыць гэта простым спосабам: 1) узялі людзей, якія праходзілі іхнія апытанні ў 2021 2) падзялілі іх на групы ў залежнасці ад таго, падтрымлівалі яны тады пуціна ці не 3) праверылі, ці можна да іх датэлефанавацца ў 2022 і правесці з імі апытанне.
Адказ: Падтрымліваў ты пуціна ў 2021 ці не - верагоднасць прайсці апытанне аднолькавая. Тобок, ніякіх структурных скосаў выбаркі не назіраецца. Тобок, расіяне падтрымліваюць вайну і пуціна.
*Насамрэч, выбаркі там не такія вялікія, хацелася б больш. Але дастатковыя, каб сказаць "гіпотэза пра страх не мае эмпірычнай падтрымкі"
**Пра гэта яшчэ 2 месяцы таму пісаў беларускі сацыёлаг Філіп Біканаў. Пост занадта вялікі, каб прымацаваць скрыншотам, таму прыйдзецца вам ісці на фб і чытаць
**Пра гэта яшчэ 2 месяцы таму пісаў беларускі сацыёлаг Філіп Біканаў. Пост занадта вялікі, каб прымацаваць скрыншотам, таму прыйдзецца вам ісці на фб і чытаць
#machinelearning #visualization
Падзялюся з вамі візуалізацыяй таго, як працуе машыннае навучанне ака Machine Learning. Перыядычна ёй з усімі дзялюся, бо надта добра зроблена і зроблена для людзей, а не тэхнічных спецыялістаў. Па-беларуску, увы, няма, але ёсць на іншых мовах.
http://www.r2d3.us/visual-intro-to-machine-learning-part-1/
Падзялюся з вамі візуалізацыяй таго, як працуе машыннае навучанне ака Machine Learning. Перыядычна ёй з усімі дзялюся, бо надта добра зроблена і зроблена для людзей, а не тэхнічных спецыялістаў. Па-беларуску, увы, няма, але ёсць на іншых мовах.
http://www.r2d3.us/visual-intro-to-machine-learning-part-1/
www.r2d3.us
A visual introduction to machine learning
What is machine learning? See how it works with our animated data visualization.
#statistics
Даўно хацеў напісаць які-небудзь занудны пост пра статыстыку. Ваш час пакутаваць надышоў.
Мы часта чуем фразы а-ля “навукоўцы даказалі”, ці “статыстычна значны”. Дык а як навукоўцы нешта “даказваюць”? Што гэта ўвогуле значыць? Зараз я паспрабую ў 3 абзацах максімальна проста патлумачыць вам 95% сучаснай статыстыкі.
Бяром 2 групы па 100 чалавек, у якіх баліць галава. Адным даем аспірын, другім не даем. Праз гадзіну запытваем “ну шо ты”. У першай групе галава перастала балець у 30 чалавек, у другой - 15. Адкуль мы ведаем, што аспірын працуе?
Усё насамрэч проста. Кажам: “давайце ЎЯВІМ, што аспірын НЕ працуе”. Значыцца розніца, якую мы бачым (30 супраць 15 чалавек) - гэта чыста памылка выбаркі. Ну, набралі мы так людзей, што ў эксперыментальнай групе ў большай колькасці галава б і так прайшла, без усялякіх аспірынаў.
Далей мы задаём цэнтральнае пытанне 95% усіх сучасных навуковых даследаванняў, якія выкарыстоўваюць статыстыку: калі розніца няма, як часта мы б пабачылі такую (30 супраць 15) ці большую розніцу праз памылку выбаркі. Калі адказ “менш чым у 5% выпадкаў”, тады мы называем гэты вынік “статыстычна значным” і бяжым да журналістаў казаць, што аспірын дапамагае ад галавы. Усё.
Падрабязней можаце пачытаць тут
Даўно хацеў напісаць які-небудзь занудны пост пра статыстыку. Ваш час пакутаваць надышоў.
Мы часта чуем фразы а-ля “навукоўцы даказалі”, ці “статыстычна значны”. Дык а як навукоўцы нешта “даказваюць”? Што гэта ўвогуле значыць? Зараз я паспрабую ў 3 абзацах максімальна проста патлумачыць вам 95% сучаснай статыстыкі.
Бяром 2 групы па 100 чалавек, у якіх баліць галава. Адным даем аспірын, другім не даем. Праз гадзіну запытваем “ну шо ты”. У першай групе галава перастала балець у 30 чалавек, у другой - 15. Адкуль мы ведаем, што аспірын працуе?
Усё насамрэч проста. Кажам: “давайце ЎЯВІМ, што аспірын НЕ працуе”. Значыцца розніца, якую мы бачым (30 супраць 15 чалавек) - гэта чыста памылка выбаркі. Ну, набралі мы так людзей, што ў эксперыментальнай групе ў большай колькасці галава б і так прайшла, без усялякіх аспірынаў.
Далей мы задаём цэнтральнае пытанне 95% усіх сучасных навуковых даследаванняў, якія выкарыстоўваюць статыстыку: калі розніца няма, як часта мы б пабачылі такую (30 супраць 15) ці большую розніцу праз памылку выбаркі. Калі адказ “менш чым у 5% выпадкаў”, тады мы называем гэты вынік “статыстычна значным” і бяжым да журналістаў казаць, што аспірын дапамагае ад галавы. Усё.
Падрабязней можаце пачытаць тут
Wikipedia
Null hypothesis
statistical concept
#everyday
Нядаўна пачуў спрэчку пра тое, як правільна займацца ў трэнажорцы. Першы раз са школы мабыць. Ну, колькі падыходаў, колькі паўтораў, як часта і г.д. Мы зараз пра рост мышцаў, канешне. Адказ тут ёсць і даўно вядомы. Зараз распавяду.
Гісторыя ў гэтага пытання прыкольная. Напрыклад, быў такі Арнольд Шварцэнэгер. Ён займаўся вельмі шмат, часам - па 32 падыходы на групу мышцаў у тыдзень. Як выглядае Шварцэнэгер усе ведаюць. У яго быў канкурэнт - Майк Мэнцэр. Майк рабіў, у экстрыме, 1-2 падыходы на групу ў тыдзень і ўсё. Майк выглядаў вось так. Адсюль пытанне, якое нарадзіла мільёны гадзін спрэчак: калі няма розніцы, навошта займацца больш?
Ясна, што яны - прафесійных атлеты, а мы з вамі - прафесійныя катлеты, у лепшым выпадку. Але для нас тут таксама ёсць карысная інфармацыя.
Існуе тысячы, літаральна, даследаванняў пра тое, як правільна хадзіць у трэнажорку. Я буду спасылацца на адну добра напісаную паперу, якая ўключае іншыя агляды літаратуры, дадзеныя мета-аналізаў і дадзеныя канкрэтных эксперыментаў.
Няма ніякай розніцы, колькі і чаго вы робіце, калі вы робіце 2-20 падыходаў на групу мышцаў у тыдзень з інтэнсіўнасцю прыкладна ў 30-80% ад вашага максімума на адзін раз у канкрэтным практыкаванні і ў дыяпазоне 2-35 паўтораў. Ніякай розніцы. Адзінае, што гуляе ролю - аб’ём нагрузкі за тыдзень. А як вы яе размяркуеце ролі не гуляе.
Парачка прыкладаў. Адна група рабіла 7 падыходаў на 2-4 паўторы, другая - 3 падыходы на 8-12 паўтораў. Пасля 8 тыдняў ніякай розніцы ў росце мышцаў. У другім эксперыменце ўсе рабілі па 3 падыходы, але адна група - у дыяпазоне 25-35 паўтораў, другая - у дыяпазоне 8-12 паўтораў. Пасля 8 тыдняў ніякай розніцы ў росце мышцаў. Наступны эксперымент: адна група займалася 4 разы ў тыдзень, другая - 2 разы, але з аднолькавай колькасцю падыходаў. Пасля 6 тыдняў адгадайце што? Правільна - ніякай розніцы ў росце мышцаў. І г.д. і г.д.
Адзінае, на што варта арыентавацца, гэта вашыя асабістыя пажаданні. Бегаць 6 разоў на тыдзень у трэнажорку ў большасці з нас часу няма. Для таго, каб займацца з максімальнай інтэнсіўнасцю і вам хапала 1-2 падыходаў на тыдзень, у нас з вамі няма тэхнікі і матывацыі. Ну гэта і проста рызыкоўна - занадта высокі шанец траўмы.
Для большасці з нас аптымальны наступны пратакол: 5-10 падыходаў на групу мышцаў у тыдзень, у дыяпазоне 5-25 паўтораў, каб хаця б адзін падыход у тыдзень быў “да адмовы” - каб яшчэ адзін паўтор вы фізічна зрабіць не маглі.
Нядаўна пачуў спрэчку пра тое, як правільна займацца ў трэнажорцы. Першы раз са школы мабыць. Ну, колькі падыходаў, колькі паўтораў, як часта і г.д. Мы зараз пра рост мышцаў, канешне. Адказ тут ёсць і даўно вядомы. Зараз распавяду.
Гісторыя ў гэтага пытання прыкольная. Напрыклад, быў такі Арнольд Шварцэнэгер. Ён займаўся вельмі шмат, часам - па 32 падыходы на групу мышцаў у тыдзень. Як выглядае Шварцэнэгер усе ведаюць. У яго быў канкурэнт - Майк Мэнцэр. Майк рабіў, у экстрыме, 1-2 падыходы на групу ў тыдзень і ўсё. Майк выглядаў вось так. Адсюль пытанне, якое нарадзіла мільёны гадзін спрэчак: калі няма розніцы, навошта займацца больш?
Ясна, што яны - прафесійных атлеты, а мы з вамі - прафесійныя катлеты, у лепшым выпадку. Але для нас тут таксама ёсць карысная інфармацыя.
Існуе тысячы, літаральна, даследаванняў пра тое, як правільна хадзіць у трэнажорку. Я буду спасылацца на адну добра напісаную паперу, якая ўключае іншыя агляды літаратуры, дадзеныя мета-аналізаў і дадзеныя канкрэтных эксперыментаў.
Няма ніякай розніцы, колькі і чаго вы робіце, калі вы робіце 2-20 падыходаў на групу мышцаў у тыдзень з інтэнсіўнасцю прыкладна ў 30-80% ад вашага максімума на адзін раз у канкрэтным практыкаванні і ў дыяпазоне 2-35 паўтораў. Ніякай розніцы. Адзінае, што гуляе ролю - аб’ём нагрузкі за тыдзень. А як вы яе размяркуеце ролі не гуляе.
Парачка прыкладаў. Адна група рабіла 7 падыходаў на 2-4 паўторы, другая - 3 падыходы на 8-12 паўтораў. Пасля 8 тыдняў ніякай розніцы ў росце мышцаў. У другім эксперыменце ўсе рабілі па 3 падыходы, але адна група - у дыяпазоне 25-35 паўтораў, другая - у дыяпазоне 8-12 паўтораў. Пасля 8 тыдняў ніякай розніцы ў росце мышцаў. Наступны эксперымент: адна група займалася 4 разы ў тыдзень, другая - 2 разы, але з аднолькавай колькасцю падыходаў. Пасля 6 тыдняў адгадайце што? Правільна - ніякай розніцы ў росце мышцаў. І г.д. і г.д.
Адзінае, на што варта арыентавацца, гэта вашыя асабістыя пажаданні. Бегаць 6 разоў на тыдзень у трэнажорку ў большасці з нас часу няма. Для таго, каб займацца з максімальнай інтэнсіўнасцю і вам хапала 1-2 падыходаў на тыдзень, у нас з вамі няма тэхнікі і матывацыі. Ну гэта і проста рызыкоўна - занадта высокі шанец траўмы.
Для большасці з нас аптымальны наступны пратакол: 5-10 падыходаў на групу мышцаў у тыдзень, у дыяпазоне 5-25 паўтораў, каб хаця б адзін падыход у тыдзень быў “да адмовы” - каб яшчэ адзін паўтор вы фізічна зрабіць не маглі.
#statistics #belarus
Часам можна пабачыць, як людзі заломваюць рукі і пытаюцца, чаму Беларусь не дэмакратыя. Пытанне валіднае і для грамадскай дыскусіі карыснае. Але ёсць нюанс. Мне падаецца, што ў гістарычнай перспектыве яно не вельмі цікавае. Прынамсі пакуль. Бо нічога незвычайнага ў беларускім аўтарытарызме няма.
Часам, калі аналізуюць дэмакратызацыі, у якасці адной з пераменных выкарыстоўваюць дыстанцыю, у кіламетрах, да Бруселя. Як тут. Які ў гэтым сэнс? Ідэя ў тым, што недзе ў тых землях, ці адносна побач, з людзьмі нешта не так. То пратэстантызм сабе прыдумаюць, то дэмакратыю, то яшчэ чаго для праваслаўнага чалавека шкоднага.
Ну а далей зусім проста: ідэі, як вірус, пераносяцца людзьмі, ну і раз суседзі камунікуюць больш, ідэі паміж імі перацякаюць хутчэй. У гэтым сэнсе проста кіламетры да Бруселя - метрыка ідыёцкая, размова пра шчыльнасць кантактаў, гандлю і г.д. Затое яе проста падлічыць.
Увогуле, калі паглядзець на мапу Freedom House, на нашым кантыненце не так шмат анамалій: дэмакратычная Манголія, дэмакратычная Індыя ну і яшчэ парачку. У астатнім - дэмакратыя, як пляма, размазана кіламетрамі ад Бруселя. Але гэта візуальна, то мне захацелася падлічыць усё больш фармальна.
Ну я і падлічыў. Карэляцыя паміж тым, колькі краіна год бесперапынна дэмакратыя і кіламетрамі для Бруселя негатыўная, -0.6. Тобок, чым далей ад брусэляў, тым менш год вашым дэмакратыям.
Карэляцыя -0.6 гэта многа ці мала? Для параўнання:
- карэляцыя паміж інфляцыяй і ростам ВУП з 1960 па 2020 на планеце была -0.064
- карэляцыя паміж памерам ВУП на душу і працягласцю жыцця за той ж перыяд была 0.549
Кажучы проста, тупыя кіламетры для Бруселя - больш моцны прэдыктар дэмакратызацыі, чым ВУП на душу насельніцтва - прэдыктар працягласці жыцця і нашмат больш моцны, чым інфляцыі ёсць прэдыктарам эканамічнага росту.
Прынамсі, гэта для краін "Europe & Central Asia" у класіфікацыі сусветнага банку. Для ўсёй планеты гэта працаваць не будзе, таму што дыстанцыя да Новай Зеландыі ў кіламетрах надта вялікая. А дадзеных пра шчыльнасць кантактаў, гандлю і г.д. у мяне няма.
Пры гэтым, калі вы распавядзе пра гэты факт “палітолагам”, вы адразу пачуеце мільён заўваг: “Вільня ж не далей ад Бруселя, чым Менск!”, “а Талін далей, ха!” і г.д. Усё гэта таму, што ў “палітолагаў”, як правіла, няма колькаснай інтуіцыі наконт таго, колькі контрпрыкладаў можа існаваць на залежнасці рознай сілы.
Часам можна пабачыць, як людзі заломваюць рукі і пытаюцца, чаму Беларусь не дэмакратыя. Пытанне валіднае і для грамадскай дыскусіі карыснае. Але ёсць нюанс. Мне падаецца, што ў гістарычнай перспектыве яно не вельмі цікавае. Прынамсі пакуль. Бо нічога незвычайнага ў беларускім аўтарытарызме няма.
Часам, калі аналізуюць дэмакратызацыі, у якасці адной з пераменных выкарыстоўваюць дыстанцыю, у кіламетрах, да Бруселя. Як тут. Які ў гэтым сэнс? Ідэя ў тым, што недзе ў тых землях, ці адносна побач, з людзьмі нешта не так. То пратэстантызм сабе прыдумаюць, то дэмакратыю, то яшчэ чаго для праваслаўнага чалавека шкоднага.
Ну а далей зусім проста: ідэі, як вірус, пераносяцца людзьмі, ну і раз суседзі камунікуюць больш, ідэі паміж імі перацякаюць хутчэй. У гэтым сэнсе проста кіламетры да Бруселя - метрыка ідыёцкая, размова пра шчыльнасць кантактаў, гандлю і г.д. Затое яе проста падлічыць.
Увогуле, калі паглядзець на мапу Freedom House, на нашым кантыненце не так шмат анамалій: дэмакратычная Манголія, дэмакратычная Індыя ну і яшчэ парачку. У астатнім - дэмакратыя, як пляма, размазана кіламетрамі ад Бруселя. Але гэта візуальна, то мне захацелася падлічыць усё больш фармальна.
Ну я і падлічыў. Карэляцыя паміж тым, колькі краіна год бесперапынна дэмакратыя і кіламетрамі для Бруселя негатыўная, -0.6. Тобок, чым далей ад брусэляў, тым менш год вашым дэмакратыям.
Карэляцыя -0.6 гэта многа ці мала? Для параўнання:
- карэляцыя паміж інфляцыяй і ростам ВУП з 1960 па 2020 на планеце была -0.064
- карэляцыя паміж памерам ВУП на душу і працягласцю жыцця за той ж перыяд была 0.549
Кажучы проста, тупыя кіламетры для Бруселя - больш моцны прэдыктар дэмакратызацыі, чым ВУП на душу насельніцтва - прэдыктар працягласці жыцця і нашмат больш моцны, чым інфляцыі ёсць прэдыктарам эканамічнага росту.
Прынамсі, гэта для краін "Europe & Central Asia" у класіфікацыі сусветнага банку. Для ўсёй планеты гэта працаваць не будзе, таму што дыстанцыя да Новай Зеландыі ў кіламетрах надта вялікая. А дадзеных пра шчыльнасць кантактаў, гандлю і г.д. у мяне няма.
Пры гэтым, калі вы распавядзе пра гэты факт “палітолагам”, вы адразу пачуеце мільён заўваг: “Вільня ж не далей ад Бруселя, чым Менск!”, “а Талін далей, ха!” і г.д. Усё гэта таму, што ў “палітолагаў”, як правіла, няма колькаснай інтуіцыі наконт таго, колькі контрпрыкладаў можа існаваць на залежнасці рознай сілы.
#statistics
Хачу дапамагчы вам разабрацца з адной памылкай, якую часта робяць, калі глядзяць у выніку апытанняў.
Уявім сабе, што спрыяльна да расіі ў сакавіку 2022 ставілася 43% беларусаў, а ў чэрвені 2022 - 40% беларусаў. Я часта бачу наступную выснову: “ну, гэта не статыстычна значны вынік” / “нуу, там памылка рэпрэзентатыўнасці 2%” / і г.д., а значыцца нічога насамрэч не памянялася.
Вось гэтая выснова “нічога насамрэч не памянялася” - памылка. Выснову, якую мы павінны зрабіць (гіпотэза, якая найбольш верагодная) - гэта тое, што падтрымка рф упала на 3 працэнты. Прычым гэта будзе справядліва і для выбаркі ў 10, у 1.000, у 100.000 чалавек. Усё, што будзе адрознівацца - нашая ступень упэўненасці ў гэтым. Але НЕ, гэта не значыць, што калі вынікі "не статыстычна значныя", гэта робіць гіпотэзу пра адсутнасць зменаў найбольш верагоднай. Не, не робіць,
Пры гэтым, агульны скептыцызм я падзяляю і паважаю. Чым больш вы скептычныя да дадзеных, тым лепш. А я бачу ўсё больш і больш крытычных пытанняў такога кшталту ад беларусаў. Вы малайцы.
Хачу дапамагчы вам разабрацца з адной памылкай, якую часта робяць, калі глядзяць у выніку апытанняў.
Уявім сабе, што спрыяльна да расіі ў сакавіку 2022 ставілася 43% беларусаў, а ў чэрвені 2022 - 40% беларусаў. Я часта бачу наступную выснову: “ну, гэта не статыстычна значны вынік” / “нуу, там памылка рэпрэзентатыўнасці 2%” / і г.д., а значыцца нічога насамрэч не памянялася.
Вось гэтая выснова “нічога насамрэч не памянялася” - памылка. Выснову, якую мы павінны зрабіць (гіпотэза, якая найбольш верагодная) - гэта тое, што падтрымка рф упала на 3 працэнты. Прычым гэта будзе справядліва і для выбаркі ў 10, у 1.000, у 100.000 чалавек. Усё, што будзе адрознівацца - нашая ступень упэўненасці ў гэтым. Але НЕ, гэта не значыць, што калі вынікі "не статыстычна значныя", гэта робіць гіпотэзу пра адсутнасць зменаў найбольш верагоднай. Не, не робіць,
1) З выбаркай у 10 чалавек, мы б сказалі “гіпотэза пра падзенне ў 3% найбольш верагодная, але давер у нас вельмі нізкі”Адзіна што, вы можаце быць моцна ўпэўненыя, што лічба не змянілася. Тады вы кажаце: “дадзеныя настолькі слабыя, а маё меркаванне - настолькі моцнае, што я гатовы змяніць яго з 0% да 0.3%, максімум. Але ніяк не да 3%”. Гэта абсалютна нармальна, завецца “баесаўская статыстыка”, але рабіць гэта трэба экспліцытна і шчыра. Асабліва карысна самому сабе прызнавацца ў сваіх моцных меркаваннях.
2) З выбаркай у 1000 чалавек, мы б сказалі “гіпотэза пра падзенне ў 3% найбольш верагодная, але давер у нас сярэдні”
3) З выбаркай у мільён чалавек, мы б сказалі “гіпотэза пра падзенне ў 3% найбольш верагодная, мамай клянуся”
Пры гэтым, агульны скептыцызм я падзяляю і паважаю. Чым больш вы скептычныя да дадзеных, тым лепш. А я бачу ўсё больш і больш крытычных пытанняў такога кшталту ад беларусаў. Вы малайцы.
Знаёмы хацеў даведацца, ці вядзе два тг-каналы адзін і той ж чалавек. Ну мы з @mickolka і напісалі пад гэта старонку. Ідэя даволі простая: тое, колькі ў вас словаў у сярэднем на сказ, колькі вы косак ставіце, як актыўна ўжываеце “:” ці “–” ёсць нейкімі маркерамі вашага стылю, даволі ўстойлівымі.
Большасць метрык там "p/s" - per sentence, тобок "на сказ". 95% давяральныя інтэрвалы мы туды таксама прыкруцілі, каб у людзей было ўяўленне, наколькі гэтыя стытыстыкі шумныя.
Мабыць каму з вас спатрэбіцца: https://share.streamlit.io/mickolka/texts_comparison/streamlit-integration/streamlit_main.py
Большасць метрык там "p/s" - per sentence, тобок "на сказ". 95% давяральныя інтэрвалы мы туды таксама прыкруцілі, каб у людзей было ўяўленне, наколькі гэтыя стытыстыкі шумныя.
Мабыць каму з вас спатрэбіцца: https://share.streamlit.io/mickolka/texts_comparison/streamlit-integration/streamlit_main.py
#science
Выглядае, што ўбер плаціў эканамістам у Францыі і Германіі, каб яны пісалі для іх акадэмічныя паперы, у якіх падкрэслівалі перавагі ўбера: маўляў, працоўныя месцы стварае, транспартную сістэму паляпшае і г.д. Бо іхнія ўрады актыўна ставілі ўберу палкі ў колы рэгуляцыямі.
Наколькі гэта праўда ці не мне зрабіць выснову складана. Але нічога дзіўнага ў гэтым няма - фармакалагічныя кампаніі займаюцца подкупам акадэмікаў 24/7. І шмат яшчэ хто.
Год 5-7 таму часта бачыў спрэчкі пра ўбер, дзе там сям прыводзілі спасылкі на падобныя артыкулы з аргументацыяй “навука даказала”. Ахах, тобок ой.
Выглядае, што ўбер плаціў эканамістам у Францыі і Германіі, каб яны пісалі для іх акадэмічныя паперы, у якіх падкрэслівалі перавагі ўбера: маўляў, працоўныя месцы стварае, транспартную сістэму паляпшае і г.д. Бо іхнія ўрады актыўна ставілі ўберу палкі ў колы рэгуляцыямі.
Наколькі гэта праўда ці не мне зрабіць выснову складана. Але нічога дзіўнага ў гэтым няма - фармакалагічныя кампаніі займаюцца подкупам акадэмікаў 24/7. І шмат яшчэ хто.
Год 5-7 таму часта бачыў спрэчкі пра ўбер, дзе там сям прыводзілі спасылкі на падобныя артыкулы з аргументацыяй “навука даказала”. Ахах, тобок ой.
#belarus #statistics
Ніколі такога не было і вось ізноў: Чалы спрабуе даказаць беларусам, што не трэба слухаць Шрайбмана (спасылка на Курэйчыка рандомная, мне лянота арыгіналы шукаць). Не ведаю, якое ў вас стаўленне да гэтага пласту беларускай культуры. Я стараюся ігнараваць, але часам як у тым меме з чалавекам-павуком.
Але распавесці хачу не пра гэта. Яны там закранаюць даследаванне Chatham House пра тое, як мы ставімся да геяў, чорных, арабаў і г.д. У Гены Коршунава ёсць добры агляд, каму цікава.
Калі коратка, задаюць пытанне “Я лично готов(а) принять представителя данной группы …" і даюць адказы: Как близкого родственника, Как близкого друга, Как соседа по дому, Как коллегу по работе, Как гражданина моей страны, Как гостя (туриста) в моей стране, Ни в каком виде. Далей прыпісваюць балы ад 1 да 7 і мераюць дыстанцыю. Усё даволі проста.
А я вырашыў разабрацца, якімі характарыстыкі беларусаў можна прадказаць. І прыйшоў да высновы, што прадказаць беларусаў…немагчыма.
Усяго задаюць пытанні пра 14 груп. Я пабудаваў лінейныя мадэлі (што крыху бязбожна, затое хутка) для ўсіх 14. Ну і набраў тыповых падазроных: пол, узрост, памер населенага пункту, матэрыяльнае становішча, узровень адукацыі. Дык вось. Мае мадэлі на каленцы тлумачаць 0 - 9% варыяцыі ў адказах. Тобок нічога не тлумачаць.
Лепш за ўсё тлумачыцца стаўленне да геяў, 9%. Ну і гісторыя там прадказальная: чым вы маладзейшы, больш адукаваны, у лепшым матэрыяльным стане, тым больш вы талерантны. Яшчэ дапамагае, калі вы жанчына. Усё гэта карэлюе з адказамі, проста слаба.
Агулам беларусы непрадказальныя, няўлоўныя, містычныя. Як смуга над полем, як багна, як чарговая тэма для срачаў у твітэры.
Ніколі такога не было і вось ізноў: Чалы спрабуе даказаць беларусам, што не трэба слухаць Шрайбмана (спасылка на Курэйчыка рандомная, мне лянота арыгіналы шукаць). Не ведаю, якое ў вас стаўленне да гэтага пласту беларускай культуры. Я стараюся ігнараваць, але часам як у тым меме з чалавекам-павуком.
Але распавесці хачу не пра гэта. Яны там закранаюць даследаванне Chatham House пра тое, як мы ставімся да геяў, чорных, арабаў і г.д. У Гены Коршунава ёсць добры агляд, каму цікава.
Калі коратка, задаюць пытанне “Я лично готов(а) принять представителя данной группы …" і даюць адказы: Как близкого родственника, Как близкого друга, Как соседа по дому, Как коллегу по работе, Как гражданина моей страны, Как гостя (туриста) в моей стране, Ни в каком виде. Далей прыпісваюць балы ад 1 да 7 і мераюць дыстанцыю. Усё даволі проста.
А я вырашыў разабрацца, якімі характарыстыкі беларусаў можна прадказаць. І прыйшоў да высновы, што прадказаць беларусаў…немагчыма.
Усяго задаюць пытанні пра 14 груп. Я пабудаваў лінейныя мадэлі (што крыху бязбожна, затое хутка) для ўсіх 14. Ну і набраў тыповых падазроных: пол, узрост, памер населенага пункту, матэрыяльнае становішча, узровень адукацыі. Дык вось. Мае мадэлі на каленцы тлумачаць 0 - 9% варыяцыі ў адказах. Тобок нічога не тлумачаць.
Лепш за ўсё тлумачыцца стаўленне да геяў, 9%. Ну і гісторыя там прадказальная: чым вы маладзейшы, больш адукаваны, у лепшым матэрыяльным стане, тым больш вы талерантны. Яшчэ дапамагае, калі вы жанчына. Усё гэта карэлюе з адказамі, проста слаба.
Агулам беларусы непрадказальныя, няўлоўныя, містычныя. Як смуга над полем, як багна, як чарговая тэма для срачаў у твітэры.
Добрай раніцы. Да ўчорашняга паста.
Разумныя людзі мне кажуць, што нізкая сувязь паміж такімі пытаннямі і сацыяльна-дэмаграфічнымі характарыстыкі - рэч не ўнікальная для беларусаў. Італьянцаў там якіх ці грэкаў таксама складана прадказаць. Так крыўдна за ўнікальнасць беларусаў зрабілася, быццам у душу наплявалі.
Таму я вырашыў паглядзець, што ж у дадзеных Рыгора Астапені больш за ўсё карэлюе з дыстанцыяй да розных сацыяльных груп. Ну і пачаў з геяў.
Па-першае, адказы на іншыя пытанні карэлююць. Ну, калі вам не хочацца ціснуць руку яўрэям ці чорным, геям вы таксама наўрад ці пяцюні раздаяце. Гэта нецікавая частка.
Цікавая частка ў тым, што найбольш негатыўна (-0.28) з дыстанцыяй да геяў карэлюе адказ на пытанне "Я убежден, что протестное движение было вызвано извне недружественными действиями иностранных государств". А найбольш пазітыўна (0.304) з адказамі на пытанне "Как вы относитесь к акциям протеста против действующей власти?"
Тобок, геяў не любяць у нас тыя, для каго пратэсты былі аркестраванымі замежнымі лялькаводамі і тыя, каму яны агулам не падабаліся. І гэта нашмат больш істотны фактар, чым пол, узрост, заробак ці адукацыя. Ці астатнія 270 пытанняў, якія я праверыў. Аналагічна і па іншых сацыяльных групах.
Такія справы.
Разумныя людзі мне кажуць, што нізкая сувязь паміж такімі пытаннямі і сацыяльна-дэмаграфічнымі характарыстыкі - рэч не ўнікальная для беларусаў. Італьянцаў там якіх ці грэкаў таксама складана прадказаць. Так крыўдна за ўнікальнасць беларусаў зрабілася, быццам у душу наплявалі.
Таму я вырашыў паглядзець, што ж у дадзеных Рыгора Астапені больш за ўсё карэлюе з дыстанцыяй да розных сацыяльных груп. Ну і пачаў з геяў.
Па-першае, адказы на іншыя пытанні карэлююць. Ну, калі вам не хочацца ціснуць руку яўрэям ці чорным, геям вы таксама наўрад ці пяцюні раздаяце. Гэта нецікавая частка.
Цікавая частка ў тым, што найбольш негатыўна (-0.28) з дыстанцыяй да геяў карэлюе адказ на пытанне "Я убежден, что протестное движение было вызвано извне недружественными действиями иностранных государств". А найбольш пазітыўна (0.304) з адказамі на пытанне "Как вы относитесь к акциям протеста против действующей власти?"
Тобок, геяў не любяць у нас тыя, для каго пратэсты былі аркестраванымі замежнымі лялькаводамі і тыя, каму яны агулам не падабаліся. І гэта нашмат больш істотны фактар, чым пол, узрост, заробак ці адукацыя. Ці астатнія 270 пытанняў, якія я праверыў. Аналагічна і па іншых сацыяльных групах.
Такія справы.
#statistics
Атрымаў мілых каментароў пад гэты пост і вырашыў перыядычна дапамагаць вам з розным там статыстычным жаргонам.
Сёння паразмаўляем пра “давяральныя інтэрвалы”. Упэўнены, што бачылі вы іх часта. Уявім, што Андрэй Вардамаці аналізаваў сацыялогію згушчонкі. І 50% беларусаў выбралі рагачоўскую. І ў дужках вы бачыце стандартны тэкст (як тут): “памылка выбаркі пры 95% давяральным інтэрвале не перавышае 3%”.
Окей, але што гэта значыць? Куды яно чаго не перавышае? Інтуітыўна зразумела, што 3% - лепш, чым 30%, а яшчэ б лепш 0.03%. Інтуітыўна вы абсалютна правыя. Я прыкладна гэтак імі і карыстаюся. Цікавасці пачынаюцца тады, калі задаваць больш канкрэтныя пытанні.
Уявім сабе, што сацыёлаг Алег Манаеў вырашае правесці аналагічнае апытанне. Выбарка такога ж памеру, пытанне такое ж, усё такое ж. Які шанец, што % за рагачоўскую згушчонку на новай выбарцы трапіць у 47-53%, як у Вардмацкага? Нагадваю, інтэрвал у нас 95%. Адказ 0.95, канешне, няправільны. Правільны адказ - 0.83. А калі сюды падключыцца Філіп Біканаў і правядзе трэцяе апытанне, верагоднасць, што і ягоныя вынікі, і вынікі Манаева трапяць у давяральныя інтэрвалы, разлічаныя Вардмацкім, будзе 0.72. Ну і г.д.
“Што за хрэнь?” - гэта пытанне, якое я задаю сабе кожны дзень на працы. Справа ў любові класічнай статыстыкі дазянонаўскай Беларусі ідэальных сутнасцяў, бясконсасцяў і іншых тэарэтычных канструктаў. А выбаркі ў нас жывыя, выбаркі ў нас шумныя. І шум кожнай індывідуальнай выбаркі накладаецца. Фармальна гэта тлумачыцца праз адатыўнасць варыяцыі, але я не прыдумаў, як вам проста гэта патлумачыць.
Калі гэтае пытанне задалі 263 псіхолагам, медыкам і спецыялістам па нейранавуках, большасць з іх таксама адказала няправільна. Чаму? Разгадка простая - мы эвалюцыянавалі каб бегаць ад драпежнікаў, бегаць за ежай і каб прыгожая малпа з суседняй пальмы нас заўважыла. І не для разважанняў пра верагоднасці. Таму, калі доўга паўтараць “95% давяральны інтэрвал”, людзям пачынае падавацца, што адказ заўсёды “95%”. Малпачка бачыць - малпачка паўтарае.
Атрымаў мілых каментароў пад гэты пост і вырашыў перыядычна дапамагаць вам з розным там статыстычным жаргонам.
Сёння паразмаўляем пра “давяральныя інтэрвалы”. Упэўнены, што бачылі вы іх часта. Уявім, што Андрэй Вардамаці аналізаваў сацыялогію згушчонкі. І 50% беларусаў выбралі рагачоўскую. І ў дужках вы бачыце стандартны тэкст (як тут): “памылка выбаркі пры 95% давяральным інтэрвале не перавышае 3%”.
Окей, але што гэта значыць? Куды яно чаго не перавышае? Інтуітыўна зразумела, што 3% - лепш, чым 30%, а яшчэ б лепш 0.03%. Інтуітыўна вы абсалютна правыя. Я прыкладна гэтак імі і карыстаюся. Цікавасці пачынаюцца тады, калі задаваць больш канкрэтныя пытанні.
Уявім сабе, што сацыёлаг Алег Манаеў вырашае правесці аналагічнае апытанне. Выбарка такога ж памеру, пытанне такое ж, усё такое ж. Які шанец, што % за рагачоўскую згушчонку на новай выбарцы трапіць у 47-53%, як у Вардмацкага? Нагадваю, інтэрвал у нас 95%. Адказ 0.95, канешне, няправільны. Правільны адказ - 0.83. А калі сюды падключыцца Філіп Біканаў і правядзе трэцяе апытанне, верагоднасць, што і ягоныя вынікі, і вынікі Манаева трапяць у давяральныя інтэрвалы, разлічаныя Вардмацкім, будзе 0.72. Ну і г.д.
“Што за хрэнь?” - гэта пытанне, якое я задаю сабе кожны дзень на працы. Справа ў любові класічнай статыстыкі да
Калі гэтае пытанне задалі 263 псіхолагам, медыкам і спецыялістам па нейранавуках, большасць з іх таксама адказала няправільна. Чаму? Разгадка простая - мы эвалюцыянавалі каб бегаць ад драпежнікаў, бегаць за ежай і каб прыгожая малпа з суседняй пальмы нас заўважыла. І не для разважанняў пра верагоднасці. Таму, калі доўга паўтараць “95% давяральны інтэрвал”, людзям пачынае падавацца, што адказ заўсёды “95%”. Малпачка бачыць - малпачка паўтарае.
Telegram
Лінейная (аг | рэг) рэсія
#statistics
Даўно хацеў напісаць які-небудзь занудны пост пра статыстыку. Ваш час пакутаваць надышоў.
Мы часта чуем фразы а-ля “навукоўцы даказалі”, ці “статыстычна значны”. Дык а як навукоўцы нешта “даказваюць”? Што гэта ўвогуле значыць? Зараз я паспрабую…
Даўно хацеў напісаць які-небудзь занудны пост пра статыстыку. Ваш час пакутаваць надышоў.
Мы часта чуем фразы а-ля “навукоўцы даказалі”, ці “статыстычна значны”. Дык а як навукоўцы нешта “даказваюць”? Што гэта ўвогуле значыць? Зараз я паспрабую…
Добрай раніцы. Забыў ва учорашнім пасце пра самае сакавітае.
Дык, гэта, калі мы атрымалі 50% за рагачоўскую, памылка выбаркі ў нас не перавышае +/- 3% пад 95% давяральнымі інтэрваламі, які шанец што рэальны % за рагачоўскую ў папуляцыі - паміж 47% і 53%? Як вы маглі здагадацца, адказ 0.95 зноў няправільны.
Правільны адказ: альбо 1, альбо 0 - альбо рэальны % у гэты інтэрвал трапляе, альбо не. І гэта, як не дзіва, не пустая філасофія.
Сачыце за рукамі. Уявім сабе, што вы гуляеце ў гульню. Вам даюць 2 капэрты на выбар.У адной з іх у 2 разы больш грошаў, чым у іншай. Вы выбіраеце. Пасля гэтага вам прапануюць капэрту памяняць . Ці трэба вам мяняцца?
Разважаем наступным чынам: У нашай капэрце Х грошаў. Значыцца з верагоднасцю 1/2 у іншай капэрце альбо 2Х, альбо X/2. Тады матэматычнае чаканне сумы ў іншай капэрце ў нас 1/2*2X + 1/2*X/2 = 5/4*X. А гэта больш, чым X. Значыцца трэба мяняць капэрту. Але! Калі вы яе памяняеце і вам прапануюць зноў яе памяняць, вам зноў больш рацыянальна пагадзіцца - разлік ж той жа самы.
Ага ага. Памылка тут у інтэрпрэтацыі верагоднасці. Як і ў пытанні “якая верагоднасць, што рэальны % за рагачоўскую ў давяральным інтэрвале”. Калі вам даюць капэрты, выбар наконт таго, колькі грошаў у якую пакласці ўжо зроблены. І ніякай “верагоднасці” там ужо няма. І калі вы бачыце давяральны інтэрвал сваёй выбаркі, ніякай верагоднасці там таксама няма - у вас і інтэрвал фіксаваны, і рэальны % за рагачоўскую ў папуляцыі фіксаваны. Вы проста не ведаеце, як.
А тут ужо можна ўпадаць у філасофію. Гэта ўсё справядліва толькі для таго варыянта “верагоднасці”, у межах якога, канцэптуальна, давяральныя інтэрвалы канструююцца. Класічны альбо частотны варыянт. Але гэта не адзіная канцэптуалізацыя верагоднасці. Ну і пайшло паехала.
Дык, гэта, калі мы атрымалі 50% за рагачоўскую, памылка выбаркі ў нас не перавышае +/- 3% пад 95% давяральнымі інтэрваламі, які шанец што рэальны % за рагачоўскую ў папуляцыі - паміж 47% і 53%? Як вы маглі здагадацца, адказ 0.95 зноў няправільны.
Правільны адказ: альбо 1, альбо 0 - альбо рэальны % у гэты інтэрвал трапляе, альбо не. І гэта, як не дзіва, не пустая філасофія.
Сачыце за рукамі. Уявім сабе, што вы гуляеце ў гульню. Вам даюць 2 капэрты на выбар.У адной з іх у 2 разы больш грошаў, чым у іншай. Вы выбіраеце. Пасля гэтага вам прапануюць капэрту памяняць . Ці трэба вам мяняцца?
Разважаем наступным чынам: У нашай капэрце Х грошаў. Значыцца з верагоднасцю 1/2 у іншай капэрце альбо 2Х, альбо X/2. Тады матэматычнае чаканне сумы ў іншай капэрце ў нас 1/2*2X + 1/2*X/2 = 5/4*X. А гэта больш, чым X. Значыцца трэба мяняць капэрту. Але! Калі вы яе памяняеце і вам прапануюць зноў яе памяняць, вам зноў больш рацыянальна пагадзіцца - разлік ж той жа самы.
Ага ага. Памылка тут у інтэрпрэтацыі верагоднасці. Як і ў пытанні “якая верагоднасць, што рэальны % за рагачоўскую ў давяральным інтэрвале”. Калі вам даюць капэрты, выбар наконт таго, колькі грошаў у якую пакласці ўжо зроблены. І ніякай “верагоднасці” там ужо няма. І калі вы бачыце давяральны інтэрвал сваёй выбаркі, ніякай верагоднасці там таксама няма - у вас і інтэрвал фіксаваны, і рэальны % за рагачоўскую ў папуляцыі фіксаваны. Вы проста не ведаеце, як.
А тут ужо можна ўпадаць у філасофію. Гэта ўсё справядліва толькі для таго варыянта “верагоднасці”, у межах якога, канцэптуальна, давяральныя інтэрвалы канструююцца. Класічны альбо частотны варыянт. Але гэта не адзіная канцэптуалізацыя верагоднасці. Ну і пайшло паехала.
#covid
Кавідны пост
Пачуў на днях пра артыкул, пра які вы таксама хутка пачуеце, калі яшчэ не - пра тое, што пабочных эфектаў ад mRNA вакцын больш, чым карысці. Крытыка таксама ўжо даступная. Ну і вырашыў напісаць свой першы і спадзяюся апошні пост пра кавід.
Справа ў тым, што я нічога не ведаю пра кавід. І гэтаму ёсць некалькі прычын.
Па-першае, мне проста не цікава. На пачатку эпідэміі ў мяне яшчэ былі спадзяванні на зомбі-апакаліпсіс, але ўся гэтая гісторыя надакучыла мне даволі хутка.
Па-другое, веды статыстыкі, якія патрабуюцца для аналізу такіх дадзеных, у мяне адсутнічаюць. Дакладней, ніякіх асаблівых ведаў там не патрэбна, але ў мяне адсутнічае інтуіцыя пра нюансы працы з імі. Адносныя рызыкі, абсалютныя рызыкі, OR, RR, крывыя выжывання, кантрольныя кропкі, чаго ўвогуле, куды, за шо.
Па-трэцяе, на адных ведах статыстыкі далёка не ўедзеш. Для таго, каб ацаніць дызайн у такіх рэчах, трэба шмат прадметных ведаў: як так арганізаваць плацэба для прыскалкі ў нос, у якой ёсць спірт, каб кантрольная нічога не зразумела; хто там праводзіць даследаванне - персанал, які пастаянна кантактуе з кавіднікамі ці нейкія стэрыльныя таварышы; адкуль там антыцелы браць, праз які перыяд і мільёны падобных нюансаў. Калі казаць выключна пра статыстыку, ёсць жарт, што людзі, якія бачылі, як медыкі аналізуюць свае дадзеныя, пачынаюць паважаць эканамістаў. Што таксама не дадае матывацыі ў гэтым разбірацца.
Гляджу таму я на гэта ўсё гэта даволі прагматычна:
1. Кумулятыўных доказаў таго, што вакцыны працуюць (у шырокім сэнсе), настолькі шмат, што мне лянота сумнявацца. Калі нехта знойдзе канкрэтны прабел, я пра гэта абавязкова пачую, мы ўсе пачуем.
2. Калі мне задаюць пытанне, наколькі верагодныя фальсіфікацыі ў дадзеных пра кавід, я адказваю, што верагоднасць там 100%. Ну, ціпа - фармакалогія ёсць самай карумпіраванай дысцыплінай, у якой выкарыстоўваецца статыстыка. Але чаму толькі кавідныя вакцыны? Гэта ж для ўсяго справядліва, было і будзе. Пераставаць хадзіць да доктараў я праз гэта не збіраюся.
Асноўная праблема каляпалітычных антываксерскіх дэбатаў пра кавід у тым, што людзі бачаць нейкую супярэчнасць паміж гэтымі фактамі. Я не бачу.
Кавідны пост
Пачуў на днях пра артыкул, пра які вы таксама хутка пачуеце, калі яшчэ не - пра тое, што пабочных эфектаў ад mRNA вакцын больш, чым карысці. Крытыка таксама ўжо даступная. Ну і вырашыў напісаць свой першы і спадзяюся апошні пост пра кавід.
Справа ў тым, што я нічога не ведаю пра кавід. І гэтаму ёсць некалькі прычын.
Па-першае, мне проста не цікава. На пачатку эпідэміі ў мяне яшчэ былі спадзяванні на зомбі-апакаліпсіс, але ўся гэтая гісторыя надакучыла мне даволі хутка.
Па-другое, веды статыстыкі, якія патрабуюцца для аналізу такіх дадзеных, у мяне адсутнічаюць. Дакладней, ніякіх асаблівых ведаў там не патрэбна, але ў мяне адсутнічае інтуіцыя пра нюансы працы з імі. Адносныя рызыкі, абсалютныя рызыкі, OR, RR, крывыя выжывання, кантрольныя кропкі, чаго ўвогуле, куды, за шо.
Па-трэцяе, на адных ведах статыстыкі далёка не ўедзеш. Для таго, каб ацаніць дызайн у такіх рэчах, трэба шмат прадметных ведаў: як так арганізаваць плацэба для прыскалкі ў нос, у якой ёсць спірт, каб кантрольная нічога не зразумела; хто там праводзіць даследаванне - персанал, які пастаянна кантактуе з кавіднікамі ці нейкія стэрыльныя таварышы; адкуль там антыцелы браць, праз які перыяд і мільёны падобных нюансаў. Калі казаць выключна пра статыстыку, ёсць жарт, што людзі, якія бачылі, як медыкі аналізуюць свае дадзеныя, пачынаюць паважаць эканамістаў. Што таксама не дадае матывацыі ў гэтым разбірацца.
Гляджу таму я на гэта ўсё гэта даволі прагматычна:
1. Кумулятыўных доказаў таго, што вакцыны працуюць (у шырокім сэнсе), настолькі шмат, што мне лянота сумнявацца. Калі нехта знойдзе канкрэтны прабел, я пра гэта абавязкова пачую, мы ўсе пачуем.
2. Калі мне задаюць пытанне, наколькі верагодныя фальсіфікацыі ў дадзеных пра кавід, я адказваю, што верагоднасць там 100%. Ну, ціпа - фармакалогія ёсць самай карумпіраванай дысцыплінай, у якой выкарыстоўваецца статыстыка. Але чаму толькі кавідныя вакцыны? Гэта ж для ўсяго справядліва, было і будзе. Пераставаць хадзіць да доктараў я праз гэта не збіраюся.
Асноўная праблема каляпалітычных антываксерскіх дэбатаў пра кавід у тым, што людзі бачаць нейкую супярэчнасць паміж гэтымі фактамі. Я не бачу.
Ssrn
Serious Adverse Events of Special Interest Following mRNA Vaccination in Randomized Trials
Introduction: In 2020, prior to COVID-19 vaccine rollout, the Coalition for Epidemic Preparedness Innovations and Brighton Collaboration created a priority list
#everyday
На працы паказалі графік з верагоднасцю трапіць у шпіталь з пераломам у залежнасці ад узросту. Даволі цікавае.
Па-першае, на графіку добра бачны пубертат: да 15 год хлопчыкі і дзяўчынкі ламаюцца прыкладна аднолькава, пасля 15 дзяўчынкі рэзка перастаюць, хлопчыкі - паскараюцца ўдарнымі тэмпамі. Яно і зразумела: спрадвечная эвалюцыйная стратэгія “прыгні з маста, каб спадабацца дзяўчыне, з якой ты нават не размаўляў” сама сябе не рэалізуе.
Далей таксама цікавае. Самы надзейны ўзрост для мужчын - гэта 60 год. Літаральна перасячэнне, калі яшчэ ёсць нейкі тэстастэрон і здольнасць утрымліваць мышачную масу, але схільнасці да ідыятызму куды менш, чым у 17.
P.S.: Калі вам 60 год і вы яшчэ прыгаіце з мастоў, каб спадабацца жанчынам - заўвагу пра ідыятызм можаце ігнараваць. Бясконца паважаю і не адгаворваў б.
На працы паказалі графік з верагоднасцю трапіць у шпіталь з пераломам у залежнасці ад узросту. Даволі цікавае.
Па-першае, на графіку добра бачны пубертат: да 15 год хлопчыкі і дзяўчынкі ламаюцца прыкладна аднолькава, пасля 15 дзяўчынкі рэзка перастаюць, хлопчыкі - паскараюцца ўдарнымі тэмпамі. Яно і зразумела: спрадвечная эвалюцыйная стратэгія “прыгні з маста, каб спадабацца дзяўчыне, з якой ты нават не размаўляў” сама сябе не рэалізуе.
Далей таксама цікавае. Самы надзейны ўзрост для мужчын - гэта 60 год. Літаральна перасячэнне, калі яшчэ ёсць нейкі тэстастэрон і здольнасць утрымліваць мышачную масу, але схільнасці да ідыятызму куды менш, чым у 17.
P.S.: Калі вам 60 год і вы яшчэ прыгаіце з мастоў, каб спадабацца жанчынам - заўвагу пра ідыятызм можаце ігнараваць. Бясконца паважаю і не адгаворваў б.
#statistics #science
Мне па працы часта прыходзіцца чытаць артыкулы пра пра менструальныя цыклы, цяжарнасці ці авуляцыі. Часам натыкаюся на вясёлы трэш. Зараз пра адзін распавяду.
Аўтары паперы знайшлі, што ў 2012 у ЗША замужнія жанчыны ў авуляцыю часцей выбіралі Ромні, а незамужнія ў авуляцыю - Абаму. Тлумачылі яны гэта прыкладна так: для незамужніх у авуляцыю важна перадаць свае гены, таму яны выбіраюць больш сіметрычнага Абаму (больш сіметрыі - лепшыя гены). А замужнія абіраюць кансерватара Ромні, бо гэта ў іх ад шлюбу развіўся механізм, які ў авуляцыю робіць іх больш кансерватыўнымі і такім чынам спрыяе захаванню шлюба.
Душэўна. Давайце ўявім, што аўтары б атрымалі вынікі наадварот - незамужнія ў авуляцыю галасуюць за кансерватараў, замужнія ў авуляцыю - за лібералаў. Прыдумаць такой якасці “тлумачэнне” - 2 хвіліны: “незамужнія выбіраюць у авуляцыю кансерватараў, бо шукаюць больш маскулінных партнёраў, а замужнія галасуюць за лібералаў, бо цяжар сямейнага быту робіць усялякія ліберальныя каштоўнасці, у тым ліку - вольныя сексуальныя паводзіны, больш прывабнымі”. Ну ці прыдумайце свой варыянт. Прыдумляць іх можна хоць да ночы.
Я гэта да чаго. Ёсць шмат прычын лічыць, што гэтае даследаванне - шум. Калі паварочаць любы шум - па рознаму вызначаць фертыльнае акно, паглядзець не на шлюбы, а на заробак, ці лакацыю і г.д. - шум пачне складацца ў патэрны. Якія патэрны мы б там не пабачылі, мы б заўсёды здолелі прыдумаць ім тлумачэнне.
Мне па працы часта прыходзіцца чытаць артыкулы пра пра менструальныя цыклы, цяжарнасці ці авуляцыі. Часам натыкаюся на вясёлы трэш. Зараз пра адзін распавяду.
Аўтары паперы знайшлі, што ў 2012 у ЗША замужнія жанчыны ў авуляцыю часцей выбіралі Ромні, а незамужнія ў авуляцыю - Абаму. Тлумачылі яны гэта прыкладна так: для незамужніх у авуляцыю важна перадаць свае гены, таму яны выбіраюць больш сіметрычнага Абаму (больш сіметрыі - лепшыя гены). А замужнія абіраюць кансерватара Ромні, бо гэта ў іх ад шлюбу развіўся механізм, які ў авуляцыю робіць іх больш кансерватыўнымі і такім чынам спрыяе захаванню шлюба.
Душэўна. Давайце ўявім, што аўтары б атрымалі вынікі наадварот - незамужнія ў авуляцыю галасуюць за кансерватараў, замужнія ў авуляцыю - за лібералаў. Прыдумаць такой якасці “тлумачэнне” - 2 хвіліны: “незамужнія выбіраюць у авуляцыю кансерватараў, бо шукаюць больш маскулінных партнёраў, а замужнія галасуюць за лібералаў, бо цяжар сямейнага быту робіць усялякія ліберальныя каштоўнасці, у тым ліку - вольныя сексуальныя паводзіны, больш прывабнымі”. Ну ці прыдумайце свой варыянт. Прыдумляць іх можна хоць да ночы.
Я гэта да чаго. Ёсць шмат прычын лічыць, што гэтае даследаванне - шум. Калі паварочаць любы шум - па рознаму вызначаць фертыльнае акно, паглядзець не на шлюбы, а на заробак, ці лакацыю і г.д. - шум пачне складацца ў патэрны. Якія патэрны мы б там не пабачылі, мы б заўсёды здолелі прыдумаць ім тлумачэнне.