Лінейная (аг | рэг) рэсія
1.3K subscribers
85 photos
3 files
140 links
Пра даныя і як іх прыстасаваць да штодзённасці

Мяне можна знайсці

У твітары: https://twitter.com/aliaksandr_k
Англ: https://twitter.com/unfriendlydata
Ці ў тг: @shurackapalieski
Download Telegram
Зоркі аўтарытарнай мадэрнізацыі і беларуская эканамічная навука

#statistics #belarus

Ёсць такая зорка беларускай аўтарытарнай мадэрнізацыі як Кірыл Руды. Кірыл Руды - прафесара кафедры сусветнай эканомікі і доктар эканамічных навук. У яго ёсць артыкул у часопісе “Банкаўскі веснік”, за люты 2021, пад назвай “О политэкономии финансовой стабильности”. Там ён мадэлюе “взаимосвязь между долгосрочным экономическим ростом и динамикой политических предпочтений”. Ну, груба кажучы, спрабуе “прадказаць” ці “патлумачыць”, чаму ў некаторых краінах падтрымліваюць дэмакратыю, у некаторых - аўтарытарных лідараў, ці ваенных і г.д.

Нас цікавіць ягоная лінейная мадэль “прадказання” ці “тлумачэння” узроўню падтрымкі ваенных. R^2 гэтай мадэлі - 1. Калі вам не смешна, віншую - вы здаровы чалавек. Мне вельмі смешна і зараз я буду тлумачыць так, каб і вам было. Спачатку будзе крыху нудна, але заставайцеся на сувязі - потым будзе забаўна.

Я буду спрошчваць і апускаць дэталі, але для папулярнага тлумачэння пойдзе. Уявіце сабе, як у школе, каардынатную плоскасць. X у нас будзе “аб’ём экспарту фіялак”, а Y - “колькасць забойстваў на душу насельніцтва”. Цяпер паставім адну кропу, Беларусь. Праз нашую няшчасную Беларусь можна правесці прамую лінію. Цяпер дакінем яшчэ кропку, Уганду. Праз любыя 2 кропкі на каардынатнай плоскасці таксама можна правесці прамую лінію. Такім чынам, усе нашыя кропкі ляжаць на прамой лініі і гэтая прамая лінія ідэальна “тлумачыць” залежнасць колькасці забойстваў ад экспарту фіялак, і фіялкамі можна беспамылкова прадказваць забойствы. R^2, альбо “якасць падгонкі” такой лінейнай мадэлі будзе 1, ідэальная. Як у Кірыла Рудага. А вось калі мы дакінем яшчэ кропку, прамую лінію ўжо не абавязкова атрымаецца правесці так, каб усе тры з іх ляжалі на ёй. Можна, але не абавязкова.

Цяпер уявім трохмерную прастору: экспарт фіялак, папулярнасць гурту РСП і колькасць забойстваў. Праз адну, дзве ці тры кропкі на гэтай прасторы заўсёды можна правесці плоскасць. І R^2 будзе 1. Ідэальная мадэль. А праз чатыры - ужо не абавязкова. Не складана здагадацца, як гэта абагульніць: калі на прасторы, сфармаванай N пераменнымі, ляжыць N ці менш кропак, праз іх заўсёды можна правесці N-1 гіперплоскасць. І заўсёды атрымаць R^2 = 1 (насамрэч для той мадэлі, якой карыстаецца Руды, гэта справядліва і для N+1 кропак, але тое тэхнічныя дэталі).

Іншы папулярны метад стрэльнуць сабе ў нагу і атрымаць ідэальную мадэль - гэта прадказваць пераменную з дапамогай гэтай ж пераменнай. Ну, колькасць забойстваў з дапамогай колькасці забойстваў. Ідэальнае прадказанне, R^2 = 1.

Што канкрэтна нарабіў Кірыл Руды я не ведаю. З таго, што напісана ў тэксце, памылку рэканструяваць нельга. У яго 38 краін для аналізу і 13 пераменных. Падазраю, недзе згубіў больш паловы сваіх назіранняў.

Памылкі робяць усе. Памылкі такога кшталту ўвогуле здараюцца часта. Нармальная рэакцыя на гэта - пабачыць, што ў цябе R^2 = 1, зрабіць кавы і пачаць разбірацца, дзе ты накасячыў. Тое, што ў Кірыла Рудага, ці ў аспірантаў у ягоным рабстве, якія насамрэч пісалі гэты артыкул, нічога не стрэльнула ў галаве, ёсць даволі іранічным. Тое самае тычыцца рэцэнзентаў, якія гэты артыкул правяралі і дапускалі да публікацыі.

А разгадка простая: беларуская эканамічная навука ў заўважнай ступені - карга-культны карга-культ, дзе шмат у каго мала ўяўлення пра тое, чым яны спрабуюць займацца.
#war #statistics #belarus

Пад’ехала чарговае апытанне пра стаўленне беларусаў да пуцінскай вайны з Украінай. У адрозненні ад папярэдняга апытання, якое я скідваў, цяпер у нас не тэлефоннік, а інтэрнэт-панэль.

З большага, лічбы падобная. Жадаюць удзелу Беларусі ў вайне супраць Украіны 3% (магія). У тэлефонніку такіх было 11%.

Падтрымліваюць дзеянні расіі ў той ці іншай форме 8% - 39%, у залежнасці ад пытання. У тэлефонніку было ~25-40%

Самай “папулярнай” формай падтрымкі ёсць “Поддержать действия России, но не вступать в военный конфликт” - 28%. Не жадаюць падтрымліваць расію, хочуць вываду войска/нейтралітэту/падтрымаць Украіну/ваяваць за Украіну - 45%.

З большага, гэтая пара апытанняў выглядае адэкватна: на інтэрнэт-панэлі лічбы крыху лепш, на тэлефонніку - крыху горш, але з большага яны падобная. З улікам таго, што нічога лепшага мы верагодна не атрымаем, я б на іх арыентаваўся як на лепшую прыкідку.
#statistics #belarus

Часам можна пабачыць, як людзі заломваюць рукі і пытаюцца, чаму Беларусь не дэмакратыя. Пытанне валіднае і для грамадскай дыскусіі карыснае. Але ёсць нюанс. Мне падаецца, што ў гістарычнай перспектыве яно не вельмі цікавае. Прынамсі пакуль. Бо нічога незвычайнага ў беларускім аўтарытарызме няма.

Часам, калі аналізуюць дэмакратызацыі, у якасці адной з пераменных выкарыстоўваюць дыстанцыю, у кіламетрах, да Бруселя. Як тут. Які ў гэтым сэнс? Ідэя ў тым, што недзе ў тых землях, ці адносна побач, з людзьмі нешта не так. То пратэстантызм сабе прыдумаюць, то дэмакратыю, то яшчэ чаго для праваслаўнага чалавека шкоднага.

Ну а далей зусім проста: ідэі, як вірус, пераносяцца людзьмі, ну і раз суседзі камунікуюць больш, ідэі паміж імі перацякаюць хутчэй. У гэтым сэнсе проста кіламетры да Бруселя - метрыка ідыёцкая, размова пра шчыльнасць кантактаў, гандлю і г.д. Затое яе проста падлічыць.

Увогуле, калі паглядзець на мапу Freedom House, на нашым кантыненце не так шмат анамалій: дэмакратычная Манголія, дэмакратычная Індыя ну і яшчэ парачку. У астатнім - дэмакратыя, як пляма, размазана кіламетрамі ад Бруселя. Але гэта візуальна, то мне захацелася падлічыць усё больш фармальна.

Ну я і падлічыў. Карэляцыя паміж тым, колькі краіна год бесперапынна дэмакратыя і кіламетрамі для Бруселя негатыўная, -0.6. Тобок, чым далей ад брусэляў, тым менш год вашым дэмакратыям.

Карэляцыя -0.6 гэта многа ці мала? Для параўнання:
- карэляцыя паміж інфляцыяй і ростам ВУП з 1960 па 2020 на планеце была -0.064
- карэляцыя паміж памерам ВУП на душу і працягласцю жыцця за той ж перыяд была 0.549

Кажучы проста, тупыя кіламетры для Бруселя - больш моцны прэдыктар дэмакратызацыі, чым ВУП на душу насельніцтва - прэдыктар працягласці жыцця і нашмат больш моцны, чым інфляцыі ёсць прэдыктарам эканамічнага росту.

Прынамсі, гэта для краін "Europe & Central Asia" у класіфікацыі сусветнага банку. Для ўсёй планеты гэта працаваць не будзе, таму што дыстанцыя да Новай Зеландыі ў кіламетрах надта вялікая. А дадзеных пра шчыльнасць кантактаў, гандлю і г.д. у мяне няма.

Пры гэтым, калі вы распавядзе пра гэты факт “палітолагам”, вы адразу пачуеце мільён заўваг: “Вільня ж не далей ад Бруселя, чым Менск!”, “а Талін далей, ха!” і г.д. Усё гэта таму, што ў “палітолагаў”, як правіла, няма колькаснай інтуіцыі наконт таго, колькі контрпрыкладаў можа існаваць на залежнасці рознай сілы.
#belarus #statistics

Ніколі такога не было і вось ізноў: Чалы спрабуе даказаць беларусам, што не трэба слухаць Шрайбмана (спасылка на Курэйчыка рандомная, мне лянота арыгіналы шукаць). Не ведаю, якое ў вас стаўленне да гэтага пласту беларускай культуры. Я стараюся ігнараваць, але часам як у тым меме з чалавекам-павуком.

Але распавесці хачу не пра гэта. Яны там закранаюць даследаванне Chatham House пра тое, як мы ставімся да геяў, чорных, арабаў і г.д. У Гены Коршунава ёсць добры агляд, каму цікава.

Калі коратка, задаюць пытанне “Я лично готов(а) принять представителя данной группы …" і даюць адказы: Как близкого родственника, Как близкого друга, Как соседа по дому, Как коллегу по работе, Как гражданина моей страны, Как гостя (туриста) в моей стране, Ни в каком виде. Далей прыпісваюць балы ад 1 да 7 і мераюць дыстанцыю. Усё даволі проста.

А я вырашыў разабрацца, якімі характарыстыкі беларусаў можна прадказаць. І прыйшоў да высновы, што прадказаць беларусаў…немагчыма.

Усяго задаюць пытанні пра 14 груп. Я пабудаваў лінейныя мадэлі (што крыху бязбожна, затое хутка) для ўсіх 14. Ну і набраў тыповых падазроных: пол, узрост, памер населенага пункту, матэрыяльнае становішча, узровень адукацыі. Дык вось. Мае мадэлі на каленцы тлумачаць 0 - 9% варыяцыі ў адказах. Тобок нічога не тлумачаць.

Лепш за ўсё тлумачыцца стаўленне да геяў, 9%. Ну і гісторыя там прадказальная: чым вы маладзейшы, больш адукаваны, у лепшым матэрыяльным стане, тым больш вы талерантны. Яшчэ дапамагае, калі вы жанчына. Усё гэта карэлюе з адказамі, проста слаба.

Агулам беларусы непрадказальныя, няўлоўныя, містычныя. Як смуга над полем, як багна, як чарговая тэма для срачаў у твітэры.
#belarus #statistics

Прынёс вам малавядомае (як мне падаецца) апытанне беларускай моладзі. Наколькі я ведаю, у яго быў спецыфічны рэкрутынг, могуць быць скосы ў бок моладзі больш актыўнай. Але пачытаць было цікава. Парачка вясёлых фактаў:

• Для прыхільнікаў улады дзеці з’яўляюцца непараўнальна большай каштоўнасцю, чым для праціўнікаў.
• Апазіцыйная моладзь хоча ў Балта-Чарнаморскі Саюз нават больш, чым у ЕС.
#statistics #belarus

Чалавек тут паспрабаваў прыкінуць, колькі твітаў па-беларуску публікуецца ў дзень. Атрымалася каля 4.000. Метадалогія апісаная тут.

Колькі твітаў у дзень прыходзіцца на аднаго карыстальніка падлічыць складана, вельмі залежыць ад групы. Ёсць лічба ў 2.6 твітаў на дзень. 4.000/2.6 = 1538 унікальных беларускамоўных карыстальнікаў у дзень.

Пры гэтым, усяго ў краіне каля 147.000 карыстальнікаў твітэра. Гэта тыя, да каго можна дабрацца рэкламай, на думку твітэра. Але колькі ў гэтай лічбе канкрэтна актыўных, колькі піша кожны дзень і г.д. сказаць цяжка.
#belarus

У сувязі з апошнімі навінамі, пакажу вам забаўную статыстыку з далёкага 2012.

Напэўна шмат хто чуў пра тое, што Беларусь некалькі год займала першае месца ў свеце па колькасці шэнгенаў на душу насельніцтва. У першай таблічцы гэта і бачна - гіганцкі адрыў ад суседзяў, да і ўсіх астатніх.

Мала хто ведае, што Беларусь пры гэтым трымала 4 месца ў свеце (з канца) па колькасці адмоваў у візах. Гэта другая табліца. Менш адмаўлялі толькі жыхарам Бахрэйна, Амана і Трынідада і Табага. Я праўда не ведаю, але падазраю, што там проста мала іх выдавалі - аля “залатыя візы” для шэйхаў.

Пры гэтым, большасць адмоваў беларусам была праз недахоп фінансавых сродкаў - 2351 выпадак у 2011. А праз фальшывыя дакументы - 2.

Гэта ўсё зараз не вельмі важна. Але важна ўмець складаць ідэнтычнасць з дробных фактаў. Факт у тым, што беларусы былі самымі цывілізаванымі з т.з. “трэціх краін” - акропалісы не грамілі, дакументы адказна рыхтавалі, арганізаванымі чэргамі вярталіся дадому. Чым, у тым ліку, еўрапейцы актыўна карысталіся ў сваіх эканамічных інтарэсах.
#belarus #statistics

Другі дзень крычу з дадзеных пра веру ў астралогію і "іногда не до законов", можаце і вы пакрычаць. Залежнасць знайшла каманда майго сябра, сацыёлага Філіпа Біканава, які нарэшце завёў сабе канал. Там больш падрабязнасцяў.

Добрай усім пятніцы
#belarus #statistics

У Chatham House выйшла чарговая, здаецца 11-ая хваля апытанняў гарадскога насельніцтва Беларусі. Папярэдняя была ў чэрвені.

З цікавага:
• Ваяваць на баку расіі ўсё яшчэ хоча 3%
• Мінімальна падае падтрымка расіі ў вайне супраць Украіны, з 33% да 30%
• Расце колькасць тых, хто расію не падтрымлівае - з 43% да 45%
• Назіраецца падзенне па ўсіх слупах крамлёўскага наратыву: менш людзей верыць, што войска рф не бамбіць мірных жыхароў, менш верыць ва ўдзел беларускай арміі, больш людзей лічаць вайну бессэнсоўнай.

Тэндэнцыі ў правільным кірунку, але не рэвалюцыйныя па памеры. З чым яны звязаныя - сказаць складана. Падазраю, што барацьба з каларадам на свежым паветры і адсутнасць на дачах тэлевізара мае тэрапеўтычны эфект. З іншага боку, апытанне за жнівень і людзі яшчэ навіны пра Ізюм і Балаклею не бачылі.