как они растут /
3.13K subscribers
174 photos
36 videos
4 files
156 links
Download Telegram
как они растут /
Photo
Только что увидел в сторис у ПВ вот такие прекрасные лейблы-предупреждалки на венгерских Мальборо. Запостил вк. Пишут, что такие не только в Венгрии, но вообще в ЕС и не только на Мальборо. Меж тем в Таиланде всё как-то менее атмосферно:
ДВАДЦАТЬ ТРИ СОТЫХ ЧЕЛОВЕКА

В фб у Петра Талантова https://goo.gl/YK3Ng4 наткнулся на свежий пример про важность конфаундинга. Для тех, кто не читал мой предыдущий пост (https://t.me/rastut/413), напоминаю, что конфаундинг — это когда на какой-то исход (к примеру, развитие заболевания) влияют несколько факторов. Исследователь может найти статистически значимую связь между неким фактором и интересующим результатом, и, игнорируя присутствие других факторов, сделать неправильный причинно-следственный вывод. Часто это происходит в ходе небольших кросс-секционных исследований. Такие исследования нужны, потому что через них накапливаются данные в принципе о возможных комбинациях причин и следствий. С другой стороны, от каждого такого исследования порождается очередная куча бестолковых пресс-релизов в новостях, которые бесят и которые все уже научились игнорить, типа «КАРТОШКА ВЫЗЫВАЕТ РАК» «НАЙДЕН НОВЫЙ ПРОДУКТ ДЛЯ ПОХУДЕНИЯ, а «британские учёные доказали, что…»

1 ноября на газета.ру https://goo.gl/VnYiWV (и ещё много где) вышли статьи «АППЕНДИКС ДОЛОЙ! КАК УДАЛЕНИЕ АППЕНДИКСА ПОМОГАЕТ СПАСТИСЬ ОТ БОЛЕЗНИ ПАРКИНСОНА». По мотивам исследования, опубликованного 31 октября в science translational medicine https://goo.gl/WJ1PkU . Идея такая: в основе развития болезни Паркинсона лежит разрушение нейронов черной субстанции, вырабатывающих дофамин. Т-лимфоциты разрушают нейроны, потому что на поверхности последних накапливается патологическая форма белка альфа-синуклеина, обладающего антигенными свойствами. Недавно патологическую форму альфа-синуклеина нашли в аппендиксе и задачей исследования, опубликованного в science translational medicine, было посмотреть: есть ли статистически-значимые различия в развитии болезни Паркинсона между группами людей, у которых в анамнезе была аппендэктомия и у которых не было. Анализировались данные 1,6 миллиона человек. В итоге, оказалось что у людей после аппендэктомии болезнь Паркинсона развивалась на 20% реже, чем у людей с неудалённым аппендиксом. Вернёмся к посту Талантова https://goo.gl/YK3Ng4 . Он справедливо замечает, что подобного рода обсервационное исследование лишь добавляет данные в копилку, но никак не указывает на причинно-следственную связь, потому что — конфаундинг (мы не знаем о возможном наличии какого-то третьего фактора, который обуславливает предрасположенность к воспалению аппендикса и в то же время снижает риск развития болезни Паркинсона).

Но самое главное, такую разницу едва ли можно считать клинически значимой, потому что если перевести результаты из относительных цифр в абсолютные, получается, что болезнь Паркинсона была диагностирована у 1,17 человека из каждой тысячи перенесших аппендэктомию, и у 1,4 человека на каждую тысячу популяции в целом (не пугайтесь дробей в отношении людей, в данном случае это ОК). То есть на тысячу людей аппендэктомия препятствовала развитию заболевания у двадцати трёх сотых человека (1,4-1,17). Скольким людям из общей популяции надо планово удалить аппендикс, чтобы уберечь одного ЦЕЛОГО человека от развития болезни Паркинсона (при условии, что аппендикс действительно влияет на её развитие)? Составляем пропорцию 0,23человека/1000людей=1целый человек/Xлюдей X=1000/0,23=4347,82 человека (округляем до 4348 целых людей)
как они растут /
ДВАДЦАТЬ ТРИ СОТЫХ ЧЕЛОВЕКА В фб у Петра Талантова https://goo.gl/YK3Ng4 наткнулся на свежий пример про важность конфаундинга. Для тех, кто не читал мой предыдущий пост (https://t.me/rastut/413), напоминаю, что конфаундинг — это когда на какой-то исход (к…
И ещё один хороший пример про конфаундинг (фрагмент из книги Чарльза Уилана "Голая статистика")

Рассмотрим следующую гипотетическую новость из интернета: «Люди, которые делают короткие перерывы в работе в течение дня, имеют гораздо больше шансов умереть от рака». Представьте появление на экране такого сообщения, когда вы занимаетесь веб-серфингом. Согласно весьма впечатляющим результатам обследования 36 000 работников (огромный массив данных, не правда ли?!), у тех, кто выходил из офиса на регулярные десятиминутные перерывы в течение каждого рабочего дня, вероятность заболевания раком в последующие пять лет оказалась на 41 % выше, чем у тех, кто офисы не покидал. Понятно, что узнав такую новость, мы обязаны как-то на нее реагировать: возможно, провести общенациональную кампанию за запрет коротких перерывов в течение рабочего дня.

А может, следует подойти к проблеме с другой стороны и задуматься над тем, чем именно обычно занимаются работники во время таких десятиминуток? Не мне вам рассказывать, что многие кучкуются неподалеку от входа в офисное помещение, покуривая сигареты (и создавая при этом облако дыма, через которое вынуждены проходить те, кто входит или выходит из здания). Смею предположить, что именно сигареты, а не кратковременные перерывы в работе, являются основной причиной раковых заболеваний. Большинству читателей этот пример покажется абсурдным, но могу вас заверить, что многие статистические умозаключения, встречающиеся в реальной жизни, оказываются не менее абсурдными после их тщательного анализа.
Было очень важно записать. Просто оставлю здесь.
как они растут /
Было очень важно записать. Просто оставлю здесь.
ПРО P-УРОВЕНЬ ЗНАЧИМОСТИ

(Спешл для тех, кто хочет уже наконец разобраться, как работает медико-биологическая статистика!!)

Статистические методы, любые, в том числе из медико-биологических исследований, основаны на теории вероятностей. Простой и ключевой тезис, хотя для человека «непосвящённого» это может быть не столь очевидно. Откуда вообще появляется 'вероятность', если мне, например, надо узнать: работает лекарство или нет? Неужели недостаточно просто набрать две группы людей, одним давать препарат, другим — плацебо, и оценить результаты? (разумеется, сделать всё методологически правильно: участников набрать по заранее установленным критериям включения-невключения, провести рандомизацию, создать условия двойного ослепления и т.д.).

Вот например, были у нас грибы (а может быть, сушёные чёрные тараканы?) и мы обнаружили в них вещество, которое, как нам кажется, может увеличивать суточный диурез — объём мочи, который человек выделяет за сутки. Мы провели исследование и выяснили, что в первой группе, которая получала таблетку с веществом, среднее значение суточного диуреза было на 150 мл выше, чем в плацебо-группе. Неужели только этих данных недостаточно, чтобы сделать выводы об эффективности? Причём тут статистическая значимость и теория вероятностей?

Современные статистические методы основаны на идее фреквентизма. Сама идея была разработана Рональдом Фишером, английским биологом-эволюционистом. Согласно ей, статистическая неопределённость, т.е. вероятность ошибиться, имеет место, потому что мы можем получить выводы только на данных выборки, а не ЦЕЛОЙ ПОПУЛЯЦИИ (=совокупности).

Важно: критерии однородности тех, кого считать «популяцией», задаёт сам исследователь. Например, в исследовании эффективности химиопрепарата против рака молочной железы в качестве популяции будут выступать все женщины с определённым типом рака молочной железы, в отношении которого, как предполагается, этот химиопрепарат активен. В нашем примере с потенциальным диуретиком из гриба мы принимаем за популяцию всех людей с нормальным диурезом. Тем не менее суточный диурез при одинаковом потреблении жидкости даже у здоровых добровольцев постоянно колеблется. И полученную разницу в 150мл, мы могли получить лишь потому что в группу 'диуретика' случайно попали люди, у которых в день исследования диурез был завышен, в то время как в группе-плацебо оказались преимущественно те, у кого диурез был ниже обычного. Результат — зафиксирована разница 150мл. Наша задача выяснить: какая вероятность получить похожую разницу, если просто рандомно вытащить две выборки из популяции, ничем при этом на них не действуя.
как они растут /
ПРО P-УРОВЕНЬ ЗНАЧИМОСТИ (Спешл для тех, кто хочет уже наконец разобраться, как работает медико-биологическая статистика!!) Статистические методы, любые, в том числе из медико-биологических исследований, основаны на теории вероятностей. Простой и ключевой…
Теперь можно провести мысленный эксперимент. Мы знаем что средний суточный диурез у здорового человека равен примерно 1200мл. При этом, используя статистическую модель, мы можем спрогнозировать с какой частотой в популяции будут встречаться другие численные показатели диуреза (см.картинку ниже — основная часть будет сконцентрирована вокруг среднего). Условно примем что вся совокупность равна 100 человек (сто, тысяча или десять тысяч — не принципиально, так как согласно модели, частота, т.е. ДОЛЯ конкретного значения признака от общего числа вариантов, всегда будет приблизительно одной и той же. Когда так происходит и почему — отдельный разговор).

Начинаем мысленно извлекать из этой сотни разные пары выборок, допустим, по 10 человек. Возможное число комбинаций в этом случае приблизительно равно 10^27. И теперь мы можем посчитать, сколько из этих пар могут дать разницу в 150мл и больше. На этом этапе мы можем увидеть, например, что разницу в 150мл и более давали бы 50% всех рандомно-извлекаемых пар выборок. То есть мы бы через раз получали такую разницу, просто измеряя диурез в двух разных группах здоровых людей без какого-либо предварительного воздействия. Нет оснований считать такую разницу результатом действия диуретика. То есть она СТАТИСТИЧЕСКИ НЕЗНАЧИМА. Если же мы видим, что такая разница возникает менее чем в 5% от всех возможных пар выборок, то у нас есть основания считать, что эта разница НЕ СЛУЧАЙНА, то есть СТАТИСТИЧЕСКИ ЗНАЧИМА. Другими словами если диуретик и плацебо оказывают одинаковое воздействие (то есть НЕ ОКАЗЫВАЮТ никакого воздействия) вероятность получить наблюдаемые различия будет меньше 5%. Этот процент, эта вероятность и есть p-уровень значимости. Его критическое значение 0,05 (0,02 или 0,01) устанавливает сам исследователь. Если мы получили p-уровень значимости меньше установленного заранее критического значения, то у нас есть основания полагать, что полученная разница обусловлена, например, действием препарата.
как они растут /
Теперь можно провести мысленный эксперимент. Мы знаем что средний суточный диурез у здорового человека равен примерно 1200мл. При этом, используя статистическую модель, мы можем спрогнозировать с какой частотой в популяции будут встречаться другие численные…
(Из Гланца) ‘горка’ сверху — распределение значений признака в популяции, где помеченные кружочки — показатели, которые случайно попали в выборки. Ниже показано как эти данные видит исследователь. Возможное число комбинация пар выборок по 10чел=10^27. В данном случае препарат, как и плацебо, не влияет на диурез.
ПРО БАЙЕСЫ

Многолетний ажиотаж вокруг витамина C ещё в 70-ые в мировом масштабе заварил дважды нобелевский лауреат Лайнус Полинг (зацените-ка авторитетность экспертного мнения!), который считал, что аскорбиновая кислота в больших дозах способна не только лечить простуду, но и замедлять старение, и даже предотвращать развитие онкологических заболеваний и ещё много чего. Самым живучим оказалось заблуждение о простуде. Чарлмерс и Альтман в книге «Систематические обзоры» историю Полинга приводят в качестве иллюстрации примера «систематической ошибки отбора». То есть проанализировав литературу в общем, а также книги и обзоры самого Полинга о пользе витамина С, авторы обнаружили, что уже на тот момент, 1980-ые, только пара исследований как-то подтверждали пользу витамина С в защите от простуды, в то же время существовало гораздо больше данных, не подтверждающих эту гипотезу. Дело даже не в том, что у Полинга могли быть какие-то корыстные цели сбить всех с толку. Скорее эта история про то, что он настолько был одержим своей витаминной теорией и верил в неё, что игнорировал любые противоречивые данные.

Те, кто когда-нибудь пробовал спорить в интернете, писал какие-то работы и делал доклады, могут узнать себя. Вспомнить это стремление найти нужную информацию, подтверждающую собственную точку зрения, игнорируя всё, что хоть как-то идёт вразрез. Вообще, это так называемый конфэмейшн байес — confirmation bias (‘предвзятость подтверждения'), о нём хорошо рассказывала у себя на канале Ксения Ниглас, посмотрите https://youtu.be/6BbvudRd6Dg
как они растут /
ПРО БАЙЕСЫ Многолетний ажиотаж вокруг витамина C ещё в 70-ые в мировом масштабе заварил дважды нобелевский лауреат Лайнус Полинг (зацените-ка авторитетность экспертного мнения!), который считал, что аскорбиновая кислота в больших дозах способна не только…
Ещё интересный пример есть у Сэкетта (Clinical Epidemiology : A Basic Science for Clinical Medicine, для тех, кто не в курсе, Дэвид Сэкетт — это тот самый чувак, основоположник доказательной медицины) про то, что при обследовании пациентов врачи стремятся найти тот диагноз, который они изначально заподозрили, порой из пальца высасывая данные ‘за’ и игнорируя данные ‘против’. Как и с любыми другими когнитивными искажениями, так происходит, потому что для мозга это более простая, удобная тактика. При этом если два врача предполагают разные диагнозы, им даже при наличии результатов объективного исследования и диагностических тестов сложно прийти к общему консенсусу. Есть даже такой индекс каппа — про интерпретацию данных инструментальных исследований, который при абсолютном согласии между двумя специалистами равен 1,0. На практике показатель единицы кажется невозможным. Тот же Сэкетт приводит следующие данные: для специалистов, оценивающих давление в яремных венах, стадию диабетической ретинопатии по снимкам глазного дна, результаты маммографии, индексы каппа в среднем составляют соответственно 0.42 , 0.55 и 0.67. Немного жутко.

Так вот, люди — существа очень предвзятые, очень. Новый опыт нам приходится пропускать через призму опыта старого и в зависимости от условий, целей, убеждений наблюдатели могут интерпретировать одну и ту же вещь по-разному. Отсюда вытекает множество других когнитивных искажений — байесов (см. картинку ниже, в целом они похожи между собой). Наука как таковая, т.е. научная методология, в том числе математические методы — это такой способ максимально уменьшить влияние байесов на процесс познания (отсюда например, крайне важно ослепление в любых исследованиях, где это только осуществимо). Хотя работает это далеко не во всех случаях и постоянно вскрываются какие-то новые и новые неучтённые байесы.
как они растут /
https://307ntl34wci12hk39n1c9pfv-wpengine.netdna-ssl.com/wp-content/uploads/2016/02/bi_graphics_20-cognitive-biases-that-screw-up-your-decisions.png
Отсюда же возникает один из основополагающих философских вопросов: возможно ли объективное познание мира и объективная реальность — она есть вообще? Как подчёркивает Нейт Сильвер, собственно наука начинается там, где вопреки нигилистической точке зрения, принимается условие — что ДА есть и к объективному пониманию можно стремиться (бесконечно приближаться, ага). А немецкий психолог Герд Гигеренцерне в книге ‘Bounded and Rational: Contemporary Debates in Cognitive Science' пишет, что не следует считать человеческое мышление насквозь пронизанным иррациональными когнитивными искажениями, скорее следует рассматривать рациональность мышления как адаптивный инструмент, который не всегда подчиняется правилам формальной логики или теории вероятностей.

Поэтому здравый смысл, методология и математика — очень-очень-очень важно, ага. Конечно, это всем и так понятно, это я так, просто, чтобы не забывать.
как они растут /
Отсюда же возникает один из основополагающих философских вопросов: возможно ли объективное познание мира и объективная реальность — она есть вообще? Как подчёркивает Нейт Сильвер, собственно наука начинается там, где вопреки нигилистической точке зрения, принимается…
P.S. Насчет последних постов: если кто-то знает крутые книги по теме (в том числе по философии науки, проблемы познания, когнитивистику и тп), которые вы читали и вам понравилось, ПОКИДАЙТЕ В ЛИЧКУ @katuninx ❗️ буду очень рад годноте
​​​​​​Медицинский юрисконсульт и генеральный директор «Факультета Медицинского Права» Полина Габай рассказывает о росте уголовных дел против врачей, юридической грамотности и ятрогенных преступлениях. Разобрали самые важные вопросы: от оказания помощи на улице, до ошибок при ведении истории болезни.
Слушать: http://medach.pro/post/1801

Сайт "Факультета медицинского права": https://www.kormed.ru

VK: https://vk.com/kormed
Facebook: https://www.facebook.com/groups/mediclaw
Telegram: https://t.me/kormed
ПРО УРАВНЕНИЕ БАЙЕСА
< или как посчитать вероятность, что у женщины действительно рак груди, если во время скрининга на маммографии она получила положительный результат >

Прежде всего надо отметить, что между английским словом байес (bias — искажение, предубеждение) и теоремой Байеса нет ничего общего, просто слова в русском похожи ( «байес» во втором случае — русское произношение фамилии английского математика Thomas Bayes, хотя носители произносят её как ‘беиз’)

Знакомство с байесианским мышлением, статистикой обычно начинают с вывода ключевой формулы — уравнения Байеса.
Есть культовая статья Юдковского из далёкого 2003 года, где он начинает с такой задачи:

1% женщин в возрасте 40 лет, участвовавших в регулярных обследованиях, имеют рак груди. 80% женщин с раком груди имеют положительный результат маммографии. 9.6% здоровых женщин также получают положительный результат (маммография, как любые измерения, не дает стопроцентных результатов). Женщина-пациент из этой возрастной группы получила положительный результат на регулярном обследовании. Какова вероятность того, что она фактически больна раком груди?

(Текст задачи из русского перевода статьи https://goo.gl/dqkdNo , ссылка на оригинальную статью там же. На этом месте можно попробовать решить задачу самостоятельно, можно растянуть удовольствие, перейти по ссылке и начать копаться в подробных рассуждениях Юдковского, можно читать этот пост дальше, но тут сразу спойлеры, если что.)

Подавляющее большинство врачей, решающих задачу, дают ответ 80% или вероятность близкую к этому значению. То есть рассуждая так: если 80% женщин с раком груди имеют положительную маммографию, то стало быть, если женщина получила положительный результат маммографии, у неё с 80% вероятностью действительно есть рак груди. Некоторые дают ответ 70,4%, вычитая 9,6% ложноположительных результатов из 80% истинно-положительных. Хотя и тот и другой ответ в корне неверны.

!!! Правильный ответ задачи: ЕСЛИ ЖЕНЩИНА ПОЛУЧИЛА ПОЛОЖИТЕЛЬНЫЙ РЕЗУЛЬТАТ МАММОГРАФИИ, ВЕРОЯТНОСТЬ ЧТО У НЕЁ ДЕЙСТВИТЕЛЬНО ЕСТЬ РАК ГРУДИ РАВНА 7,76%.

откуда взялась эта цифра? Примем всех женщин из задачи за X. Тогда женщины, которые больны раком — это 0,01X, а все здоровые, соответственно, X-0,01X=0,99X. Дальше мы должны найти вероятность получить положительный результат маммографии во время скрининга, независимо от того больна женщина или нет. Для этого нам нужны две вероятности. Первая — вероятность получить положительный результат маммографии, будучи действительно больной. Мы знаем, что 80% женщин с раком получают положительный результат, соответственно, 0,8*0,01X=0,008X — вероятность женщины больной раком получить положительный результат. Вторая вероятность — это вероятность здоровой женщины получить положительный результат маммографии. Мы знаем, что 9,6% всех здоровых женщины ошибочно узнают о положительном результате. Соответственно, 0,096*0,99=0,09504 — вероятность здоровой женщины получить ложноположительный результат. Если мы сложим две эти вероятности, получим 0,09504X+0,008X=0,10304X — ту самую вероятность получить положительный результат маммографии во время скрининга, независимо от того больна женщина или нет. Теперь, чтобы найти, какую часть от этого показателя составляют женщины с положительным результатом маммографии и действительно больные раком, мы должны 0,08X/0,10304X (то есть если проговаривать подробно: разделить ‘вероятность женщины больной раком получить положительный результат' на ' вероятность получить положительный результат маммографии во время скрининга, независимо от того больна женщина или нет'). На самом деле, всё это можно было найти гораздо быстрее как раз с помощью уравнения Байеса, которое собирает в одно выражение все произведенные в этом абзаце действия.

(стоит отметить, что ‘вероятности’ в решении написаны с иксом, потому что это удобно в плане рассуждения. Хотя конечно, когда речь идёт о вероятностях, икс не нужен. С иксом — это уже частотный показатель. Но суть одна и та же.)
как они растут /
ПРО УРАВНЕНИЕ БАЙЕСА < или как посчитать вероятность, что у женщины действительно рак груди, если во время скрининга на маммографии она получила положительный результат > Прежде всего надо отметить, что между английским словом байес (bias — искажение, предубеждение)…
Тут в первую очередь стоит задуматься о существенной разнице в интерпретации данных. С одной стороны, есть врач, который может ошибочно сказать пациентке, что положительный результат маммографии значит, что пациентка с 80% вероятностью действительно больна. С другой стороны — есть врач, который понимает, что эта цифра равна всего лишь 7,76% — 0,0776, то есть, если сделать маммографию 10,000 пациенткам, мы получим 1030 положительных результатов, лишь 80 из которых будут принадлежать реально больным раком. (при этом данный пример недалёк от реальности: у маммографии действительно хромает специфичность, поэтому вопрос о её регулярном скрининговом использовании у пациенток старше сорока вне групп риска остаётся дискутабельным https://goo.gl/ozMpsS ).
как они растут /
Тут в первую очередь стоит задуматься о существенной разнице в интерпретации данных. С одной стороны, есть врач, который может ошибочно сказать пациентке, что положительный результат маммографии значит, что пациентка с 80% вероятностью действительно больна.…
Хорошее видео (есть русские субтитры) https://youtu.be/R13BD8qKeTg , сюжет — просто некое абстрактное тяжёлое заболевание.
Но на самом деле в контекст вписываются не только условия, связанные с диагностикой, чувствительностью и специфичностью. Вот ещё один околомедицинский пример из статьи на lesswrong https://goo.gl/Jejq2x :

«Предположим, что вы врач и к вам пришел пациент, который жалуется на головную боль. Далее предположим, что есть две причины, по которым может болеть голова: опухоль мозга и простуда. Опухоль мозга всегда вызывает головную боль, однако она является крайне редким заболеванием. И наоборот, головная боль редко возникает при простуде, однако множество людей простужается каждый год. Если нет другой информации, что вероятнее — что человек простудился или у него опухоль мозга?
Если вы решили, что вероятнее всего простуда, то это был ответ, которого я ждал. Даже если опухоль вызывает боль каждый раз, а простуда только в одном проценте случаев, случаев простуды настолько больше, что случаев головной боли, вызванной простудой, куда больше, чем болей, вызванных опухолью мозга. Теорема Байеса, в основном, говорит что если причина А может быть источником симптома Х, то тогда мы должны учесть обе вероятности, что А вызывает Х (находится, грубо, умножением частоты А на шанс, что А вызовет Х) и вероятность что что-то еще вызовет Х»

То есть когда вы просыпаетесь и понимаете что у вас болит голова, как понять, что это признак опухоли в голове? Условный пример, конечно, но тот же принцип, как и с восьмьюдесятью процентами. КЕК.
как они растут /
Хорошее видео (есть русские субтитры) https://youtu.be/R13BD8qKeTg , сюжет — просто некое абстрактное тяжёлое заболевание. Но на самом деле в контекст вписываются не только условия, связанные с диагностикой, чувствительностью и специфичностью. Вот ещё один…
Байесианское мышление для нашего мозга является неестественным и он зачастую ему противится. Главная ошибка того, кто хочет назвать 80%, вместо 7,16%, заключается в игнорировании первоначальной вероятности заболеть в популяции, которая равна — 1%. 1% в примере про рак молочной железы — это то, что называется априорной вероятностью. И вот понятие априорной вероятности является одним из ключевых в байесианстве. Если объяснять этот момент в рамках поста, то можно взять пример Ричарда Прайса, впервые представившего эссе Томаса Байеса Королевскому обществу. Далее цитата из книги Нейта Сильвера «Сигнал и шум»:

«В описании эссе Байеса Прайс приводит пример человека, попадающего в наш мир (например Адам, либо человек из платоновской пещеры) и впервые наблюдающего восход солнца. Сначала он не знает обычное ли это событие или из ряда вон выходящее. Однако он видит восход солнца каждый последующий день и начинает всё сильнее верить, что это — постоянное свойство природы. Постепенно, основываясь лишь на этой, в чистом виде статистической форме взаимодействия с природой, он присваивает своему прогнозу о том, что солнце вновь встанет на следующий день, вероятность, максимально близкую (хотя и никогда не достигающую) к 100%».
То есть в примере речь идёт об априорной вероятности, которая от маловероятного события с каждым новым регулярным восходом сдвигается к 100%.

К слову, фишеровская статистика, которая широко используется в научных исследованиях, игнорирует понятие априорной вероятности (и не только) и из-за этого лагает. По-хорошему, часто фишеровские методы должны дополняться байесианскими. То есть, если представить это на очень грубом примере (взят у того же Нейта Сильвера), есть контора, предсказывающая результаты выборов. И в преддверии выборов она организует собственный опрос определённой выборки и делает прогноз. При этом за историю своего существования контора стабильно демонстрирует искажение в сторону какой-то партии и у неё есть определённый процент ошибочных предсказаний. Фишеровские методы, на которых основывается прогноз, каждый раз работают с информацией в изолированных условиях. Байесинские методы учитывают небезупречный контекст «конторы». Просто и подробнее, с дополнительными ссылками, в этом посте: https://goo.gl/oK4ELw
На Priceonomics есть интересный текст, который на примере одной истории даёт общее представление о том, как в 20-ом веке развивалась современная научная методология, где были подводные камни и что до сих пор остаётся уязвимым местом https://goo.gl/koznsh . Статья называется «Почему отец современной статистики не верил в то, что курение вызывает рак».

Отец современной статистики — генетик, биолог-эволюционист Рональд Фишер. Был студентом у Пирсона (другого знаменитого статистика) и однажды за неделю решил ряд задач, над которыми лучшие статистики на тот момент трудились не один десяток лет (вопрос заключался в определённых нюансах оценки вариабельности признака в совокупности через небольшой набор данных — выборку). Пирсон сначала отказался публиковать идеи Фишера, так как сам их до конца не понимал, позже всё-таки согласился и опубликовал в виде огромной сноски в собственной статье. С тех пор между ними началась вражда.

У Пирсона Фишер не остался и в 1919 году стал работать статистиком на сельскохозяйственной станции в Ротамстеде. Там он исследовал эффективность удобрений. Были определённые участки земли, которые обрабатывались удобрением А, другие — удобрением Б и т.д. Однако, как было изначально очевидно Фишеру, если растения растут лучше на территории, обработанной удобрением А, это не значит, что А эффективнее, чем Б, так как причина такого роста может заключаться в том, что изначально почва участка с удобрением А более плодородна, чем почва с удобрением Б (а также наличие других смежных влияющих на рост факторов — конфаундинга. Фишер уже на тот момент употреблял этот термин, ‘confound’ значит сбивать с толку). Решая эту проблему, он придумал один из ключевых принципов — рандомизацию. То есть участки земли были разбиты на множество секций, каждая из которых рандомно обрабатывалась тем или иным удобрением. Идея заключалась в том, что если действительно рандомно распределить обработку множества секций удобрениями, то плодородная и неплодородная почва, а также другие конфаундинг-факторы, между ними распределятся равномерно. И можно будет увидеть явное действие удобрений. Также Фишер станет новатором и разработчиком основных принципов статической обработки данных, широко использующихся до сих пор.

К середине 20-го века была зафиксирована стремительно растущая смертность от рака лёгких. На проблему обратили внимание и было много теорий, почему так происходит, то есть на это могло влиять и то, что далеко продвинулись рентген-технологии — стала возможна значительно более точная диагностика, чем раньше. Промышленное загрязнение, машины и множество других теорий — про сигареты в том числе. И пионерами в решении вопроса стали Брендфорд Хилл и Ричард Долл (Хилл, кстати сказать, до этого провёл первое рандомизированное клиническое испытание со стрептомицином в лечении туберкулёза). Разумеется, учёные не могли набрать большую группу людей и рандомно заставить одних курить, а других не курить. Надо было придумывать что-то более реальное. И здесь возникли два новых подхода. Первый — типа случай-контроль, когда учёные набрали группу людей с диагностированным раком и похожую по характеристикам контрольную группу здоровых людей, уточняя по опроснику разные факторы из жизни людей в двух группах. Курение оказалось наиболее разобщающим. Тем не менее контрольная группа была набрана не рандомно и это говорило о нечистоте эксперимента. В 1951 году учёные разработали второй тип исследования — когортное — “British Doctor Study”, в которое они набрали порядка 30.000 врачей, курящих и некурящих и потом через года смотрели: сколько и когда людей заболело раком лёгких, и есть ли зависимость от количества выкуриваемых пачек в день. Данные получились внушительные. Учитывая другие похожие исследования в 1957 году Британский медицинский журнал опубликовал призыв указывать информацию о вреде сигарет в рекламе, так как уже скопилось достаточно данных, подтверждающих этот факт.
И вот тут Фишера, отца, бомбануло не на шутку.