Biostatistics on the Table

Позволю себе начать издалека. Прикладная статистика – это область, глубоко погруженная в контекст, который ее окружает. Часто трудно провести границу между самой предметной областью и статистикой, а еще сложнее – между статистикой и эпистемологией. Поэтому…

Теперь о статистике.
Я хочу выделить две книги, которые хорошо помогают сформировать правильный «статистический майндсет». Участвуя в многочисленных биостатистических дискуссиях, в основном с медиками, я понял, что главная сложность в освоении прикладной статистики вовсе не в формулах. Сложнее всего понять, о чем эта наука: как статистики и аналитики данных смотрят на устройство мира, как предметные вопросы переводятся в вопросы, на которые можно ответить с помощью данных, какие выводы и утверждения можно делать с использованием ее инструментов.
Мне очень понравилось замечание Энди Грива в одном из обсуждений о преподавании статистики: существует два разных вопроса – «What p-value is» и «What p-value means». Ответить на первый можно в паре предложений, но вот со вторым, куда более важным, все гораздо сложнее.

«Искусство статистики» Дэвида Шпигельхалтера
Наверное, лучшее, что можно порекомендовать людям, которые только начинают знакомство со статистикой. Здесь нет избыточных упрощений, которые искажают суть концепций (и которыми очень часто злоупотребляют). Думаю, что эта книга, если и не может заменить учебники типа «статистика для ~~котиков~~ нестатистиков», то точно должна им предшествовать, чтобы после их прочтения не сформировалось очень опасного ощущения полного понимания.
Я пока не успел подробно ознакомиться с новой книгой Шпигельхалтера «The Art of Uncertainty», но предполагаю, что ее место тоже здесь. Постараюсь в ближайшее время исправить это и поделиться своими впечатлениями.

«Dicing with Death: Chance, Risk and Health» Стефена Сенна
Эта книга вряд ли подойдет людям, которые совсем далеки от статистики, несмотря на то, что несомненно является научно-популярной. Она поможет раскрыть и посмотреть под другим углом на многие вещи, которые мы применяем при анализе данных. Я не являюсь поклонником составления рейтингов, но если бы мне пришлось, то эта книга совершенно точно была бы в тройке самых важных и полезных лично для меня книг. Кстати, не так давно вышло третье издание, которое было дополнено, в том числе, разделами, связанными с Covid-19.

❤7👍1

1.16K viewsMaksim Kuznetsov, 13:32