статИИстик

🤔 Цель любого научного исследования или анализа, а статистика - лишь инструмент для того и другого, - получить новые, истинные знания. Научное исследование - не только проведение эксперимента и проверка гипотез, но и убеждение других людей - остальных ученых - в истинности того, что вы обнаружили. Истинность подтверждается через воспроизводимость результатов.
К сожалению, в настоящее время, огромные ресурсы, вливаемые в науку в надежде на полезную отдачу, растрачиваются на исследования, абсолютно не несущие новых знаний. Ошибки и ляпы, во многом совершенные в ходе статистического анализа, регулярно прорываются через системы рецензирования даже авторитетных научных журналов. Наши головы наполняются «фактами», которые неверны, преувеличены или заведомо ложны. И в самых худших случаях, особенно когда дело касается медицинской науки, гибнут люди.

💯2

171 views19:04

статИИстик

«Харкинг» (HARKing, Hypothesising After the Results are Known) - разновидность p-хакинга, когда берется имеющийся набор данных, прогоняется через кучу разных статистических тестов без какой-либо определенной гипотезы в голове, а потом просто докладывается о каких угодно эффектах, которым случилось получить p-значения ниже 0.05. Затем исследовать может заявить, в том числе убеждая самого себя, что изначально и ждал этих результатов.
Такую разновидность p-хакинга наглядно демонстрирует аналогия «техасского стрелка», который выхватил револьвер, наугад изрешетил стену амбара, а потом нарисовав мишень вокруг пулевых отверстий, оказавшихся рядом друг с другом, заявил, что, мол, туда и целился.

👍2

136 views19:08

статИИстик

Про причинный вывод (Causal Inference)

В научных медицинских публикациях очень часто наблюдается проблема, связанная с формулировкой причинных выводов. Точнее сказать исследователи слишком спекулируют подобного рода формулировками, не имея на то достаточных оснований в ходе обсуждения полученных результатов. Причинный вывод подразумевает доказательство и/или логическое обоснование причинно-следственной связи.
Понятие причинности можно сформулировать так: будет ли результат другим, если мы изменим то, что мы называем причинным фактором? Например, мы говорим, что курение вызывает рак легких, потому что, если мы сократим курение, мы уменьшим заболеваемость раком. И наоборот, хотя продажи мороженого сильно коррелируют с нападением акул, мы избегаем говорить о причинно-следственной связи, поскольку запрет мороженого не сделает плавание в океане в жаркую погоду более безопасным. Основная проблема заключается в том, что авторы слишком часто избегают каких-либо явных рассуждений и предоставления доказательств причинно-следственных связей, но затем все же пытаются сделать причинные выводы, хотя могут даже этого не замечать. Статистическая взаимосвязь (корреляционная, регрессионная или др.) не равно причинно-следственная связь!
Например, такие формулировки как лекарство «снижает риск», а метод лечения «улучшает результаты», или когда даются рекомендации пациентам или врачам к изменению их поведения, чтобы улучшить результаты, явно подразумевается причинно-следственную связь. Оценить статистическую связь легко, а определить причинно-следственную связь сложно!

Что и как делать:
1. Сформулировать научную гипотезу и заранее продумать причинно-следственные связи, если такие планируется обнаружить. Они должны быть логически объяснимы и понятны! В разделе «Введение» должна быть явная ссылка на причинно-следственную связь, если вы формулируете причинно-следственную гипотезу. Не для всех исследований это требуется, если вы не ставите таких целей.

2. Опишите возможные причинно-следственные связи в разделе «Методы». Хотя это можно сделать формально, например, с помощью ориентированных ациклических графов (DAG), но причинно-следственные связи разумно описывать и обычным языком в основном тексте.

3. Подберите и выполните статистический анализ для поиска статистических взаимосвязей. Помните, что Correlation is not Causation!
3.1 Факторы, которые могут влиять и нарушать причинно-следственные связи следует оценивать в качестве конфаундеров в многомерных моделях.
3.2 Можно применять анализ взаимосвязей скорректированный по различным переменным.
3.3 Существуют отдельные статистические и графические методы для оценки причинно-следственных взаимосвязей.

статИИстик

Что такое конфаундеры (спутывающие/сбивающие факторы в исследованиях)

Сбивающие факторы - переменные, которые могут влиять на интересующий нас исход, но при этом не являются промежуточными переменными в цепочке причинно-следственных связей. Они могут создать…

❤2

153 views10:30

статИИстик

4. В разделе "Обсуждение" подробно опишите полученные результаты и логически объясните найденные причинно-следственные связи с отсылкой на результаты статистического анализа.
4.1 Следует осторожно применять язык причинного вывода, если у вас нет оснований для этого. Это относится не только к словам «причина» и «причинная связь», но также к словам, которые подразумевают причинную связь, например «следствие», «уменьшение», «увеличение» и «воздействие», а также к рекомендациям, которые зависят от причинно-следственной связи. Например, «пациенты должны избегать», «врачи должны использовать» и т.д. При этом следует избегать термина «фактор риска», поскольку он имеет неопределенное значение.
4.2 Причинно-следственную связь следует обсуждать в контексте практических действий. Например, мы знаем, что курение вызывает рак легких (помимо других заболеваний), поэтому мы советуем пациентам бросить курить.
4.3 Важно оценить все возможные риски предвзятости (bias)
4.4 Необходимо сообщить о размере причинно-следственной оценки (величне эффекта). Например, в одном исследовании высокое потребление кофе было связано со снижением риска летального рака простаты более чем на 50%. Это намного выше, чем химиопрофилактическое действие лекарств, воздействующих на определенные пути канцерогенного воздействия (например, тамоксифен и ралоксифен снижают риск рака молочной железы примерно на 40%), и поэтому и выглядит неправдоподобно.

5. Сделайте выводы для других исследователей и/или клинической практики в свете причинно-следственных связей. Рекомендации должны быть четкими, а последствия решений - конкретными. Следует избегать расплывчатых призывов к дальнейшим исследованиям и вместо этого подробно рассказывать о том, как такие исследования следует проводить, учитывая конкретные, полученные вами результаты.

Статистические шоты

Про bias (предвзятость / смещенность)

Под предвзятостью в статистике понимается систематическая ошибка или искажение в способе сбора, анализа или интерпретации данных, приводящие к неточным или вводящим в заблуждение результатам. Предвзятость может возникать…

❤2

142 views10:30

статИИстик

В этом исследовании, на которое можно ссылаться, в ходе статистических экспериментов показано, что минимальный размер выборки для построения модели логистической регрессии должен включать 20-50 изучаемых событий на одну переменную (Events per variable, EPV), в то время как при использовании методов машинного обучения (CART, SVM, NN, RF) модели оказывались нестабильными даже при EPV>200. Под стабильностью здесь понималась стабильность AUC при моделировании на разных по размеру выборках.

BioMed Central

Modern modelling techniques are data hungry: a simulation study for predicting dichotomous endpoints - BMC Medical Research Methodology

Background Modern modelling techniques may potentially provide more accurate predictions of binary outcomes than classical techniques. We aimed to study the predictive performance of different modelling techniques in relation to the effective sample size…

🔥2❤1👍1

153 viewsedited 18:29

статИИстик

🧠 "Физики не существует" - эта фраза присутствует в фантастическом романе Лю Цысиня "Задача трех тел" и связана с кризисом воспроизводимости научных экспериментов в области фундаментальной физики, который повлек за собой череду самоубийств известных ученых.
Кризис воспроизводимости - невозможность воспроизвести ранее поставленные эксперименты, и это серьезная проблема современной науки. Причин тому множество, от нарушений условий проведения повторных исследований, до октровенной фальсификации первоначальных результатов. Есть еще одна причина, которая неподвластна какому-либо контролю. Это фундаментальная неопределенность.
Как бы хорошо вы не спланировали свое исследование, всегда присутствует элемент некотролируемой случайности, который может повлиять на ваши результаты. В свое время Рональд Фишер ввел понятие порогового значения p-уровня значимости = 0.05, чтобы минимизировать эффект случайности. Это правда сыграло злую шутку, и теперь большое число исследователей занимаются p-хакингом, а не поиском истины.
Представим ситуацию. Вы хотите понять честная ли у вас монетка. Если да, то при ее подбрасывании количество орлов и решек будет примерно поровну. Будем подбрасывать монетку 5 раз. Можно больше, но сейчас это сути не меняет. Итак вы проводите первый эксперимент, подбросили монетку 5 раз и получили 5 орлов! Первая мысль - монетка нечестная, так как вероятность пяти подряд орлов крайне мала. В биномиальном тесте вы получите статистическую значимость. Если бы за этим экспериментом скрывалась проверка какой-либо реальной гипотезы, которую хотелось бы подтвердить, вы, как и большинство исследователей, закончили бы исследование, радостно потирая ладоши. Но проблема в том, что это могло быть всего лишь случайностью, которая бы не подтвердилась, если воспроизвести эксперимент снова. Другой вариант - вы подбросили монетку 100 раз и везде получили примерно равное распределение орлов и решек, но при 101 попытке выпало пять орлов. Скорее всего в этом случае большинство исследователей склонилось к бы версии случайности, ведь, если долго мучиться, то что-нибудь получится. Те, кто сочтут данный результат истиной, скорее всего являются p-хакерами, не учитывающими поправки на множественные сравнения.
Итак, в обоих описанных вариантах могла быть случайность! А главная проблема заключается в том, что у нас нет критериев и предсказательных возможностей, чтобы понять когда она наступит - сразу или после нескольких попыток. Статистическая значимость полученного результата не исключает случайность или ошибку 1 рода, возникшую по иным причинам.
Мораль этого поста заключается в том, что все результаты исследования, начиная со сбора данных и заканчивая расчетами, могут оказаться случайным эффектом, произошедшим в данный конкретный момент жизни вселенной. Вы не можете вернуться в прошлое, повторить эксперимент и убедиться в обратном. Один из вариантов подтверждения того, что вы подтвердили свою гипотезу - повторные эксперименты других исследователей. Именно поэтому вы должны максимально подробно описать в публикации дизайн и ход вашего исследования. Из-за того, что это не делается, в том числе существует кризис воспроизводимости в науке. Вы можете сами повторить свой эксперимент через какое-то время, вновь собрав другие данные, но этим вряд ли кто будет заниматься. Еще есть технология бутсрэппа, которая может помочь понять стабильность ваших результатов, что повысит вероятность их неслучайности.

🔥4

136 viewsedited 19:55

статИИстик

🗣️ Если вы интерпретируете статические данные, исходя из ваших ожиданий, а не фактических результатов… Если вы принимаете и публикуете только значимые результаты, а о незначимых предпочитаете умолчать… Если вы избирательно презентуете результаты так, чтобы они подтверждали ваши аргументы и прерываете свое исследование, как только достигли p-уровня значимости менее 0.05… Вы на темной стороне науки!

❤1🌚1

139 viewsedited 13:39

статИИстик

🗣️ Ценность положительных, статистически значимых результатов в науке столь высока, что многие исследователи забывают: отрицательные результаты тоже важны! Тот факт, что метод лечения не работает или болезнь не связана с неким биомаркером - ценная информация, а значит в дальнейшем мы сможем тратить время и деньги на что-то другое. Если исследование правильно организовано, то представляет интерес вне зависимости от того, дает ли оно положительные или отрицательные результаты.

👍1🔥1

126 views14:28

статИИстик

Про величину эффекта, статистическую мощность и размер выборки

Величина эффекта - насколько отличается изучаемое событие или явление между сравниваемыми группами или насколько сильно оно меняется под воздействием какого-либо фактора (ов). Например, разница арифметических средних возрастов между двумя группами пациентов или отношение рисков в анализе общей выживаемости между группами больных, получавших и не получавших новое лечение.
Величина эффекта может быть статистически значимой, но не клинически значимой. Например, новое лечение статистически значимо может снижать вероятность рецидива рака на 2%, но вряд ли такой эффект имеет большое клиническое значение.

С величиной эффекта напрямую связана статистическая мощность - шансы (вероятность), что мы увидим статистический значимый сигнал, когда он действительно есть. Поэтому чем больше мощность, тем лучше! Рекомендуемая мощность статистического теста должна быть 80% и выше. Чем ниже мощность, тем сложнее обнаружить слабые эффекты или, наоборот, чем меньше величина эффекта, тем большая мощность статистического теста требуется. Мощность, в свою очередь, зависит от размера выборки! Слабые эффекты можно обнаружить лишь на достаточно больших по размеру выборках. Эксперименты же с низкой мощностью могут обнаружить только большой по величине эффект, который скорее всего при этом будет преувеличен, чем он есть на самом деле.

Публикация маломощных исследований приводит к публикационному смещению (что можно увидеть при проведении мета-анализа) - игнорирование отрицательных результатов и публикация результатов с преувеличенным эффектом приводит к искажению истинного усредненного результата изучаемого явления в сторону ошибки 1 рода. Например, если ученые публикуют только те исследования, в которых они нашли доказательства эффективности некой терапии на исход заболевания X и не публикуют работы с отрицательными результатами, независимый мета-анализ покажет, что данная терапия действительно работает лучше, чем есть на самом деле.

В медицине величины эффектов, как правило, низкие или средние, поэтому для их обнаружения нужны большие по размеру выборки. Когда вы планируете исследование, вы заранее должны предположить величину изучаемого эффекта, которую вы хотите найти. Это будет важной частью вашей научной гипотезой! Зная величину эффекта и статистический тест, который вы решите использовать для его обнаружения с заданной величиной мощности, например =0.8, можно рассчитать требуемый размер выборки, воспользовавшись специальным калькулятором для данного вида анализа. Например, так поступают при планировании клинических исследований, рассчитывая число пациентов для каждой группы сравнения.

Статистические шоты

#глоссарий. Минимальная клинически значимая разница (minimum clinically important difference, MCID) - наименьший размер различия в данных, который исследователь считает настолько важным, что не хотел бы, чтобы его не заметили в ходе исследования. Другими…

❤2🔥1

136 views15:01

статИИстик

Новости медицинской (и не только) науки

😱 Громкий скандал в онкологическом институте Дана-Фарбер (Бостон, США). Это, мягко скажем, очень плохой пиар для них... По последним данным 6 научных работ, опубликованных их исследователями, отзываются, а 31 исправляется после того, как один специалист по анализу данных обнаружил массу доказательств манипуляций с изображениями. В основном это фотошоп изображений вестерн-блотов, и хотя некоторые из них могут быть просто ошибкой... многие из них - явное мошенничество. Возможно, дальше будет хуже. Короче "позор" - и это в одном из лучших исследовательских институтов США!

🧐 Новое исследование показывает, как модели клинического прогнозирования могут быть удивительно "круты" в рамках набора данных, на котором они были обучены... но затем оказываются совершенно бесполезными при прогнозировании на выборках данных, не участвоваших в обучении из-за подгонки по всем параметрам. Много раз уже говорил, что нельзя просто так взять и сделать качественную прогностическую модель, работающую в реальных условиях.

😡 Появились доказательства того, что так называемые "бумажные фабрики" (организации, заполняющие научные журналы фальшивыми статьями, предположительно продавая авторство ученым, которые хотят улучшить свое резюме без особых усилий) подкупают редакторов журналов, чтобы те предоставили им возможность публиковаться. В РФ такие тоже есть.

🙉 Опубликовано исследование, в котором 53.7% из 6200 опрошенных медицинских работников из Китая заявили, что совершали те или иные научные махинации, другими словами недобросовестно относились к научным исследованиям. Интересно как обстоят дела в России 😏.

🤖 Вы можете подумать, что воспроизвести результаты симуляционных исследований очень просто. В конце концов, это же всего лишь компьютерный код, верно? Это все in silico! Не нужно возиться с пипеткой или, не дай бог, иметь дело с живыми людьми! Но зачастую все не так просто, согласно этому исследованию. В нем содержится несколько советов о том, как сделать ваше симуляционное исследование лучше.

😬 Препринт о чрезмерной нагрузке на научные журналы. Ученые все больше ошеломлены объемом публикуемых статей. Общее количество статей, индексируемых в Scopus и Web of Science, за последние годы выросло в геометрической прогрессии; в 2022 году общее количество статей стало на 47% выше, чем в 2016 году, что опередило рост числа практикующих ученых, если таковой вообще был за это время.

NBC News

A prestigious cancer institute is correcting dozens of papers and retracting others after a blogger cried foul

The criticism spotlights how artificial intelligence is playing a growing role in catching sloppy or dubious science.

👍2🔥1

188 views15:46

статИИстик

Про мультиколлинеарность в регрессионном анализе

Мультиколлинеарность - явление, когда две или более предикторных переменных сильно коррелируют между собой. Это означает, что они изменяются вместе, что затрудняет выделение их индивидуального влияния на переменную отклика (исход).

Проблемы:
✅ Мультиколлинеарность может увеличить дисперсию коэффициентов регрессии, что приводит к менее надежным оценкам.
✅ Мультиколлинеарность может привести к ошибочным p-значениям для предикторов, предполагая, что переменная незначима, когда она значима, или наоборот.
✅ Мультиколлинеарность снижает статистическую мощность регрессионной модели.

Признаки мультиколлинеарности:
✅ Высокие коэффициенты инфляции вариации (VIF): VIF > 10 часто считается признаком мультиколлинеарности, но некоторые авторы предлагают более низкий порог, например 5.
✅ Пары предикторов с высокими коэффициентами корреляции, обычно >=0.8 (при построении матрицы попарной корреляции).

Способы устранения мультиколлинеарности:
✅ Удалить одну из коррелирующих переменных (выбирайте, основываясь на знаниях предметной области, или ту, которая вносит меньший вклад в модель).
✅ Объединить коррелирующие переменные (например, сделать комбинированный показатель).
✅ Уменьшить размерность данных (например, использовать метод главных компонент).
✅ Использовать другие варианты регрессионного анализа с методами регуляризации (гребневая регрессия, регрессия Лассо).

Дополнительно:
✅ Даже если переменные коррелируют между собой, они могут иметь различное влтияние в реальных сценариях. Поэтому принимая решение об удалении той или иной переменной из анализа, учитывайте знания предметной области и практический контекст ситуации. Если ваша цель прогнозирование, удаление коллинеарных переменных может не потребоваться, если это сильно ухудшает качество модели.

Statistical Horizons

When Can You Safely Ignore Multicollinearity? | Statistical Horizons

Paul Allison talks about the common problem of multicollinearity when estimating linear or generalized linear models.

❤1

164 viewsedited 11:31

статИИстик

Изучение классической частотной статистики должно начинаться с понимания p-уровня значимости. Как только вы поймете, что p-уровень статистической значимости это вероятность, относящаяся к наблюдаемым данными, а не вероятность того, что гипотеза верна, вы уже будете работать значительно лучше, чем большинство ваших коллег.

Статистические шоты

#базовыйуровень
✍ Про p-уровень статистической значимости (предложен Рональдом Фишером в 1925 году)

В классической статистике существуют понятия нулевой гипотезы (H0) и альтернативной гипотезы (H1). H0 гласит, что 2 случайные выборки, взятые из генеральной…

166 views07:12

статИИстик

📚 В России около 6000 научных журналов, подавляющее большинство которых издается на русском языке и пользуются популярностью среди ученых страны. Исследование 2019 года показало, что российские авторы публикуют в отечественных журналах гораздо больше работ, чем, например, их коллеги в Польше, Германии или Индонезии. Но стандарты зачастую низкие. Например, в марте 2018 года исследователи портала «Диссернет» , занимающающегося чисткой отечественных научных работ от некачественного контента, выявили более 4000 случаев плагиата и сомнительного авторства среди 150 000 статей примерно в 1500 журналах.
В сентябре 2019 года портал Антиплагиат, проанализировав 4.3 миллиона русскоязычных исследований, обнаружил, что более 70 тысяч из них были опубликованы как минимум дважды; некоторые были опубликованы целых 17 раз! Большинство случаев связано с самоплагиатом.
Более подробно о проблемах с отечественными научными публикациями можно почитать здесь.

Антиплагиат

Антиплагиат онлайн⚡: бесплатно проверить текст на плагиат, генерацию ИИ и уникальность

Официальная система обнаружения текстовых заимствований ⭐ Антиплагиат: ☑️ результат онлайн проверки на плагиат, уникальность и генерацию текста через ИИ подходит для ВУЗов, ✔️ бесплатная демо-версия

👍1

181 views08:34

статИИстик

Про самые распространенные распределения вероятностей

В мире данных существуют повторяющиеся закономерности, что делает возможным создание прогностических моделей, машинное обучение и ИИ. По сути применяя машинное обучение, включая нейронные сети, мы пытаемся моделировать закономерности в данных. Хорошая модель может предсказать невидимые значения данных, которые являются частью исходного их распределения.

Самые распространенные распределения вероятностей и где они встречаются в природе:

Симметрия и нормальное распределение - природа любит баланс. Вы видите его в узорах крыльев бабочек, лицах и в физических законах. Природные явления, демонстрирующие симметрию, часто хорошо согласуются с нормальным распределением.

Центральная предельная теорема говорит нам, что совокупность средних значений многих независимых, одинаково распределенных переменных приближается к нормальному распределению. Эти распределения характеризуются средним значением и стандартным отклонением, и все, начиная от роста человека, уровня IQ и заканчивая скоростями молекул в газе, подчиняется нормальному распределению.

Логнормальное распределение - если логарифм переменной следует нормальному распределению, то сама переменная имеет логнормальное распределение. Распределение финансовых активов или размеры частиц, образующихся при их измельчении, артериальное давление и скорость метаболизма в различных организмах часто следуют логнормальному распределению. Логнормальное распределение часто возникает в процессах мультипликативного роста, когда переменная многократно умножается на некоторый случайный фактор.

Равномерное распределение. Все исходы одинаково вероятны. Например, бросок игральной кости или выбор карты из хорошо перетасованной колоды соответствует равномерному распределению.

Распределение Пуассона - описывает вероятность того, что заданное количество событий произойдет за определенный промежуток времени или пространства. События должны происходить с известной постоянной средней скоростью и независимо друг от друга. Оно подходит для прогнозирования редких событий. Распределение Пуассона моделирует количество распадов радиоактивного атома за определенный промежуток времени или количество автомобилей, проезжающих через определенную точку за определенный промежуток времени. Пример из медицины.

Распределение Бернулли - дискретное распределение вероятностей, которое моделирует один эксперимент с ровно двумя исходами, часто называемыми "успех" и "неудача", и характеризуется единственным параметром p, вероятностью успеха. Подбрасывание монеты, генетическое наследование (у вас либо есть признак, либо нет) и поляризация одного фотона (вертикальная или горизонтальная) моделируют это распределение.

Биномиальное распределение описывает количество успехов в фиксированном числе независимых испытаний Бернулли, каждое из которых имеет одинаковую вероятность успеха. Например, с помощью этого распределения можно смоделировать количество орлов при многократном подбрасывании монеты.

Экспоненциальное распределение моделирует время ожидания следующего события в сценариях, где события происходят независимо и с постоянной средней скоростью. Его часто используют для описания таких явлений, как время между прибытием автобуса или интервалы между событиями радиоактивного распада.
По сути это распределение для понимания "времени ожидания" в различных природных и искусственных системах.

Существуют и другие распределения ...

🔥1

215 views07:18

статИИстик

Почему мы часто верим лекторам на конференциях, даже если они ошибаются

Присутствуя на научных конференциях мы зачастую абсолютно доверяем информации от тех, кто ее презентует в виде выступлений, докладов и дискуссий. На самом деле, если мероприятие серьезное, как может быть иначе. Вряд ли нас хотят обмануть сознательно. Однако, быват так, что лектор ошибается неспециально или в связи с недостаточной компетентностью в освящаемом им вопросе. В итоге слушатели получают недостоверную информацию и принимают ее к сведению.
Причины того, почему это происходит:
1. Отсутствие критического мышления. Полностью доверять никому нельзя и это не шутка! Если тема вам действительно интересна и важна, найдите первоисточник(и), прочтите его и попытайтесь разобраться самостоятельно. Как минимум вы укрепите свои знания в данной области. Многие не следуют данному совету.
2. Лень. Это одна из банальных причин отсутствия критического мышления, указанного в пункте 1 или самообразования.
3. Эффект Барнума-Форера - тенденция людей безоговорочно верить в информацию, которая касается непосредственно их и иллюстрирует их с лучшей стороны. Эффект получил название благодаря американскому шоумену Финеасу Барнуму, который устраивал представления, используя многочисленные психологические манипуляции. Второе название - эффект Форера - происходит от фамилии психолога Бертрама Форера, который исследовал технику, применяемую Барнумом. В 1948 году Форер провел эксперимент: каждому из своих студентов психолог написал персональную характеристику, основываясь на анализе личности, а затем попросил оценить точность описания по пятибалльной шкале. Средняя оценка, которую дали студенты, равнялась 4.26. Однако суть эксперимента заключалась в том, что на самом деле Форер дал всем абсолютно идентичный текст, который он позаимствовал из гороскопа. Этот эксперимент многократно повторяли и другие исследователи в многочисленных вариациях, однако результаты были неизменными: испытуемые склонны верить в информацию, которую им предоставляют. Эффект Барнума-Форера прекрасно работает в астрологии, гадании, гомеопатии. Экстраполируя его на научные конференции необходимо соблюдение 3-х главных условий:

1) Слушатель должен быть убежден, что материал был подготовлен специально для него. Собственно он и его коллеги для этого и собрались вместе.
2) Слушателю необходимо чувствовать, что доклад делает авторитетная для него личность. Как правило, на конференциях выступают ключевые лидеры мнений в данной области.
3) Полученная информация должна давать преимущественно положительные оценки. Например, что новое лечение эффективно и это было показано в клинических исследованиях. При этом некоторые важные детали, например статистического характера, которые могут приуменьшить WOW эффект, часто замалчиваются.

❤‍🔥1

149 views12:01

статИИстик

Рекомендации по описанию статистических данных в медицине

✅ В зависимости от распределения количественных переменных укажите либо среднее значение и стандартное отклонение, либо медиану и IQR (при ассиметричном распределении: среднее/стандартное отклонение <2). Гистограммы распределения хорошо иллюстрируют данные.

✅ При построении прогностических моделей проверьте все допущения (assumptions) к используемым статистическим методам.

✅ Указывайте точное значение p (например, p=0.032, а не p<0.05). Однако можно использовать неравенство p<0.0001 при очень малых значениях p.

✅ Не сообщайте о результатах анализа как об "отсутствии эффекта" при статистической незначимости, за исключением случаев, когда все эффекты внутри интервальной оценки являются клинически незначимыми или когда величина эффекта приближается к нулю

✅ Интерпретируйте результаты на основе их клинической (практической) значимости с учетом оценки 95% доверительного интервала.

✅ Выявляйте факторы (конфаундеры), искажающие результаты, на основе вашей экспертной оценки исходной информации, логически рассуждая о причинно-следственных связях, а не на основе статистических тестов и значимости.

✅ Если доля пропущенных значений в данных достаточно высока, чтобы повлиять на результаты, используйте методы, выходящие за рамки простого удаления неполных записей, например, множественное вменение.

✅ Оценивайте наличие и устраняйте ошибки в данных с помощью методов, разработанных для этой цели.

✅ Если частота изучаемого исхода высока, сообщайте об отношениях риска или разнице рисков вместо отношений шансов. Нереально большие показатели отношения шансов с широкими интервалами (например, отношение шансов >10 с пределами 2 и 50) указывают на проблемы с данными, которые можно уменьшить с помощью регрессий со штрафными коэффициентами или байесовских методов.

✅ Оценивайте аддитивные взаимодействия (эффект двух или более факторов в модели просто складывается), а не только мультипликативные (эффект факторов в модели умножается). Другими словами не занимайтесь дихотомией количественных переменных по порогу перед созданием моделей. Чтобы оценить возможный аддитивный эффект, лучше не делить переменную на категории, а оставить ее в первоначальном количественном виде. Если исходная переменная является количественной, а вы делите ее на две категории, то в этом случае в модели будет оцениваться мультипликативный эффект взаимодействия.

👍3

144 viewsedited 16:49

статИИстик

Про цель и дизайн научного исследования

От правильного описания цели, задач, дизайна и выборок данных зависит качество исследования и правильная интерпретация его результатов. При планировании или описании научного исследования следует руководствоваться описанными ниже базовыми принципами:

✅ Цель, дизайн исследования и выборка данных должны быть четко описаны, что позволит оценить валидность (пригодность применения методик и результатов исследования в конкретных условиях) и экстраполируемость полученных выводов. Это важно в случае публикации в научных журналах и для понимания читателями.

✅ Цель исследования может быть описательной (описать какое-то явление/феномен), прогностической (предсказать риск исхода), объясняющей причинно-следственные связи или смешанной. Цель должна отражать суть исследования в изучении конкретного главного вопроса.

✅ Дизайн - описание типа исследования, он должен быть подробно описан. Примеры дизайнов: рандомизированное клиническое исследование, когортное (продольное), случай-контроль и поперечное исследование.
Поперечное исследование (cross-sectional study) - исследование, в котором собираются данные о болезнях или состояниях здоровья в определенный момент времени.
Продольное исследование (cohort study) - долгосрочное исследование, в котором выборка людей наблюдается на протяжении времени с целью изучения факторов риска заболеваний и исхода заболевания.
Важно описать процедуру рандомизации, период наблюдения, формирование выборки и контрольной группы при наличии.

✅ Выборка относится к исходной генеральной совокупности данных и целевой популяции, к которой потом можно будет приложить результаты исследования. Это важно для обобщаемости и экстраполируемости полученных результатов. Размер выборочной совокупности имеет решающее значение для последующих выводов. Исходная популяция - источник данных для анализа, целевая - та, к которой будут обобщены результаты. Важно указать критерии включения/исключения для формирования выборочной совокупности в исследовании.

❤2

142 views08:48

статИИстик

Про виды аналитики данных

Описательная аналитика
Отвечает на вопрос "Что произошло?". Методы описательной аналитики обобщают и характеризуют массив данных (описание распределения данных, сравнение распределений).

Диагностическая аналитика
Отвечает на вопрос "Почему это произошло?". Диагностическая аналитика помогает ответить на вопросы о причинах произошедшего и является следующим шагом в аналитике данных после описательной статистики. Включает в себя: определение аномалий в данных, выявление взаимосвязей и тенденций, объясняющих эти аномалии.

Предиктивная аналитика
Отвечает на вопрос "Что произойдет в будущем?". Методы прогнозной аналитики включают в себя статистические методы и методы машинного обучения, такие как нейронные сети, деревья решений и регрессинный анализ и др.

Предписывающая аналитика
Отвечает на вопрос "Что делать для решения задачи?" на основе данных в условиях неопределенности. Например, такие методы используются в медицинских системах поддержки приянтия решений.

Когнитивная аналитика
Отвечает на вопрос "Как лучше всего решать проблему?". Когнитивная аналитика объединяет подходы искусственного интеллекта и машинного обучения с возмодностью переобучения и/или самообучения.

👍2❤1👎1

150 views09:08

статИИстик

Про пересекающиеся кривые выживаемости

Если кривые выживаемости Каплан-Мейера пересекаются (перекрываются) это затрудняет применение таких статистических тестов, как log-rank и Cox (возможно нарушение допущения о пропорциональных рисках - относительный риск меняется со временем). В этом случае log-rank тест лучше заменить на критерий Гехана (Gehan) или критерий Уилкоксона (Wilcoxon). Считается, что предположение о пропорциональных риска не выполняется (нельзя использовать Hazard ratio), если кривые выживаемости пересекаются в течение значительного (более четверти от начала измерения) периода наблюдения. Если период времени, в течение которого кривые выживаемости пересекаются, составляет менее 1/4 от общего периода наблюдения, то такое пересечение можно считать несущественным. Тем не менее, в случае пересечения кривых выживаемости и высокой вероятности нарушения пропорциональности рисков лучше использовать альтернативные методы анализа, такие как разница ожидаемой продолжительности жизни (LE) и коэффициент ожидаемой продолжительности жизни (LER), которые являются взаимодополняющими абсолютными и относительными показателями и которые можно рассчитать для любой формы кривых выживания.

❤2👍2

175 views16:46

статИИстик

Кратко про обобщенные аддитивные модели (Generalized Additive Models - GAM)

Это гибкие регрессионные модели, которые могут отражать нелинейные взаимосвязи. Идеальный вариант для тех случаев, когда данные - не просто прямая линия! Вместо того чтобы подгонять прямую линию (или плоскость), GAM подгоняет данные под плавные кривые. GAMs используют функции сглаживания - математические конструкции, которые позволяют учесть изгибы и повороты в отношениях между предикторами и результатом. Например, сплайны. Тем не менее, большая гибкость иногда может привести к чрезмерной подгонке модели. Когда модель слишком соответствует обучающим данным, она плохо работает на новых данных. Это все равно что заучить ответы на тест, но провалиться на настоящем экзамене, где будут другие вопросы. Для борьбы с переобучением используются штрафные функции (внутренний контроль излишней подгонки модели). Интерпретация GAM может быть довольно интуитивной. Вы получаете наглядные графики, показывающие влияние каждого предиктора на результат.

158 views15:46

статИИстик

#глоссарий
Статистический глоссарий для исследований с причинно-следственными выводами

✅ Причинно-следственная диаграмма (ориентированный или направленный ациклический граф, DAG) - диаграмма, показывающая причинно-следственные связи между переменными (узлами) с помощью направленных стрелок. Отсутствие стрелки между двумя узлами означает отсутствие прямого причинного эффекта.
DAG используется для моделирования и визуализации причинно-следственных отношений между событиями, условиями и результатами. Вершины в DAG представляют события, факторы или состояния, а рёбра между ними - причинно-следственные связи.
При этом DAG должен удовлетворять следующим условиям:
➡️ Направленность рёбер показывает направление причинно-следственной связи - из одной вершины в другую.
➡️ Отсутствие циклов, так как причина не может быть следствием самой себя.
➡️ Каждая вершина может иметь несколько предшествующих причин и несколько следствий.

👍1👎1

128 viewsedited 14:01

About

Blog

Apps

Platform