статИИстик
183 subscribers
75 photos
3 videos
162 links
О медицинской статистике и не только
Личные сообщения @glivec
Download Telegram
Про s-value

p-уровень статистической значимости (p-value) - интуитивно трудно понимаемый термин частотной статистики. Также у него есть ряд объективных проблем в практическом применении. Однако с p-уровнем можно сделать преобразование -log2(p), известное как информационный критерий Шеннона или "величиная сюрприза" (s-value). Например, для p=0.05, s-уровень будет равен ~4. Это соответствует ситуации, что при подбрасывании честной монетки 4 раза подряд выпадет "орел" или "решка". Другими словами полученный статистический результат не более удивителен, чем 4 раза выбросить монетку одной стороной. При p=0.005, "s-уровень значимости" будет равен ~8, а значит результаты не более удивительны, чем получение всех "орлов" при 8 честных подбрасываниях монеты. Вероятность такой ситуации равняется 0.5^8 = 0.39%. Сюрприз!
Зависимость p- и s-value представлена на картинке.

Калькулятор для конвертирования p-уровня в s-уровень: https://zadrafi.shinyapps.io/shinyapp/
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
В линейной регрессии предполагается, что наблюдения (точки) являются результатом случайных отклонений от лежащей в ее основе зависимости, которую можно представить в виде прямой линии. На видео простая, но очень наглядная практическая реализация "линии наилучшего соответствия".
Про базовые понятия вероятности и статистики. Часть 1.

Случайности окружают нас повсюду. Теория вероятности - математическая основа (аппарат), которая позволяет нам анализировать случайные события логически обоснованным образом. Вероятность события - число, показывающее, насколько вероятно, что это событие произойдет. Это число всегда находится в диапазоне от 0 до 1, где 0 означает невозможность, а 1 - абсолютная уверенность.

Шансовые события
Классическим примером вероятностного эксперимента является подбрасывание монеты, в котором возможны два исхода: "орел" или "решка". В этом случае вероятность того, что выпадет орел или решка, равна 1/2 (шансы 1 к 1). В реальной серии подбрасываний честной монеты мы можем получить больше или меньше, чем ровно 50%. Но по мере увеличения числа подбрасываний частота выпадения орла или решка в долгосрочной перспективе будет все ближе и ближе к 50%.

Математическое ожидание
Математическое ожидание случайной величины - число, которое пытается определить срединный центр распределения этой случайной величины. Его можно интерпретировать как долгосрочное среднее значение многих независимых выборок из данного распределения. Более точно, оно определяется как взвешенная по вероятности сумма всех возможных значений в поддержке случайной величины. Рассмотрим вероятностный эксперимент по бросанию честного кубика с 6 гранями. Вероятность выпадания значения от 1 до 6 составляет 1/6 или 0.17. Среднее значение выборки при многократном подбрасывании такого кубика сходится к ожидаемому значению (1+2+3+4+5+6)/6 = 3.5.

Дисперсия
В то время как ожидание определяет меру центральности, дисперсия случайной переменной количественно определяет разброс распределения этой случайной переменной около средней. Дисперсия - среднее значение квадрата разности между случайной величиной и ее ожиданием: Σ(xi - x̅)2 / n. Например, если бросать честный кубик, то дисперсия его значений будет стремится к ((1-3.5)^2 + (2-3.5)^2 + (3-3.5)^2 + (4-3.5)^2 + (5-3.5)^2 + (6-3.5)^2) /6 = 2.9.
👍3
Про базовые понятия вероятности и статистики. Часть 2

Множество
Множество в теории множеств — совокупность объектов или единичных событий. В контексте теории вероятностей мы используем множества для описания составных событий. Другими словами это математический язык, на котором можно записать различные выражения и условия. Например, {1, 2, 3} - множество, содержащее числа 1, 2 и 3; 1 ∈ {1, 2, 3} - 1 является элементом множества {1, 2, 3}; b ∉ {1, 2, 3} - b не является элементом множества {1, 2, 3} и т.д. Более подробно о константах множества здесь

Множество всех возможных исходов эксперимента называется пространством выборки. Мы представляем пространство выборки как множество, содержащее все возможные исходы. Например, если подбросить честную монету дважды, то пространство выборки будет следующим: S = {орел-орел, орел-решка, решка-орел, решка-решка}.

Если мы возьмем пациента, который обратился к врачу с некими неспецифичными симптомами, то пространство выборки в виде возможных диагнозов может быть огромным.

Комбинаторика
Бывает трудно подсчитать количество последовательностей или множеств, удовлетворяющих определенным условиям. Например, рассмотрим мешок с шариками, в котором 4 шарика разного цвета. Если мы будем вынимать шарики последовательно по одному из мешка, сколько различных упорядоченных последовательностей (перестановок) и неупорядоченных наборов (комбинаций) из всех шариков возможно?
Количество всех последовательностей из 4 цветных шариков = n! = 4! = 24
🟡🟢🔵🟣, 🟢🟡🔵🟣, 🟡🟢🟣🔵, и т.д.
Количество комбинаций из 4 шариков (в любой последовательности) = n! / ((n-k)! * k!) = 4! / ((4-4)! * 4!) = 24 / (1*24) = 1
🟡🟢🔵🟣

Количество комбинаций из 3 шариков (в любой последовательности) = 4! / ((4-3)! * 3!) = 4
🟡🟢🔵, 🟡🔵🟣, 🟡🟢🟣, 🟢🔵🟣

Условная вероятность
Условные вероятности позволяют нам учитывать информацию, которую мы имеем об интересующей нас системе. Например, мы можем ожидать, что вероятность того, что у пациента (в общем случае) инфекция, будет меньше, чем вероятность того, что у пациента инфекция, учитывая, что у него повышена температура. Эта последняя вероятность является условной вероятностью, поскольку она учитывает соответствующую информацию, которой мы обладаем. С математической точки зрения, вычисление условной вероятности равносильно сокращению пространства выборки до конкретного события. В системе "пациент" - сокращение числа возможных диагнозов, при условии, что мы имеем информацию о результатах обследования.

Вот пример. Вероятность того, что у случайного человека есть заболевание, может быть низкой, скажем, 5% (соответствует распространенности заболевания в популяции). Но если мы знаем, что у этого человека положительный результат скринингового теста, вероятность того, что у него действительно есть болезнь, при положительном результате теста, может быть гораздо выше. Конечно, если тест обладает хорошими показателями чувствительности и специфичности. Это и есть условная вероятность P(болезнь | положительный результат теста).
Про базовые понятия вероятности и статистики. Часть 3

Распределение вероятностей
- определение относительных вероятностей всех возможных исходов.

Случайная величина (переменная) - формально функция, которая присваивает действительное число каждому исходу в вероятностном пространстве. Например, выборка пациентов из популяции - набор случайных величин.

Существует два основных класса распределений вероятности: дискретные и непрерывные. Дискретная случайная величина имеет конечное число возможных значений, которые можно подсчитать. Непрерывная случайная величина принимает несчетно бесконечное число возможных значений (например, все действительные числа).

Распределение дискретных величин:
Случайная величина Бернулли принимает значение 1 с вероятностью p и 0 с вероятностью 1-p. Самый простой пример - представление бинарных экспериментов, таких как бросание монеты. В медицине бинарные эксперименты очень распространены, например, прогноз того умрет пациент или нет к определенному моменту времени.

Биномиальная случайная величина представляет собой сумму n независимых случайных величин Бернулли с параметром p. Она используется для моделирования числа успехов в определенном количестве одинаковых бинарных экспериментов, например, числа орлов в пяти подбрасываниях монеты или при расчете летальности в группе пациентов. Пример из медицины был ранее в статшоте №111: https://t.me/statshots/111

Геометрическая случайная величина подсчитывает количество испытаний, необходимых для наблюдения одного успеха, где каждое испытание является независимым и имеет вероятность успеха p. Например, это распределение можно использовать для вычисления количества бросков кубика для того, чтобы выпала шестерка.

Предположим, проводится испытание нового препарата для лечения высокого кровяного давления. Врач дает лекарство пациентам и проверяет, снижается ли у них давление до нормального уровня, что свидетельствует об успешном применении лекарства. Каждый пациент имеет независимую вероятность p того, что лекарство подействует с первой попытки, например, p=0.5. Количество пациентов, на которых врач должен испробовать лекарство, прежде чем увидит первый успех, соответствует геометрическому распределению = 1/p = 2 пациента. Однако геометрическое распределение дает только ожидаемое число испытаний. Фактическое количество необходимых пациентов может быть больше или меньше 2. Это может быть 1 пациент (если препарат сработает с первой попытки), или 3 пациента, 4 пациента и так далее. Геометрическое распределение просто говорит нам, что в среднем мы ожидаем, что препарат подействует после лечения 2 пациентов.

Массовая функция вероятности (probability mass function, PMF) дискретной случайной величины описывает вероятность того, что случайная величина примет определенное значение. Для геометрического распределения PMF дает вероятность того, что первый успех произойдет на n-ом испытании: P(X = n) = p(1-p)^(n-1), в примере выше p - вероятность того, что препарат окажется эффективным для каждого конкретного пациента, n - количество пациентов, необходимое для достижения первого успеха. При p=0.5 и n=2 значение PMF = 0.25. Вероятность того, что для того, чтобы препарат впервые подействовал, потребуется ровно 2 пациента, учитывая, что вероятность успеха для любого отдельного пациента равна 0.5, составляет 0.25 или 25%. Остальные возможности (1 пациент, 3 пациента, 4 пациента и так далее) составляют в сумме оставшиеся 75% вероятности.
Таким образом, в данном случае геометрическая случайная величина представляет собой количество пациентов, на которых врач должен опробовать новое лекарство от давления, прежде чем впервые убедиться в его эффективности. Среднее значение и массовая функция вероятности этого геометрического распределения будут зависеть от вероятности p того, что лекарство сработает для любого пациента.

Пуассоновская случайная величина подсчитывает количество событий, происходящих в фиксированном интервале времени или пространства, учитывая, что эти события происходят со средней скоростью. Пример из медцины был ранее: https://t.me/statshots/110
Отрицательная биномиальная случайная величина подсчитывает количество одних событий в последовательности независимых испытаний Бернулли с параметром p до того как произойдет нужное другое событие. Например, это распределение можно использовать для моделирования количества выпадения орлов, которые выпадут до появления трех решек в последовательности бросания монет. Предположим, врач пробует новый метод лечения определенного заболевания. Вероятность (p) ответа на лечение, например, p=0.5. Лечение считается успешным, если хотя бы 5 (r) пациентов на него ответили. Ожидаемое число пациентов, на которых врач должен опробовать лечение, пока не будет достигнуто 5 положительных результатов, соответствует отрицательному биномиальному распределению = r/p = 5/0.5 = 10 (количество "неудач" + "успехов"). Ожидаемое число неудач (не ответивших на лечение пациентов) = r*(1-p)/p = 5. Также в этом случаем можно рассчитать PMF, но уже по более сложной формуле: P(X = k) = (k-1)! / (r-1)!(k-r)! * p^r * (1-p)^(k-r), где k = необходимое количество "неудач" + "успехов".

Распределение непрерывных величин:
Равномерное распределение - непрерывное распределение, при котором все исходы имеют равную вероятность возникновения. Другими словами, все возможные значения в диапазоне имеют равные шансы быть выбранными. Пример равномерного распределения являются бросок несмещенного кубика - каждое число от 1 до 6 имеет вероятность 1/6 (формально это распределение дискретной случайной величины), измерение температуры / частоты сердечных сокращений / уровня гемоглобина и т.д. у пациента, находящегося в одинаковых условиях (с оговоркой, что показатели здоровья пациента не могут принимать какие угодно значения). То есть если мы будем измерять уровень гемоглобина у случайно взятых здоровых лиц, то мы получим разные его значения, но с одинаковой вероятностью в пределах референсного интервала.

Нормальное (или Гауссово) распределение имеет колоколообразную функцию плотности и используется в науке для представления реальных случайных величин, которые, как предполагается, аддитивно порождаются множеством малых воздействий (отдельные случайные события вносят фиксированный вклад в общий результат). Также см. https://t.me/statshots/73

t-распределение Стьюдента, или просто t-распределение, возникает при оценке среднего значения нормально распределенной совокупности в ситуациях, когда размер выборки мал (менее 30 наблюдений), а стандартное отклонение неизвестно. t-распределение учитывает эту большую неопределенность из-за малого размера выборки. Оно имеет более толстые "хвосты" по сравнению с нормальным распределением, поскольку более экстремальные отклонения от среднего значения более вероятны, когда среднее значение выборки оценивается с меньшей точностью. По мере увеличения объема выборки t-распределение начинает приближаться к нормальному распределению. Это происходит потому, что при увеличении выборки оценка среднего становится более точной и определенной. Практическое значение данного тезиса сводится к возможности применения теста Стьюдента на малых выборках вне нормального распределения, но при наличии некоторых других допущений (отсуствия экстремальных выбросов, равенстве дисперсий в группах).

Другие типы распределений: хи-квадрат, экспоненциальное, Фишера, гамма, бета.

Центральная предельная теорема (ЦПТ)
ЦПТ утверждает, что выборочное среднее достаточно большого числа случайных величин распределено приблизительно нормально. Чем больше выборка, тем лучше такая аппроксимация. Если мы последовательно будем формировать множество выборок пациентов из одной популяции, то распределение средних значений, например, возраста в данных выборках будет принимать приблизительно нормальное распределение.
Про базовые понятия вероятности и статистики. Часть 4

Частотный вывод (Frequentist Inference) - вид статистического вывода, процесс определения свойств базового распределения на основе наблюдения за данными.

Точечная оценка
Одна из основных целей статистики - оценка неизвестных параметров. Для аппроксимации этих параметров мы выбираем оценщик, который является просто любой функцией случайно отобранных наблюдений. Примеры простых оценщиков выборочных данных: средняя, медиана, пропорция и др.

Доверительный интервал (ДИ)
В отличие от точечных оценок, с помощью ДИ оценивают параметр, задавая диапазон возможных значений. Такой интервал связан с уровнем доверия, который представляет собой вероятность того, что при повторе эксперимента с теми же условиями мы получим результат, находящийся в пределах данного интервала. Другими словами, это уверенность (например, 95% или 99%), что истинный параметр популяции находится в пределах вычисленного интервала. Также можно сказать, что 95% ДИ означает, что если мы будем повторять экспермент (выборку и расчеты) много раз и каждый раз вычислять ДИ, то примерно 95% вычисленных интервалов будут содержать истинный, изучаемый нами, параметр популяции. Например, с помощью ДИ можно описать возрастное распределение пациентов.

Бутстрэп (Bootstrap)
Статистический метод, который обеспечивает удобный способ оценки свойств статистического вывода с помощью повторной выборки, что позволяет расчитать ДИ для изучаемого параметра.
Дополнительно здесь: https://t.me/statshots/138
Про базовые понятия вероятности и статистики. Часть 5

Байесовский вывод - статистический подход, позволяющий получить вероятности изучаемых событий (явлений) по мере получения новых данных, учитывая предварительные знания и учась на новой информации. При байесовском выводе мы сначала задаем предварительное распределение вероятностей, которое отражает наши представления о параметрах до получения данных. Затем мы получаем новую информацию и, используя теорему Байеса, обновляем предварительное (априорное) распределение, чтобы получить апостериорное распределение вероятности.

Предположим, что во время последнего визита к врачу пациент решил пройти тест на некое заболевание. Если ему не повезло и результат оказался положительным, то логичным будет следующий вопрос: "Учитывая результат теста, какова вероятность того, что у пациента действительно есть это заболевание?" Медицинские тесты, в конце концов, не являются идеально точными. Ответ на вопрос следующий P(Disease|+) = P(+|Disease) x P(Disease) / P(+).
Как следует из уравнения, апостериорная вероятность наличия заболевания при положительном результате теста зависит от априорной вероятности заболевания P(Disease). Можно считать, что это частота встречаемости заболевания в общей популяции. Например, 0.1 (10%). Апостериорная вероятность также зависит от точности теста: как часто тест правильно сообщает об отрицательном результате для здорового пациента (специфичность) и как часто он сообщает о положительном результате для человека с заболеванием (чувствительность). Например, чувствительность = специфичность = 0.75. Наконец, нам необходимо знать общую вероятность положительного результата P(+) в популяции, например, 0.3.
Теперь у нас есть все необходимое для расчетов:
P(Disease|+) = 0.75 (чувствительность) x 0.1 / 0.3 = 0.25 (только 25%!)
P(Healthy|-) = 0.75 (специфичность) x (1-0.1) / (1-0.3) = 0.96
P(Disease|-) = 1-0.96 = 0.04
P(Healthy|+) = 1-0.25 = 0.75


Правдоподобие (Likelihood)
Понятие правдоподобия играет фундаментальную роль как в байесовской, так и в частотной статистике. В байесовском выводе под правдоподобием понимается вероятность получения данных с учетом гипотезы или модели. Правдоподобие представляет собой вероятность наблюдения тех значений данных, которые мы наблюдаем, в случае истинности определенной гипотезы или модели. Таким образом, правдоподобие по сути, является оценкой того, насколько хорошо конкретная модель соответствует наблюдаемым данным. Модель с более высоким значением правдоподобия означает, что данные с большей вероятностью соответствуют этой модели. Правдоподобие = вероятность той или иной гипотезы, которых может быть много. В примере выше правдоподобие, например, показывает, насколько вероятен результат теста (например, положительный результат), если у пациента действительно есть заболевание, что будет равно чувствительности 0.75 (вероятность гипотезы, что пациент болен при положительном результате теста).

Отношение правдоподобия (фактор Байеса, LR) – решение о том, какая из гипотез более правдоподобна в эксперименте. В примере выше чувствительность диагностического теста = 0.75 и специфичность = 0.75 (частота ложноположительных результатов = 1-0.75=0.25). Тогда, положительный тест будет верно прогнозировать заболевание у пациента, имеющего данное заболевание, в 0.75/0.25 = 3 раз чаще, чем отрицательный. Это и есть LR+ для положительного результата теста. Другими словами, если до применения теста вероятность заболевания у пациента расценивалась как 10% или шансы 1/9, то после получения результатов теста шансы увеличились до 1/9 x LR (3)=3/9=1/3 (~0.33), а вероятность заболевания составила 0.33/(1+0.33) = 25%. Другими словами вероятность, что пациент болен стала на 25-10=15% выше вероятности, что он болен исходя из априорной вероятности иметь болезнь в популяции, равной 10%.
Как видно из примеров выше, вероятность гипотезы (правдоподобие) не равно истинной вероятности события. Вероятность гипотезы, что пациент болен при положительном результате теста равняется 75%, а истинная вероятность, что пациент болен составила только 25%.
Вычисление размера выборки для оценки арифметической средней. Предположим, что мы хотим оценить среднее систолическое артериальное давление в группе пациентов, чтобы 95% доверительный интервал (d) был шириной 10 мм рт.ст., т.е. 5 мм рт.ст. в обе стороны от среднего значения, не больше.

1. Посчитайте стандартное отклонение выборки, например, SD=11.
2. Воспользйтесь формулой: 1.96^2 x 4 x SD^2 / d^2 = 1.96^2 x 4 x 11^2 / 10^2 = 19 пациентов.
Если уменьшить ДИ до 5 мм рт.ст.: 1.96^2 x 4 x 11^2 / 5^2 = 74 пациента. Сокращение ДИ в 2 раза увеличивает размер выборки в 4.
Если ваша выборка меньше полученного значения, ее необходимо увеличить, чтобы соответствовать требуемым критериям.

Формулы для различных ДИ:

95% ДИ: N = 1.96^2 x 4 x SD^2 / d^2
90% ДИ: N = 1.64^2 x 4 x SD^2 / d^2
99% ДИ: N = 2.58^2 x 4 x SD^2 / d^2
Вычисление размера выборки для оценки пропорции.
Предположим, что мы хотим оценить распространенность (частоту встречаемости) некоего заболевания среди взрослого населения чтобы 95% доверительный интервал (d) был шириной 0.1 (10%), т.е. 5% в обе стороны от доли заболевания в популяции.

1. Задайте ожидаемую долю заболевания в популяции (p), например, p=0.1 (10%). Ее можно предположить или взять из других исследований (литературы). Если никакие варианты не подходят, используйте p=0.5.
2. Воспользйтесь формулой: 1.96^2 x 4p x (1-p) / d^2 = 1.96^2 x 4 x 0.1 x (1-0.1) / 0.1^2 = 138 пациентов.
Если мы удвоим точность измерения сузив ДИ до 0.05 (5%), то N = 1.96^2 x 4 x 0.1 x (1-0.1) / 0.05^2 = 553 пациента.

Формулы для различных ДИ:
95% ДИ: N = 1.96^2 x 4p x (1-p) / d^2
90% ДИ: N = 1.64^2 x 4p x (1-p) / d^2
99% ДИ: N = 2.58^2 x 4p x (1-p) / d^2

Правда более классическая формула не включает в себя множитель "4", 95% ДИ: N = 1.96^2 x p x (1-p) / d^2. Калькулятор
#глоссарий. Минимальная клинически значимая разница (minimum clinically important difference, MCID) - наименьший размер различия в данных, который исследователь считает настолько важным, что не хотел бы, чтобы его не заметили в ходе исследования. Другими словами, этот размер разницы между величинами считается клинически значимым. MCID необходима при расчете минимального размера выборки. Если выборка данных слишком мала для того, чтобы обнаружить эту величину различий, а она на самом деле существует, то сравнение не будет иметь клинической значимости, а исследование будет неубедительным и его нет смысла проводить. Выбор величины MCID не является статистическим правилом, а зависит от контекста исследования.
Расчет минимального размера выборки при сравнении средних при условии нормального распределения данных.

Для этого понадобятся следующие вводные:
- Стандартное отклонение (SD) выборки
- Минимальная разница (d), которая является клинически значимой (MCID)
- Уровень значимости (α - вероятность ошибки I рода, обычно 0.05)
- Мощность теста (1-β (вероятность ошибки II рода), обычно 0.8)
Формула: N = 2K x SD^2 / d^2

K - это множитель, который зависит от уровня значимости α и мощности 1-β, происходит из нормального распределения и определяется по специальным таблицам. Для α=0.05 и β=0.8, K = 7.8. Чем ниже α или выше β, тем выше K.

Например, мы захотели сравнить средние уровни гемоглобина в группах мужчин и женщин при заболевании X. SD всей выборки составила 20 г/л, d - 10 г/л (минимальная разница, которая будет по нашему мнению клинически значимой), K = 7.8.
Тогда N = 2 x 7.8 x 20^2 / 10^2 = 62 пациента в каждой группе!
Джордж Бокс — британский статистик, внёсший заметный вклад в такие области, как контроль качества, планирование эксперимента, анализ временных рядов и байесовский вывод.
Одним из допущений логистической регрессии, которое не все считают обязательным проверять и выполнять, является предположение о линейности зависимости между непрерывными количественными предикторами и исходом. На самом деле отсутствие линейной взаимосвязи может негативно сказываться на интерпретации и качестве медицинской прогностической модели.

В недавней работе международная группа статистиков провела анализ, как данный фактор оценивается в ранее опубликованных прогностических моделях. В обзор было включено 118 исследований (в 18 исследованиях (15%) оценивалось предположение о линейности или использовались методы обработки нелинейности, а в 100 исследованиях (85%) - нет). Для обработки нелинейности часто использовались трансформация предикторов и сплайны, которые применялись в 7 (n=7/18, 39%) и 6 (n=6/18, 33%) исследованиях соответственно. Также для обработки непрерывных предикторов в большинстве исследований применялась категоризация (n=67/118, 56.8%) и дихотомия (n=40/67, 60%), что также является большой проблемой и ошибкой.

Дополнительные материалы по теме в группе:
Пример нелинейной взаимосвязи в медицине
Про допущения логистической регрессии
Как проверить линейную зависимость
Что может, а что не может категоризация
Цена дихотомии непрерывных (количественных) переменных
👍2
​Внимательно смотрим на картинку и видим проблему в виде величин отношения шансов (Exp(b)) = 1.8 млрд. и 0 😳. Подобную картину можно иногда наблюдать для границ доверительных интервалов ОШ. Если вы столкнулись с такой ситуацией в научной публикации или сами получаете нечто похожее на своих данных, даже при намного меньших цифрах, то это связано с так называемой проблемой "разделения (сепарации)" в логистической регрессии, когда у вас есть бинарная (или категориальная ковариата) с почти или полным отсутствием событий в одной из катерогий. В итоге получаем "бесссмысленное отношение шансов". Ссылка на статью китайских исследователей будет в комментариях.

Проблема разделения (включая полное и квазиполное разделение) или монотонного правдоподобия наблюдается в процессе подгонки логистической модели. Разделение в основном происходит в небольших выборках с несколькими несбалансированными и высокопрогностичными факторами риска.

Что делать в случае проблемы:
Проверить данные на ошибки
Изменить размер выборки в сторону увеличения и/или устранить дисбаланс зависимой переменной
Применить метод Firth's Bias-Reduced Logistic Regression

Показано, что регрессия Фирта, первоначально разработанная для уменьшения смещения оценок максимального правдоподобия, обеспечивает идеальное решение проблемы разделения. Она позволяет получить оценки конечных параметров с помощью пенализированной (оштрафованной) оценки максимального правдоподобия.
Виды и отличия статистических анализов, связанных с обобщением агрегированных данных, в медицине

1. Pooled analysis (Объединенный анализ)
Объединение исходных данных нескольких отдельных исследований, как правило, схожего дизайна для создания более крупного набора данных для анализа. Простыми словами данные из разных исследований суммируются без взвешивания, так, как если бы они были получены из одной выборки. Это обеспечивает бОльшую статистическую мощность за счет бОльшего размера выборки. Также он полезен при субгрупповой оценке или для изучения взаимодействий (явлений), которые изначально не были запланированы как цели отдельных исследований.

2. Meta-analysis (Мета-анализ)
Предполагает анализ сводных статистических данных (средние значения, риски и др.), полученных в ходе нескольких независимых друг от друга исследованиях. Его цель - взвешенно обобщить результаты различных исследований для получения суммарной синтетической оценки эффекта лечения или связи между переменными. Мета-анализ используется в ситуациях, когда существует несколько исследований, посвященных одному и тому же вопросу, и их однотипные результаты необходимо объединить для получения более надежной и точной оценки основного эффекта.

3. Individual Participant Data (IPD) meta-analysis (Мета-нализ с индивидуальными данными участников)
Такой подход предполагает сбор и анализ исходных данных от каждого отдельного участника исследований (пациента). Это позволяет проводить более детальный и всесторонний анализ, а также лучше контролировать потенциальные конфаундеры (спутывающие переменные). Таким образом, IPD мета-нализ не опирается на сводную статистику или агрегированные результаты, но требует доступа к первичным сырым данным.

4. Network meta-analysis (Сетевой мета-анализ)
Также известен как анализ множественных методов лечения или косвенное сравнение методов лечения. Представляет собой статистический метод, используемый для анализа сравнительной эффективности нескольких видов терапии в отсутствии всех прямых "head-to-head" сравнений данных видов лечения между собой. Сетевой мета-анализ использует принципы традиционного мета-анализа в ситуации, когда существует сеть исследований, включающих различные методы лечения и их относительные эффекты (например, отношение шансов / рисков).

5. Component Network Meta-Analysis (CNMA)
CNMA представляет собой усовершенствованный вариант сетевого мета-анализа, предназначенный для анализа многокомпонентных схем лечения. В отличие от стандартного сетевого подхода, рассматривающего каждую комбинацию лечения как отдельную сущность, CNMA декомпозирует такие схемы на отдельные компоненты (например, лекарственные препараты) и оценивает вклад каждого в общий терапевтический эффект. Метод позволяет моделировать потенциальную эффективность новых комбинаций даже при отсутствии прямых клинических данных, а также уточнять роль каждого компонента в уже существующих схемах.
Что такое конфаундеры (спутывающие/сбивающие факторы в исследованиях)

Сбивающие факторы - переменные, которые могут влиять на интересующий нас исход, но при этом не являются промежуточными переменными в цепочке причинно-следственных связей. Они могут создать ложное представление о связи между исследуемой переменной и результатом. Например, мы изучаем как употребление алкоголя влияет на риск заболеваний сердца, но не учитываем факт курения. При этом курение (конфаундер) будет самостоятельно влиять на исход.

Отсутствие учета конфаундеров может привести к:
1. Неверным выводам
2. Недостоверным результатам
3. Нерациональному использованию ресурсов

Перед началом работы необходимо определить потенциальные конфаундеры, через:
1. Обзор литературы
2. Мнения экспертов по теме исследования
3. Промежуточный анализ данных (корреляция, кросс-табуляция)

Особенности дизайна исследований с учетом конфаундеров:
1. Рандомизированные контролируемые исследования (РКИ)
В идеале в РКИ конфаундеры распределяются между группами поровну, но такие исследования далеко не всегда выполнимы по практическим причинам.

2. Сопоставление (Matching)
Подбор участников на основе конфаундеров. Например, если возраст является конфаундером, то в обеих группах должны быть участники одинакового возраста.

3. Стратификация
Сгруппировать участников по уровню сбивающих переменных. Проанализируйте каждую страту отдельно.

Post-Hoc методы
Проверьте, сохраняются ли какие-либо закономерности основных эффектов, если к ним добавить конфаундер. Например, если в уравнение регрессии добавить новую переменную, изменит ли это предыдущий результат. Если изучаемый нами предиктор сохраняет направление и статистическую значимость, то добавленная нами переменная не является конфаундером (помехой). Если же основной эффект меняет направленность или значимость, то добавленная ковариата - слабый или сильный конфаундер. Но надо помнить, что проблемы могут возникнуть и из-за нарушений к допущений к регрессионному анализу. Одним из признаков, что в данных есть конфаундер, является парадокс Симпсона.
👍1
Про оценку максимального правдоподобия (Maximum Likelihood Estimation или MLE)

MLE - одна из ключевых концепций в статистике, на базе которой построена работа регрессионного анализа и ряда методов машинного обучения. Разберем ее максимально простым языком без математического аппарата, хотя и здесь есть в чем запутаться.

Для начала нам нужны уже знакомые термины:
Вероятность (Probability, P) - вероятность того, что событие произойдет. Например, вероятность выпадения орла при подбрасывании правильной монеты равна 0.5.

Правдоподобие (Likelihood, L) - вероятность получить наблюдаемый результат с учетом известных входных параметров. Например, если мы 10 раз подрбросим монетку и N раз получим выпадение орла, а 1-N раз выпадение решки это будет нашим результатом. У этого результата (комбинации орлов и решек) будет своя вероятность, у другого результата - своя. Она называется правдоподобие.

Теперь, что такое MLE:
Через функцию MLE мы можем рассчитать какова максимальная вероятность того, что результаты получены при некоем условии, например, что у нас правильная монетка с P(орла) = 0.5 или любая другая монетка с любой P(орла/решки). Если вместо результатов с монеткой у нас какой-либо набор данных, от которого зависит вероятность исхода, то при оценке MLE мы можем определить при каких значениях этих данных вероятность исхода будет максимальной. Это используется в регрессионном анализе.

Итак, MLE — метод поиска значений параметров, которые делают ваши наблюдаемые данные наиболее вероятными, или, другими словами, максимизируют функцию правдоподобия. В примере с монетой MLE найдет значение P(орла/решки), которое делает наблюдаемое в эксперименте количество орлов и решек наиболее вероятным.Таким образом, оценка максимального правдоподобия — метод, который помогает вам найти наиболее подходящие значения параметров для вашей статистической модели, определяя значения, которые делают наблюдаемый исход (данные) наиболее вероятным.

Совсем простая аналогия — подбор ключа к замку. Представьте, что ключ это вероятность открыть замок, тогда MLE поможет вам найти наиболее подходящий для этого замка ключ, смотря на какие-то другие его характеристики. MLE не гарантирует, что вы найдете истинную вероятность, она лишь показывает, что из всех ключей (данных) что вы перебрали, именно этот наиболее вероятно окажется подходящим, чтобы достичь результата (открыть замок). MLE — это прекрасное сочетание логики, интуиции и математики, помогающее нам понять смысл окружающего мира.

Разновидностями классической MLE являются пенализированные (оштрафованные) функции MLE, используемые в соответствующих регрессиях, например, регрессия Фирта. Дело в том, что регрессионные модели очень чувствительны к размеру выборки. Оценки моделей могут оказаться не совсем корректными на малых выборках (например, при N менее 1000). В штрафных моделях максимизируется пенализированное (оштрафованное) правдоподобие L, а не обычное правдоподобие L. Дальше уже идет почти сплошная математика, поэтому следует остановиться и сделать выводы. Если вы делаете логистический регрессионный анализ, особенно при малых размерах выборок, да и при больших тоже, предпочтительнее использовать штрафные регрессии по умолчанию (регрессия Фирта (brglm2 package в R), LASSO, Ridge Regression, Elastic Net Regression). Какая практическая польза? Да просто ваши модели могут быть лучше и точнее!
👍1