статИИстик
183 subscribers
75 photos
3 videos
162 links
О медицинской статистике и не только
Личные сообщения @glivec
Download Telegram
🗣️ В приложении статИИстик реализован бесплатный калькулятор расчета размера выборки для создания прогностической модели с использованием пакета pmsampsize по методике Ричарда Райли. Потому что качественная прогностическая медицина начинается не с алгоритма, а с достаточного объема данных и строгой методологии.
👍4
🗣️ На днях я впервые выполнил заказной статистический анализ, полностью используя только приложение статИИстик. Методологически задача была не сложная - анализ общей и беспрогрессивной выживаемости, в том числе в зависимости от достижения ответа на терапию по двум разным заболеваниям. Итоговый отчет составил 15 страниц word документа, включая графики выживаемости, таблицы вероятности дожития, интерпретацию результатов, заключение и объяснение методологии примененных методов. Отчеты были сформированы почти автоматически с помощью ИИ и проверены мною, после чего я внес лишь небольшие правки, связанные с контекстом данных. :
Сочетание корректно выполненного статистического анализа и настроенного ИИ в приложении статИИстик - практически работающий инструмент, позволяющий быстро, эффективно и профессионально решать большое количество самых распространенных статических задач.

Пара советов:
- при передаче данных ИИ старайтесь называть переменные так, чтобы они были "ему" понятны. Например, переменную время в анализе выживамости, лучше назвать не Time, а Months или Years, в зависимости от того, в чем она измерена
- при оформлении результатов исследования в своей научной работе, полученных в приложении статИИстик, пишите, что для проведения статистического анализа был использован язык программирования Python, в частности версия 3.10 (или 3.12).
🔥7
Как искать конфаундеры с помощью GLM. Часть 1.

Недавно передо мной стояла задача сравнить две группы пациентов по числу проведенных аферезов гемопоэтических стволовых клеток (ГСК) и по количеству заготовленных ГСК. На первом этапе все достаточно просто: можно использовать стандартные методы сравнения количественных показателей между двумя группами — например, тест Уэлча, Брауна–Муда или Манна–Уитни. Это позволяет оценить, есть ли различия между группами в целом. Это есть в приложении статИИстик.

Однако далее задача усложнилась. Нужно было понять, объясняются ли найденные различия только основной группирующей переменной или на результат также влияют другие факторы. Такие факторы называются конфаундерами — они могут искажать оценку эффекта, если их не учитывать в модели. В обсервационных исследованиях одной из главных методологических проблем является конфаундинг — ситуация, при которой связь между экспозицией и исходом искажается третьей переменной. Конфаундер связан как с воздействием, так и с исходом, и при его игнорировании оценка эффекта может быть смещена. Подробнее можно почитать здесь.

Для решения этой задачи применяются обобщенные линейные модели (GLM), которые позволяют анализировать влияние нескольких факторов одновременно. Подробнее здесь. Сложность заключалась в типе зависимых переменных. В одном случае это было число процедур (дискретные значения от 1 до 7), в другом — количество заготовленных клеток (непрерывная положительная величина). При этом все независимые переменные, включая основную группирующую и возможные конфаундеры, были бинарными.

Классическая линейная регрессия здесь не подходит, потому что она предполагает нормальное распределение зависимой переменной. Логистическая регрессия тоже не подходит, так как используется для бинарных исходов. Поэтому для анализа числа аферезов была выбрана регрессия Пуассона, которая предназначена для моделирования счетных данных. А для анализа количества заготовленных клеток использовалась гамма-регрессия, поскольку эта модель лучше подходит для непрерывных положительных показателей с асимметричным распределением.

В моделях обобщенной линейной регрессии, включая линейную, логистическую и пуассоновскую регрессию, один из наиболее распространенных практических подходов к выявлению конфаундеров основан на оценке изменения коэффициента регрессии при добавлении потенциальной переменной в модель.

Сначала строится «грубая» модель без конфаундеров. Затем добавляется предполагаемый конфаундер, и сравнивается коэффициент регрессии у основного переменной (группирующей). То есть мы усложняем модель и смотрим как ведут себя коэффциенты регрессии. Если после добавления новой переменной коэффициент заметно изменяется, это трактуется как наличие конфаундинга. Исторически в литературе закрепилось эмпирическое правило: если изменение превышает 10%, переменную считают конфаундером и оставляют в модели. На этом задачу можно считать выполненной. Кто не хочет на этом останавливаться, читайте часть 2.
🔥1
Как искать конфаундеры с помощью GLM. Часть 2.

Правило 10% является условным и не имеет универсального статистического обоснования. Величина возможного изменения коэффициента регрессии зависит от размера выборки, силы эффекта, дисперсии данных и структуры корреляций между переменными. В больших выборках даже небольшие изменения могут быть статистически значимыми, тогда как в малых выборках 10%может быть слишком строгим или, наоборот, слишком мягким критерием. Таким образом, фиксированный порог не учитывает характеристики конкретных данных и может приводить к неправильным решениям о включении или исключении переменных.

Более обоснованный подход заключается в том, чтобы вычислить индивидуальный порог для конкретной модели. Для этого в модель многократно добавляют случайную, не связанную с исходом переменную и оценивают, насколько изменяется коэффициент экспозиции исключительно из-за случайного шума. Методика простая, описана здесь. Мы берем исходную модель и многократно добавляем в нее искусственно созданную случайную переменную — просто набор случайных чисел той же длины, что и выборка. Эта переменная никак не связана ни с исходом, ни с основной переменной интереса и служит моделью "чистого шума". Каждый раз после ее добавления пересчитывается модель и фиксируется, насколько изменился коэффициент при основной переменной. Такую процедуру повторяют, например, 10 000 раз. В результате получается распределение случайных изменений коэффициента, и по его верхнему перцентилю определяется порог, выше которого изменение уже нельзя объяснить простым статистическим шумом.
Затем берут верхний перцентиль распределения этих изменений, например 95-й, и используют его как адаптивный порог. Такой метод позволяет оценить, какое изменение может возникнуть случайно, и отделить его от систематического влияния реального конфаундера. В отличие от фиксированного правила 10%, этот подход учитывает параметры модели и особенности выборки, обеспечивая статистически более корректную идентификацию конфаундирующих факторов.
При этом важно понимать, что любой метод, основанный на данных, включая критерий изменения коэффициента, не заменяет каузального мышления. Решение о включении переменной в модель должно учитывать предметные знания и причинную структуру, а не только числовой порог изменения коэффициента.
🔥1
🗣️ В приложении статИИстик добавлен новый анализ - линейная регрессия. Это статистический метод прогнозирования значения постоянной зависимой количественной переменной на основе одной или нескольких независимых переменных. Он оценивает взаимосвязь с помощью линейного уравнения. Линейное уравнение - прямая линия, которая моделирует связь между зависимой и независимой переменными, показывая, как изменения входящих характеристик влияют на целевое значение.
Подробне про допущения к методу можно почитать здесь. Еще больше информации в можете найти в "справочных материалах" на сайте.
👍2
🗣️ В приложении статИИстик добавлен расчет стабильности прогностической модели при построении бинарной логистической регрессии. Стабильность прогностической модели - одна из важнейших характеристик, которую почти никогда не проверяют. Нестабильные прогностические модели не будут работать в реальных условиях и не должны рекомендоваться для практического использования. Главная причина нестабильности модели - маленькая обучающая выборка.

Подробнее вы можете прочитать в справочных материалах в приложении "Про нестабильность прогностических моделей или причем тут "мультиверс" .
🗣️ В анализ бинарной логистической регрессии в приложении статИИстик добавлен расчет bias-скорректированной калибровки по методу профессора Фрэнка Харрелла

Подробнее:
В клинических прогностических моделях мы обычно оцениваем два ключевых свойства: дискриминацию и калибровку. Если дискриминация показывает, насколько хорошо модель разделяет пациентов с событием и без события (обычно через AUC), то калибровка отвечает на более клинически важный вопрос: насколько предсказанная вероятность соответствует реальному риску. Иными словами, если модель прогнозирует риск события 30%, то действительно ли примерно у 30% пациентов происходит событие?

Однако при оценке модели на той же выборке, на которой она была построена, возникает фундаментальная проблема — оптимистическое смещение (optimism). Модель частично "подстраивается" под случайные особенности обучающих данных. В результате её калибровка на обучающей выборке выглядит лучше, чем будет на новых пациентах. Такая калибровка называется apparent calibration (наблюдаемая калибровка). Она почти всегда несколько переоценивает качество модели.

Для решения этой проблемы Фрэнк Харрелл предложил метод bias-corrected calibration — калибровки с поправкой на смещение. Этот подход широко используется в современной медицинской статистике и лежит в основе рекомендаций TRIPOD и методологии построения регрессионных моделей. Его цель — оценить, как будет выглядеть калибровка модели на новых данных, не имея независимой внешней выборки.

Метод основан на бутстрэп процедуре. Из исходной выборки многократно формируются бутстрэп-подвыборки (обычно сотни повторений). На каждой из них модель строится заново. Затем оценивается её калибровка в двух ситуациях: на той же бутстрэп-выборке (где она обучалась) и на исходной выборке. Разница между этими двумя кривыми отражает оптимизм или ту часть качества модели, которая обусловлена переобучением. После усреднения этого оптимизма по всем бутстрэп-итерациям он вычитается из исходной (apparent) калибровки. В результате получается bias-corrected калибровочная кривая, более реалистичная оценка поведения модели на новых данных.

На графике обычно показывают несколько линий. Первая — идеальная калибровка (диагональ), где предсказанный риск полностью совпадает с наблюдаемым. Вторая — apparent calibration, построенная на обучающей выборке. Третья — bias-corrected calibration, скорректированная с помощью bootstrap-оценки оптимизма. Если эти две кривые сильно расходятся, это указывает на переобучение модели. Если же они почти совпадают, модель демонстрирует хорошую внутреннюю стабильность.

Важно понимать, что bias-corrected калибровка не заменяет внешнюю валидацию. Она лишь позволяет более корректно оценить модель на этапе разработки. Тем не менее этот подход считается одним из лучших методов внутренней проверки прогностических моделей, особенно когда доступна только одна небольшая выборка пациентов.

Таким образом, bias-corrected calibration по методу Харрелла — способ оценить реальную клиническую калибровку модели с поправкой на переобучение. Он позволяет увидеть, насколько оптимистична исходная калибровка и насколько вероятно, что модель сохранит свою точность при применении к новым пациентам. Именно поэтому этот метод сегодня является стандартом при разработке медицинских прогностических моделей.
👍2
Сегодня день числа Пи (3 месяц, 14 число)

🔵 Число «Пи» представляет собой математическую константу и является отношением длины окружности к ее диаметру. В цифровом выражении «Пи» начинается как 3,141592... и имеет бесконечную математическую продолжительность.
🔵 Придумал этот неофициальный праздник физик из Сан-Франциско Ларри Шоу, который подметил, что в американской системе записи дат (месяц/число) день 14 марта — 3/14 — совпадает с первыми разрядами числа «Пи» = 3,14…
🔵 В этот день в учебных заведениях полагается читать лекции о загадочном числе «Пи» и «проводить мероприятия, направленные на повышение интереса к математике».
Каждый год 14 марта в 1:59:26 люди, интересующиеся математикой, празднуют «День числа Пи», пекут круглый торт, усаживаются за круглый стол и обсуждают число π, решают задачи и головоломки, связанные с «Пи».
🔵 В английском языке слова pie (пирог) и pi (число π) звучат одинаково, и поэтому приготовление и поедание пирогов стало веселой частью праздника.
🔵 В числе «Пи» можно найти самые различные последовательности чисел, например, свою дату рождения или номер сотового телефона. Это можно проверить на первых 200 миллионах знаках после запятой здесь: https://www.angio.net/pi/
🔵 В сериале «Звездный путь» один из персонажей побеждает злой компьютер, предложив ему вычислить последнюю цифру числа. Тот не выдержал перегрузки и сгорел.
🔵 Вниманием это число не обошли и поэты. Неизвестный написал: «Надо только постараться и запомнить все, как есть – три, четырнадцать, пятнадцать, девяносто два и шесть».
👍2
Про математическое ожидание или почему нельзя выиграть у казино

Математическое ожидание — одно из ключевых понятий теории вероятности, которое отражает среднее значение случайной величины при очень большом числе повторений эксперимента. Прдстаьвте, что если эксперимент повторять много раз, то среднее значение наблюдаемых результатов будет стремиться именно к математическому ожиданию. Формально математическое ожидание рассчитывается как сумма всех возможных значений случайной величины, умноженных на вероятность каждого из них. Это понятие широко используется в статистике, экономике, медицине и анализе данных, поскольку позволяет оценивать ожидаемый результат в условиях неопределенности. Например, при моделировании эффективности лечения или анализе клинических исходов математическое ожидание помогает определить средний ожидаемый эффект терапии на основе вероятностей различных исходов.

Рассмотрим классический пример из казино — рулетку. В европейской рулетке на колесе 37 ячеек: 18 красных, 18 черных и одно зеро. Предположим, игрок ставит 1000 рублей на красное. Если выпадает красное (вероятность
18/37), игрок выигрывает и получает прибыль 1000 рублей. Если выпадает черное или зеро (вероятность 19/
37), он проигрывает свою ставку -1000 рублей. Математическое ожидание выигрыша можно рассчитать как сумму произведений результата на его вероятность: 1000×(18/37) - 1000 (19/37) ≈ −27 рублей. Это означает, что в среднем при каждой такой ставке игрок "теряет" около 27 рублей. Конечно, для отдельной ставки результат может быть как выигрышным, так и проигрышным, но при большом числе ставок средний результат будет стремиться к этому отрицательному значению. Именно поэтому казино в долгосрочной перспективе остается в выигрыше, ведь математическое ожидание для игрока отрицательное. По этой же логике можно анализировать любую азартную игру — математическое ожидание отрицательное, в долгой серии ставок игрок почти неизбежно окажется в проигрыше 🎲

Теперь рассмотрим простой медицинский пример. Предположим, что новый препарат для лечения заболевания приводит к полному выздоровлению у 60% пациентов, частичному улучшению у 30%, а у 10% пациентов эффекта не наблюдается. Если условно оценить исходы баллами: 2 — полное выздоровление, 1 — частичное улучшение и 0 — отсутствие эффекта, то математическое ожидание результата лечения можно рассчитать как сумму произведений каждого исхода на его вероятность: 2×0,6+1×0,3+0×0,1=1,5. Полученное значение 1,5 отражает средний ожидаемый эффект терапии для одного пациента. Это не означает, что конкретный пациент получит именно такой результат, но при большом числе наблюдений средний эффект лечения будет стремиться к этому значению. Такой подход используется при анализе эффективности терапии, моделировании клинических исходов и в фармакоэкономических оценках.
👍1
Байесовские методы в клинических исследованиях наконец получили четкую регуляторную поддержку. В 2026 году FDA выпустило долгожданный draft guidance, фактически закрепив их как полноценную альтернативу традиционному частотному анализу. Это важный сигнал для клиницистов и исследователей — подход, который десятилетиями использовался ограниченно, теперь официально признан применимым для оценки эффективности и внедрения лекарств.

Ключевое различие между подходами — в самом вопросе, который мы задаем данным. Частотная статистика отвечает косвенно: p-уровень показывает, насколько маловероятны наблюдаемые данные, если лечение не работает. Байесовский подход отвечает прямо: какова вероятность того, что лечение эффективно. Это делает результаты более клинически интерпретируемыми. Например, вместо формулировки "p<0,05" врач может получить вывод "вероятность общей пользы терапии составляет 86%, вероятность значимого эффекта (выше заданного клинического порога) — 44%".

Суть метода — в объединении накопленных знаний и новых данных. В байесовском анализе используется prior (априорное распределение), отражающее предыдущие исследования или экспертные ожидания, и текущие данные исследования. Их комбинация дает posterior — обновленную оценку эффекта лечения. Итоговая интерпретация зависит от выбранного prior, что влияет на итоговую вероятность итогоговой пользы.

Практическая ценность подхода особенно заметна в дизайне исследований. Во-первых, можно использовать результаты предыдущих исследований или реальную клиническую практику (RWD), снижая необходимый размер выборки. Например, результаты фазы II можно использовтаь как prior для фазы III исследования. Хотя выбор prior часто критикуется как субъективный, его явное задание делает допущения прозрачными — в отличие от p-хакинга в частотной статистике. Во-вторых, байесовские исследования по своей природе адаптивны. По мере накопления данных posterior обновляется. Это означает, что исследование может раньше выявить неэффективность или, наоборот, быстрее подтвердить пользу терапии.

Мы переходим от контроля ошибки I рода к оценке вероятности эффективности. Решения могут приниматься на основе posterior probability, что ближе к клинической логике: не "есть ли статистическая значимость", а "насколько вероятна клиническая польза". Эти подходы уже меняют практику, особенно в онкологии. Это делает исследования более эффективными и этичными, поскольку больше пациентов получают потенциально эффективное лечение по мере накопления данных

При этом важно понимать ограничения. Байесовский подход не является универсальным решением. Он требует тщательного обоснования prior, проведения симуляций для оценки надежности дизайна и может иногда приводить к необходимости увеличения выборки для корректного учета неопределенности. Также остается потребность в обучении специалистов и развитии удобных инструментов анализа.

В целом, новое руководство FDA отражает фундаментальный сдвиг того, что клинические исследования постепенно переходят от жестких, фиксированных схем к более гибким, адаптивным и клинически ориентированным методам анализа. Для врачей это означает, что в ближайшие годы результаты исследований будут все чаще формулироваться не через p-уровень значимости, а через вероятности — и станут ближе к реальному принятию решений в клинической практике.
🔥3
Про расчет размера выборки при анализе выживаемости

Расчет размера выборки в частотной статистике имеет значение для определения мощности имеющихся данных перед проверкой статистической гипотезы. При недостаточной мощности данных повышается вероятность ошибки II рода - не получить значимых различий, где они действительно есть. Самыми распространенными статистическими тестами сравнения кривых выживаемости являются logrank тест и Hazard Ratio (HR). Существуют разные калькуляторы для расчет размера выборки, которые отличаются сложностью и числом начальных параметров. Независимо от калькулятора, вы вводите в него гипотетические данные, которые ожидаете. Их можно либо предположить, либо найти в литературе в прошлых исследованиях.

👨‍💻 Простой расчет. Используйте вот этот калькулятор.

Для расчета объема выборки в данном калькуляторе необходимо указать уровень статистической значимости (Type I error, α), который обычно принимают равным 0,05, вероятность ошибки II рода (Type II error, β), соответствующую выбранной мощности исследования, например β = 0,20 при мощности 80%, ожидаемую выживаемость (survival rate) в первой и во второй группе к определенному (любому) моменту наблюдения (доля от 0 до 1), а также соотношение размеров групп (ratio of sample sizes), которое при равном распределении пациентов составляет 1.

Например: α = 0.05, β = 0.2, ожидаемая 2-летняя выживаемость 0.5 и 0.7, соотношение размеров групп = 1. Получаем: общий размер выборки 192 пациента (по 96 в каждой группе).
Проблема данного калькулятора: результат sample size меняется в зависимости от выбранной временной точки.

👨‍💻 Более сложный и точный расчет с использованием HR (ожидаемый размер эффекта). Используйте мощный онлайн калькулятор, сделанный на языке R. Можно остановится на методе Schoenfeld.

Необходимо ввести предполагаемое отношение рисков (HR) между группами, уровень статистической значимости α, требуемую мощность исследования (1−β), отношение размера исследуемой группы к контролю (allocation ratio k), предполагаемую медиану выживаемости в контрольной группе (можно из данных литературы), длительность периода набора пациентов (accrual time), продолжительность последующего наблюдения после завершения набора (follow-up time), а также ожидаемую ежегодную частоту выбывания пациентов из под наблюдения (dropout rate). Калькулятор сначала определяет необходимое число событий, после чего на основании ожидаемой частоты наступления событий за период наблюдения рассчитывает общий объем выборки.

Например: HR = 0.6, α = 0.05, 1-β = 0.8, соотношение размеров групп = 1, медиана выживаемости в группе контроля - 36 мес., период набора пациентов в исследование - 24 мес., продолжительность наблюдения за пациентами после включения в исследование - 36 мес., ожидаю выбывание 5% пациентов из под наблюдения ежегодно (Annual dropout rate = 0,05).
Получаем: общий размер выборки 148 пациентов (по 74 в каждой группе).
🔥1
Известный профессор статистики Фрэнк Харрелл опубликовал презентацию на тему, как он использует ИИ в статистическом анализе. Выводы в целом положительные. ИИ помогает по многим вопросам. "Use AI to raise the bar for productivity, efficiency, problem-solving, reliability."

Кроме того, Харрелл написал несколько ключевых навыков для ИИ-агентов, которые превращают ИИ в граммотного статистического аналитика, соблюдающего основные приниципы методологии классической и байесовской статистики. Эти навыки загружены в нашего ИИ-агента архИИмед на mdcopilot.ru.

Теперь статистический анализ стал еще более доступным. Вы можете выполнять его как в приложении статИИстик, так и полностью поручить его на аутсорсинг архИИмеду.
🔥1