статИИстик

Читая чаты по медицинской статистике ...

Просить порекомендовать метод статистического анализа для своих данных, а потом наблюдать спор, что лучше Спирмен или Пирсон, Стьюдент или Манн-Уитни, Фридман или кто-то еще, что часто видишь в чатах по статистике, это как лечить анализы, а не диагноз у пациента. Да, все мы учимся и нет предела совершенства, и тем, кто еще в самом начале своего научного пути позволено задавать разные вопросы подобного рода, но всегда есть НО! Есть немало экспертов в тех же чатах, которые учат, советуют и даже преподают за деньги. Но все сводится к лечению анализов, а не пациента. Где формулировки научных гипотез и рассуждения в контексте их доказательств? Их нет. Спрашивайте и советуйте не как купировать симптом, а как вылечить болезнь! Купирование симптомов - не чем не лучше, чем p-хакинг, напротив, лечение первопричины этих сиптомов равно доказательству научной гипотезы. Да и симптоматическое лечение, которое рекомендуют многие, зачастую малоэффективно. Но люди склоны верить и доверять, не проверяя так ли хорошо на самом деле работает лекарство (совет), который им дал тот или иной "гуру". Совет из ряда "используйте ROC-анализ, чтобы найти порог для вашей прогностической модели или превращения количественной переменной в категориальную" равноценен совету выпить яд, чтобы долго не мучаться.
Начинайте с дизайна своего исследования, формулируйте научные гипотезы, каждую из которых можно проверять разными методами статистического анализа, также как для разного диагноза может существовать несколько видов лекарств. Не спрашивайте про симптоматическое лечение, ищите возможность решения проблемы целиком. Не занимайтесь наукой для галочки, потому что для этого вам не нужно ничего спрашивать, вам нужно просто уметь сочинять (ИИ в помощь). Познание истины - единственная возможная цель, но она не всегда достижима, это тоже нужно понимать. Поэтому ставьте только те задачи, которые реально решить. Что реально, а что нет, определяет правильный дизайн вашего исследования и методы статистического анализа для каждой и сформулированных научных гипотез.
@glivec

👍1

143 viewsedited 17:02

статИИстик

🗣️ Причинно-следственный вывод больше зависит от дизайна исследования, нежели от метода статистического анализа или машинного обучения.

125 views10:41

статИИстик

Луи Доминик Жюль Гаварре (28 января 1809 - 30 августа 1890) - пионер "статистического метода" в медицине, его книга "Principes de Statistique Médicale" (1840) одна из первых, в которой изложены статистические принципы для тщательного проведения клинических исследований.

Впервые он слышит о "вычислении вероятностей" в октябре 1835 года во время дебатов в Академии наук, где Навье - автор уравнения Навье-Стокса, описывает, как можно применить свое уравнение в терапевтических исследованиях (и побеждает в дебатах).
Лаплас и Пуассон уже предполагали, что расчеты вероятностей могут быть применены к количественным медицинским данным, чтобы помочь в принятии клинических решений. Гаварре ссылается на них в своей работе "Probabilité des Jugements.’".
Гаварре вычисляет прототип доверительного интервала ("limites d'oscillation") для данных Пьера-Шарля Луи об эффективности кровопускания как метода лечения пневмонии. Луи сообщил о 52 смертях из 140 пациентов (37%). Аргументируя против принятия точечной оценки Луи за чистую монету, он говорит: "Все, что мы узнали... в действительности, это то, что под влиянием лечебных средств, использованных в его 140 наблюдениях, количество смертей должно колебаться... приблизительно между 49 и 26 случаев смерти на 100 пациентов".

Его 5 советов по проведению клинических испытаний по-прежнему актуальны:
1. "Пациенты должны быть взяты исключительно в одном населенном пункте и из одних и тех же слоев населения"
2. "У пережитого заболевание пациента должен быть точный диагноз и идеальное его определение. Оно должно быть нозологически четко очерчено и отделено от болезней, наиболее похожих на него в данной группе"
3. "Статистические данные по заболеванию должны содержать точное указание числа случаев в рамках каждой из его разновидностей"
4. "Необходимо четко формулировать применяемое лекарство, а также его основные модификации для каждой из разновидностей заболевания"
5. "Медицинский статистик должен быть компетентным".

258 viewsedited 15:41

статИИстик

Ежегодно публикуется множество медицинских прогностических моделей, но зачастую они имеют методологические недостатки, которые ограничивают их валидность и применимость. Представлено руководство из 13 шагов, которое поможет медицинским работникам и исследователям разрабатывать и проверять модели прогнозирования, избегая распространенных "подводных камней". На первом этапе необходимо определить цель модели прогнозирования, включая целевую популяцию, прогнозируемый исход, медицинскую среду, в которой будет использоваться модель и предполагаемых пользователей. Прогнозное моделирование требует совместных и междисциплинарных усилий в рамках команды, которая в идеале включает клиницистов с опытом работы, методистов и пользователей. К числу распространенных ошибок относятся неправильная категоризация непрерывных исходов или предикторов, точки отсечения (пороги), основанные на данных, одномерные методы выбора предикторов, чрезмерная подгонка, недостаточное внимание к отсутствующим данным и неверная оценка эффективности и клинической пользы модели.
Помощь в создании прогностических моделей на statshots.ru

176 views10:55

статИИстик

Машинное обучение играет важнейшую роль во многих современных областях науки и инновациях. Все методы МО можно разделить на несколько главных групп, которые могут пересекаться между собой в решении тех или иных практических задач:

✅ Регрессия
✅ Классификация
✅ Кластеризация
✅ Оптимизация
✅ Компьютерное зрение
✅ Прогнозирование
✅ Рекомендательные системы
✅ Обработка естественного языка (NLP)

Изучение 1-3 ключевых алгоритмов в каждой из этих областей может значительно повысить вашу универсальность как специалиста по анализу данных.

164 views15:34

статИИстик

0:37

This media is not supported in your browser

VIEW IN TELEGRAM

Как работает нейронная сеть: входные данные, активация нейронов в промежуточных слоях, выходной слой с наиболее вероятным результатом.

121 viewsedited 06:09

статИИстик

This media is not supported in your browser

VIEW IN TELEGRAM

Алгоритм Дейкстры — алгоритм для поиска кратчайшего пути от одной вершины (пункта отправки) до всех других вершин (пунктов назначения) в графе с ненулевыми и неотрицательными весами рёбер. Может использоваться в контексте поддержки принятия решений в медицинских информационных системах. Подробнее на statshots.ru

135 views16:14

статИИстик

В 2019 году была опубликована статья Американской статистической ассоциации (ASA) "Статистический вывод в 21 веке: мир за пределами p < 0.05"

В ней авторы рассказывают историю появления статистического вывода и роли p-уровня значимости в нем. P-значение впервые введено в статистику Рональдом Фишером в 1920-х годах, как способ оценки значимости результатов экспериментов. Однако со временем p-уровень значимости стали использоваться как единственный критерий для оценки значимости результатов, что привело к ряду проблем.
Одной из основных проблем является то, что p-уровень значимости часто интерпретируются неправильно. Многие исследователи считают, что p-значение представляет собой вероятность того, что нулевая гипотеза верна или что результат обусловлен случайностью. Однако это не так. P-значение представляет собой только вероятность получения наблюдаемого результата или более экстремального результата, если нулевая гипотеза верна.
Авторы также обсуждают проблему множественных сравнений. Когда исследователи проводят множество тестов, они часто используют p-уровень значимости для оценки значимости каждого теста. Однако это может привести к тому, что некоторые из результатов будут признаны значимыми просто по случайности.
Другой проблемой, обсуждаемой в статье, является то, что p-уровень значимости не учитывают размер эффекта. Даже если результат статистически значим, он может быть практически незначимым, если размер эффекта мал.
Предлагается несколько альтернативных подходов к статистическому выводу, которые могут помочь решить эти проблемы. Одним из них является использование доверительных интервалов. Это может помочь исследователям оценить размер эффекта и понять, насколько результаты могут быть обобщены на другие ситуации.
Другим подходом является использование байесовских методов. Байесовские методы позволяют исследователям обновлять свои убеждения о вероятности того или иного события на основе новых данных. Это может помочь исследователям оценить вероятность того, что нулевая гипотеза верна или что результат обусловлен случайностью.
Статистический вывод должен быть более детальным и информативным. При интерпретации результатов исследователи должны учитывать множество факторов, включая научный вопрос (гипотезу), дизайн исследования и качество данных. P-уровень значимости не должны быть единственным критерием для оценки важности полученных результатов.

Taylor & Francis

Moving to a World Beyond “p < 0.05”

EDITORIAL: The editorial was written by the three editors acting as individuals and reflects their scientific views not an endorsed position of the American Statistical Association.

147 views17:34

статИИстик

🚀 ПРОФЕССИОНАЛЬНЫЙ АНАЛИЗ ДАННЫХ: ОТ ОПИСАТЕЛЬНОЙ СТАТИСТИКИ ДО МАШИННОГО ОБУЧЕНИЯ

Помогу превратить ваши данные в качественные проекты!

📊 ЧТО Я ДЕЛАЮ:
• Разрабатываю дизайн исследований
• Провожу глубокий статистический анализ
• Создаю прогностические модели по западным стандартам
• Разрабатываю интерактивные визуализации и калькуляторы
• Внедряю решения на базе машинного обучения
• Обучаю статистике

💡 МОЙ ПОДХОД:
✓ Современная методология
✓ Полное погружение в проект
✓ Решения "под ключ"

🎯 Посмотреть примеры моих проектов: https://sites.google.com/view/luchinin

📩 СВЯЗАТЬСЯ СО МНОЙ:
Email: glivec@mail.ru
Телеграм: @glivec

Готов обсудить ваш проект и предложить оптимальное решение!

211 views18:09

статИИстик pinned «🚀 ПРОФЕССИОНАЛЬНЫЙ АНАЛИЗ ДАННЫХ: ОТ ОПИСАТЕЛЬНОЙ СТАТИСТИКИ ДО МАШИННОГО ОБУЧЕНИЯ Помогу превратить ваши данные в качественные проекты! 📊 ЧТО Я ДЕЛАЮ: • Разрабатываю дизайн исследований • Провожу глубокий статистический анализ • Создаю прогностические модели…»

18:40

статИИстик

Про синтетические данные в медицине

Синтетические данные в медицине – искусственно созданные данные, которые имитируют реальные, сохраняя статистические характеристики и паттерны, но без раскрытия персональной информации о пациентах. Они играют важную роль в развитии ИИ в здравоохранении, особенно для задач, требующих больших и разнообразных наборов данных.
Применение синтетических данных охватывает разные направления: от улучшения диагностики и прогнозирования заболеваний до ускорения клинических исследований. Например, для разработки алгоритмов, работающих с редкими заболеваниями, где реальных данных может быть мало, синтетические данные позволяют восполнить имеющиеся пробелы. Современные технологии позволяют искусственно создавать практически любые типы данных (табличные, геномные, текстовые, медицинские изображения ...) для проведения различных типов исследований.
Гибридные данные — сочетание реальных и синтетических данных, позволяющее, например, улучшить качество прогностических моделей (точность и стабильность), обучая их на расширенном и разнообразном датасете.

Пара последних исследований в данной области:
☑️ Synthetic data in machine learning for medicine and healthcare ...
☑️ Generation of Multimodal Longitudinal Synthetic Data By Artificial Intelligence to Improve Personalized Medicine in Hematology ...

✅ Для синтеза или устранения пропущенных значений в табличных числовых данных вы можете воспользоваться сервисом DataClone, ссылка на который также есть на statshots.ru.

PubMed Central (PMC)

Synthetic data in machine learning for medicine and healthcare

The proliferation of synthetic data in artificial intelligence for medicine and healthcare raises concerns about the vulnerabilities of the software and the challenges of current policy.

166 views11:04

статИИстик

Datasaurus Dozen — коллекция из тринадцати наборов данных, демонстрирующая важность их визуализации в процессе анализа. Несмотря на практически идентичные сводные статистические показатели, такие как среднее значение, дисперсия и корреляция, эти наборы при графическом отображении показывают совершенно разные распределения. Этот пример подчеркивает, что опора исключительно на сводные статистики может быть обманчивой, так как они не всегда отражают истинную структуру данных.

Идея Datasaurus Dozen была вдохновлена квартетом Энскомба — классическим примером, включающим четыре набора данных со схожими статистическими свойствами (схожие средние и коэффициенты корреляции), но радикально различными визуальными проявлениями. Datasaurus Dozen расширяет эту концепцию, демонстрируя, что наборы данных могут разделять одни и те же сводные показатели, при этом формируя разнообразные фигуры при построении графиков. Например, один из наборов, названный «Datasaurus», визуально образует фигуру динозавра, что стало яркой иллюстрацией этой концепции.

На практике эта коллекция напоминает исследователям, аналитикам и ученым о важности графического представления данных. Визуализация позволяет выявить аномалии, скрытые закономерности или необычные взаимосвязи, которые остаются незаметными при использовании только сводной статистики. Применение таких методов способствует более глубокому пониманию данных, точной интерпретации и обоснованным выводам, что особенно важно в контексте принятия решений.

🔥1

170 views20:25

статИИстик

This media is not supported in your browser

VIEW IN TELEGRAM

R², или коэффициент детерминации, измеряет долю дисперсии (изменчивости) зависимой переменной, которая объясняется независимой переменной в регрессионной модели. Диапазон значений составляет от 0 до 1, причем более высокие значения указывают на более сильную линейную связь. Подробнее ...

124 viewsedited 17:29

статИИстик

Forwarded from 🤖 ИИ ШОТы

Большие языковые модели (LLM) активно внедряются в сферу здравоохранения, что требует разработки стандартизированных рекомендаций по отчетности для обеспечения прозрачности и воспроизводимости исследований. Представлено руководство TRIPOD-LLM (Transparent Reporting of a Multivariable Prediction Model for Individual Prognosis or Diagnosis with Large Language Models) — расширение стандарта TRIPOD + AI, адаптированное для решения проблем, связанных с использованием LLM в биомедицинских приложениях.
TRIPOD-LLM предлагает структурированный контрольный список, состоящий из 19 основных пунктов и 50 подпунктов, охватывающих ключевые аспекты отчетности — от формулировки заголовка до интерпретации результатов и обсуждения.
Данные рекомендации направлены на повышение качества отчетности, минимизацию методологических ошибок и обеспечение прозрачности при использовании LLM в клинической практике и биомедицинских исследованиях. Внедрение TRIPOD-LLM способствует стандартизации представления данных, что критически важно для оценки надежности, воспроизводимости и этической обоснованности применения крупных языковых моделей в здравоохранении.

Nature

The TRIPOD-LLM reporting guideline for studies using large language models

Nature Medicine - TRIPOD-LLM (transparent reporting of a multivariable model for individual prognosis or diagnosis–large language model) is a checklist of items considered essential for good...

👍1

133 views17:38

статИИстик

🔐 Защита авторских прав на программное обеспечение = публикация в журнале ВАК!

Если ваша научная работа содержит идеи, которые можно превратить в программный продукт (например, медицинский калькулятор, справочник, или что-то другое), мы готовы взять весь процесс на себя:

🔹 Разработка программного продукта под ключ
🔹 Запуск в Интернете
🔹 Подготовка описания
🔹 Подача заявки в ФИПС и ведение переписки до получения авторского свидетельства

Программный продукт не только заменяет публикацию в журнале ВАК, но добавляет вашей работе реальную практическую ценность!

✨ Начните превращать ваши идеи в инновации уже сегодня!
📩 Свяжитесь с нами:
@glivec | glivec@mail.ru

798 viewsedited 11:10

статИИстик

Если ваша зависимая переменная (Y) количественная, вы можете использовать следующие подходы для анализа и моделирования:

✅ Линейные модели (OLS) — подходят при условии нормального распределения остатков. Это базовый подход для регрессии количественных данных.
✅ Обобщенные линейные модели (GLM) — позволяют учитывать зависимости, выходящие за рамки нормального распределения, используя специальные распределения, такие как гамма.
✅ Обобщенные аддитивные модели (GAM) — расширяют линейные модели, позволяя непараметрически моделировать нелинейные зависимости.
✅ Квантильная регрессия — полезна для анализа данных, где важно моделировать медианы или другие квантили вместо среднего значения.
✅ Устойчивые регрессионные модели — подходят для случаев с выбросами или когда сумма квадратов ошибок не является подходящей метрикой.
✅ Полупараметрические модели — включают подходы, использующие ранги данных (например, модель Кокса для времени до события) или порядковые модели, такие как пропорциональная логистическая регрессия (модель пропорциональных шансов).
✅ Модели кумулятивных вероятностей — являются полупараметрическими из более широкого класса семейств, чем логистические.
Каждый метод имеет свои преимущества и ограничения, выбор зависит от свойств ваших данных и исследовательских целей. Если данные имеют сложную структуру или нарушения стандартных предположений (например, нормальности), стоит рассмотреть более гибкие модели, такие как GAM или квантильная регрессия.
Источник ...

🔥2👍1

188 viewsedited 18:24

статИИстик

Про TRIPOD-AI, TRIPOD-LLM, PROBAST-AI и DECIDE-AI

TRIPOD-AI, TRIPOD-LLM, PROBUST-AI и DECIDE-AI — руководства по отчетности, разработанные для повышения прозрачности и качества исследований, связанных с моделями прогнозирования и системами поддержки решений на основе искусственного интеллекта (ИИ) в здравоохранении.

TRIPOD-AI (Transparent Reporting of a multivariable prediction model for Individual Prognosis Or Diagnosis with Artificial Intelligence) — о бновленная версия оригинального руководства TRIPOD 2015 года. TRIPOD-AI представляет собой контрольный список из 27 пунктов, предназначенный для проверки отчетности по исследованиям, разрабатывающим, валидирующим или расширяющим модели прогнозирования, независимо от того, используются ли методы регрессии или машинного обучения. Цель состоит в обеспечении полной и точной отчетности, что способствует оценке и внедрению моделей в клиническую практику.

TRIPOD-LLM (TRIPOD for Large Language Models) — расширение TRIPOD-AI, с пециально разработанное для отчетности исследований, связанных с разработкой, настройкой или оценкой больших языковых моделей (LLM) в области здравоохранения. Этот контрольный список из 19 основных пунктов и 50 подпунктов охватывает ключевые аспекты от названия до обсуждения, учитывая особенности разработки и внедрения LLM в биомедицинских приложениях.

PROBAST-AI (Prediction model Risk Of Bias Assessment Tool for Artificial Intelligence) — об новленный инструмент для оценки качества, риска систематической ошибки и применимости исследований, связанных с моделями прогнозирования на основе ИИ. PROBAST-AI предоставляет формальный инструмент для оценки качества процесса разработки модели и риска систематической ошибки, обеспечивая надежную оценку исследований в этой области.

DECIDE-AI — ру ководство по отчетности для ранней клинической оценки систем поддержки решений, основанных на искусственном интеллекте. Оно включает контрольный список из 27 пунктов, разработанный для обеспечения прозрачности и полноты отчетности в исследованиях, оценивающих ИИ-системы на ранних стадиях их внедрения в клиническую практику. DECIDE-AI подчеркивает важность учета человеческих факторов и взаимодействия между пользователями и ИИ-системами.

Эти руководства играют ключевую роль в обеспечении надежности и воспроизводимости исследований, связанных с ИИ в медицине, способствуя более эффективному и безопасному внедрению ИИ-технологий в клиническую практику.

👍2🔥1

121 viewsedited 06:42

статИИстик

Про анализ взаимодействия

В одном из аутсорсинговых проектов передо мной стояла, казалось бы, стандартная задача — сравнить выживаемость пациентов, получавших два различных лечения. Я начал с классических подходов: log-rank тест и однофакторная регрессия Кокса позволили оценить влияние лечения на выживаемость, получить Hazard ratio, доверительные интервалы, p-value. На этом уровне задача была тривиальной, одно из лечений действительно выглядело лучше.

Однако истинный интерес заказчика заключался не в разнице между группами, а в гипотезе, что новое лечение нивелирует влияние неблагоприятного фактора X, который присутствует в обеих группах больных. Именно благодаря подавлению действия X, лечение B оказалось эффективнее. Такая задача уже нетривиальна, поскольку требует проверки взаимодействия между переменными.

Основной статистический способ проверить гипотезу "лечения против X" — добавить взаимодействие Surv(...) ~ Treatment * X (или Treatment + X + Treatment:X) в модель Кокса. Это прямой путь, дающий интерпретируемый результат: если взаимодействие значимо, значит, эффект лечения зависит от значения X, и гипотеза о нивелировании может быть подтверждена.

Однако в реальности модель с взаимодействием оказалась неустойчивой: малое число событий, особенно в подгруппах, не позволило получить надежную оценку. Это привело к необходимости искать обходные, но всё же статистически обоснованные пути.

Первый из них — стратифицированные модели. Использование Surv(...) ~ Treatment + strata(X) позволяет оценить влияние лечения в пределах уровней X, устраняя необходимость явно моделировать взаимодействие. Аналогично, модель Surv(...) ~ X + strata(Treatment) помогает понять, сохраняется ли эффект X внутри каждой группы лечения. Эти два подхода в совокупности дают косвенную, но ценную информацию о том, действует ли X во всех группах одинаково или только в одной из них.

Дополнительно использовались модифицированные версии регрессии Кокса: робастная модель с корректировкой стандартных ошибок и методы регуляризации (LASSO, ridge), особенно полезные при малом числе событий и высокой размерности. Эти методы позволяют стабилизировать оценки и, в случае регуляризации, также использовать автоматический отбор признаков.

Вывод, к которому я пришёл: даже при невозможности напрямую протестировать взаимодействие из-за ограничений данных, гипотезу о нивелировании можно проверять через стратификацию и модифицированные модели. Главное — понимать, какую именно гипотезу мы хотим подтвердить, и выбирать способ анализа, исходя из структуры и объема данных, не теряя логики исследования.

Также не стоит забывать о визуальной оценке кривых выживаемости. Даже когда формальные тесты не показывают статистически значимых различий — особенно при малом числе событий — визуализация может дать важную качественную информацию. В частности, скорректированные кривые выживаемости, построенные на основе модели Кокса, позволяют наглядно оценить, как лечение влияет на выживаемость в различных подгруппах.

Отсутствие статистической значимости не всегда означает отсутствие эффекта — особенно в условиях недостаточной мощности. Если кривые устойчиво расходятся, особенно в направлении, соответствующем исследовательской гипотезе (например, лечение B улучшает выживаемость у пациентов с X), это может стать дополнительным аргументом в пользу существования эффекта. Такой подход особенно важен на ранних этапах анализа, когда данные ограничены, но нужно принять решение о дальнейшем исследовании или подтверждающем анализе.

Если вам нужен качественный статистический анализ с глубоким погружением в суть ваших гипотез, пишите - @glivec
Подробнее: https://t.me/statshots/353

Статистические шоты

👍3

140 views07:20

статИИстик

Про динамическую ROC-кривую

Оценка прогностических моделей в медицине редко бывает статичной — нас интересует не просто вероятность события, а ее изменчивость во времени. Именно поэтому все большую популярность приобретают динамические ROC-кривые, позволяющие анализировать чувствительность и специфичность модели на заданных временных точках. В отличие от классических ROC, которые фиксируют способность модели различать исходы в конкретный момент, динамические ROC-кривые учитывают временной характер событий и цензурирование. Особенно это актуально при создании прогностических моделей выживаемости.

В работе над одним из недавних проектов у меня стояла задача создания прогностической модели общей выживаемости больных раком легких. За основу была взятя регрессионная модель пропорциональных рисков Кокса. На графике представлено изменение AUC во времени — метрики, отражающей дискриминационную (дискриминативную) способность модели. Видно, что на третьем месяце AUC составляет около 0.78, что говорит о достаточно высокой точности прогнозов. Однако к шестому месяцу наблюдается заметное снижение AUC до ≈0.74, а затем — относительно стабильное поведение около этой отметки. Такой профиль может отражать постепенное снижение уверенности модели по мере удаления от момента базового прогноза, что типично для моделей, не учитывающих зависимые от времени коваритаты. Также это логично, потому что предсказывать что-либо на коротком промежутке времени всегда проще, чем далеко вперед. Вспомните прогноз погоды.

98 viewsedited 06:22

статИИстик

Важно понимать, что снижение AUC не обязательно означает «плохую» модель — наоборот, это может быть отражением реальности, где влияние исходных предикторов ослабевает с течением времени. Такие результаты помогают уточнять горизонты прогноза, актуализировать модель или даже внедрять механизмы динамического обновления риска. В конечном счете, анализ AUC во времени позволяет не просто оценить, насколько хорошо работает модель, но и когда именно она наиболее информативна. А это — ключевой вопрос в принятии клинических решений, особенно в контексте медицины.

👍1

91 views06:25

статИИстик

Про множественное вменение пропущенных значений

Множественное вменение (multiple imputation) — статистический метод обработки пропущенных данных, при котором отсутствующие значения заменяются не один раз, а несколько раз, с созданием нескольких полных наборов данных, которые учитывают неопределённость, связанную с пропусками.
🔹 Создание нескольких импутаций: пропущенные значения заполняются разными разумными значениями, полученными на основе модели (например, регрессии, деревьев, байесовских подходов). Обычно создают несколько версий одного и того же датасета, где пропуски заменены чуть по-разному.
🔹 Анализ каждого датасета отдельно: на каждом из полученных "заполненных" наборов данных проводится интересующий анализ — например, строятся модели, оцениваются коэффициенты.
🔹 Объединение результатов: итоги из всех датасетов объединяются в единый результат с учётом внутригрупповой и межгрупповой дисперсии, что позволяет получить более реалистичную оценку доверительных интервалов, ошибок и значимости.

👨‍🎓 Я провел эксперимент. В рамках его проводилось сравнение трёх различных методов восстановления пропущенных значений в небольшом датафрейме медицинских данных, содержащем 169 строк и 23 столбца. Применялись: простая медианная замена пропусков, множественное вменение методом mice, и метод missForest на основе случайного леса.

Для оценки качества восстановления использовалась метрика RMSE (Root Mean Square Error) — корень из средней квадратичной ошибки между вмененнными значениями и исходными «истинными» значениями, которые искусственно были удалены. RMSE показывает, насколько в среднем восстановленные значения отклоняются от настоящих: чем меньше значение RMSE, тем лучше метод справился с задачей восстановления пропусков. RMSE рассчитывалась на множестве бутстрэп-выборок (n = 1000), что позволило получить не только среднее значение ошибки, но и доверительные интервалы, отражающие устойчивость каждого метода. Пропуски были внесены искусственно случайным образом в два сценария — 10% и 30% от общего числа ячеек.

При 10% пропущенных значений:
Всего было удалено 397 значений в числовых переменных.
Медианный метод показал среднее RMSE 43.2 с 95%-м доверительным интервалом от 19.7 до 64.3.
Метод mice дал RMSE 47.6, интервал — от 30.4 до 64.7.
Метод missForest оказался наиболее точным: RMSE 38.6, интервал — от 19.5 до 56.6.

При 30% пропусков:
Было удалено 1170 числовых значений.
Медианный метод дал RMSE 34.2, с интервалом от 24.6 до 44.7.
Метод mice оказался менее точным, с RMSE 44.9, интервал — от 35.6 до 55.6.
missForest снова лидировал: среднее RMSE 30.9, интервал — от 22.3 до 40.4.

Результаты показывают, что missForest стабильно демонстрирует наименьшие значения RMSE при различной доле пропусков, а также имеет более узкие доверительные интервалы по сравнению с mice. Это указывает на его устойчивость и высокую способность к точному восстановлению пропущенных данных даже при росте доли отсутствующих значений. Метод mice, напротив, показывает наибольшую неопределённость и большую ошибку, особенно при увеличении доли пропусков. Медианный метод остаётся простым и относительно стабильным, особенно при большом количестве пропусков, и не уступает mice, однако уступает missForest по точности.

Бесплатно выполнить множественное вменение методом missForest вы можете в сервисе DataClone на сайте https://dataclone.shinyapps.io/DataClone/

👍3

115 viewsedited 07:55

About

Blog

Apps

Platform