написали и пропали…
Но!
Пропали не просто так😅
Случились новые методические рекомендации, которыми мы тоже поделимся…
Как только они выйдут🤣
А пока👇 👇 👇
Но!
Пропали не просто так
Случились новые методические рекомендации, которыми мы тоже поделимся…
Как только они выйдут
А пока
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 ТОП-5 надёжных инструментов для расчёта размера выборки в медицинских исследованиях
1️⃣ EpiTools Sample Size (AusVet, Австралия)
Профессиональный набор утилит для расчёта объёма выборки:
Раздел «Cohort/Case-control» — подходит для сравнений между группами (пре- и пост-обследования)
Один показатель (proportion) и среднее значение (mean) для простых дизайнов
Удобен, быстр и подходит под академические задачи.
🧾 Идеально, если: ты знаешь процент или среднее и хочешь получить точный расчёт с учётом α и β.
2️⃣ RiskCalc Sample Size
Уникальный калькулятор для клинических и эпидемиологических исследований:
RCT, когорты, case–control и нестандартные дизайны.
Рассчёт по разнице рисков или относительным рискам на основе современных формул
🧾 Идеально, если: ты работаешь с наблюдательными данными или планируешь клиническое исследование.
3️⃣ ClinCalc Sample Size Calculator
Бесплатный онлайн-инструмент для быстрого расчёта:
поддержка как непрерывных, так и бинарных исходов; объяснения — почему именно нужно столько участников и что будет если изменить размеры выборки
🧾 Идеально, если: нужно мягкое решение для диплома или при отсутствии доступа к GPower.*
4️⃣ Qualtrics Sample Size Calculator (блог + инструмент)
Простой интерфейс и для социологических и популяционных исследований:
настраиваемая погрешность, уровень доверия и размер популяции;
пошаговое руководство с формулами (Cochran, з-нормальные интервалы)
🧾 Идеально, если: нужно оценить размер выборки для опроса/сервей–проекта.
5️⃣ G*Power (Windows / Mac)
Лидирующее ПО для статистических power-анализов:
Поддержка t-тестов, ANOVA, χ², регрессионных моделей;
Можно построить графики мощности (power contours) и выполнить sensitivity analysis
🧾 Идеально, если: у тебя есть данные о разбросе, ожидаемый эффект известен или можно оценить.
❗ Совет — не сделай этих ошибок ❗
👉 Всегда определяй α ≤ 0.05 и мощность ≥ 0.8: это главный стандарт для исследований
👉 Найди похожее исследование — и определи effect size на его основе
👉 Не выбирай минимальный объём — выбирай оптимальный.
👉 Маленький = риск пропустить эффект, слишком большой = этично сомнительно и неэкономично.
👉 Чем шире доверительный интервал, тем точнее инсайт.
👉 Используй калькуляторы погрешностей, как на Qualtrics
👉 Фиксируй параметры расчёта: α, мощность, design, effect size — чтобы можно было повторить или объяснить расчёт в работе.
✅ Что делать прямо сейчас
🔹Определи задачу исследования — RCT, case‑control, survey или кросс-секционный дизайн
🔹Выбери подходящий инструмент из списка выше
🔹Зайди и введи свои параметры: effect size, α, power
🔹Получи объём выборки
Теперь пригодится не только G*Power, но и практичные сервисы прямо в браузере.
Профессиональный набор утилит для расчёта объёма выборки:
Раздел «Cohort/Case-control» — подходит для сравнений между группами (пре- и пост-обследования)
Один показатель (proportion) и среднее значение (mean) для простых дизайнов
Удобен, быстр и подходит под академические задачи.
Уникальный калькулятор для клинических и эпидемиологических исследований:
RCT, когорты, case–control и нестандартные дизайны.
Рассчёт по разнице рисков или относительным рискам на основе современных формул
Бесплатный онлайн-инструмент для быстрого расчёта:
поддержка как непрерывных, так и бинарных исходов; объяснения — почему именно нужно столько участников и что будет если изменить размеры выборки
Простой интерфейс и для социологических и популяционных исследований:
настраиваемая погрешность, уровень доверия и размер популяции;
пошаговое руководство с формулами (Cochran, з-нормальные интервалы)
Лидирующее ПО для статистических power-анализов:
Поддержка t-тестов, ANOVA, χ², регрессионных моделей;
Можно построить графики мощности (power contours) и выполнить sensitivity analysis
🔹Определи задачу исследования — RCT, case‑control, survey или кросс-секционный дизайн
🔹Выбери подходящий инструмент из списка выше
🔹Зайди и введи свои параметры: effect size, α, power
🔹Получи объём выборки
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍1🔥1
и немножко запрещенки удивительной книги, которую я уверена должен иметь каждый ( кто связан с медициной, конечно же)
если вы не зацените Литтманна…то тогда уже не знаю
а вы точно медик?😂
если вы не зацените Литтманна…то тогда уже не знаю
а вы точно медик?
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6
Пока другие только говорят про будущее,
🔹 находить актуальные клинические рекомендации по онкологии,
🔹 адаптировать их под конкретного пациента,
🔹 принимать решения быстрее — без потери качества.
📲 Как это работает:
Вы просто вводите ключевой запрос или параметры пациента — AI мгновенно подбирает нужные рекомендации из базы ASCO.
🧠 Система построена на проверенных протоколах, работает на базе современных языковых моделей и регулярно обновляется в соответствии с новыми гайдлайнами.
🌍 Для
онкологов,ординаторов , клинических фармакологов, исследователей, организаторов здравоохранения и всех, кто работает в онкологической практике.
🔐 Доступ свободный (пока что!) — используйте этот инструмент, чтобы быть на шаг впереди и строить практику на основе самых сильных источников.
✳️ ИИ уже здесь. Не заменяет врача — усиливает его.
Тестируем?
Делитесь в комментах
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍1🔥1
Forwarded from Галина Киреева | Наука | Медицина | Докмед
Вопрос, который часто задают люди, не связанные с медициной и исследованиями (а иногда и связанные): «А вот эти ваши исследования – как вы можете гарантировать, что это авторы не выдумали какие-то цифры и написали? Это же легко. А следовательно, как этому можно верить?».
Логика верна отчасти. Гарантировать и правда не может никто – достаточно редко журналы могут запросить первичную документацию по исследованию, и то в 99% случаев это будут таблички с сырыми данными, т.е. не истории болезни. А значит, теоретически, в эту табличку можно загнать любые данные и получить любой результат.
Но на практике, как это ни парадоксально, правдоподобно подделать данные оказывается практически невыполнимой задачей. Да, бывают талантливые подделки – чего стоит история японского анестезиолога, сфабриковавшего данные в 172 (!!!) статьях за 19 лет активной «творческой» деятельности (и 18 из 19 лет никто ничего не подозревал). Но это крайне редкие истории. Чаще встречаются неумелые подделки, которые быстро выдают себя, если знать, на что смотреть.
Два примера на скринах выше:
⚠️Первый – многие по-прежнему агрессивно отрицают роль Таблицы 1 с исходной характеристикой пациентов в грамотной и критичной оценке исследования. А зря! Мало того, что это дает вам понимание общего «портрета» включенных пациентов – а значит, и сразу ясно, на кого можно проецировать полученные результаты. Но вдобавок можно обнаружить индикатор «фальшивки»: средний возраст пациентов в обеих группах имеет стандартное отклонение 1,7 и 2 года. При том, что критериями включения были люди старше 18 лет (без верхней границы). А теперь вспомните, какой обычно бывает разбег в средних возрастах пациентов при таких вводных – иногда плюс/минус 10, а иногда и плюс/минус 20. Но никак не 1,5 года. Даже если посмотреть исследования по аналогичной тематике с похожими задачами – в них минимальный разбег возраста будет 11 лет. А судя по цифрам от авторов этой статьи почти каждый пациент, один за другим, имел возраст 42 или 43 года. А значит, либо было какое-то негласное указание не включать людей с другим возрастом (что уже говорит о невоспроизводимости результатов), либо это откровенная «липа» - никаких пациентов не было, возраст рисовали с потолка, но боялись «неправдоподобного» разброса, и получилась неправдоподобная точность. Откуда я это знаю? Знание исследований, статистики и опыт работы с огромным массивом статей и авторов (в т.ч. недобросовестных).
⚠️Второй – посмотрите на результаты исследования, где авторы пишут про количество баллов по ВАШ (шкала для оценки боли). Ничего вас не настораживает в этих цифрах? А если я напомню, что ВАШ – это 100-балльная шкала, и она достаточно субъективна. И значит, что если у вас среднее значение для 30 пациентов имеет стандартное отклонение 1,1 или 1,3 балла, то пора снимать лапшу с ушей. Не могут 30 пациентов подряд на 100-балльной шкале все указывать свою боль в условном диапазоне 67-68 баллов. Опять же, зависит от рассматриваемой патологии, но стандартное отклонение по ВАШ начинается (начинается!) от 3-4 баллов, а чаще составляет около 10. Поэтому вот в этих результатах снова проступает эта старательность в прорисовке несуществующих данных так, чтобы они были близехонько друг от друга – обратите внимание, что стандартное отклонение не доходит даже до 2 баллов именно после оцениваемого воздействия. И в этом есть желание продемонстрировать якобы равномерный (одинаково проявляющийся у всех пациентов) эффект от выполненного лечения.
Оговорюсь, что бывают разные ситуации – разные исследования и разные пациенты, поэтому конечно не всегда столь удивительные цифры говорят о сфабриковке. Но, например, рассмотренные статьи имеют много других недочетов и нестыковок, из-за чего вот эти аномальные цифры становятся финальным приговором – да, это подделка.
Призываю вас к одному – будьте внимательны, и очень часто цифры могут сказать гораздо больше, чем 7 страниц текста статьи. Надо только уметь их распознать и понимать, что заложено, по смыслу, в каждое из значений.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5⚡2❤🔥2
🎓 С Днём учителя, друзья науки!
Сегодня — праздник всех, кто делится знаниями, вдохновляет, направляет и помогает нам расти как исследователям.
Но знаете, кто становится лучшим учителем в науке?
Тот, кто учится сам — у текста, ошибок и обратной связи.
✍️ В честь этого дня — подарок всем, кто пишет статьи, дипломы, диссертации или просто борется с белым листом.
Мы нашли свежайшую работу 2024 года, которая показывает, как технологии могут заменить строгого, но доброго научного руководителя — хотя бы частично.
📘 Статья: “Automated Focused Feedback Generation for Scientific Writing Assistance” (arXiv, 2024) 🔗 arxiv.org/abs/2405.20477
💬 В ней исследователи из Университета Беркли и Microsoft Research разработали систему SWIF²T, которая автоматически анализирует научный текст и даёт точечную обратную связь: — где не хватает логики, — какие аргументы звучат слабо, — как улучшить ясность и структуру.
То есть — как если бы рядом сидел научрук, который спокойно говорит: «Хорошо, но добавь контекст в первом абзаце и уточни методику».
🧠 ЗАЧЕМ ❓
👉 Помогает развивать научное мышление, а не просто править ошибки.
👉 Экономит время и делает работу над текстом осознанной.
👉 Можно использовать как практику саморедактуры, даже без доступа к рецензентам.
💬 Маленькое упражнение на сегодня:
Выбери абзац из своей научной работы и задай себе вопросы:
Понятно ли, зачем я это пишу?
Есть ли связь с предыдущим и следующим абзацем?
Могу ли я сказать то же самое проще?
Если да — поздравляем, ты уже не просто студент или исследователь.
Ты — учитель для самого себя.
#НаПутиКНауке #ДеньУчителя #НаучноеПисьмо #ScienceWriting #AIinScience
Сегодня — праздник всех, кто делится знаниями, вдохновляет, направляет и помогает нам расти как исследователям.
Но знаете, кто становится лучшим учителем в науке?
Тот, кто учится сам — у текста, ошибок и обратной связи.
Мы нашли свежайшую работу 2024 года, которая показывает, как технологии могут заменить строгого, но доброго научного руководителя — хотя бы частично.
📘 Статья: “Automated Focused Feedback Generation for Scientific Writing Assistance” (arXiv, 2024) 🔗 arxiv.org/abs/2405.20477
💬 В ней исследователи из Университета Беркли и Microsoft Research разработали систему SWIF²T, которая автоматически анализирует научный текст и даёт точечную обратную связь: — где не хватает логики, — какие аргументы звучат слабо, — как улучшить ясность и структуру.
То есть — как если бы рядом сидел научрук, который спокойно говорит: «Хорошо, но добавь контекст в первом абзаце и уточни методику».
💬 Маленькое упражнение на сегодня:
Выбери абзац из своей научной работы и задай себе вопросы:
Понятно ли, зачем я это пишу?
Есть ли связь с предыдущим и следующим абзацем?
Могу ли я сказать то же самое проще?
Если да — поздравляем, ты уже не просто студент или исследователь.
Ты — учитель для самого себя.
#НаПутиКНауке #ДеньУчителя #НаучноеПисьмо #ScienceWriting #AIinScience
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🔥1💯1
Авторы из University of California, Berkeley и Microsoft Research представили инновационную систему SWIF²T (Scientific Writing Intelligent Feedback Tool) — инструмент, который использует искусственный интеллект для анализа черновиков научных текстов и формирования сфокусированной содержательной обратной связи.
В отличие от простых грамматических корректоров, SWIF²T оценивает структуру аргументации, связность текста, логику изложения и полноту научных доказательств, предлагая автору точечные рекомендации по улучшению.
🔬 Исследование демонстрирует, что внедрение интеллектуальных систем обратной связи способствует развитию навыков критического мышления, саморедактуры и научного письма у исследователей, особенно в ранней карьере. Модель SWIF²T рассматривается как новый формат наставничества в цифровую эпоху, усиливающий традиционное взаимодействие между студентом и научным руководителем.
📄
В отличие от простых грамматических корректоров, SWIF²T оценивает структуру аргументации, связность текста, логику изложения и полноту научных доказательств, предлагая автору точечные рекомендации по улучшению.
🔬 Исследование демонстрирует, что внедрение интеллектуальных систем обратной связи способствует развитию навыков критического мышления, саморедактуры и научного письма у исследователей, особенно в ранней карьере. Модель SWIF²T рассматривается как новый формат наставничества в цифровую эпоху, усиливающий традиционное взаимодействие между студентом и научным руководителем.
📄
Рекомендуется всем авторам научных статей, преподавателям и руководителям исследовательских проектов, интересующимся современными подходами к обучению академическому письму.
❤1👌1🤗1
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7
Антиплагиат.
почему это не «формальность», а фундамент научной культуры?
Каждый раз, когда кто-то спрашивает:
, — я понимаю, насколько сильно мы недооцениваем саму суть научной работы.
Антиплагиат — не про проценты. И уж точно не про игру «как обмануть алгоритм».
Антиплагиат — про уважение. К читателю. К коллегам. К себе.
С чего я это взяла?
🔬 1. Наука держится на воспроизводимости, а не на копировании.
Если исследователь не может честно описать свои методы и результаты, мы не можем воспроизвести его работу. Плагиат в данном случае — всё равно что подделанные данные: он разрушает доверие. В международных журналах именно поэтому плагиат рассматривается почти как научная фальсификация (Committee on Publication Ethics — COPE).
📚 2. Каждый заимствованный фрагмент — это не «текст», а мысль другого человека.
Когда автор, не задумываясь, копирует абзац, он копирует чей-то интеллектуальный труд. И одновременно лишает себя возможности сформулировать идею своими словами — а значит, теряет навык мышления. Этим, кстати, прекрасно объясняется, почему диссертации с высоким уровнем плагиата часто оказываются пустыми по сути.
🧠 3. Работа с источниками — это способ развивать научное мышление.
Когда вы ищете нужные статьи, сравниваете данные, проверяете выводы — ваш мозг формирует собственную научную позицию. Когда вы копируете — ваша позиция так и остаётся не сформированной.
Сами исследования по science education показывают, что перефразирование и критическое пересказывание усиливают когнитивное понимание на порядок глубже, чем простое копирование.
А как же «проценты»?
Самое смешное, что высокий процент оригинальности сам по себе ничего не гарантирует. Можно написать текст из одних общих фраз, которые пройдут любые проверки, — но в научном смысле это будет пустота.
И наоборот: хороший обзор литературы никогда не покажет «100% оригинальности» — и это нормально.
Важно не процент, а корректность работы с источниками:
-прямые цитаты оформлены как цитаты;
-идеи переданы своими словами;
-на каждую заимствованную мысль есть ссылка;
-структура и выводы — авторские.
Именно это оценивает научное сообщество, а не зелёные и красные полоски в программе.
Зачем тогда вообще нужен сервис проверки?
Антиплагиат — не судья(представьте себе😂). Это скорее зеркало. Он показывает, где вы используете общеизвестные формулировки, где цитируете, а где увлеклись «заимствованием» чуть больше, чем этично.
Что действительно помогает писать честно
🔹 Понимать материал, а не пересказывать его побуквенно. Если вы не можете объяснить концепцию своими словами — вы её не поняли.
🔹 Вести заметки. Записывайте свои мысли по ходу чтения, а не копируйте текст. Потом именно заметки превратятся в авторский текст.
🔹 Отрицать соблазн «быстро сделать». Плагиат всегда появляется там, где торопятся. Наука не любит спешки.
🔹 Помнить, что честно написанная работа — это не только вклад в науку, но и вклад в свою профессиональную репутацию.
И финальная мысль 💭
Научный текст — это всегда диалог: между вами и теми, кто открыл тему до вас. Плагиат превращает диалог в подражание. Антиплагиат — всего лишь инструмент, который напоминает об этом.
Но настоящая честность — внутри.
И да…её не проверяют процентами.
почему это не «формальность», а фундамент научной культуры?
Каждый раз, когда кто-то спрашивает:
«Ну что ты там проверяешь в этом антиплагиате? Это же просто формальность»
, — я понимаю, насколько сильно мы недооцениваем саму суть научной работы.
Антиплагиат — не про проценты. И уж точно не про игру «как обмануть алгоритм».
Антиплагиат — про уважение. К читателю. К коллегам. К себе.
С чего я это взяла?
🔬 1. Наука держится на воспроизводимости, а не на копировании.
Если исследователь не может честно описать свои методы и результаты, мы не можем воспроизвести его работу. Плагиат в данном случае — всё равно что подделанные данные: он разрушает доверие. В международных журналах именно поэтому плагиат рассматривается почти как научная фальсификация (Committee on Publication Ethics — COPE).
📚 2. Каждый заимствованный фрагмент — это не «текст», а мысль другого человека.
Когда автор, не задумываясь, копирует абзац, он копирует чей-то интеллектуальный труд. И одновременно лишает себя возможности сформулировать идею своими словами — а значит, теряет навык мышления. Этим, кстати, прекрасно объясняется, почему диссертации с высоким уровнем плагиата часто оказываются пустыми по сути.
🧠 3. Работа с источниками — это способ развивать научное мышление.
Когда вы ищете нужные статьи, сравниваете данные, проверяете выводы — ваш мозг формирует собственную научную позицию. Когда вы копируете — ваша позиция так и остаётся не сформированной.
Сами исследования по science education показывают, что перефразирование и критическое пересказывание усиливают когнитивное понимание на порядок глубже, чем простое копирование.
А как же «проценты»?
Самое смешное, что высокий процент оригинальности сам по себе ничего не гарантирует. Можно написать текст из одних общих фраз, которые пройдут любые проверки, — но в научном смысле это будет пустота.
И наоборот: хороший обзор литературы никогда не покажет «100% оригинальности» — и это нормально.
Важно не процент, а корректность работы с источниками:
-прямые цитаты оформлены как цитаты;
-идеи переданы своими словами;
-на каждую заимствованную мысль есть ссылка;
-структура и выводы — авторские.
Именно это оценивает научное сообщество, а не зелёные и красные полоски в программе.
Зачем тогда вообще нужен сервис проверки?
Антиплагиат — не судья(представьте себе😂). Это скорее зеркало. Он показывает, где вы используете общеизвестные формулировки, где цитируете, а где увлеклись «заимствованием» чуть больше, чем этично.
Что действительно помогает писать честно
🔹 Понимать материал, а не пересказывать его побуквенно. Если вы не можете объяснить концепцию своими словами — вы её не поняли.
🔹 Вести заметки. Записывайте свои мысли по ходу чтения, а не копируйте текст. Потом именно заметки превратятся в авторский текст.
🔹 Отрицать соблазн «быстро сделать». Плагиат всегда появляется там, где торопятся. Наука не любит спешки.
🔹 Помнить, что честно написанная работа — это не только вклад в науку, но и вклад в свою профессиональную репутацию.
И финальная мысль 💭
Научный текст — это всегда диалог: между вами и теми, кто открыл тему до вас. Плагиат превращает диалог в подражание. Антиплагиат — всего лишь инструмент, который напоминает об этом.
Но настоящая честность — внутри.
И да…её не проверяют процентами.
❤5🔥4⚡2🦄1
Forwarded from medstatistic
Как сравнить количественный показатель, например, уровень гемоглобина в крови, в двух группах?
Зависит от того, как сформулирован наш исследовательский вопрос:
1️⃣ Если нас интересует, различаются ли средние значения уровня гемоглобина - используем параметрические t-критерий Стьюдента или Уэлча.
2️⃣ Если хотим сделать вывод о том, что в одной из групп более вероятны либо более высокие, либо более низкие значения, чем в другой, - используем непараметрический критерий Уилкоксона-Манна-Уитни (или просто Манна-Уитни, далее я буду называть его критерий WMW).
Как мы знаем, второй вариант используется во многих исследованиях. В этом случае нас не беспокоит информативность средних значений, отклонение распределения от нормального или наличие выбросов.
Однако, решительно применяя критерий WMW для разных показателей, авторы редко вспоминают о том, что он вообще-то имеет существенное ограничение: корректность оценки гарантируется только при равных дисперсиях сравниваемых групп! То есть вариабельность признака и форма распределения в группах должны быть одинаковыми. А поскольку такое на практике встречается нечасто, значит во многих случаях WMW-тест может давать неверные p-значения.
Насколько неверные? Например, в одной симуляции WMW-критерий тестировался в следующих ситуациях:
🔺 2 нормальных распределения с разными дисперсиями,
🔺 уни- и бимодальное распределения,
🔺 2 симметричных распределения с разными дисперсиями,
🔺 2 распределения с разными дисперсиями и разнонаправленной асимметрией.
В результате вместо фактической вероятности ошибки I рода α=0.05, были получены оценки от 0.028 до 0.122!
Что же делать? Как поступить, если при сравнении групп мы не уверены в равенстве дисперсий?
Вспомним критерий Уэлча - модифицированный t-критерий Стьюдента, который позволяет корректно сравнивать средние значения в группах с разными дисперсиями. Вот такую же модификацию критерия WMW выполнили и описали в 2000 году немецкие статистики Edgar Brunner и Ullrich Munzel. И получили метод, который в описанной выше симуляции при α=0.05 давал оценки частоты ошибок I рода от 0.046 до 0.057. Согласитесь, это значительно более точные оценки по сравнению с критерием WMW.
По данным другой симуляции, проведенной K.Noguchi с соавт. (2021), в случае сравнения групп с разными дисперсиями при заданной α=0.05 критерий Бруннера-Мюнцеля показал частоту ошибок I рода в диапазоне от 0.049 до 0.057. Диапазон для критерия WMW был значительно шире, оценки «размазались» от 0.02 до 0.085.
И ещё в одной симуляции C.P.Nowak с соавт. (2022) при сравнении 2 групп с нормальным распределением, но разными дисперсиями (σ1/σ2=5), при заданной α=0.05 оценки частоты ошибок I рода составили:
🔸 для критерия WMW от 0.004 до 0.174,
🔸 для критерия Бруннера-Мюнцеля от 0.035 до 0.052.
А если дисперсии одинаковые?
По данным K.Noguchi с соавт. критерий WMW оказался немного более точным, чем критерий Бруннера-Мюнцеля. Но и в этом случае последний показал оценки частоты ошибок I рода с погрешностью, не превышающей 0.01. По данным C.P.Nowak с соавт. оба теста дали вполне надежные оценки:
🔸 критерий WMW - от 0.043 до 0.053,
🔸 критерий Бруннера-Мюнцеля - от 0.048 до 0.053.
Подытожим.
Критерий Бруннера-Мюнцеля тестирует нулевую гипотезу: вероятности того, что случайно взятое значение из одной группы будет выше, чем случайно взятое значение из другой группы, для обеих групп равны. И позволяет достаточно точно оценить вероятность ошибочного отклонения этой нулевой гипотезы (т.е. получить корректные p-значения) в случаях как равных, так и разных дисперсий.
Зависит от того, как сформулирован наш исследовательский вопрос:
1️⃣ Если нас интересует, различаются ли средние значения уровня гемоглобина - используем параметрические t-критерий Стьюдента или Уэлча.
2️⃣ Если хотим сделать вывод о том, что в одной из групп более вероятны либо более высокие, либо более низкие значения, чем в другой, - используем непараметрический критерий Уилкоксона-Манна-Уитни (или просто Манна-Уитни, далее я буду называть его критерий WMW).
Как мы знаем, второй вариант используется во многих исследованиях. В этом случае нас не беспокоит информативность средних значений, отклонение распределения от нормального или наличие выбросов.
Однако, решительно применяя критерий WMW для разных показателей, авторы редко вспоминают о том, что он вообще-то имеет существенное ограничение: корректность оценки гарантируется только при равных дисперсиях сравниваемых групп! То есть вариабельность признака и форма распределения в группах должны быть одинаковыми. А поскольку такое на практике встречается нечасто, значит во многих случаях WMW-тест может давать неверные p-значения.
Насколько неверные? Например, в одной симуляции WMW-критерий тестировался в следующих ситуациях:
🔺 2 нормальных распределения с разными дисперсиями,
🔺 уни- и бимодальное распределения,
🔺 2 симметричных распределения с разными дисперсиями,
🔺 2 распределения с разными дисперсиями и разнонаправленной асимметрией.
В результате вместо фактической вероятности ошибки I рода α=0.05, были получены оценки от 0.028 до 0.122!
Что же делать? Как поступить, если при сравнении групп мы не уверены в равенстве дисперсий?
Вспомним критерий Уэлча - модифицированный t-критерий Стьюдента, который позволяет корректно сравнивать средние значения в группах с разными дисперсиями. Вот такую же модификацию критерия WMW выполнили и описали в 2000 году немецкие статистики Edgar Brunner и Ullrich Munzel. И получили метод, который в описанной выше симуляции при α=0.05 давал оценки частоты ошибок I рода от 0.046 до 0.057. Согласитесь, это значительно более точные оценки по сравнению с критерием WMW.
По данным другой симуляции, проведенной K.Noguchi с соавт. (2021), в случае сравнения групп с разными дисперсиями при заданной α=0.05 критерий Бруннера-Мюнцеля показал частоту ошибок I рода в диапазоне от 0.049 до 0.057. Диапазон для критерия WMW был значительно шире, оценки «размазались» от 0.02 до 0.085.
И ещё в одной симуляции C.P.Nowak с соавт. (2022) при сравнении 2 групп с нормальным распределением, но разными дисперсиями (σ1/σ2=5), при заданной α=0.05 оценки частоты ошибок I рода составили:
🔸 для критерия WMW от 0.004 до 0.174,
🔸 для критерия Бруннера-Мюнцеля от 0.035 до 0.052.
А если дисперсии одинаковые?
По данным K.Noguchi с соавт. критерий WMW оказался немного более точным, чем критерий Бруннера-Мюнцеля. Но и в этом случае последний показал оценки частоты ошибок I рода с погрешностью, не превышающей 0.01. По данным C.P.Nowak с соавт. оба теста дали вполне надежные оценки:
🔸 критерий WMW - от 0.043 до 0.053,
🔸 критерий Бруннера-Мюнцеля - от 0.048 до 0.053.
Подытожим.
Критерий Бруннера-Мюнцеля тестирует нулевую гипотезу: вероятности того, что случайно взятое значение из одной группы будет выше, чем случайно взятое значение из другой группы, для обеих групп равны. И позволяет достаточно точно оценить вероятность ошибочного отклонения этой нулевой гипотезы (т.е. получить корректные p-значения) в случаях как равных, так и разных дисперсий.
🔥3❤1