Science & Health Writing
3.19K subscribers
38 photos
3 videos
2 files
272 links
Канал Екатерины Кушнир о научной и медицинской журналистике. Рассказываю о том, что показалось интересным и полезным.

Для связи: @Ekaterina_Kuschnir Рекламы нет
Download Telegram
​​Подборка англоязычных сайтов с красивыми и полезными данными

Подборка ресурсов, чтобы искать информацию для статей или вдохновляться идеями. Также подойдут, чтобы смотреть, как можно визуализировать различные данные.

Наш мир в данных

Известный сайт, где собраны данные по экономике, медицине и другим направлениям. Например, там можно посмотреть, сколько людей в разных странах погибает от употребления наркотиков или где какой уровень неравенства. Все это упаковано в интерактивные диаграммы и графики. Сайт регулярно обновляется, он бесплатный. Цель проекта — сделать доступными данные, которые помогут решить мировые проблемы.

Визуальный капиталист

Огромная библиотека визуализаций, основанных на самых разных данных о медицине, экологии, экономике, демографии, технологиях и многом другом. Один из лучших, на мой взгляд, ресурсов, где можно посмотреть актуальные данные в красивом формате и с пояснениями, а также найти ссылки на их источники. Все бесплатно, цель проекта — тоже сделать данные понятнее и доступнее для широкого круга людей.

Работа с данными

Можно найти графики с данными о чем угодно — от количества книг Агаты Кристи и их распределения по языкам до использования возобновляемой энергии в Боливии. Не все важные данные свежие — например, данные об экономике стран могут быть за 2021 год, с которого там многое изменилось. Но бывают и совсем новые.

Глобальная база ВОЗ

Множество визуализаций от Всемирной организации здравоохранения — можно найти много интересного от данных по причинам смертности в мире до распространенности конкретных болезней по регионам.

Открытые данные Всемирного банка

Уровни доходов по странам, инфляция, рост цен на продукты питания и прочие экономические (и не только) показатели в удобных графиках.

Информация прекрасна

Это сайт Дэвида МакКэндлесса, где публикуют классные визуализации актуальных данных из разных источников. Можно посмотреть для вдохновения или поиска источников, откуда эти данные получены.

Система

Граф данных, в основном отражающий связи между заболеваниями и различными факторами. Например, можно посмотреть, какие факторы влияют на мигрень, а также к каким последствиям она приводит. Можно залипнуть на пару часов.

Экономист

Ежедневные графики от The Economist — источник вдохновения и полезной информации. Чтобы их просматривать, надо зарегистрироваться на сайте.

Открытые данные Google

Это агрегатор от Google, который собирает ссылки на общедоступные данные и прогнозы от ряда международных организаций и научных учреждений. Есть поиск по ключевым словам. Пригодится, если нужно найти что-то специфическое.

👉 Знаете другие интересные ресурсы — делитесь в комментариях)

❤️ Еще могу порыться в закладках и собрать такую подборку с русскоязычными ресурсами — ставьте сердечки, если интересно.

😍 На рисунке — население разных стран. Размер площади на диаграмме зависит от количества живущих там людей.

#sciencewriting
Работает или не работает

В комментариях к статьям про неэффективность каких-либо методик лечения или препаратов часто пишут: «А где доказательства, что это не работает? Если нет доказательств, то может работать».

Этот вопрос кажется логичным, но только на первый взгляд.

На самом деле, чтобы использовать препарат или методику в медицине, нужны доказательства того, что это работает. Их отсутствие — подтверждение отсутствия эффекта, данные «против». А вот если нет доказательств, что препарат или методика не работают — это не значит ничего.

Почему это так? Представим, что человек попал в больницу с инфарктом и ему нужна срочная операция на сосудах, у которой есть доказанный эффект. Но врач начинает поить его соком сельдерея, ведь нет доказательств того, что он бесполезен при инфарктах — вдруг поможет.

На таком примере хорошо видно, что эта логика приводит к смерти пациента. В менее критических ситуациях вроде лечения насморка гомеопатией или УВЧ при артрите все не так очевидно. Отсутствие доказательств эффективности тут мало кого смущает, а меньше всего тех, кто продает подобную терапию.

Даже некоторые медицинские журналисты делают эту ошибку — ищут доказательства неэффективности средства, а потом делают вывод, что, может быть, у него есть эффект, раз таких нет. Но «может быть» — плохое основание, чтобы советовать методику или препарат людям. Нет доказательств эффективности — значит, на этом этапе оно неэффективно.

🌈 Мне нравится фраза Карла Сагана: «Экстраординарные утверждения требуют экстраординарных доказательств». Чем удивительнее методика, тем более вескими должны быть подтверждения ее эффективности. Если смотреть с этой точки зрения, становится еще яснее — факт, что никто не доказал отсутствие эффекта, не выглядит убедительным доказательством и никак не подтверждает эффективность чего-либо.

#sciencewriting
Что стоит знать об относительном и абсолютном риске в медицине

Часто в заголовках медицинских новостей или статьях можно прочитать что-нибудь такое: «Чай повышает риск рака в десять раз» или «Любители морковки в два раза чаще болеют деменцией». Звучит пугающе, но в реальности все зачастую не так плохо.

Проблема в том, что авторы обычно берут из исследований показатели относительного риска. Однако, чтобы оценить, насколько какой-либо фактор в реальности влияет на заболеваемость, нужно знать абсолютный риск. Попробую объяснить разницу.

👉 Все примеры вымышлены, брала самые простые — иначе легко уйти в статистические дебри, где легко запутаться. Поверхностно разберу оба понятия, без подробностей о математических расчетах.

В чем разница между относительным и абсолютным риском

Предположим, вы прочитали, что картошка увеличивает риск диабета в два раза. Речь как раз идет об относительном риске — это сравнение вероятности события в двух группах людей. Например, на одних действует фактор риска, на других нет, либо одни получают лечение, другие нет. В нашем примере одна группа ела картошку, а вторая нет — потом ученые сравнили, где больше людей с диабетом.

В чем тут проблема? Мы знаем, что риск у любителей картошки в два раза больше, но не знаем, в два раза больше чего.

Проблему помогает решить абсолютный риск — это показатели риска для каждой группы людей. Допустим, в группе тех, кто не ел картошку, диабет развился у пяти людей из 50, а в группе тех, кто ел — у 10 из 50. Абсолютный риск для первой группы — 10%, для второй — 20%. Разница 10 процентных пунктов — не сказать, что много. А вот если мы сравним риски двух групп и посчитаем относительный риск, то увидим рост в два раза — звучит уже совсем иначе.

Еще пример — картошка на треть увеличивает риск деменции. Это может означать, например, что из 100 человек, которые не едят картошку, трое заболеют деменцией, а из 100 любителей картошки — четверо. Воздействие фактора добавляет одного человека с деменцией на сотню — тоже не так пугающе, как увеличение риска на треть.

То есть относительный риск — это соотношение абсолютных рисков в двух группах. Отсюда следует: даже если что-то увеличивает риск чего-то в 10 раз, в реальности это может ничего не значить. Чтобы понять, стоит принимать во внимание эту информацию или нет, надо найти в исследовании показатели абсолютного риска.

Если они не доступны, могут помочь данные о распространенности заболевания. Например, в статье пишут, что риск заболеть редкой болезнью Фунге-Пунге из-за кофе увеличивается вдвое. Но эта болезнь встречается у одного человека на 1000, то есть исходный риск заболеть 0,1%. Получается, кофе увеличит его всего лишь до 0,2%.

Еще абсолютный риск поможет лучше понять эффективность чего-либо

Например, из двух групп по сто человек одна не занималась спортом, а вторая занималась. В первой группе стенокардией заболело 2 человека — 2%, а во второй — один, или 1%. То есть люди, которые занимаются спортом, вполовину реже болеют стенокардией.

Но, допустим, что в первой группе заболело 20 человек — 20%, а во второй — 10, или 10%. Снова те, кто занимается спортом, вполовину реже болеют стенокардией. Однако в первом случае абсолютный риск снизился на 1, а во втором — на 10 процентных пунктов. Разница есть.

Другой пример — мы читаем, что препарат снижает риск смерти в два раза. Но разница между абсолютными рисками будет, допустим, всего 0,1 процентный пункт. Получается, что из 1000 человек, получивших лечение, умрет на одного меньше. Стоит ли использовать такую терапию, зависит от кучи факторов, в том числе тяжести побочных эффектов — их получит вся 1000, а пользу только один.

#sciencewriting
​​Про оценку результатов скрининговых исследований

В продолжение темы оценки рисков — встретила в одном курсе хороший пример, упростила и делюсь с вами.

Существует некий тест на рак. Пусть его чувствительность — доля действительно положительных результатов, когда рак есть и он выявлен, будет 90%.

Специфичность тоже высокая — пусть доля ложноположительных результатов, то есть людей с положительным тестом, но без рака, будет всего 10%.

Теперь представим человека с положительным тестом — какова вероятность, что у него рак? Нет, не 90% 😊

Посчитать легко, если знать распространенность болезни. Допустим, она 1% — из 1000 людей больны 10. Тогда:

1⃣ Из этих 10 у 9 анализ будет положительным — помним, что чувствительность теста 90%. У одного тест рак не увидит.

2⃣ Остаётся 990 здоровых людей. У 99 из них тест будет положительным — те самые 10% ложноположительных результатов. 

3⃣ Всего получается 108 людей с положительным тестом — 99 здоровых и 9 нет. 

4⃣ Теперь легко вычислить вероятность того, что наш человек попадет в категорию больных — считаем процент людей с раком от всех с положительным тестом. Выходит около 8%, а вероятность того, что болезни нет — целых 92%, несмотря на результат.

▶️ Нагляднее на картинке — нарисовала по-старинке на бумажке 😀

#sciencewriting
Как найти работу научным журналистом или редактором: часть 2

Здесь коротко расскажу о подводных камнях, которые могут ждать на этом пути.

😢 Буду честной — сейчас переход из IT в научную коммуникацию оправдан только в случае, если вам действительно это интересно.

В IT человеку с мозгами и навыками работы с текстом найти работу намного легче — и получать за эту работу он в среднем будет больше. Особенно, если уже есть нужный опыт. Мне иногда пишут работодатели — и 90% вакансий, которые они предлагают, связаны с IT, хотя я уже три года не работаю в этой нише.

💸 Я уходила из IT обратно в медицинскую редактуру в более благоприятных условиях.

Во-первых, мне было, куда идти — у меня был нужный опыт, и я сразу же сменила место главреда в IT-компании на комфортную по времени и деньгам позицию медицинского редактора в крупном бренд-медиа.

Во-вторых, это было еще до войны. Тогда казалось, что сфера будет развиваться дальше. Нельзя сказать, что сейчас она совсем умерла, но перспектив стало меньше. Площадок, фондов, организаций, медиа, где нужны настоящие научные коммуникаторы, редакторы и журналисты, и так было немного, а теперь их можно по пальцам пересчитать — при этом некоторые будут «нежелательными», «иноагентами» и так далее.

То есть найти работу стало тяжелее — это затронуло все ниши, но научную коммуникацию, на мой взгляд, сильнее всего. Здесь дорогие и трудоемкие тексты, по ряду причин их сложно дистрибутировать, просвещение в трудные времена всегда уходит на задний план — или перерождается в пропаганду.

👉 Кроме того, значительная часть вакансий на российском рынке на самом деле не имеет отношения к научной журналистике и коммуникации — так было и раньше, но сейчас, кажется, стало заметнее.

Название позиции будет одно, а в реальности придется или продвигать чьи-то услуги/товары/препараты, «просвещая» людей так, как выгодно клиенту, или выполнять функции пиарщика, штампуя бессмысленные пресс-релизы, или писать статьи в духе «Ученые раскрыли, в чем смертельная опасность микроволновок».

👾 Если знаете английский язык, можно посмотреть зарубежные площадки — их больше, условия там обычно интереснее. Я пока изучаю этот вопрос, но в целом выглядит так, что за границей работа научного коммуникатора или журналиста востребованнее, чем у нас.

У меня к вам встречный вопрос — какие курсы проходили, какие понравились, а какие нет? Если не сложно, напишите в комментариях, в личку или через форму. Очень интересно 😊

#sciencewriting
В чем разница между распространенностью заболевания и заболеваемостью

Минутка эпидемиологии. Разберем два понятия, которые часто путают, — со мной тоже такое случалось.

Распространенность показывает все случаи заболевания в популяции в определенный момент или за определенный период времени. Важно то, что этот показатель включает как новые случаи, так и те, что уже есть.

Например, есть 10 000 человек, из них болями в спине страдает 1000. Получается, что распространенность болей в спине — 1000/10000, то есть 10%, или 100 случаев на 1000 человек.

👉 Распространенность нужна, чтобы понять, сколько людей в мире/регионе/стране живут с заболеванием. Также можно брать разные группы людей и смотреть распространенность среди них — например, считать только пожилых людей, женщин, мужчин и так далее.

⚡️Этот показатель будет меняться, когда люди выздоравливают или умирают — ведь уменьшается общее число случаев заболевания во взятый момент или период.

Тут есть подвох. Высокая распространенность или ее рост не всегда означают проблему, а низкая распространенность или ее снижение — не всегда хорошо.

Так, высокая распространенность может быть связана с плохой тенденцией — больше людей заболевает, а может с хорошей — больше людей выживают и продолжают жить с болезнью. Например, сахарный диабет первого типа раньше лечить не умели, люди просто умирали — распространенность была ниже. А сейчас она выше — люди с диабетом в среднем живут почти столько же, сколько и остальные.

Низкая распространенность болезни тоже может быть связана как с хорошими тенденциями — меньше новых случаев, быстрое выздоровление, так и с плохими — больше смертей.

Заболеваемость показывает новые случаи заболевания в популяции за определенный период времени.

Например, есть 10 000 человек, за год у ста из них появляются боли в спине. Заболеваемость будет 100/10000, то есть 1%, или 10 человек из 1000.

👉 Заболеваемость в основном нужна для оценки скорости распространения заболевания среди людей. Ее тоже можно смотреть по населению мира/региона/страны в целом или по отдельным группам — женщинам, мужчинам, детям, пожилым людям и так далее.

⚡️Заболеваемость может оставаться постоянной, в то время как распространенность растет. Такое как раз случается, когда мы учимся лечить хронические болезни. У того же диабета первого типа число новых случаев может быть постоянным, потому что заболевание больше связано с генетическими факторами, а число людей с ним в популяции будет расти с ростом прогресса в лечении.

Может быть и так, что заболеваемость растет, а распространенность не меняется — когда люди быстро умирают или выздоравливают от болезни. Тогда число новых случаев растет, но общее число людей с болезнью в популяции остается примерно одинаковым.

#sciencewriting
Почему с данными систематических обзоров тоже могут быть проблемы

Систематические обзоры находятся на вершине пирамиды доказательной медицины, потому что объединяют результаты многих исследований и позволяют оценить их в комплексе. Но и к ним нужно относиться критически.

Кокрейновское сообщество выделяет 5 факторов, снижающих качество доказательств обзоров исследований.

⓵ В обзоре оценивали исследования низкого качества, то есть с погрешностями в дизайне. Если объединить результаты исследований, которые не дают достоверных данных, то и обзор будет недостоверным.

⓶ В обзор включены исследования, которые только косвенно касаются изучаемого вопроса. Например, сравнивают два препарата, но нет исследований, оценивающих их взаимодействие, есть только эксперименты, где сравнивают каждое лекарство с плацебо. В таком случае сравнить два средства можно только косвенно.

⓷ В обзор включены исследования с противоречивыми результатами — это называют гетерогенностью, и для этих противоречий нет объяснения. Например, часть исследований показывает заметный эффект от препарата, а часть — не показывает эффекта или он незначительный. Это может быть нормой, если различия связаны, например, с разным эффектом в разных группах людей. Но если авторы не могут правдоподобно объяснить расхождение данных, то качество обзора под вопросом.

⓸ В обзор включены исследования с маленькой выборкой — и даже после их объединения участников все равно мало, чтобы точно оценить результаты.

⓹ Есть признаки предвзятости обзора — то есть в него включены только исследования, которые подтверждают выводы. Самый очевидный пример — в обзор исследований эффективности добавки включили лишь несколько небольших положительных исследований, профинансированных производителем. Такое же бывает, если, например, ученые публиковали только исследования с положительным результатом, а те, что ничего не показали, не публиковали.

㊉ Даже если обзор качественный, это еще не значит, что на нем можно основывать какие-то рекомендации.

Например, есть кокрейновский обзор влияния зверобоя на течение депрессии. Он показал, что трава так же эффективна, как антидепрессанты. Значит ли это, что зверобоем можно лечить депрессию? Нет, как минимум потому, что дозировку активных веществ в добавках вне исследования вычислить сложно, а еще трава негативно влияет на действие многих лекарств.

#sciencewriting
​​Что такое черри-пикинг и почему важно его замечать

Черри-пикингом часто называют выборочное представление фактов. Дословно переводится как «сбор вишенок» — сборщик ягод выбирает или самые привлекательные ягоды, или те, что ему доступны.

Такое встречается не только в журналистике, а практически везде. Например, когда руководитель отдела показывает гендиректору только ту информацию, что представляет его отдел в выгодном свете, — это тоже черри-пикинг.

👉 Неосознанный черри-пикинг связан с когнитивными искажениями, такими как эвристика доступности — то, что легче найти или вспомнить, ложится в основу суждения о чем-либо, и предвзятость подтверждения — склонность людей лучше замечать факты, подтверждающие их точку зрения. А сознательный становится инструментом разных неблаговидных манипуляций с информацией.

👉 Черри-пикинг отличается от обычной лжи тем, что основан на реальных фактах — просто не на всех, а на тщательно подобранных. Из-за этого его бывает сложно выявить. На стратегии черри-пикинга базируются многие лженаучные дисциплины — берем единичные исследования, факты и события, получаем мощную базу для обоснования почти чего угодно: от гомеопатии до астрологии. Однажды мне прислали статью про «доказательную» остеопатию — внешне она не отличалась от качественных научно-популярных статей, вот только многие факты автор обходил стороной.

👉 Черри-пикинг может сказаться на результатах систематических обзоров исследований — если авторы отбирают только нужные данные, это, по сути, становится фальсификацией результата. Из-за этого научное сообщество вынуждено было разработать строгие правила подготовки таких обзоров. Однако сами эксперименты тоже можно интерпретировать по-разному, если брать только нужные данные. Для этого есть другой интересный термин — «метла Оккама»: исследователи как бы заметают лишние данные под ковер, чтобы они не мешали интерпретировать реальность нужным образом. Манипуляции с отдельными исследованиями отследить сложнее, что создает массу проблем.

⚡️Бороться с предвзятостью и взвешенно оценивать данные сложнее, чем насобирать фактов для подтверждения выбранной точки зрения — именно поэтому черри-пикинг так часто встречается в научно-популярных и других статьях. Но если задаться целью и тщательнее работать с информацией, то выборочного представления фактов можно избежать.

❤️ Автор комикса: Gordon Rugg. У него есть еще забавные на эту тему.

#sciencewriting
​​Виды медицинских исследований

Думаю, стоит разобрать этот базовый, но важный вопрос. Поговорим об исследованиях с участием людей, не касаясь тех, что проводят в пробирке или на животных.

👉 Во-первых, бывают наблюдательные исследования — когда ученые изучают ситуацию, не вмешиваясь в ход событий, и клинические эксперименты — когда то, что происходит, спланировано учеными. Наблюдательные исследования не показывают причинно-следственные взаимосвязи, только корреляции, поэтому их выводы желательно проверять в экспериментах.

Наблюдательные исследования

Они могут быть описательными — когда описывают закономерности, чтобы сформулировать гипотезу, и аналитическими — когда изучают корреляции между факторами, пытаясь подтвердить или опровергнуть гипотезу. Также исследования бывают ретроспективными — когда изучаемые исходы уже произошли, информацию собирают задним числом, и проспективными — когда некие события только ожидаются в будущем.

1⃣ Клинические случаи или серии клинических случаев — например, врач зафиксировал новые симптомы у одного либо нескольких пациентов и описал их. По сути, это подробное описание историй болезни с лечением и исходами, а также выявлением закономерностей, если речь идет о группе людей.

2⃣ Поперечное, или одномоментное исследование — берут группу людей и изучают их в конкретный момент времени. Например, проводят опрос среди мужчин определенного возраста, собирая информацию о проблемах с сердцем и рационе.

3⃣ Экологическое исследование — когда проблему изучают на уровне популяции или групп внутри популяции. Например, заболеваемость раком легких в разных городах либо среди мужчин и женщин. Обычно основаны на информации из государственных или других баз данных.

4⃣ Исследование «случай — контроль» — берут две схожие группы людей: одну с каким-то признаком, а другую без него, и сравнивают их. Например, мужчин старше 50 лет с гипертонической болезнью и без нее — так можно заподозрить, что с первыми не так и почему они заболели.

5⃣ Когортные исследования — какое-то время изучают группу людей со схожими характеристиками. Такие исследования относят к лонгитюдным — то есть, в отличие от поперечных, информацию собирают не один раз, а несколько.

Зачастую когортные исследования длятся долго. Например, ученые 20 лет изучают группу мужчин с 30—34 лет, фиксируя инфаркты, а также особенности их жизни: рацион, активность и так далее. Или 25 лет наблюдают за курящими людьми, чтобы увидеть, что с ними происходит.

Клинические эксперименты

В этом случае ученые берут группы людей и воздействуют на них нужным образом. Например, одна группа спортсменов получает перед тренировками специальный напиток, вторая — обычную воду, а потом ученые оценивают выносливость и силу.

Качественные клинические исследования должны быть:

⚡️рандомизированными — люди случайно распределены между группами;
⚡️плацебо-контролируемыми — одна из групп должна получать «пустышку»: воду, как в примере выше, или таблетку из крахмала, когда проверяют новые лекарства. Это нужно, чтобы исключить эффект плацебо. Иногда вместо «пустышки» используют старый препарат, например, если людей неэтично оставлять без лечения;
⚡️двойными слепыми — ни врачи, ни участники не знают, кто в какой группе.

Обычно исследования лекарств проводят в несколько фаз. В первую фазу на небольшом числе участников смотрят, безопасен ли препарат и какие дозы лучше использовать, во вторую фазу берут группу больше и начинают оценивать эффективность, в третью фазу изучают эффективность на большой выборке — обычно от 1000 человек. Четвертая фаза — когда данные собирают после начала продаж препарата.

Если расположить исследования по силе доказательств от большей к меньшей, то первое место займут клинические эксперименты. Далее идут когортные исследования и исследования «случай — контроль», а потом уже все остальные.

#sciencewriting
​​В чем разница между скринингом и ранней диагностикой

Небольшая заметка о понятиях, которые часто путают.

1⃣ Скрининг — обследование целевой группы людей без жалоб. Позволяет выявить болезнь на стадиях, когда симптомов нет, а в случае рака еще и предраковые состояния. Например, маммография у всех женщин старше 40—50 лет — это скрининг.

Эффективные скрининги есть не для всех болезней. Например, в случае с раком для большинства людей работают программы по диагностике рака шейки матки, молочной железы и кишечника.

Хороший скрининг дает такой результат: человек, у которого выявили болезнь на обследовании, живет дольше того, у которого ее нашли позже. Речь именно о продолжительности жизни, а не о годах с диагнозом. Например, если у одного человека нашли рак в 30 лет на скрининге, а у его сверстника в 40 лет из-за жалоб, но оба умерли в 50 — скрининг неэффективен. А вот если первый человек пережил второго на 10 лет, так как раньше начал лечиться, скрининг годный.

2⃣ Ранняя диагностика — обследование людей с жалобами. Помогает выявить болезнь на начальных стадиях, но когда уже есть те или иные проявления. Например, маммография из-за того, что женщина пришла к врачу с болезненностью в одной груди, или из-за того, что врач осмотрел пациентку и заметил нечто подозрительное.

Ранняя диагностика лучше работает, если врачи и пациенты знают, из-за каких признаков стоит назначить дополнительное обследование, а из-за каких нет.

👉 картинка с сайта ВОЗ

#sciencewriting
​​Почему нельзя верить статьям вроде «Ученые доказали, что долгая работа ведет к гипертонии»

Потому что их авторы путают корреляцию и причинно-следственную связь:

👉 Корреляция — переменные статистически связаны: когда меняется одна, меняется и другая.
👉 Причинно-следственная связь — переменные влияют друг на друга: изменение одной вызывает изменение другой.

Корреляция не всегда означает причинно-следственную связь, но причинно-следственная связь всегда подразумевает корреляцию.

🙄 Между долгим рабочим днем и гипертонией будет как раз корреляция — о чем и предупреждают авторы исследования, по которому писали новости. Чтобы понять, есть ли причинно-следственная связь и как переменные вообще взаимосвязаны, нужны дополнительные исследования.

🙌 Корреляция не равна причинно-следственной связи по разным причинам. Например, на переменные может влиять третий фактор или они вовсе связаны случайно. Скорее всего, что-то подобное происходит и в нашем примере, хотя многие смешивающие факторы вроде образа жизни исследователи исключили. Например, люди могут перерабатывать, потому что склонны к тревоге из-за результатов, и та же тревожность влияет на сердечно-сосудистую систему.

Во многих исследованиях также непонятно, какая из переменных первична. Например, если у людей с депрессией снижен уровень витамина D — неизвестно, это недостаток соединения привел к депрессии или из-за депрессии развился его дефицит: человек может не выходить на улицу и плохо питаться.

Только корреляцию показывают многие научные исследования. Причинно-следственную связь можно проверить в контролируемых экспериментах — в таких исследованиях прямо указывают на нее и пишут: causal relationship или causation. Еще иногда о причинно-следственной связи можно говорить, если накоплено много разных данных, позволяющих предполагать, что одно вызывает другое. Про виды исследований в медицине у меня есть отдельный пост.

То есть вместо «длинный рабочий день приводит к гипертонии» правильнее написать: «люди, которые много работают, чаще страдают гипертонией» или «долгая работа связана с гипертонией».

#sciencewriting
Please open Telegram to view this post
VIEW IN TELEGRAM
Как оценивают данные наблюдательных исследований

Наверное, все знают, что причинно-следственную связь можно установить только с помощью контролируемого эксперимента, а наблюдательное исследование показывает только корреляции. Что тогда делать в ситуациях, когда не получится экспериментировать с людьми? Например, нельзя заставить одну группу 10 лет пить пиво, а вторую нет: можно только изучать реальных пьющих и непьющих людей.

В таких случаях можно использовать наблюдательные исследования, чтобы с высокой точностью заподозрить причинно-следственную связь, но при условии, что данных достаточно и они соответствуют определенным критериям. Такие критерии в 1965 году сформулировал британский эпидемиолог и статистик Остин Хилл — в модифицированном виде они актуальны и сейчас: ученые применяют более серьезные методы, но для всех остальных они сгодятся.

9 критериев причинно-следственной связи

1⃣ Чем сильнее корреляция, тем выше вероятность причинно-следственной связи. Например, рак легких у курящих встречается в 15—30 раз чаще, чем у некурящих — такие цифры позволяют предполагать, что курение вызывает рак.

2⃣ Корреляция подтверждается в разных исследованиях, в том числе в тех, что проводили разные ученые в разных местах и в разное время, то есть результат воспроизводим. Например, то, что переработанное мясо повышает риск рака и сердечно-сосудистых заболеваний подтверждалось во многих исследованиях, в том числе крупных: их несколько десятков.

3⃣ Взаимосвязь специфична — эффект сложно объяснить другой причиной. Опять хорошим примером будет курение: многие курящие умирают от рака легких. А вот если бы они с одинаковой частотой умирали от разных болезней или на всех действовали другие значимые факторы риска, причинно-следственную связь установить было бы сложнее.

4⃣ Причина идет раньше следствия — люди сначала начинают пить, а потом у них развивается цирроз печени. Главное, не пропустить обратную причинность. Например, люди с ожирением чаще пьют газировку без сахара — вряд ли это значит, что напиток вызывает ожирение, скорее, наоборот: люди с лишним весом пытаются потреблять меньше сладкого.

5⃣ Чем сильнее воздействие, тем выше вероятность события — это называют зависимостью «доза-эффект»: чем больше человек курит, тем больше рискует заболеть раком легких. Если такая зависимость выражена, можно заподозрить причинно-следственную связь. Хотя иногда для события достаточно присутствия фактора, а сила его воздействия не важна.

6⃣ Существует правдоподобное объяснение корреляции — некий биологический механизм, в который укладывается происходящее. Например, понятно, почему сигареты вызывают рак легких, а алкоголь цирроз печени.

7⃣ Результат исследования согласуется с существующими теориями и прошлыми данными, в том числе лабораторными, а не противоречит им и не является неоднозначным. И снова хороший пример — курение: большинство исследований показывают связь с раком легких, а не, допустим, 50% с болезнью, а 50% с ее профилактикой. Чем больше согласующихся данных, тем лучше.

8⃣ Прекращение или изменение воздействия приводит к изменению результата. Например, у бросивших курить риск рака легких снижается.

9⃣ Аналогичные воздействия приводят к похожим результатам. Допустим, если курение табака вызывает рак легких, то вдыхание других продуктов горения может давать похожий эффект — и исследования это показывают, например, для угля и древесины. Если такие данные есть, они будут еще одним аргументом в пользу причинно-следственной связи.

Чем больше критериев набирается, тем лучше. Если собраны все или почти все, то хорошо, чтобы у ученых получилось подтвердить результаты еще и экспериментально, например, в рандомизированном контролируемом исследовании, но даже если нет — скорее всего, причинно-следственная связь существует.

#sciencewriting
​​Парадокс Симпсона

Интересное явление в статистике, когда тенденция заметна в нескольких группах связанных данных, если рассматривать их по отдельности, но исчезает или меняется, если рассматривать все данные в целом.

Нашла несколько медицинских примеров этого парадокса

1⃣ Исследование двух методов лечения камней в почках. Если оценивать эффективность по всем случаям, окажется, что эффективнее новый метод. А если разбить людей на две группы — с мелкими и крупными камнями, станет ясно, что эффективнее старый: с ним процент успешных случаев выше в каждой группе. Так получилось, потому что менее эффективное лечение чаще применяли к мелким камням, которые легче лечить. В итоге для нового метода набралось много пациентов с неплохими результатами — легкость случая компенсировала выбор худшей терапии.

2⃣ Смертность от коронавирусной инфекции в 2020 году в Италии оказалась выше, чем в Китае, если учитывать всех заболевших и умерших людей. Если же разделить людей по возрастным группам, выяснится, что в Италии смертность ниже — просто в этой стране чаще болели пожилые люди, у которых вероятность смерти выше сама по себе.

3⃣ Похожая штука с исследованиями вреда курения — например, процент женщин, которые курили и выжили, будет больше, чем тех, что курили и умерли, пока их не разделят на возрастные группы. Вот тогда станет видно, что внутри каждой такой группы вероятность умереть выше у курящих.

4⃣ Еще один похожий пример: эффективность вакцины от тяжелого течения COVID-19 в Израиле без разделения на возрастные группы всего 67,5%. Но если разбить вакцинированных по возрасту, то в каждой группе эффективность будет более 80%. На картинке видно, как так вышло.

5⃣ В исследовании зафиксировали, что в период с 1970 по 1975 годы в психиатрических клиниках стало меньше пациентов мужского пола. Однако если разбить мужчин на две группы — до 65 лет и старше, то выяснится, что в каждой их стало больше. Здесь эффект связан с тем, что в больницах было больше молодых мужчин и пожилых женщин, кроме того, в этот период в целом было меньше госпитализаций.

▶️ Парадокс Симпсона обычно возникает, когда при оценке данных не учитывают некий важный фактор, влияющий на результат, например, размер камней или возраст, как в примерах. Это не значит, что все данные надо разбивать на максимально большое число групп. С точки зрения статистики, чем больше таких разбивок, тем выше вероятность ложно-положительного результата. Например, можно разделить людей еще по росту или цвету глаз — и получить совсем другие, но неверные результаты. Кроме того, в группах с небольшим числом участников выше роль случайности. Из-за этого ученые при разбивке данных должны учитывать важность влияющего фактора и еще кучу всяких деталей.

#sciencewriting
Увидела очередную рекламу добавок, которые в исследованиях повышают уровень антиоксидантов и уменьшают маркеры окислительного стресса и воспаления, поэтому их якобы нужно пить для профилактики рака, старения и много чего еще. На самом деле это так не работает: если в организме что-то изменилось, в том числе в анализах крови, это еще не значит, что здоровье стало лучше.

Посмотрим на примере клинических исследований препаратов. Там исследователи стараются измерять реальную пользу — то есть клинические результаты, например, стали люди, принимающие препарат, жить дольше или нет. Если клинический результат оценить невозможно, ученые берут связанный с ним параметр — его называют суррогатной конечной точкой.

Допустим, изучают препарат от болезни Альцгеймера. Можно отслеживать, как у участников меняются когнитивные способности. Если те, кто пьет лекарство, в среднем теряют память медленнее, значит, оно работает. Это будет клинический результат. А можно оценивать, сколько в мозге участников плохого белка бета-амилоида, который сейчас считают виновником симптомов деменции. Если у тех, кто пьет препарат, белковых бляшек стало меньше или они медленнее растут, возможно, лекарство работает. Это будет суррогатная конечная точка. Оценить ее проще, потому что болезнь Альцгеймера развивается медленно, иногда влияние лекарства на когнитивные способности можно увидеть только через несколько лет.

Проблема с суррогатными результатами в том, что они не всегда хорошо предсказывают клинический результат. Есть те, что довольно точно отражают последствия для здоровья. Например, уровень артериального давления позволяет спрогнозировать инсульт, а уровень в крови гликированного гемоглобина — осложнения диабета. Такие суррогатные точки можно назвать идеальными — не нужно тратить годы на ожидание результата, есть простой способ проверить эффект.

Есть неоднозначные суррогатные точки — такие, как влияние на бета-амилоид из нашего примера. Уменьшение бляшек в мозге — не гарантия того, что человек сохранит память, хотя кажется, что должен. В 2021 году так одобрили препарат от болезни Альцгеймера адуканумаб — в этом году его снимают с производства, в итоге так и не ясно, насколько он в реальности помогал людям. Неоднозначные точки контроля ученым приходится использовать в тех случаях, когда ждать клинического результата неэтично или болезнь нечем лечить, нужна любая возможность ее затормозить.

А еще есть и вовсе бесполезные суррогатные точки, изменение которых ни на что не влияет. Например, пытаться снижать антитела при аутоиммунном тиреоидите — бесполезная затея, это не улучшает течение болезни.

То же самое с увеличением уровня антиоксидантов: оно не означает, что риск рака снизится — для его оценки нужны другие исследования. Мало того, он может даже увеличиться — например, курящие люди, которые пьют добавки с антиоксидантом бета-каротином, чаще болеют раком легких. В общем, прежде чем что-то принимать, стоит подумать, а правда ли обещанное действие будет полезно — даже если оно реально.

#sciencewriting
​​Подборка инструментов искусственного интеллекта для поиска научных статей и исследований

1⃣ Semantic Scholar — ищет в базе, где более 200 млн публикаций. Можно выбрать период, за который нужны статьи, сортировать их по цитируемости, релевантности, дате выхода и другим параметрам. Если открыть статью, можно прочитать саммари, а также задать вопросы к тексту, например, попросить ИИ сформулировать выводы или указать, какие у исследования ограничения. Эта возможность пока в бета-версии, работает не всегда корректно, но на базовые вопросы инструмент ответит. Нужные публикации также можно сохранять в папки, еще есть возможность подписаться на обновления по разным темам. Инструмент бесплатный.

2⃣ Elicit — ищет исследования и делает краткий обзор результатов по самым релевантным публикациям, в бесплатной версии берет для этого 4 статьи. Также выдает весь список найденных статей с саммари по каждой. В этом списке можно добавить столбцы: ограничения, главные выводы, методология, оценка результатов и другие, а потом посмотреть нужные данные по каждой публикации. Еще можно фильтровать статьи: например, выбирать год публикации вплоть до 2024, искать только РКИ, мета-анализы или другие виды исследований, указывать ключевые слова, которые должны быть в аннотации, а также сортировать публикации по дате выхода и цитируемости. Еще инструмент умеет извлекать данные из PDF-файлов — после загрузки можно получить краткое содержание исследования и обзор разных разделов. В бесплатной версии дают 5000 кредитов — этого хватает примерно на 50 запросов, потом надо покупать платную.

3⃣ Consensus — ищет исследования из базы данных Semantic Scholar, набор данных обновляется ежемесячно. На мой взгляд, это самый удобный из этих трех инструментов. Показывает исследования по теме с классными метками, например: РКИ, очень строгий журнал, большое испытание на людях, мета-анализ, часто цитируется — это помогает сразу видеть качественные. Еще выдает краткий обзор информации из 10 самых релевантных статей. Если на запрос можно ответить «Да» или «Нет», показывает предположительный ответ на него — на скрине видно, как это выглядит. Кроме того, можно выбрать режим второго пилота, тогда инструмент покажет более развернутое обобщение 10 статей с ключевыми выводами. Фильтровать исследования можно по году публикации, цитированию, типу исследований, размеру выборки, типу доступа, особенностям журналов. Еще можно посмотреть снимок исследования — краткую информацию об участниках, их количестве, полученных результатах, методологии. У инструмента есть бесплатная версия с некоторыми ограничениями, например, на количество обращений к второму пилоту и просмотров снимков исследований, но число поисковых запросов не ограничено, поэтому для базового использования ее хватает.

И бонусная ссылка — расширение для браузера Google Chrome SciSpace. На странице с любым исследованием или обзором можно открыть чат расширения и попросить его сделать краткое саммари или собрать нужную информацию, еще можно выделить выбранный абзац — тогда инструмент может коротко рассказать, о чем он, добавить пояснения, например, для непонятных терминов, или дать ссылки на связанные научные статьи.

#sciencewriting
Расплывчатые формулировки в научно-популярных статьях вводят читателей в заблуждение

Например, субъективные формулировки вроде «ученые верят», «ученые считают» или «ученые думают» делают факты похожими на мнения. Если использовать их там, где есть убедительные доказательства, это искажает восприятие читателей.

Исследование, в котором участвовало почти 3000 человек, показало: люди, читавшие заголовки с субъективными глаголами, например «верить», думали, что рассматриваемая проблема — предмет дискуссии, даже если это был объективный факт. Глаголы «знают», «доказали» и тому подобные в таких случаях были точнее — с ними читатели воспринимали сообщение как нечто подтвержденное.

На мой взгляд, это работает и в обратную сторону. Например, некоторые известные редакторы советуют избегать модальных глаголов, в частности глагола «мочь». Из-за этого в статьях о здоровье встречаются категоричные, но не всегда верные утверждения, например: «препарат вызывает понос», «массаж облегчит боль в пояснице» и тому подобное. На самом деле у кого-то будет такой эффект, а у кого-то нет. Кажется, что мелочь, но иногда это важно — например, можно напугать человека побочными эффектами лекарства так, что он не станет его принимать.

#sciencewriting
Чем больше людей участвует в исследовании, тем достовернее результат: почему это не всегда так

Сначала вспомним основные термины. Например, мы хотим определить средний рост взрослых жителей России. Все эти люди будут генеральной совокупностью. В идеальной ситуации мы измеряем рост каждого — и точно определяем средний. Однако это долго и дорого, поэтому можно взять не всех людей, а какую-то часть, допустим, 10% от взрослого населения. Это и будет выборкой — она должна быть достаточно большой по размеру и отражать характеристики генеральной совокупности. То есть просто измерить рост ваших соседей по дому нельзя — их слишком мало, кроме того, они могут отличаться от жителей других регионов страны.

Так что с размером выборки

Действительно, чем больше выборка, тем точнее оценка, а чем она меньше, тем больше погрешность. Поэтому кажется логичным — на крупные исследования обращаем внимание, на мелкие нет.

Но это не всегда так. Например, чем больше размер выборки, тем чаще выявляются статистически значимые эффекты, у которых нет практического значения, вроде небольших отклонений в анализах или колебаний веса. А значимые в реальности эффекты зачастую можно обнаружить и на небольшой выборке, допустим, случаи полного выздоровления от тяжелой болезни. В общем, если эффект сильный, то и небольшое исследование может быть важным, если в остальном оно качественное.

Еще размер выборки зависит от темы. Например, если изучают распространенность заболеваний сердца среди населения страны, в нем могут быть сотни тысяч человек. А если исследуют редкие генетические болезни, большого количества пациентов просто не будет — например, во всем мире может быть всего несколько десятков людей с нужной болезнью.

Кроме размера, важна репрезентативность

Это то, насколько выборка отражает оцениваемую генеральную совокупность. Лучше небольшая репрезентативная выборка, чем большая и нерепрезентативная. Например, если для изучения поведения берут студентов университета, где работают ученые, пусть и в большом количестве, как часто бывает в психологических исследованиях — такую выборку называют удобной или доступной, то результат нельзя распространить на людей в целом.

Пусть лучше в исследовании будет меньше участников, но из разных групп населения в том же соотношении, что и в генеральной совокупности — при этом выбранных случайно, а не потому, что исследователю было так удобно.

#sciencewriting
Три способа сделать научно-популярную статью интереснее

Эмма Блумфилд, доцент кафедры коммуникационных исследований в Университете Невады и автор книги «Наука против историй», заметила, что дезинформация зачастую выглядит убедительно из-за того, что ее авторы используют истории, например, яркий личный опыт. Однако в научно-популярных статьях сторителлинг встречается не так часто. В статье в журнале The Conversation она дает три базовых совета о том, как сделать их интереснее.

👧 Найти персонажей

Это могут быть ученые, которые совершают открытия, люди, переживающие последствия чего-либо, например, климатических изменений, герои, которые делятся личным опытом.

👣 Объяснять науку как процесс

Науку часто преподносят как нечто объективное и беспристрастное. Однако на самом деле путь к любым научным открытиям связан с выбором, ошибками, предвзятостями — это все может лечь в основу истории. Такая история позволит объяснить людям, как делается наука, и почему ученые приходят к тем или иным выводам — а это убедительнее, чем давать читателям только набор фактов.

👀 Добавить то, что волнует людей

Например, проблемы окружающей среды на самом деле мало кого интересуют. Однако людей волнуют инфляция, преступность, экономика и многие другие вещи. Можно рассматривать актуальные темы в свете тех, о которых хочется рассказать, например, показать, как экологический кризис влияет на экономику и конкретные рабочие места.

#sciencewriting