Выше квартилей
2.56K subscribers
98 photos
1 video
1 file
269 links
HSE: Home of Scientometrics and Expertise

Обучение и консультирование по практическим вопросам research evaluation и управлении наукой.

Все вопросы и предложения направляйте @vyshekbot или на почту Наукометрического центра ВШЭ: scientometrics@hse.ru
Download Telegram
Спящие красавицы и статьи бустеры: (не-)удачный эксперимент

В одном из прошлых постов мы писали о «спящих красавицах» — статьях, которые долгое время после публикации оставались без внимания, а потом по различным причинам начинали активно цитироваться. Эта тема заинтересовала нас, и мы решили частично повторить опыт подобного исследования.

Предлагаем читателям поделиться своими идеями, как можно было бы улучшить предлагаемый подход, в комментариях.

#цитируемость #аналитика #визуализация
​​День космонавтики

Вчера с космодрома «Восточный» успешно стартовала ракета «Ангара-А5», а сегодня в России и многих странах СНГ празднуется День космонавтики: 63 года назад корабль «Восток» с Юрием Гагариным на борту успешно вышел на орбиту и за 108 минут облетел Землю.

С тех пор наука о космосе сильно продвинулась вперед. Немалая часть работ засекречена, но некоторые статьи все-таки публикуются: так, к профилю «Роскосмоса», согласно данным OpenAlex, в настоящее время приписана 581 публикация, включая статьи, книги, главы книг и даже одну диссертацию. При этом часть из них написана в соавторстве с другими космическими агентствами и институтами (на графике иностранные организации выделены голубым цветом; размером показано совокупное число публикаций).

Команда канала «Выше квартилей» поздравляет всех исследователей и сотрудников космической отрасли с Днем космонавтики и от всей души желает подниматься в научной работе не только выше квартилей, но и выше звезд!

#денькосмонавтики #openalex #роскосмос
​​SJR 2023: ежегодное обновление

На прошлой неделе вышло обновление показателя SJR для источников, входящих в Scopus. Всего в обновленный список вошло 29165 изданий, у 28740 изданий есть квартиль (в 2022 году квартили были присвоены 27606 изданиям, а в 2021 — 26701). Таким образом, тренд на сокращение списка, сохранявшийся с 2017 года, развернулся в сторону увеличения количества изданий, что не могло не повлиять на квартильные окна (особенно в гуманитарных и социально-экономических дисциплинах, где различия в значениях SJR порой минимальны).

Мы по традиции решили рассмотреть изменение позиций российских журналов. Всего таких изданий в нынешнем списке 566, квартиль присвоен 559 (в прошлом году журналов было 565, из них квартиль был у 504). Большинство журналов Q1 по максимальному квартилю сохранили свои позиции (48 из 69). Кроме того, в Q1 вошло 2 издания, не индексировавшихся ранее.

Для наглядности мы обновили sankey-диаграмму (https://hsenc.shinyapps.io/sjr-update/), которая отражает «миграцию» журналов. Теперь в ней три столбца — 2021, 2022 и 2023 гг. соответственно. В таблице по той же ссылке можно проверить квартили для отдельных журналов за те же годы.

#scopus #sjr #квартили #россия #журналы #инфографика
Первые индексы и ранние метрики

Мы продолжаем нашу рубрику, посвященную истории развития наукометрии. В новом выпуске мы расскажем об истории библиометрических индексов до появления современных научных метрик. 
Новый пост можно найти по следующей ссылке: https://telegra.ph/Pervye-indeksy-i-rannie-metriki-04-17

#историянаукометрии
Академический угон: обзор публикаций о hijacked журналах

В апрельском выпуске Journal of the Association for Information Science and Technology вышла статья Анны Абалкиной, посвященная проблемам, связанным с похищенными журналами (hijacked journals) в Scopus. Ранее мы затрагивали эту тему в контексте paper mills.

По мнению исследовательницы, уязвимость библиометрических баз данных Web of Science и Scopus, индексация в которых является показателями качества, приводит к распространению мошеннического контента. Издатели-мошенники активно используют в своих целях ошибки в системах безопасности баз данных и упущения в издательской политике редакции.

Ярким примером эксплуатации такого рода ошибок являются “похищенные” журналы. Издатели-мошенники создают копии сайтов научных журналов, которые тяжело отличить от официальных страниц. Как правило, они копируют название журнала и его ISSN, заполняют страницу настоящими данными о членах редакционной коллегии или придумывают свою, включая в неё имена настоящих и/или выдуманных ученых. Злоумышленники создают архив, чтобы убедить потенциальных авторов в том, что журнал публикуется постоянно. Архив наполняется статьями из оригинального журнала или некачественным контентом.

Как правило, жертвами “похищений” становятся определенные типы журналов:

• выпускаемые исключительно в печатном виде (где сайт-клон может служить единственным сайтом для журнала);
• узкоспециализированные или университетские журналы (кражи журналов крупных и авторитетных издателей легче отследить).

Казалось бы, потенциальные авторы могут проверить профиль журнала в библиометрических базах данных, поскольку в них размещают всю необходимую информацию, включая ссылку на домашнюю страницу, однако у мошенников есть несколько стратегий, позволяющих ввести потенциальных авторов в заблуждение:

- похищение журналов без ссылок или с неактивными ссылками на домашнюю страницу в профиле в индексируемых базах данных;

- регистрация домена журнала с истекшим сроком действия (способ позволяет мошенникам не менять ссылку на домашнюю страницу в библиографических базах данных);

- взлом официального сайта журнала;

- подделка ссылки на домашнюю страницу журнала в его профиле в библиографических базах данных (indexjacking);

- «вторая жизнь» для журналов, которые прекратили выпускаться.

Методы, с помощью которых похищенные журналы действительно проникают в библиографические базы данных и, тем более, индексируют неутвержденный контент в этих базах данных, малоизучены. По данным Elsevier в Scopus это происходит, когда «журналы обновляют URL-адреса или другие каналы контента», по мнению других исследователей, основной причиной является несвоевременная оплата домена.

К сожалению, даже крупнейшие базы данных не ведут учет случаев удаления контента, опубликованного и проиндексированного во взломанных журналах. Известно, что Scopus хранит и обновляет список журналов и изданий, индексация которых прекращена (с указанием причин), однако информация о прекращении индексации взломанных журналов отдельно не фиксируется.

Отсутствие такого списка является проблемой для академического сообщества, так как материалы из похищенных журналов потенциально не рецензируется должным образом. Исследования показывают, что на такие статьи могут ссылаться авторитетные издания. Более того, отсутствие прозрачности в учете похищенных журналов позволяет обманывать ученых даже после удаления неутвержденного контента.

Несмотря на удаление материалов из Scopus и истечения срока действия доменов похищенных журналов, статьи всё ещё можно найти в различных базах данных (ORCID, eLibrary), а также в различных онлайн-репозиториях (ResearchGate, Academia.edu) или на сайтах университетов. Кроме того, неутвержденный контент по-прежнему присутствует в Scopus за все годы с 2013 по 2023 (по состоянию на сентябрь 2023 года). В таких случаях прозрачная документация могла бы помочь преодолеть асимметрию информации и сохранить научную честность.

#обзор #hijackedjournals #scopus
​​Феномен анонимных публикаций в современности

В декабре прошлого года в Scientometrics была опубликована статья, посвященная феномену анонимного авторства. Годом ранее там же вышла публикация, согласно которой за последние сто лет было опубликовано более 1,4 миллиона статей, у которых были указаны один или несколько анонимных авторов.

В течение долгого времени публикация исследования могла требовать анонимности по соображениям безопасности, а также по культурным или религиозным причинам, но в итоге большинство таких работ не получают широкого распространения, если за ними не стоит сильный автор или авторский коллектив. В оригинальной статье рассматривается Harvard Law Review как журнал, который публикует относительно много анонимных работ, являясь при этом значимым и респектабельным в своей сфере.

Хотя авторы предыдущих работ анализируют датасеты, полученные из Web of Science, мы решили проанализировать относительно небольшую выборку работ, индексируемых в Scopus с 2021 по 2024 год, у которых поле «Автор» не содержит записей (102 414 публикаций), либо хотя бы один из авторов указан как “Anon/Anonymous” (111 публикаций). К сожалению, нет надежного способа проверить все записи с незаполненным полем авторства, но выборочная проверка показала, что в этих публикациях авторство действительно не указано, либо указано название коллектива авторов (особенно это характерно для наук о здравоохранении — это могут быть сотрудники лаборатории или компании).

Для первой части датасета (с отсутствующим указанием авторства) мы отфильтровали все записи с нулевым количеством цитирований, поскольку чаще всего это титульные страницы и страницы с оглавлением, которым присваивается отдельный DOI. Таких оказалось большинство — в итоговом датасете осталось всего 5343 записи. Больше всего публикаций без указания авторства в области наук о здравоохранении, в частности фундаментальной медицины.

С работами, где в качестве авторов указан аноним, ситуация более неопределенная. По-видимому, эта традиция постепенно изживает себя: из 111 записей за рассматриваемые годы 85 относится к материалам не-серийных конференций, для которых Scopus не определяет предметную область. Остальные работы посвящены социальным наукам (30), здравоохранению (10) и естествознанию (1).

В целом, анонимные публикации продолжают занимать определенную нишу в различных научных сферах, несмотря на то, что указание “Anonymous” в качестве автора явно уступило место отсутствию упоминания об авторе. Между тем работа, где в качестве автора указано название авторского коллектива, формально не может считаться анонимной публикацией, однако Scopus не распознает такое название, что накладывает некоторые ограничения на анализ данных об авторах.

#аналитика #scopus #анонимность
Представляем свежий дайджест научных событий за последний месяц.

Редакторская политика

- В Nature вышла заметка об исследовании, подтверждающем эффективность внедрения стандартизированных рецензий на статьи. По результатам внедрения таких рецензий в 23 журналах издательства Elsevier редактор журнала Research Integrity and Peer Review делает вывод, что рецензенты, руководствуясь одними и теми же вопросами, чаще дают схожие первоначальные рекомендации относительно необходимости отклонения или принятия поступивших рукописей.

Научная политика

- На Scholarly Kitchen вышел обзор обновленной политики Фонда Билла и Мелинды Гейтс (Bill & Melinda Gates Foundation) в отношении открытого доступа в 2025 году. Вопреки ожиданиям, сложившимся на основании заявлений команды Фонда, политику Фонда затронут лишь некоторые незначительные изменения. Так, например, теперь в открытом доступе обязательно должны быть размещены препринт финансируемого исследования и текст статьи. В 2021 году это требование распространялось только на статьи.

Научная этика

- Лесли Макинтош, основательница Ripeta (компания, занимающаяся вопросами повышения качества и честности исследований), вице-президент Digital Science, предложила ввести новую область наукометрии — судебную наукометрию (Forensic Scientometrics (FoSci), что позволит выделить в отдельную категорию деятельность энтузиастов-расследователей, выступающих за соблюдение принципов академической честности.

- Сервис Turnitin отмечает первую годовщину создания ИИ-детектора письменных работ. За это время сервис обработал 200 миллионов работ, из которых 22 миллиона имеют не менее 20% содержания, написанного при помощи ИИ, а 6 миллионов — не менее 80%. С момента запуска сервис был признан инновационным решением в области образовательных технологий, поддерживающим академическую честность.

Базы данных

- Обновились показатели SJR для источников, входящих в Scopus. По традиции мы рассмотрели изменение позиций российских журналов в одном из постов.

- Вчера OpenAlex провел вебинар по работе с данными базы с привлечением Python. Код с использованием стандартных библиотек, а также видео можно найти по ссылке.

#дайджест #базыданных #новости #OpenAlex #искуственныйинтеллект
​​Сравнение методов расчета высокоцитируемых публикаций

Подсчет статей, которые выделяются за счет аномально высокого количества полученных цитирований, являются объектом изучения экспертов, занимающимися количественным анализом науки.

Очевидная необъективность и отсутствие точных методов, которые используются для составления «рейтингов» высокоцитируемых публикаций, заставляют исследователей искать новые подходы для их усовершенствования. Наиболее распространенным из различных критериев такой оценки является определение высокоцитируемых статей как статей, находящихся в первом процентиле (верхний 1%) числа цитирований, с чем связано два неразрешенных вопроса:

· как составить список наиболее цитируемых статей, ранжированных в порядке убывания (или возрастания), в зависимости от метода?

· как преобразовать это порядковое распределение в процентили, пригодные для сравнения публикаций в разных предметных областях?

Используемые для решения этих вопросов методы на данный момент имеют определенные недостатки. Но всё же общее мнение исследователей сводится к тому, что независимо от того, как рассчитывается рейтинг, необходимо учитывать практику публикаций и цитирования каждой научной специальности, чтобы уменьшить влияние асимметрии науки. Недавнее введение в Web of Science процентиля предметных категорий для журналов, перечисленных в Journal Citation Reports (JCR), является подтверждением такого консенсуса.

В 2022 году был предложен новый подход — метод Вагнер, который, в отличие от распространенных, не учитывает год выхода и тип публикации, а также направленность журнала. В апрельской статье Quantative Science Studies авторы проанализировали эффективность предложенного подхода путем его сопоставления с более привычным (в основе которого лежит метод InCites, схожий с методами Лейденского рейтинга и SCImago Journal Rank).

Исследование показало, что при использовании метода Вагнер статистическое предпочтение отдается публикациям из Китая, Японии, Южной Кореи и Сингапура, а также Саудовской Аравии и Швейцарии. В отличие от InCites, он отводит меньшую долю другим странам и регионам, таким как Австралия, Канада, Европейский союз, Великобритания, Бразилия и Южная Африка.

Анализ по дисциплинам (см. график) объясняет этот перекос: страны, в которых более развиты инженерные науки, более широко представлены в новом подходе. С другой стороны, страны со значительной долей публикаций фундаментальных исследований, исследований в области социальных и гуманитарных наук представлены недостаточно по сравнению с данными, полученными при помощи метода InCites.

Согласно результатам исследования, выбор метода расчета перцентилей влияет на долю представленности стран и дисциплин: по мнению авторов, метод Вагнер существенно искажает результаты, а «верность традиционным методам», применяемым для составления рейтинга высокоцитируемых статей, абсолютно оправдана.

#обзор #HCP #webofscience #рейтинги
​​От гипотез к обзорам? О роли редакционных статей

В апрельском выпуске Learned Publishing вышла статья Марии Плахотник, доцента и старшего научного сотрудника Вышки в Санкт-Петербурге, в которой она затрагивает вопрос роли и места редакционных статей в политике журнала.

Используя дедуктивный контент-анализ и метод таксономии Блума (инструмент для идентификации и формулирования целей, намерений к учебной деятельности и целеполагания в целом), автор определила типы целей каждой редакционной статьи. Выборка ограничилась статьями, опубликованными в 2022 году в ведущих журналах в областях organizational behaviour и human resource management. Из 103 журналов лишь в 52 (50,5%) встречались редакционные статьи, остальные — 51 (49,5%) — игнорировали эту практику.

· Анализ выборки показал, что 4 из 5 редакционных статей были направлены на повышение уровня знаний или понимания определенной темы, и очень немногие — на обсуждение и создание новых гипотез.

· Подавляющее большинство редакционных статей (66%) были направлены на улучшение понимания читателями того или иного вопроса, эти статьи встречались как в обычных, так и в специальных выпусках и в основном содержали обзор исследований конкретного номера.

· Часть статей (13 %) были написаны с целью описания фактов (юбилей журнала, смена издателя и т.д.); 17 редакционных статей (14%) были направлены на оценку состояния исследований в журнале; в 3 статьях (2%) анализировались конкретные темы, например, их авторы описывали проблемы, с которыми сталкиваются исследователи.

· В 6 статьях (5%) были созданы новые концепции или гипотезы. Примечательно, что эти редакционные статьи были написаны приглашенными редакторами.

Эти тенденции поднимают вопрос о роли редактора в развитии журнала и позволяют предположить, что большинство редакторов предпочитают реактивную редакторскую роль (принятие решений о публикации статей на основе их высокого потенциала цитирования), а значит, отказываются от другой своей роли — проактивной (продвижение журнала за счет написания редакционных статей, выступлений на конференциях и информирования о целях и политике журнала).

Многие редакторы журналов из выборки пишут редакционные статьи, чтобы расширить знания читателей и улучшить их понимание какого-либо вопроса; попытки предложить новый взгляд на проблематику или выдвинуть новую гипотезу незначительны. Ни одна из рассмотренных редакционных статей не представляла собой дальнейшее исследование прогнозов или предложений, сделанных в редакционных статьях, написанных ранее.

С одной стороны эта тенденция поддерживает аргумент о том, что редакционные статьи как жанр должны подтверждать то, что известно, а не погружаться в неизвестное, с другой — указывает на определенную непоследовательность: в конкуренции за авторов, читателей и рейтинги редакторы находятся в поиске исследований на передовые и заставляющие задуматься темы, в то время как сами зачастую предпочитают ограничиваться традиционными эссе, объясняющими, уточняющими и описывающими, но не созидающими.

#обзор #редакционныестатьи #editorials #editor
​​Аналитика: Независимые исследователи

Помимо анонимных авторов, о которых мы писали в одном из предыдущих постов, существует еще одна нестандартная группа авторов — независимые исследователи. Это ученые, не имеющие или не указавшие в своей работе аффилиации с какой-либо организацией. Такое положение имеет свои плюсы: исследователь может полностью сосредоточиться на своем исследовании, не отвлекаясь на преподавание или административные обязанности. Но одновременно с этим он лишается и преимуществ, которые дает большинство организаций: подписки на библиометрические базы, доступа к лабораторному оборудованию и т.д.

Иногда такие исследователи работают по грантам, полученным в том числе от крупных организаций. Согласно недавнему исследованию Лунда, Шамси и др., четверть независимых авторов (по данным Web of Science) получали (и указывали) финансирование в своей работе. Большинство грантодателей — государственные органы, имеющие отношение к здравоохранению, и фармацевтические компании. Это вполне соответствует предметной разбивке работ: почти 20% посвящены челюстно-лицевой хирургии и стоматологии, а всего в топ-10 по областям присутствует только одна сфера, не относящаяся к медицине — инженерное дело.

Почти половина (45%) независимых исследователей работают в США, далее следуют Германия и Великобритания. Характерно, что азиатских стран несмотря на общую высокую продуктивность в топ-10 нет.

Мы решили провести похожий анализ, основываясь на данных OpenAlex. Изначальный запрос был сформулирован как «работы, для которых raw_affiliation_strings (текстовое указание аффилиации) содержит слово «independent», начиная с 2018 года». Таких оказалось больше 70 тысяч. Затем мы отфильтровали авторов, у которых все-таки указана аффилиация, и оставили только тех, кто указал в соответствующем поле «independent researcher | scientist | consultant | scholar | advisor». В группировке по работам осталось более 22550 публикаций, написанных 16886 учеными — для сравнения, в исследовании по Web of Science число публикаций 3357. Большую часть публикаций составляют статьи (17577).

География исследователей такова: большинство (более 4 тысяч), как и в вышеупомянутой работе, ведут свою деятельность в США, затем идут Великобритания (3380) и Индия (1960). Наиболее продуктивный автор — Генри Гарретт, весьма активно прибегающий к публикации препринтов, у которого сразу 238 работ в качестве независимого исследователя.

Что касается предметных областей — картина довольно сильно отличается от результатов исследования Лунда, Шамси и др. Большая часть публикаций, согласно OpenAlex, относится к сфере социальных наук (почти 12 тысяч), а вот на долю наук о здоровье приходится всего около 6700 работ (на приведенном ниже графике отражено подробное распределение публикаций по областям).

#аналитика #независимыеисследователи #OpenAlex
​​Связь финансирования университета и его места в Шанхайском рейтинге

Сегодня мы бы хотели затронуть тему влияния финансирования университета на его место в Шанхайском рейтинге, а также рассказать об инструменте прогнозирования позиции вуза в данном рейтинге.

Тяжело переоценить влияние объема ресурсов организации на позицию в университетском рейтинге, но все же предполагается, что это влияние не играет ключевую роль и что рейтинговая позиция зависит от огромного количества параметров. Однако результаты недавнего исследования показывают существенную и устойчивую связь объема финансирования и позиции в рейтинге.

В статье авторы проанализировали 318 международных университетов и выявили связь между их финансовыми ресурсами и местом в Шанхайском рейтинге (ARWU) от 2019 года. Анализ показал, что университеты с высокими и низкими баллами ARWU зачастую демонстрируют одинаково высокую эффективность в использовании имеющихся ресурсов, из чего следует, что разница между ними состоит не в искусстве управления ресурсами, а в их количестве.

Следует отметить, что отсутствие открытой информации о финансовых данных университетов и размытые стандарты бухгалтерского учета значительно затрудняют сбор информации и влияют на выборку данных.

Существуют национальные базы — американская IPEDS, европейская ETER, британская HESA и другие, но в настоящее время финансовые данные большинства из них ограничиваются только расходами и доходами, в то время как данные об активах, обязательствах и денежных потоках не предоставляются. В этом отношении авторы делают несколько замечаний о возможных шагах по унификации данных: в частности, было бы желательно обогатить существующие базы данных вузов дополнительными финансовыми данными (или создать новые).

Сами по себе рейтинги, хотя и привлекают внимание общественности из-за удобства ранжирования организаций по показателям и тех выводов, которые можно сделать на этом основании, в то же время активно критикуются. Так, авторы ссылаются на других исследователей, которые выделяют три основные тенденции критических замечаний в адрес рейтингов:

а) содержание показателей: отсутствие учета междисциплинарности, предвзятость к крупным университетам, реальное социальное влияние университета, эффективность распоряжения
ресурсами, альтернативные миссии университетов)

б) методология: статистическая ненадежность и опора на метрики, потенциально содержащие ошибки;

в) влияние: идеологическая нагруженность, легитимация неравенства, «самоисполняющееся пророчество».

Выявление взаимосвязи параметров финансирования и итогового балла университета в рейтинге позволяет спрогнозировать его позицию в будущем. Для этого авторы разделили ARWU на несколько лиг и разработали прогностическую модель (HEI league prediction tool) для оценки балла ARWU и соответствующей лиги, опираясь на данные о ресурсах университета.

Прогностическая модель доступна онлайн по следующей ссылке: https://simonedileo.shinyapps.io/ARWU_League_Estimator/

Модель использует несколько параметров: стоимость материальных неденежных активов, общая сумма операционных расходов, количество студентов, академического и административного персонала (в эквиваленте полной занятости).

Библиометрические показатели в расчет не включены — впрочем, их связь с финансированием университета гораздо более опосредована, чем соотношение студентов и преподавателей. Одним из возможных вариантов доработки модели мог бы стать учет бюджета НИОКР, поскольку он обладает более выраженной корреляцией с публикационной активностью.

#обзор #рейтинги #ARWU
Как создаются успешные научные журналы

Успешные научные журналы в современном мире, с одной стороны, существуют и развиваются по традиционным законам издательского дела, включая маркетинговые приемы и рекламу, а с другой — часто остаются внутривузовской историей и из-за узкой направленности не выходят на широкую аудиторию.

В Институте образования НИУ ВШЭ обсудили, как сделать научный журнал международным, успешным и долгосрочным проектом. Рассмотрим пример Review of Education (ROE) — международного научного журнала Восточно-Китайского педагогического университета:

🔹Публикации и аудитория. Большинство университетских научных изданий становятся продуктом внутреннего потребления: в них публикуются только профессора и аспиранты материнского вуза, и в результате их читают только их же студенты.

Review of Education начал привлекать экспертов со всего мира, и издание стало популярно далеко за пределами Китая. Так, каждый десятый читатель ROE живет в США, каждый двадцатый — в Великобритании.

🔸 Первые два года — золотое время. Когда возникает новый журнал, сразу же появляются тысячи авторов с актуальными статьями и исследованиями, желающих опубликоваться в перспективном издании. Уже на третий год жизни любое издание начинает терять авторов, а вслед за ними и читателей.

В ROE нашли свой вариант решения этой проблемы — открытый формат (любой желающий может послать свое исследование в издание, и его опубликуют на сайте) и тематические печатные выпуски.

🔹Нетворкинг и популяризация. В современной науке нетворкинг и популяризация исследований играют не меньшую роль, чем само исследование. Принцип «реклама — двигатель прогресса» работает и в среде вузовских изданий.

Значительная часть бюджета ROE тратится на SMM-отдел для ведения аккаунтов в соцсетях. Издание регулярно организует вебинары и мастер-классы для молодых исследователей, принимает участие в научных выставках и конференциях — все ради того, чтобы ученые не писали "в стол".
​​Retracted Articles: от репутационных проблем к аналитике по областям 

Совсем недавно Wiley, авторитетное издание с двухсотлетней историей, анонсировало закрытие 19 научных журналов. Wiley сообщило, что за последние 2 года из журналов издательства были отозваны 11 300 недобросовестных исследований, 8 000 из которых относились к издательству Hindawi (в 2021 году Hindawi было выкуплено Wiley, однако после такой массовой ретракции компания Wiley объявила, что прекратит использовать бренд Hindawi, а 200 оставшихся журналов включит в свой основной портфель).

По данным Nature в перечень лидирующих стран по количеству отозванных статей за последние два десятилетия входят Саудовская Аравия, Пакистан, Россия и Китай. Согласно приведенной в заметке статистике, в Саудовской Аравии на 10 тысяч публикаций приходится в среднем 30,6 ретракций, далее следует Пакистан (28,1) и Россия (24,9), на долю Китая приходится 23,5 ретракций. При этом медианное значение колеблется около 5 на 10 000.

В связи с постоянно растущим интересом к этой теме (заметки в Scholary Kitchen, Nature, Times, проверки отозванных статей со стороны департамента науки министерства образования Китая) мы решили проанализировать количество отозванных статей в разрезе по областям на базе OpenAlex, которая как раз в марте провела довольно масштабную работу по обновлению базы отозванных статей и исправлению ложноположительных результатов.

Самый актуальный вопрос для исследования, пожалуй, заключается в том, является ли большое количество отозванных статей в рамках издательства или журнала признаком его низкого качества? В целом, можно предположить, что если статьи массово отзываются, особенно в рамках издательства или отдельного журнала, то это означает, что постпечатная проверка (или внимание публики к вышедшим материалам) по качеству превосходит проверку перед публикацией, то есть проблемы связаны преимущественно с рецензированием.

С точки зрения областей наук тенденции вполне предсказуемые — большинство отозванных работ относятся к естественным наукам, в частности, биохимии, молекулярной биологии и медицине, почти столько же в сумме составляют публикации по инженерному делу и компьютерным наукам.

В этих областях есть много нюансов. Так, например, помимо заведомого нарушения правил подготовки публикации и недобросовестного отношения к подбору материала, многие кейсы, описанные в статьях по медицине, посвящены ранним исследованиям COVID-19. После получения более широкой выборки результаты стали заведомо неточными, и часть авторов сами отозвали свои публикации. Похожие случаи встречаются и в области компьютерных наук: например, если метод или систему, предложенные в статье, не получилось масштабировать, такие статьи также отзываются по просьбе автора. В случае несогласия авторов с решением редколлегии это, как правило, отмечается в сопутствующей заметке.

Мы сделали treemap-диаграмму по статьям, помеченным как отозванные в базе данных OpenAlex. Всего таких 46 тысяч, из них мы выбрали около 19 тысяч — те, что были написаны с 2019 по 2023 гг. С интерактивной версией диаграммы вы можете ознакомиться по ссылке.

#аналитика #openalex #ретракция
Редакторские статьи в свете библиометрии

В одном из предыдущих постов мы затрагивали тему роли редакторских статей.

Сегодня мы решили расширить её и сделать специальный выпуск нашей рубрики, посвященной истории наукометрии. Представляем материал на тему нынешнего состояния области, которую можно обобщающе назвать bibliomertics of editorials. 

Новый пост можно прочитать по ссылке: https://telegra.ph/Istoriya-naukometrii-Redaktorskie-stati-05-29

#историянаукометрии
Forwarded from Эффект Матфея (katerina)
Вы удивитесь, но в исследованиях Высшей школе экономики за последние 20 лет выросла доля экономики, МФТИ стал гораздо более инженерным, а саудиты теперь чаще цитируют исследования Бауманки, чем американцы!

Узнать всё это за несколько кликов теперь можно благодаря новой платформе Rankless от венгерских исследователей.
И если что-то и поможет новому общедоступному индексу OpenAlex привлечь больше внимания уже в 2024 году, чем дорогие и просто недоступные в России Web of Science и Scopus, то это именно новый сервис с впечатляющей визуализацией. С мотивирующим лозунгом «We need to understand more and rank less» команда из CCL (Центр коллективных знаний Будапештского университета имени Корвина) нацелилась побороться с глобальными рейтингами вузов. Разобраться с содержанием образовательных программ с Rankless вряд ли получится, но актуальных выгрузок из обширной базы OpenAlex уже достаточно, чтобы сравнивать научные специализации вузов. И всё это доступно в динамике, в том числе в ежегодной с 2019 года.

Охват вузов пока ещё не полон, но выявить интересные тенденции уже можно. Например, петербургские ИТМО и СПбГУ планомерно отходят от физической специализации в пользу химии материалов, а томские ТГУ и ТПУ наоборот уменьшили долю последней в пользу инженерных исследований. При этом все четыре вуза диверсифицировали профиль исследований в целом и наращивают сотрудничество не только с Китаем, но и, например, с Ираном. Современная междисциплинарность так высока, что далёкий от моря МГТУ Баумана и ещё более континентальный Университет Назарбаева (Астана) усилили вклад в морские технологии.

Самое интересное, что можно проследить, как изменился набор стран, который цитирует исследования университета. Вот, например, в 2019 году на долю США приходилось 18% ссылок от числа всех цитирований Вышки, ссылки из Китая составляли ту же долю в 18%. В 2022 году пока проиндексировано только 675 статей Высшей школы экономики: доля ссылок из США составила уже 14%, а Китая – 24%. Однако, стоит предостеречь от окончательных выводов, так как за последние годы индексация статей в OpenAlex происходит с большой задержкой.
Дайджест: май 2024

Представляем свежий дайджест научных событий за последний месяц.

Научные события

- 30-31 мая проходит первая виртуальная конференция OpenAlex. Пользователи и разработчики делились опытом и планами на будущее. Презентации и запись можно будет найти на сайте и на YouTube-канале OurResearch (а мы скоро выпустим обзор по итогам).
- Объявлена тема Peer Review Week 2024: «Инновации и технологии в рецензировании». Об этом на Scholarly Kitchen написали организаторы события. К участию приглашаются все, кто так или иначе связан с процессом рецензирования. Судя по прошлому году, стоит ожидать вебинаров, хакатонов, онлайн-конференций, открытых дискуссий и не только.

Редакторская политика

- В Scientometrics вышла статья, анализирующая, влияет ли текст грантовой заявки на итог ее рассмотрения. Оказалось, что оценка заявки очень мало зависит от самого текста — если эксперты видят только короткую аннотацию, то их вердикт почти не меняется.
- Как мы (и некоторые наши коллеги) упоминали ранее, в этом месяце издательство Wiley анонсировало закрытие 19 журналов, что стало прямым следствием массового отзыва статей. Список журналов, которые прекратят выпускаться, можно найти на сайте Hindawi.
- IOP Publishing провели опрос насчет эффективности внедрения инструментов ИИ в процесс рецензирования. В опросе приняли более 3000 ученых. Согласно результатам, лишь 29% из опрошенных ученых считают, что внедрение ИИ окажет положительный эффект, 35% респондентов выказали негативное отношение к ИИ, а 36% убеждены, что внедрение ИИ не окажет никакого эффекта.

Базы данных

- В Quantitative Science Studies опубликовано достаточно подробное сравнение метаданных в восьми открытых библиометрических базах: Crossref, Dimensions, Google Scholar, Microsoft Academic, OpenAlex, Scilit, Semantic Scholar и The Lens. Авторы исследования показывают, что сторонние базы данных (Dimensions, OpenAlex, Scilit и The Lens) имеют более высокое количество и качество метаданных, чем академические поисковые системы (Google Scholar, Microsoft Academic и Semantic Scholar).
- Clarivate анонсировала новый продукт — Web of Science Research Intelligence. Судя по рекламному описанию, это инструмент для создания дэшбордов с интегрированным ИИ и рекомендательной системой.

Наука в России

- Число высокоцитируемых (по данным Clarivate) ученых из РФ сократилось до восьми, сообщает Институт статистических исследований и экономики знаний (ИСИЭЗ) НИУ ВШЭ.
- Коллеги из НЖБД подвели предварительный итог по количеству публикаций российских авторов в Scopus — их чуть больше 88 тысяч. С 2021 года их количество незначительно снижалось, при том, что количество российских журналов в Scopus за последние пять лет заметно увеличилось.
- 6 мая был утвержден перечень поручений Президента по итогам мероприятий к 300-летию РАН, а 8 мая вышел указ, в котором заявлено создание отечественной системы мониторинга публикаций в области социальных и гуманитарных наук, причем эта система должна быть независимой от зарубежных рейтингов показателей (п. 11, пп. “в”).
- Определены победители десятого конкурса программы мегагрантов: восемь проектов под руководством ведущих ученых и два проекта молодых перспективных ученых. Со списком можно ознакомиться на сайте Минобрнауки РФ.
- Электронная библиотека eLibrary добавила сервис поиска близких по тематике публикаций с применением нейросети SciRus-tiny, разработанной в Институте ИИ МГУ. Система автоматически подбирает документы, максимально близкие по тематической направленности. Поиск реализован на странице с описанием публикации (пункт «Найти близкие по тематике публикации» в панели «Инструменты»).

#дайджест #новости #редакторскаяполитика #базыданных #наукавроссии #OpenAlex #искуственныйинтеллект
Конференция OpenAlex: по горячим следам

Как мы уже упоминали, 30 и 31 мая состоялась первая онлайн-конференция OpenAlex. Мы внимательно наблюдали за ней (и даже задали пару вопросов), и хотим поделиться кратким описанием докладов и новостей, которые показались нам наиболее интересными.

День 1:

1️⃣ В первой секции сделали доклады Джессика Эдвардс (библиотекарь Columbia University) и Сильвия Орнер (библиотекарь University of Scranton). Их презентации были посвящены специфике применения OpenAlex в работе университетских библиотек. Энди Херцог (библиотекарь University of Minnesota) рассказал о том, как интегрировал OA в систему управления научной информацией в библиотеке своего университета.
2️⃣ Во второй секции был представлен доклад Дэниела Санфельда (доцент Universidade de Brasilia), посвященный Laguna — бразильскому data lake, который может строить сети цитирований с использованием облачных вычислений. Александр Гейтс (научный сотрудник University of Virginia School of Data Science) на основе данных OA проанализировал, как фрагментирование глобальной науки ограничивает распространение идей: например, как скоро концепция после упоминания в одной стране появляется в другой.
3️⃣ В третьей секции Саджад Эбрахими (Toronto Metropolitan University) презентовал работу своей компании — это Reviewer.ly, приложение для поиска рецензентов. Чем-то похоже на нынешнюю версию интерфейса OA, но с большим упором на визуализацию, в особенности сетей коллабораций и облака слов. Еще один инструмент для визуализации, Complemetrix, представил Альберт Диас-Гилера (Universidad de Barcelona). Двое докладчиков рассказывали про scite.ai: Шон Райф, сооснователь компании, предложил подход к построению рейтингов на основе OA, а Рикардо Хартли (Universidad Central de Chile) рассказал о непосредственном применении scite.

Завершили первый день конференции Кайл Демес и Джейсон Портеной из компании OurResearch, которая разработала OpenAlex. Они подвели итоги и поделились последними результатами и планами компании. В частности, буквально в последние недели были реализованы: стемминг поисковых запросов (теперь поисковой движок должен воспринимать различные словоформы) и интеграция с Retraction Watch. В ближайшее время планируется добавить: метаданные финансирующих учреждений, выбор полей для экспорта, новые опции поиска и новые фильтры, настраиваемые группы и взвешенный citation impact для различных предметных областей. Чуть позже будут реализованы визуализация и аналитические инструменты внутри OpenAlex, дополнительные поля, помимо количества, в группировке (group-by), больше источников, больше метрик, больше грантов и больше встреч пользователей.

День 2:

1️⃣ Во второй день было больше докладов от институтов и аналитических заметок. В первой секции доклады представили Самуэль Мок (библиотекарь University of Twente) и Сара Критцлер (библиотекарь Duisburg-Essen University) — они рассказали о своих проектах, посвященных унификации метаданных и созданию кастомизированных библиометрических отчетов. Присутствовал также Эрик Жанжирар, представитель Министерства высшего образования и науки Франции, команда которого работает над Works Magnet — инструментом для курирования метаданных.
2️⃣ Во второй секции была презентация Нееса Яна ван Эка (CWTS Leiden University) о визуализации данных OA при помощи VOSViewer. Ян Хан (The University of Arizona) рассказал об использовании OA для измерении вклада научных сотрудников университета.
3️⃣ В третьей секции интересный доклад представила Малгожата Лагиш (University of South Wales) — о больших научных коллективах и их вкладе в большую науку. И, наконец, Паскаль Поплен и Амели Черч (Sorbonne Université) рассказали об опыте полного перехода со Scopus на OpenAlex, который не так давно предприняла Сорбонна.

Программу конференции можно найти на сайте OpenAlex. Там же чуть позже будут размещены презентации докладчиков и запись эфира.

#openalex #конференция
​​Королевство пустых зеркал

В рамках нашей рубрики #историянаукометрии мы уже не раз показывали, что наука о науке не сразу обрела собственный предмет.

В дискуссии, получившей название «Как перестать беспокоиться и полюбить реферируемые журналы», А. Космарский отметил, что наукометрия как способ изучения работы научных практик может быть интересна в двух перспективах. С одной стороны, интерес к изучению науки как самостоятельного предмета может быть внутренней практикой самой науки, ее саморефлексией над происходящими внутри науки процессами. С другой стороны, в ней заинтересованы внешние по отношению к науке лица, например, государство, которое может прибегать к использованию продуктов наукометрии для (не-)эффективного администрирования процессов самой науки.

Т. Франссен и П. Воутерс в своем исследовании об изменениях использования библиометрии подчеркивают, что две эти перспективы в отношении гуманитарных наук последовательно сменяют друг друга: с 1960-х по 1980-е годы библиометрия является частью социологической оптики для изучения внутринаучных процессов, в то время как с 1980-х годов библиометрия начинает в большей степени рассматриваться как эмпирический материал для формирования научных политик и оценки исследований.

Учитывая наш личный интерес к теме, мы не могли пройти мимо анонса нашего коллеги Андрея Герасимова, который приглашает принять участие в конференции «Королевство пустых зеркал: социальные исследования социальных наук». Конференция, которая пройдет в Шанинке и онлайн, будет посвящена как эмпирическим исследованиям, реконструирующим путь становления наук и изменения их формы, так и теоретическим подходам к научной самообъективации. Направления конференции затронут в первую очередь разные социологические подходы, будь то исследования социо-гуманитарного знания в СССР, интеллектуалов, подходов к социальным наукам или социология социологии. Кроме того, одним из заявленных направлений, которое может особенно заинтересовать наших постоянных читателей, выступит наукометрическая перпектива (а также ее враги!): как цифры характеризуют нынешнее положение социальной науки, а также при помощи каких практик наука изучает эти цифры?

Мы же, по обыкновению, решили посмотреть, как схожие темы представлены в OpenAlex. Выборку было решено делать по концепциям, а не по недавно появившимся тематикам, поскольку только среди концепций удалось найти соответствующие пункты. Для анализа мы выбрали следующие концепции: Scientific integrity, Scientific thinking, Scientific evidence, Sociology of knowledge, Scientific modelling, Scientific reasoning, History of science, Scientific society, Scientific revolution, Scientific method, Scientometrics, Scientific progress, Science studies, Sociology of scientific knowledge, Scientific theory, Informetrics, порог балла связи (score) 0,5, временной период — с 2014 по 2024 гг. Результаты представлены на диаграмме (есть и интерактивная версия). Больше всего как цитирований, так и публикаций насчитывает наукометрия — более 3 тысяч статей были процитированы почти 25 тысяч раз. Сразу обращают на себя внимание концепции «научное доказательство» (scientific evidence) и история науки — публикаций по каждой из концепций около 2 тысяч, но при этом цитирований у первой более 20 тысяч, а у второй — всего 5479.

#конференция #OpenAlex #аналитика
Внедрение стандартизированных рецензий

Марио Малички (Mario Malički), редактор Research Integrity and Peer Review, опубликовал результаты пилотного исследования внедрения практики стандартизированных рецензий в журналы издательства Elsevier.

По мнению автора, рецензенты редко комментируют одни и те же аспекты исследования, что затрудняет точность оценки качества исследований и ставит под сомнение объективность процесса рецензирования.

«Я получил 2 рецензии на статью, отправленную на рассмотрение в журнал; в одной было 3 комментария, в другой — 11. Отзывы отличались по всем пунктам, кроме одного. Замечания были даны в адрес проработки раздела “обсуждение” (discussion), а также некоторых методологических деталей. Постановка целей, анализ данных и слабые стороны исследования остались без внимания рецензентов», — пишет Малички.

Авторы, как правило, руководствуются двумя распространенными предположениями в отношении отзывов рецензентов: во-первых, все аспекты, которых не коснулись рецензенты, не подверглись критике; во-вторых, рецензенты обладали достаточными знаниями для всесторонней оценки исследования.

Однако, согласно ряду исследований, процесс рецензирования полон недостатков, которые связаны с неспособностью некоторых рецензентов обнаружить:

🔹 (значительные) методологические недостатки статьи;
🔹 неточности в интерпретации и обобщении результатов;
🔹 неправильное использование ссылок;
🔹 отсутствие данных, необходимых для повторного анализа или воспроизведения исследования;
🔹 отсутствие элементов, необходимых для оценки предвзятости или качества исследования.

По мнению автора, повысить качество экспертной оценки можно за счет внедрения стандартизированных отзывов на публикации, для чего журналы должны предоставлять рецензентам список вопросов, сосредоточенных на всех аспектах исследования, а также размещать на сайте журнала:

а) список вопросов для рецензентов (что позволит авторам использовать те же вопросы в качестве контрольного списка для анализа работы и повышения её качества);
б) развернутые отзывы рецензентов (что позволит читателям посмотреть как оценивалась статья, а исследователям даст возможность изучить практику рецензирования).

Стандартизированное рецензирование было апробировано в августе 2022 года в 220 журналах Elsevier. В рамках пилотного исследования было проанализировано примерно 10% выборки, а именно — 214 отзывов рецензентов на 107 статей из 23 случайно выбранных (вне зависимости от тематики и квартиля) журналов. Каждый отзыв состоял из ответов на 9 одинаковых вопросов и информации, оставленной в поле «Комментарии для автора», и в конфиденциальном поле «Комментарии для редактора». Ознакомиться с шаблоном вопросов можно по ссылке.

Абсолютное совпадение мнений относительно окончательных рекомендаций рецензента составило 41%, причем статистической разницы между научными областями или квартилями обнаружено не было, тогда как по последним данным Elsevier (на основе 7 220 243 рукописей, опубликованных с 2019 по 2021 год в 2416 журналах), рецензенты приняли одинаковые решения на первом этапе рецензирования всего в 30% случаев.

Более того, в ряде случаев комментарии рецензентов совпадали в отношении отдельных фрагментов работы. Согласно результатам исследования, самое высокое (частичное) согласие рецензентов (72%) было обнаружено при оценивании структуры статьи, а самое низкое (частичное) согласие (53%) — для оценивания подтверждения интерпретации результатов данными, а также для оценки уместности и достаточной детальности статистического анализа (52%).

Предварительные результаты показывают, что, руководствуясь одними и теми же вопросами, рецензенты давали идентичные первоначальные рекомендации насчет принятия/отклонения или доработки публикации. По мнению автора, отсутствие стандартизированных практик в рецензировании замедляет прогресс науки, а их внедрение поможет сделать отзывы более объективными, прозрачными и заслуживающими доверия.

#Elsevier #рецензирование #обзор
​​Data paper как самостоятельная наукометрическая единица

Не так давно Иван Бегтин, которого мы регулярно читаем, опубликовал пост о том, что следует считать наборами данных. Это могут быть как стандартные датасеты, так и другие типы данных: data paper, data report, data article и data note. В такие публикации входит не только текст статьи, но и ссылки на исходные данные или данные, полученные в результате работы.

Пока нет общего мнения, можно ли считать наборы данных отдельным типом данных и следует ли в принципе индексировать их в библиометрических системах, но, как минимум, Scopus добавил к параметру DOCTYPE допустимое значение “dp” (data paper) (правда, в справке пока что этой информации не содержится), в Web of Science data paper индексируются с 2016 года, причем им присваивается двойное значение — data paper и article, а в OpenAlex есть тип “dataset”.

Наборы данных пока не везде считаются отдельным типом данных, поэтому не во всех библиометрических базах можно выделить их однозначно, но мы сделали несколько разрезов, чтобы внимательнее рассмотреть, как распределяются публикации по годам и областям, а также — какие издательства уже публикуют работы с подобными ссылками.

В Web of Science за все годы было 15 677 публикаций с типом data paper, в Scopus немного больше — 16 146. В OpenAlex же хранится информация о более чем 7 миллионах датасетов, из которых более 4 — в открытом доступе, однако данных о data paper как о полноценных статьях, описывающих содержание датасета, пока нет.

Мы проанализировали data paper, индексируемые в Scopus, по нескольким разрезам, чтобы понять, насколько распространены подобные публикации в различных странах и областях знаний. Среди государств ожидаемо лидируют США и КНР (при этом в США было опубликовано более 3000 data paper, что почти вдвое больше, чем в Китае). Россия на 12 месте (493 data paper) и опережает, например, Нидерланды, Швейцарию и Бельгию.

По областям (если не считать ожидаемого пика у Multidisciplinary) почти наравне держатся компьютерные и социальные науки — 2516 и 2507 публикаций соответственно. За ними с незначительной разницей идут науки о принятии решений и математика — 2447 и 2410. А вот биохимия, генетика и молекулярная биология, которые часто приходят на ум при словосочетании «набор данных», имеет всего 239 data papers.

Важно отметить, что большая часть data papers размещена в открытом доступе: 14 676 публикаций из 16 146 имеют различный статус Open Access, от Gold до Hybrid.

#Scopus #openaccess #datapaper
Salami Slicing: от одного исследования ко множеству публикаций

“Тактика салями” в академическом мире (Salami Slicing) — неуместное разделение одной публикации на ряд публикаций с идентичными или очень похожими данными в каждой статье. Термин, широко используемый в теоретико-игровом моделировании, как нельзя лучше подходит для описания подхода, нацеленного на искусственное завышение публикационной активности.

Попытка дважды опубликовать результаты, полученные в ходе выполнения одного исследования, — этически неприемлемая практика, она не только может приводить к искажению исследовательских выводов, но и может навредить академическому сообществу по ряду других причин:

🔹 создает дополнительную работу для читателей, будущих авторов, рецензентов и редакторов;
🔹 идет рука об руку с самоплагиатом;
🔹 приводит к дублированию публикаций.

Такая стратегия наиболее опасна для молодых исследователей, которые могут привыкнуть анализировать данные частями, забывая, что в таком случае из поля зрения ускользают более ценные выводы, которые можно было бы изложить в ходе одного исследования.

Очевидно, что опубликовать многокомпонентные исследования гораздо сложнее, чем более простые, как минимум, из-за объема работы, которую необходимо провести авторам и редакторам перед публикацией статьи. Поддаваясь искушению пойти по более лёгкому пути, исследователи в долгосрочной перспективе могут значительно снизить свои шансы на публикации во влиятельных журналах.

Дополнительная сложность заключается в том, что Salami Slicing легче идентифицировать в количественных исследованиях, чем в качественных. В дискуссиях о том, что же понимать под “неоправданной сегментацией”, исследователи сформулировали вопросы, положительные ответы на которые помогут распознать этот вид академического мошенничества:

💠 каждая публикация проверяет одну гипотезу?
💠 две (и более) публикации основываются на одном и том же массиве данных?
💠 исследования сообщают об одних и тех же результатах?/приходят к одним и тем же выводам?

Однако принудительное применение таких правил к некоторым исследованиям (например, в социальных науках) сводит сложные исследовательские вопросы к простым «данным», лишая их более глубокого контекста и значения.

Мигель Ройг, исследователь в области академической честности, в своем гайде на эту тему рекомендует напоминать себе следующее: “Если результаты одного сложного исследования наилучшим образом можно представить как “связанное” единое целое, их не следует разбивать на отдельные статьи”.

“Тактика салями” — явление хоть и не новое, но тяжело отслеживаемое, особенно в условиях высококонкурентной и ориентированной на публикации академической реальности. Следует помнить, что как и в случае с другими формами избыточности и фактического дублирования статей, неоправданная сегментация исследования приводит к искажению информации, заставляя ничего не подозревающих читателей верить в то, что данные, представленные в каждом кусочке салями (т. е. в журнальной статье), получены независимо друг от друга.

P.S.
Этот пост продолжает серию заметок о недобросовестных исследовательских практиках и мошенничестве в академическом мире. Мы публикуем серию карточек на эту тему, чтобы нашим подписчикам было проще не заблудиться в dark side of publishing.

#SalamiSlicing #тактикасалями #обзор