Резкая остановка, плавное падение или незначимый фактор: о цитируемости публикаций в журналах из Scopus Discountinued Sources List
В самом начале 2024 года на RetractionWatch появилась заметка о том, что Scopus планирует провести переоценку журналов издательства MDPI, входящих в базу, в связи с отдельными вопросами к политике издательства. Несмотря на появившийся спустя несколько дней комментарий к оценке одного из флагманов MDPI — журнала “Sustainability” (к которому у Elsevier вопросов не осталось) — не лишним будет напомнить о критериях, влияющих на повторную оценку журналов, входящих в Scopus, учитывая популярность издательства MDPI в том числе у российских коллег:
1. Журнальные показатели вызывают вопросы, так как они не соответствуют ни одному из трех показателей и критериев журналов в той же предметной области (показатели цитирования, самоцитирования и CiteScore).
2. Существует обеспокоенность по поводу стандартов публикации журнала или издателя (в том числе в результате официально полученных жалоб).
3. Журнал демонстрирует необычное поведение после включения в Scopus (значимо увеличивается число публикаций, становится необычной география соавторов и т.д.).
4. По журналу есть замечания от международного консультативного совета по отбору контента (Content Selection and Advisory Board — CSAB).
Наличия одного из перечисленных критериев достаточно для проведения процедуры повторной оценки журнала или издания. Окончательное решение об исключении журнала/издательства из базы Scopus принимается CSAB — если комиссия определит, что журнал больше не соответствует стандартам Scopus, новые статьи из такого журнала прекратят индексацию. Издания, индексация которых прекращена, могут быть повторно рассмотрены на предмет включения в базу только через 5 лет после принятия решения об их исключении.
Вообще же вхождение журнала в официальные листы крупных баз данных рецензируемых изданий и национальные списки повышает привлекательность издания для авторов: как за счет повышения видимости опубликованной работы, так и нередко из-за формальной наукометрической составляющей оценки научной продуктивности. Но означает ли это, что исключение журнала из базы может значимо влиять на видимость опубликованных статей?
Ответить на этот вопрос мы попробовали с помощью открытых данных о цитируемости изданий, попавших в Scopus Discountinued Sources List в 2020 году. Отобрав среди них те журналы, по которым имелись сведения в OpenAlex о цитируемости за несколько лет, мы рассчитали 2 показателя: (1) среднюю цитируемость статей в первые 2 года после выхода; (2) число процитированных в первые 2 года после выхода статей. Визуализация представлена на графике ниже и по ссылке.
Несмотря на объективную сложность обобщения (журналы представлены в разных дисциплинах, а также отличаются с точки зрения покрытия и общего числа публикаций) можно отметить, что на публикации 2020 года нередко приходились локальные экстремумы по числу цитирований, которые в следующие периоды затухали. При этом формальное падение “до нуля” — не единственный, хотя и наиболее распространенный сценарий. По всей видимости некоторые ученые не только продолжают читать, но и цитировать статьи журналов, вызывающих вопросы с точки зрения редакционной политики (здесь оговоримся, что мы не учитывали показатели самоцитирований).
Можно ожидать, что в случае крупных издательств тенденции “затухания” цитирования будут еще более сглаженными, чем на нашем графике. Так что угроза исключения источников (в особенности на фоне развития открытых баз без учета критериев селективности (обратная сторона медали OpenAccess), в том числе SciLit от MDPI) в будущем могут не так значимо влиять на дальнейшее воспроизводство научного знания из источников, вызывающих вопросы у профессионального сообщества.
#discountinued #Scopus #RetractionWatch #OpenAlex #цитирования #визуализация
В самом начале 2024 года на RetractionWatch появилась заметка о том, что Scopus планирует провести переоценку журналов издательства MDPI, входящих в базу, в связи с отдельными вопросами к политике издательства. Несмотря на появившийся спустя несколько дней комментарий к оценке одного из флагманов MDPI — журнала “Sustainability” (к которому у Elsevier вопросов не осталось) — не лишним будет напомнить о критериях, влияющих на повторную оценку журналов, входящих в Scopus, учитывая популярность издательства MDPI в том числе у российских коллег:
1. Журнальные показатели вызывают вопросы, так как они не соответствуют ни одному из трех показателей и критериев журналов в той же предметной области (показатели цитирования, самоцитирования и CiteScore).
2. Существует обеспокоенность по поводу стандартов публикации журнала или издателя (в том числе в результате официально полученных жалоб).
3. Журнал демонстрирует необычное поведение после включения в Scopus (значимо увеличивается число публикаций, становится необычной география соавторов и т.д.).
4. По журналу есть замечания от международного консультативного совета по отбору контента (Content Selection and Advisory Board — CSAB).
Наличия одного из перечисленных критериев достаточно для проведения процедуры повторной оценки журнала или издания. Окончательное решение об исключении журнала/издательства из базы Scopus принимается CSAB — если комиссия определит, что журнал больше не соответствует стандартам Scopus, новые статьи из такого журнала прекратят индексацию. Издания, индексация которых прекращена, могут быть повторно рассмотрены на предмет включения в базу только через 5 лет после принятия решения об их исключении.
Вообще же вхождение журнала в официальные листы крупных баз данных рецензируемых изданий и национальные списки повышает привлекательность издания для авторов: как за счет повышения видимости опубликованной работы, так и нередко из-за формальной наукометрической составляющей оценки научной продуктивности. Но означает ли это, что исключение журнала из базы может значимо влиять на видимость опубликованных статей?
Ответить на этот вопрос мы попробовали с помощью открытых данных о цитируемости изданий, попавших в Scopus Discountinued Sources List в 2020 году. Отобрав среди них те журналы, по которым имелись сведения в OpenAlex о цитируемости за несколько лет, мы рассчитали 2 показателя: (1) среднюю цитируемость статей в первые 2 года после выхода; (2) число процитированных в первые 2 года после выхода статей. Визуализация представлена на графике ниже и по ссылке.
Несмотря на объективную сложность обобщения (журналы представлены в разных дисциплинах, а также отличаются с точки зрения покрытия и общего числа публикаций) можно отметить, что на публикации 2020 года нередко приходились локальные экстремумы по числу цитирований, которые в следующие периоды затухали. При этом формальное падение “до нуля” — не единственный, хотя и наиболее распространенный сценарий. По всей видимости некоторые ученые не только продолжают читать, но и цитировать статьи журналов, вызывающих вопросы с точки зрения редакционной политики (здесь оговоримся, что мы не учитывали показатели самоцитирований).
Можно ожидать, что в случае крупных издательств тенденции “затухания” цитирования будут еще более сглаженными, чем на нашем графике. Так что угроза исключения источников (в особенности на фоне развития открытых баз без учета критериев селективности (обратная сторона медали OpenAccess), в том числе SciLit от MDPI) в будущем могут не так значимо влиять на дальнейшее воспроизводство научного знания из источников, вызывающих вопросы у профессионального сообщества.
#discountinued #Scopus #RetractionWatch #OpenAlex #цитирования #визуализация
В этом году мы решили открыть новую рубрику на нашем канале — #дайджест новостей из области наукометрии за последний месяц. Подборка будет выходить в последнюю пятницу каждого месяца.
За последнее время произошло несколько интересных событий, о которых мы хотим напомнить нашим читателям:
1. Одна из главных новостей российского сегмента — проект-победитель Всероссийского гранта Росмолодежи, сервис SciCite, на который обратил внимание в своем телеграм-канале академик РАН А.Р. Хохлов. Сервис предлагает ученым цитировать определенные работы друг друга в обмен на внутреннюю виртуальную валюту. Основная проблема, по мнению некоторых экспертов, заключается в том, что мотивация к социтированию работ «за вознаграждение» искусственна и не всегда связана с действительной научной значимостью цитируемых исследований. Новость о сервисе облетела тематические телеграм-каналы, а сам проект опубликовал пост-опровержение, в котором отмечает, что площадка была создана с целью изменения традиционного подхода к поиску единомышленников и обмену научными знаниями, а виртуальная валюта является элементом геймификации.
2. На Scholarly Kitchen вышел гостевой пост о директиве European Accessibility Act, вступающей в силу с июня 2025 года. Согласно этой директиве, к широкому спектру цифровых продуктов будут предъявляться требования, касающиеся доступности для людей с ограниченными возможностями. С июля 2025 года издательствам, независимо от страны регистрации, может быть запрещено предлагать определенные цифровые продукты и издательские услуги на рынке ЕС, если они не соответствуют требованиям директивы.
3. Совсем недавно Elsevier объявил о старте продаж Scopus AI — внимание на это обратили в том числе коллеги из канала «Научные журналы и базы данных». Этот инструмент призван помочь начинающим (и не только) исследователям ориентироваться в академическом контенте, предоставляя сводную информацию на основе названий и аннотаций к статьям. У Scopus есть еще одна новость (правда, актуальная скорее для коллег, проживающих за пределами России): последние обновления интерфейса позволяют искать авторов по ключевым словам. Это поможет быстро находить исследователей для коллаборации в интересующей сфере или экспертов для консультаций по отдельным вопросам.
4. Команда OpenAlex полностью переработала интерфейс — теперь пользователям доступен поиск и фильтрация по DOI, названию статей, именам авторов, концепциям и ключевым словам, причем фильтр распознает, к какой категории относится поисковый запрос, и предлагает варианты автозаполнения. А еще реализована вполне удобная мобильная версия.
5. На новостном портале Nature опубликован пост о новой инициативе по борьбе с т.н. «бумажными фабриками» — предприятиями, засоряющими научное поле путем выпуска поддельных или некачественных статей и продажи авторских прав. В посте описывается масштаб проблемы, а также предлагается план из пяти пунктов по ее решению. Эту новость также комментирует А.Р. Хохлов.
6. В Science вышла статья о десятилетней борьбе группы независимых ученых с публикацией фальшивых исследований. С 2013 года ими были поданы жалобы на 300 публикаций, обладающих признаками фальсификации данных и других этических нарушений. Проблема заключается в том, что исследователи всё ещё не получили обратную связь по 107 подозрительным статьям, опубликованным в 41 журнале. Упомянутые статьи всё еще находятся в открытом доступе и продолжают цитироваться, несмотря на активные попытки повлиять на их исключение из источников. По мнению инициативной группы, сложившаяся ситуация напрямую связана с нежеланием издательств своевременно и оперативно реагировать на подобные запросы, что является прямым нарушением этических норм научного сообщества.
#дайджест #OpenAlex #Scopus
За последнее время произошло несколько интересных событий, о которых мы хотим напомнить нашим читателям:
1. Одна из главных новостей российского сегмента — проект-победитель Всероссийского гранта Росмолодежи, сервис SciCite, на который обратил внимание в своем телеграм-канале академик РАН А.Р. Хохлов. Сервис предлагает ученым цитировать определенные работы друг друга в обмен на внутреннюю виртуальную валюту. Основная проблема, по мнению некоторых экспертов, заключается в том, что мотивация к социтированию работ «за вознаграждение» искусственна и не всегда связана с действительной научной значимостью цитируемых исследований. Новость о сервисе облетела тематические телеграм-каналы, а сам проект опубликовал пост-опровержение, в котором отмечает, что площадка была создана с целью изменения традиционного подхода к поиску единомышленников и обмену научными знаниями, а виртуальная валюта является элементом геймификации.
2. На Scholarly Kitchen вышел гостевой пост о директиве European Accessibility Act, вступающей в силу с июня 2025 года. Согласно этой директиве, к широкому спектру цифровых продуктов будут предъявляться требования, касающиеся доступности для людей с ограниченными возможностями. С июля 2025 года издательствам, независимо от страны регистрации, может быть запрещено предлагать определенные цифровые продукты и издательские услуги на рынке ЕС, если они не соответствуют требованиям директивы.
3. Совсем недавно Elsevier объявил о старте продаж Scopus AI — внимание на это обратили в том числе коллеги из канала «Научные журналы и базы данных». Этот инструмент призван помочь начинающим (и не только) исследователям ориентироваться в академическом контенте, предоставляя сводную информацию на основе названий и аннотаций к статьям. У Scopus есть еще одна новость (правда, актуальная скорее для коллег, проживающих за пределами России): последние обновления интерфейса позволяют искать авторов по ключевым словам. Это поможет быстро находить исследователей для коллаборации в интересующей сфере или экспертов для консультаций по отдельным вопросам.
4. Команда OpenAlex полностью переработала интерфейс — теперь пользователям доступен поиск и фильтрация по DOI, названию статей, именам авторов, концепциям и ключевым словам, причем фильтр распознает, к какой категории относится поисковый запрос, и предлагает варианты автозаполнения. А еще реализована вполне удобная мобильная версия.
5. На новостном портале Nature опубликован пост о новой инициативе по борьбе с т.н. «бумажными фабриками» — предприятиями, засоряющими научное поле путем выпуска поддельных или некачественных статей и продажи авторских прав. В посте описывается масштаб проблемы, а также предлагается план из пяти пунктов по ее решению. Эту новость также комментирует А.Р. Хохлов.
6. В Science вышла статья о десятилетней борьбе группы независимых ученых с публикацией фальшивых исследований. С 2013 года ими были поданы жалобы на 300 публикаций, обладающих признаками фальсификации данных и других этических нарушений. Проблема заключается в том, что исследователи всё ещё не получили обратную связь по 107 подозрительным статьям, опубликованным в 41 журнале. Упомянутые статьи всё еще находятся в открытом доступе и продолжают цитироваться, несмотря на активные попытки повлиять на их исключение из источников. По мнению инициативной группы, сложившаяся ситуация напрямую связана с нежеланием издательств своевременно и оперативно реагировать на подобные запросы, что является прямым нарушением этических норм научного сообщества.
#дайджест #OpenAlex #Scopus
Лейденский рейтинг: открытая версия
21 июня 2023 года вышла очередная версия Лейденского рейтинга университетов, а 15 сентября CWTS (Центр исследования науки и технологий Лейденского университета, выступающий в качестве оператора рейтинга) анонсировал специальный выпуск, основанный на открытых данных OpenAlex. Напомним, что обычная версия Лейденского рейтинга составляется на основе данных Web of Science. Попытка же воспроизведения результатов с использованием полностью открытых данных OpenAlex, несомненно, является серьезным шагом на пути к открытой науке.
Открытая версия Лейденского рейтинга была опубликована на новом портале около 2 часов назад. В качестве источника библиографических данных в методологии теперь указан портал OpenAlex (всего - более 26.6 млн публикаций); других значимых изменений в подходах к расчету индикаторов нет. Ключевое обстоятельство, которое, на наш взгляд, следует отметить — учет Лейденским рейтингом журналов так называемого ядра, критерии которого могут быть не вполне однозначно трактованы (сами формулировки по отбору источников при этом никак не изменились). Так, если при использовании WoS набор рассматриваемых журналов можно было сузить до изданий, относящихся к основным индексам (SCIE, SSCI и AHCI), то при работе с OpenAlex фильтрация источников становится менее прозрачной.
Предлагаем вместе с нами взглянуть на топ рейтинга, а также на позиции российских университетов.
Топ-3 по-прежнему занимают Гарвард, Чжэцзянский университет и Шанхайский университет Цзяо Тун (правда, последние два поменялись местами). Из значимых изменений можно отметить улучшение позиций Мичиганского университета (он поднялся с 15 места на 6), Университета Джонса Хопкинса (с 20 на 10), Сианьского Университет Цзяотун (переместился с 10 места на 20). В целом количество статей у западных вузов в новой версии рейтинга заметно выросло, тогда как для китайских вузов ситуация зачастую обратная — число осталось прежним или незначительно уменьшилось. Это может быть связано с проблемами в записи названий университетов и аффилиаций латиницей и иероглифами — если OpenAlex не хранит соответствующего варианта написания, то статья к университету приписана не будет.
Изменения в открытой версии характерны не только для западных вузов. В российской части рейтинга (всего — 14 организаций) число статей почти везде увеличилось. Где-то цифры оказались весьма внушительными: так, ТГУ поднялся с 11 места по стране на 5 — с 900 статей до 2378, не менее существенное увеличение у УрФУ: чуть более чем в 1.8 раз.
Предлагаем ознакомиться с изменениям в показателях российских университетов на приложенном графике.
#openalex #leidenranking
21 июня 2023 года вышла очередная версия Лейденского рейтинга университетов, а 15 сентября CWTS (Центр исследования науки и технологий Лейденского университета, выступающий в качестве оператора рейтинга) анонсировал специальный выпуск, основанный на открытых данных OpenAlex. Напомним, что обычная версия Лейденского рейтинга составляется на основе данных Web of Science. Попытка же воспроизведения результатов с использованием полностью открытых данных OpenAlex, несомненно, является серьезным шагом на пути к открытой науке.
Открытая версия Лейденского рейтинга была опубликована на новом портале около 2 часов назад. В качестве источника библиографических данных в методологии теперь указан портал OpenAlex (всего - более 26.6 млн публикаций); других значимых изменений в подходах к расчету индикаторов нет. Ключевое обстоятельство, которое, на наш взгляд, следует отметить — учет Лейденским рейтингом журналов так называемого ядра, критерии которого могут быть не вполне однозначно трактованы (сами формулировки по отбору источников при этом никак не изменились). Так, если при использовании WoS набор рассматриваемых журналов можно было сузить до изданий, относящихся к основным индексам (SCIE, SSCI и AHCI), то при работе с OpenAlex фильтрация источников становится менее прозрачной.
Предлагаем вместе с нами взглянуть на топ рейтинга, а также на позиции российских университетов.
Топ-3 по-прежнему занимают Гарвард, Чжэцзянский университет и Шанхайский университет Цзяо Тун (правда, последние два поменялись местами). Из значимых изменений можно отметить улучшение позиций Мичиганского университета (он поднялся с 15 места на 6), Университета Джонса Хопкинса (с 20 на 10), Сианьского Университет Цзяотун (переместился с 10 места на 20). В целом количество статей у западных вузов в новой версии рейтинга заметно выросло, тогда как для китайских вузов ситуация зачастую обратная — число осталось прежним или незначительно уменьшилось. Это может быть связано с проблемами в записи названий университетов и аффилиаций латиницей и иероглифами — если OpenAlex не хранит соответствующего варианта написания, то статья к университету приписана не будет.
Изменения в открытой версии характерны не только для западных вузов. В российской части рейтинга (всего — 14 организаций) число статей почти везде увеличилось. Где-то цифры оказались весьма внушительными: так, ТГУ поднялся с 11 места по стране на 5 — с 900 статей до 2378, не менее существенное увеличение у УрФУ: чуть более чем в 1.8 раз.
Предлагаем ознакомиться с изменениям в показателях российских университетов на приложенном графике.
#openalex #leidenranking
Как корабль назовешь: о географических наименованиях журналов в наукометрическом разрезе
Так как наука по своей природе транснациональна, а ученые при выборе журнала зачастую стремятся продемонстрировать свою работу наиболее широкому кругу читателей, можно ожидать, что многие журналы по умолчанию будут стремиться к позиционированию в качестве международных, если их тематические области позволяют выйти за рамки национальных границ.
Действительно, как показывает недавнее исследование, большинство ученых стремится опубликоваться в журналах, которые не имеют строгой привязки к географической локации, государству или институту, так как подобная аффилиация сильно влияет на представление о тематическом и географическом охвате журнала.
Как отмечают авторы, на данный момент из 23 702 действующих журналов, индексируемых в Scopus и публикующих статьи на английском языке, 3398 (14,7%) названий включают географическое название, причем 60,4% из них — названия стран, затем идут названия континентов (20,9%), городов или университетов (10,2%) и регионов (8,5%). Статистика показывает, что 40 % журналов Scopus, у которых менялось название, отказались от географической привязки. Другое исследование одной из причин перехода к интернациональному имиджу в ходе эволюции журналов называет их включение в индексируемые базы данных. При этом не секрет, что некоторые журналы, нарочито стремящиеся подчеркнуть свою «международную» направленность, избирают такую модель поведения для привлечения внимания большего числа потенциальных авторов-клиентов.
Мы решили посмотреть, как связаны между собой страны, в которых издаются журналы с географическими наименованиями, и страны авторов, цитирующих публикации из этих журналов. В качестве объекта анализа были выбраны страны «Глобального Юга» (наше базовое предположение исходит из того, что журналы с такими географическими наименованиями в меньшей степени знакомы широкому кругу читателей, нежели флагманы американских и европейских ассоциаций), а затем в OpenAlex отобраны журналы, содержащие в своем заглавии наименования этих стран, и одновременно с этим индексирующиеся в Scopus. Таких журналов оказалось 714, причем немалая часть из них публикуется издательствами Германии, Великобритании, Нидерландов и США.
Для анализа цитируемости был выбран период с 2020 по 2023 год. Всего в выбранных журналах было опубликовано более 250 тысяч статей, которые цитировались более 300 тысяч раз. На приведенных sankey-диаграммах показано, как распределены цитаты, полученные в журналах с географическими наименованиями, по страновой принадлежности цитирующих авторов (слева - число цитирующих авторов публикаций в журналах, сгруппированных по географическому признаку, а справа - распределение по числу авторов с аффилиацией из указанной страны). Отметим, что пороговое значение визуализации — не менее 2000 цитирующих авторов в рассматриваемых парах (для Китая — не менее 20 000). Китай вынесен отдельно, поскольку количество авторов, процитировавших статьи, и число цитирующих авторов из этой страны (в контексте только китайских публикаций) аномально велико по сравнению с другими странами: публикации в журналах, в названии которых упоминается «Китай» или «китайский», за 4 года были процитированы более чем 14 млн авторов.
Больше всего журналы «Глобального Юга» (за исключением Китая) цитируют ученые из Индии: более 170 тысяч цитирующих авторов (учитывался каждый автор, указавший индийскую аффилиацию (по данным OpenAlex), в том числе в статьях, написанных в соавторстве). Второе место по числу цитирующих авторов занимает Китай (143 000 цитирующих авторов), на третьем месте - США (74 000 цитирующих авторов). А наибольшее количество цитирующих авторов (после Китая и Индии), имеют нигерийские журналы: более 234 тысяч авторов со всего мира ссылались на журналы с данным географическим указанием.
Предлагаем вам изучить графики (интерактивные версии приведены по ссылкам выше).
#визуализация #OpenAlex #глобальныйюг
Так как наука по своей природе транснациональна, а ученые при выборе журнала зачастую стремятся продемонстрировать свою работу наиболее широкому кругу читателей, можно ожидать, что многие журналы по умолчанию будут стремиться к позиционированию в качестве международных, если их тематические области позволяют выйти за рамки национальных границ.
Действительно, как показывает недавнее исследование, большинство ученых стремится опубликоваться в журналах, которые не имеют строгой привязки к географической локации, государству или институту, так как подобная аффилиация сильно влияет на представление о тематическом и географическом охвате журнала.
Как отмечают авторы, на данный момент из 23 702 действующих журналов, индексируемых в Scopus и публикующих статьи на английском языке, 3398 (14,7%) названий включают географическое название, причем 60,4% из них — названия стран, затем идут названия континентов (20,9%), городов или университетов (10,2%) и регионов (8,5%). Статистика показывает, что 40 % журналов Scopus, у которых менялось название, отказались от географической привязки. Другое исследование одной из причин перехода к интернациональному имиджу в ходе эволюции журналов называет их включение в индексируемые базы данных. При этом не секрет, что некоторые журналы, нарочито стремящиеся подчеркнуть свою «международную» направленность, избирают такую модель поведения для привлечения внимания большего числа потенциальных авторов-клиентов.
Мы решили посмотреть, как связаны между собой страны, в которых издаются журналы с географическими наименованиями, и страны авторов, цитирующих публикации из этих журналов. В качестве объекта анализа были выбраны страны «Глобального Юга» (наше базовое предположение исходит из того, что журналы с такими географическими наименованиями в меньшей степени знакомы широкому кругу читателей, нежели флагманы американских и европейских ассоциаций), а затем в OpenAlex отобраны журналы, содержащие в своем заглавии наименования этих стран, и одновременно с этим индексирующиеся в Scopus. Таких журналов оказалось 714, причем немалая часть из них публикуется издательствами Германии, Великобритании, Нидерландов и США.
Для анализа цитируемости был выбран период с 2020 по 2023 год. Всего в выбранных журналах было опубликовано более 250 тысяч статей, которые цитировались более 300 тысяч раз. На приведенных sankey-диаграммах показано, как распределены цитаты, полученные в журналах с географическими наименованиями, по страновой принадлежности цитирующих авторов (слева - число цитирующих авторов публикаций в журналах, сгруппированных по географическому признаку, а справа - распределение по числу авторов с аффилиацией из указанной страны). Отметим, что пороговое значение визуализации — не менее 2000 цитирующих авторов в рассматриваемых парах (для Китая — не менее 20 000). Китай вынесен отдельно, поскольку количество авторов, процитировавших статьи, и число цитирующих авторов из этой страны (в контексте только китайских публикаций) аномально велико по сравнению с другими странами: публикации в журналах, в названии которых упоминается «Китай» или «китайский», за 4 года были процитированы более чем 14 млн авторов.
Больше всего журналы «Глобального Юга» (за исключением Китая) цитируют ученые из Индии: более 170 тысяч цитирующих авторов (учитывался каждый автор, указавший индийскую аффилиацию (по данным OpenAlex), в том числе в статьях, написанных в соавторстве). Второе место по числу цитирующих авторов занимает Китай (143 000 цитирующих авторов), на третьем месте - США (74 000 цитирующих авторов). А наибольшее количество цитирующих авторов (после Китая и Индии), имеют нигерийские журналы: более 234 тысяч авторов со всего мира ссылались на журналы с данным географическим указанием.
Предлагаем вам изучить графики (интерактивные версии приведены по ссылкам выше).
#визуализация #OpenAlex #глобальныйюг
Обновления в OpenAlex: тематический рубрикатор
12 февраля OpenAlex добавили в базу данных то, чего давно ждали аналитики и исследователи наукометрии: тематический рубрикатор по статьям. Теперь всем публикациям, индексируемым в OpenAlex, присваивается тема (Topic), автоматически определяемая на основе названия публикации, аннотации, названия журнала и данных о цитирующих статьях (подробное описание метода приведено в документации). По похожему алгоритму (за исключением данных о цитирующих статьях, которые в ряде случаев играют ключевую роль при классификации) определялись концепции (Concepts), которые сохранятся для ранее проиндексированных статей, но не будут обновляться и присваиваться новым публикациям.
Кроме большей надежности, темы отличаются еще и совпадением с рубрикатором Scopus (ASJC), за исключением того, что присваиваются они статьям, а не журналам.
Всего на данный момент выделено 4 домена, которые разделяются на 26 областей, те, в свою очередь, на 252 подобласти, и, наконец, на 4516 узких тем (для сравнения, концепций было порядка 65 тысяч).
Мы сделали иерархическую диаграмму распределения количества статей по темам в настоящий момент. С интерактивной версией можно ознакомиться по ссылке.
#openalex #классификатор #визуализация
12 февраля OpenAlex добавили в базу данных то, чего давно ждали аналитики и исследователи наукометрии: тематический рубрикатор по статьям. Теперь всем публикациям, индексируемым в OpenAlex, присваивается тема (Topic), автоматически определяемая на основе названия публикации, аннотации, названия журнала и данных о цитирующих статьях (подробное описание метода приведено в документации). По похожему алгоритму (за исключением данных о цитирующих статьях, которые в ряде случаев играют ключевую роль при классификации) определялись концепции (Concepts), которые сохранятся для ранее проиндексированных статей, но не будут обновляться и присваиваться новым публикациям.
Кроме большей надежности, темы отличаются еще и совпадением с рубрикатором Scopus (ASJC), за исключением того, что присваиваются они статьям, а не журналам.
Всего на данный момент выделено 4 домена, которые разделяются на 26 областей, те, в свою очередь, на 252 подобласти, и, наконец, на 4516 узких тем (для сравнения, концепций было порядка 65 тысяч).
Мы сделали иерархическую диаграмму распределения количества статей по темам в настоящий момент. С интерактивной версией можно ознакомиться по ссылке.
#openalex #классификатор #визуализация
Представляем свежий дайджест научных событий за последний месяц. Для удобства читателей мы разделили его на рубрики.
Научная политика
- Европейская организация по ядерным исследованиям (ЦЕРН) приняла решение не продлевать соглашение об участии российских научных организаций. Это означает также приостановку совместной работы не только на Большом адронном коллайдере, но и по другим крупным проектам. Срок действия этого соглашения истекает 30 ноября 2024 года.
- Академик А. Р. Хохлов пишет, что деятельность компании Pleiades, которая на протяжении 30 лет обеспечивала перевод статей из российских журналов на английский язык, а также размещение этих статей на платформе издательства Springer, с 2024 года будет осуществляться в РФ через дочернюю сербскую компанию «Pleiades Resources Beograd». Приостановка сотрудничества с Pleiades чревата прекращением индексации журналов международными базами данных.
Базы данных
- Иван Бегтин анонсировал запуск новой платформы для поиска данных — Dateno. Это поисковик, который уже содержит 10 млн наборов данных из 4900 каталогов всего мира. До конца 2024 года разработчики проекта планируют добавить открытый API и увеличить наборы данных до 30 млн.
- Компания OurResearch сообщает о получении гранта в размере $7,5 млн от благотворительного фонда Arcadia на развитие OpenAlex и создание устойчивого и полностью открытого индекса мировой исследовательской экосистемы.
- Коллеги из телеграм-канала “Научные журналы и базы данных” выпустили подробный пост о последнем обновлении Google Scholar для работы с pdf-документами.
Научная этика
- В Scolary Kitchen снова подняли тему использования ИИ в написании научных статей. Озабоченность связана с недавно обнаруженными двумя публикациями Elsevier, в которых содержались такие фразы как: «Конечно, вот возможное введение к вашей теме:…» и «Мне очень жаль, но у меня нет доступа к информации в реальном времени или к данным, касающимся конкретного пациента, поскольку я являюсь языковой моделью».
- В Science вышла статья о Фонде научной честности, который готов оказывать поддержку ученым, отстаивающим чистоту результатов исследований.
- Департамент науки Китая провёл крупную проверку отозванных научных публикаций. В статье-комментарии к событию отмечено, что проведённый аудит подтверждает растущее внимание к ретракции результатов исследований.
- В Times вышли статья и видеообзор на тему разоблачения фальсифицированных исследований рака, опубликованных ведущим ученым Колумбийского университета.
#дайджест #базыданных #новости #открытыйдоступ #OpenAlex #международноесотрудничество #искуственныйинтеллект
Научная политика
- Европейская организация по ядерным исследованиям (ЦЕРН) приняла решение не продлевать соглашение об участии российских научных организаций. Это означает также приостановку совместной работы не только на Большом адронном коллайдере, но и по другим крупным проектам. Срок действия этого соглашения истекает 30 ноября 2024 года.
- Академик А. Р. Хохлов пишет, что деятельность компании Pleiades, которая на протяжении 30 лет обеспечивала перевод статей из российских журналов на английский язык, а также размещение этих статей на платформе издательства Springer, с 2024 года будет осуществляться в РФ через дочернюю сербскую компанию «Pleiades Resources Beograd». Приостановка сотрудничества с Pleiades чревата прекращением индексации журналов международными базами данных.
Базы данных
- Иван Бегтин анонсировал запуск новой платформы для поиска данных — Dateno. Это поисковик, который уже содержит 10 млн наборов данных из 4900 каталогов всего мира. До конца 2024 года разработчики проекта планируют добавить открытый API и увеличить наборы данных до 30 млн.
- Компания OurResearch сообщает о получении гранта в размере $7,5 млн от благотворительного фонда Arcadia на развитие OpenAlex и создание устойчивого и полностью открытого индекса мировой исследовательской экосистемы.
- Коллеги из телеграм-канала “Научные журналы и базы данных” выпустили подробный пост о последнем обновлении Google Scholar для работы с pdf-документами.
Научная этика
- В Scolary Kitchen снова подняли тему использования ИИ в написании научных статей. Озабоченность связана с недавно обнаруженными двумя публикациями Elsevier, в которых содержались такие фразы как: «Конечно, вот возможное введение к вашей теме:…» и «Мне очень жаль, но у меня нет доступа к информации в реальном времени или к данным, касающимся конкретного пациента, поскольку я являюсь языковой моделью».
- В Science вышла статья о Фонде научной честности, который готов оказывать поддержку ученым, отстаивающим чистоту результатов исследований.
- Департамент науки Китая провёл крупную проверку отозванных научных публикаций. В статье-комментарии к событию отмечено, что проведённый аудит подтверждает растущее внимание к ретракции результатов исследований.
- В Times вышли статья и видеообзор на тему разоблачения фальсифицированных исследований рака, опубликованных ведущим ученым Колумбийского университета.
#дайджест #базыданных #новости #открытыйдоступ #OpenAlex #международноесотрудничество #искуственныйинтеллект
День космонавтики
Вчера с космодрома «Восточный» успешно стартовала ракета «Ангара-А5», а сегодня в России и многих странах СНГ празднуется День космонавтики: 63 года назад корабль «Восток» с Юрием Гагариным на борту успешно вышел на орбиту и за 108 минут облетел Землю.
С тех пор наука о космосе сильно продвинулась вперед. Немалая часть работ засекречена, но некоторые статьи все-таки публикуются: так, к профилю «Роскосмоса», согласно данным OpenAlex, в настоящее время приписана 581 публикация, включая статьи, книги, главы книг и даже одну диссертацию. При этом часть из них написана в соавторстве с другими космическими агентствами и институтами (на графике иностранные организации выделены голубым цветом; размером показано совокупное число публикаций).
Команда канала «Выше квартилей» поздравляет всех исследователей и сотрудников космической отрасли с Днем космонавтики и от всей души желает подниматься в научной работе не только выше квартилей, но и выше звезд!
#денькосмонавтики #openalex #роскосмос
Вчера с космодрома «Восточный» успешно стартовала ракета «Ангара-А5», а сегодня в России и многих странах СНГ празднуется День космонавтики: 63 года назад корабль «Восток» с Юрием Гагариным на борту успешно вышел на орбиту и за 108 минут облетел Землю.
С тех пор наука о космосе сильно продвинулась вперед. Немалая часть работ засекречена, но некоторые статьи все-таки публикуются: так, к профилю «Роскосмоса», согласно данным OpenAlex, в настоящее время приписана 581 публикация, включая статьи, книги, главы книг и даже одну диссертацию. При этом часть из них написана в соавторстве с другими космическими агентствами и институтами (на графике иностранные организации выделены голубым цветом; размером показано совокупное число публикаций).
Команда канала «Выше квартилей» поздравляет всех исследователей и сотрудников космической отрасли с Днем космонавтики и от всей души желает подниматься в научной работе не только выше квартилей, но и выше звезд!
#денькосмонавтики #openalex #роскосмос
Представляем свежий дайджест научных событий за последний месяц.
Редакторская политика
- В Nature вышла заметка об исследовании, подтверждающем эффективность внедрения стандартизированных рецензий на статьи. По результатам внедрения таких рецензий в 23 журналах издательства Elsevier редактор журнала Research Integrity and Peer Review делает вывод, что рецензенты, руководствуясь одними и теми же вопросами, чаще дают схожие первоначальные рекомендации относительно необходимости отклонения или принятия поступивших рукописей.
Научная политика
- На Scholarly Kitchen вышел обзор обновленной политики Фонда Билла и Мелинды Гейтс (Bill & Melinda Gates Foundation) в отношении открытого доступа в 2025 году. Вопреки ожиданиям, сложившимся на основании заявлений команды Фонда, политику Фонда затронут лишь некоторые незначительные изменения. Так, например, теперь в открытом доступе обязательно должны быть размещены препринт финансируемого исследования и текст статьи. В 2021 году это требование распространялось только на статьи.
Научная этика
- Лесли Макинтош, основательница Ripeta (компания, занимающаяся вопросами повышения качества и честности исследований), вице-президент Digital Science, предложила ввести новую область наукометрии — судебную наукометрию (Forensic Scientometrics (FoSci), что позволит выделить в отдельную категорию деятельность энтузиастов-расследователей, выступающих за соблюдение принципов академической честности.
- Сервис Turnitin отмечает первую годовщину создания ИИ-детектора письменных работ. За это время сервис обработал 200 миллионов работ, из которых 22 миллиона имеют не менее 20% содержания, написанного при помощи ИИ, а 6 миллионов — не менее 80%. С момента запуска сервис был признан инновационным решением в области образовательных технологий, поддерживающим академическую честность.
Базы данных
- Обновились показатели SJR для источников, входящих в Scopus. По традиции мы рассмотрели изменение позиций российских журналов в одном из постов.
- Вчера OpenAlex провел вебинар по работе с данными базы с привлечением Python. Код с использованием стандартных библиотек, а также видео можно найти по ссылке.
#дайджест #базыданных #новости #OpenAlex #искуственныйинтеллект
Редакторская политика
- В Nature вышла заметка об исследовании, подтверждающем эффективность внедрения стандартизированных рецензий на статьи. По результатам внедрения таких рецензий в 23 журналах издательства Elsevier редактор журнала Research Integrity and Peer Review делает вывод, что рецензенты, руководствуясь одними и теми же вопросами, чаще дают схожие первоначальные рекомендации относительно необходимости отклонения или принятия поступивших рукописей.
Научная политика
- На Scholarly Kitchen вышел обзор обновленной политики Фонда Билла и Мелинды Гейтс (Bill & Melinda Gates Foundation) в отношении открытого доступа в 2025 году. Вопреки ожиданиям, сложившимся на основании заявлений команды Фонда, политику Фонда затронут лишь некоторые незначительные изменения. Так, например, теперь в открытом доступе обязательно должны быть размещены препринт финансируемого исследования и текст статьи. В 2021 году это требование распространялось только на статьи.
Научная этика
- Лесли Макинтош, основательница Ripeta (компания, занимающаяся вопросами повышения качества и честности исследований), вице-президент Digital Science, предложила ввести новую область наукометрии — судебную наукометрию (Forensic Scientometrics (FoSci), что позволит выделить в отдельную категорию деятельность энтузиастов-расследователей, выступающих за соблюдение принципов академической честности.
- Сервис Turnitin отмечает первую годовщину создания ИИ-детектора письменных работ. За это время сервис обработал 200 миллионов работ, из которых 22 миллиона имеют не менее 20% содержания, написанного при помощи ИИ, а 6 миллионов — не менее 80%. С момента запуска сервис был признан инновационным решением в области образовательных технологий, поддерживающим академическую честность.
Базы данных
- Обновились показатели SJR для источников, входящих в Scopus. По традиции мы рассмотрели изменение позиций российских журналов в одном из постов.
- Вчера OpenAlex провел вебинар по работе с данными базы с привлечением Python. Код с использованием стандартных библиотек, а также видео можно найти по ссылке.
#дайджест #базыданных #новости #OpenAlex #искуственныйинтеллект
Аналитика: Независимые исследователи
Помимо анонимных авторов, о которых мы писали в одном из предыдущих постов, существует еще одна нестандартная группа авторов — независимые исследователи. Это ученые, не имеющие или не указавшие в своей работе аффилиации с какой-либо организацией. Такое положение имеет свои плюсы: исследователь может полностью сосредоточиться на своем исследовании, не отвлекаясь на преподавание или административные обязанности. Но одновременно с этим он лишается и преимуществ, которые дает большинство организаций: подписки на библиометрические базы, доступа к лабораторному оборудованию и т.д.
Иногда такие исследователи работают по грантам, полученным в том числе от крупных организаций. Согласно недавнему исследованию Лунда, Шамси и др., четверть независимых авторов (по данным Web of Science) получали (и указывали) финансирование в своей работе. Большинство грантодателей — государственные органы, имеющие отношение к здравоохранению, и фармацевтические компании. Это вполне соответствует предметной разбивке работ: почти 20% посвящены челюстно-лицевой хирургии и стоматологии, а всего в топ-10 по областям присутствует только одна сфера, не относящаяся к медицине — инженерное дело.
Почти половина (45%) независимых исследователей работают в США, далее следуют Германия и Великобритания. Характерно, что азиатских стран несмотря на общую высокую продуктивность в топ-10 нет.
Мы решили провести похожий анализ, основываясь на данных OpenAlex. Изначальный запрос был сформулирован как «работы, для которых raw_affiliation_strings (текстовое указание аффилиации) содержит слово «independent», начиная с 2018 года». Таких оказалось больше 70 тысяч. Затем мы отфильтровали авторов, у которых все-таки указана аффилиация, и оставили только тех, кто указал в соответствующем поле «independent researcher | scientist | consultant | scholar | advisor». В группировке по работам осталось более 22550 публикаций, написанных 16886 учеными — для сравнения, в исследовании по Web of Science число публикаций 3357. Большую часть публикаций составляют статьи (17577).
География исследователей такова: большинство (более 4 тысяч), как и в вышеупомянутой работе, ведут свою деятельность в США, затем идут Великобритания (3380) и Индия (1960). Наиболее продуктивный автор — Генри Гарретт, весьма активно прибегающий к публикации препринтов, у которого сразу 238 работ в качестве независимого исследователя.
Что касается предметных областей — картина довольно сильно отличается от результатов исследования Лунда, Шамси и др. Большая часть публикаций, согласно OpenAlex, относится к сфере социальных наук (почти 12 тысяч), а вот на долю наук о здоровье приходится всего около 6700 работ (на приведенном ниже графике отражено подробное распределение публикаций по областям).
#аналитика #независимыеисследователи #OpenAlex
Помимо анонимных авторов, о которых мы писали в одном из предыдущих постов, существует еще одна нестандартная группа авторов — независимые исследователи. Это ученые, не имеющие или не указавшие в своей работе аффилиации с какой-либо организацией. Такое положение имеет свои плюсы: исследователь может полностью сосредоточиться на своем исследовании, не отвлекаясь на преподавание или административные обязанности. Но одновременно с этим он лишается и преимуществ, которые дает большинство организаций: подписки на библиометрические базы, доступа к лабораторному оборудованию и т.д.
Иногда такие исследователи работают по грантам, полученным в том числе от крупных организаций. Согласно недавнему исследованию Лунда, Шамси и др., четверть независимых авторов (по данным Web of Science) получали (и указывали) финансирование в своей работе. Большинство грантодателей — государственные органы, имеющие отношение к здравоохранению, и фармацевтические компании. Это вполне соответствует предметной разбивке работ: почти 20% посвящены челюстно-лицевой хирургии и стоматологии, а всего в топ-10 по областям присутствует только одна сфера, не относящаяся к медицине — инженерное дело.
Почти половина (45%) независимых исследователей работают в США, далее следуют Германия и Великобритания. Характерно, что азиатских стран несмотря на общую высокую продуктивность в топ-10 нет.
Мы решили провести похожий анализ, основываясь на данных OpenAlex. Изначальный запрос был сформулирован как «работы, для которых raw_affiliation_strings (текстовое указание аффилиации) содержит слово «independent», начиная с 2018 года». Таких оказалось больше 70 тысяч. Затем мы отфильтровали авторов, у которых все-таки указана аффилиация, и оставили только тех, кто указал в соответствующем поле «independent researcher | scientist | consultant | scholar | advisor». В группировке по работам осталось более 22550 публикаций, написанных 16886 учеными — для сравнения, в исследовании по Web of Science число публикаций 3357. Большую часть публикаций составляют статьи (17577).
География исследователей такова: большинство (более 4 тысяч), как и в вышеупомянутой работе, ведут свою деятельность в США, затем идут Великобритания (3380) и Индия (1960). Наиболее продуктивный автор — Генри Гарретт, весьма активно прибегающий к публикации препринтов, у которого сразу 238 работ в качестве независимого исследователя.
Что касается предметных областей — картина довольно сильно отличается от результатов исследования Лунда, Шамси и др. Большая часть публикаций, согласно OpenAlex, относится к сфере социальных наук (почти 12 тысяч), а вот на долю наук о здоровье приходится всего около 6700 работ (на приведенном ниже графике отражено подробное распределение публикаций по областям).
#аналитика #независимыеисследователи #OpenAlex
Retracted Articles: от репутационных проблем к аналитике по областям
Совсем недавно Wiley, авторитетное издание с двухсотлетней историей, анонсировало закрытие 19 научных журналов. Wiley сообщило, что за последние 2 года из журналов издательства были отозваны 11 300 недобросовестных исследований, 8 000 из которых относились к издательству Hindawi (в 2021 году Hindawi было выкуплено Wiley, однако после такой массовой ретракции компания Wiley объявила, что прекратит использовать бренд Hindawi, а 200 оставшихся журналов включит в свой основной портфель).
По данным Nature в перечень лидирующих стран по количеству отозванных статей за последние два десятилетия входят Саудовская Аравия, Пакистан, Россия и Китай. Согласно приведенной в заметке статистике, в Саудовской Аравии на 10 тысяч публикаций приходится в среднем 30,6 ретракций, далее следует Пакистан (28,1) и Россия (24,9), на долю Китая приходится 23,5 ретракций. При этом медианное значение колеблется около 5 на 10 000.
В связи с постоянно растущим интересом к этой теме (заметки в Scholary Kitchen, Nature, Times, проверки отозванных статей со стороны департамента науки министерства образования Китая) мы решили проанализировать количество отозванных статей в разрезе по областям на базе OpenAlex, которая как раз в марте провела довольно масштабную работу по обновлению базы отозванных статей и исправлению ложноположительных результатов.
Самый актуальный вопрос для исследования, пожалуй, заключается в том, является ли большое количество отозванных статей в рамках издательства или журнала признаком его низкого качества? В целом, можно предположить, что если статьи массово отзываются, особенно в рамках издательства или отдельного журнала, то это означает, что постпечатная проверка (или внимание публики к вышедшим материалам) по качеству превосходит проверку перед публикацией, то есть проблемы связаны преимущественно с рецензированием.
С точки зрения областей наук тенденции вполне предсказуемые — большинство отозванных работ относятся к естественным наукам, в частности, биохимии, молекулярной биологии и медицине, почти столько же в сумме составляют публикации по инженерному делу и компьютерным наукам.
В этих областях есть много нюансов. Так, например, помимо заведомого нарушения правил подготовки публикации и недобросовестного отношения к подбору материала, многие кейсы, описанные в статьях по медицине, посвящены ранним исследованиям COVID-19. После получения более широкой выборки результаты стали заведомо неточными, и часть авторов сами отозвали свои публикации. Похожие случаи встречаются и в области компьютерных наук: например, если метод или систему, предложенные в статье, не получилось масштабировать, такие статьи также отзываются по просьбе автора. В случае несогласия авторов с решением редколлегии это, как правило, отмечается в сопутствующей заметке.
Мы сделали treemap-диаграмму по статьям, помеченным как отозванные в базе данных OpenAlex. Всего таких 46 тысяч, из них мы выбрали около 19 тысяч — те, что были написаны с 2019 по 2023 гг. С интерактивной версией диаграммы вы можете ознакомиться по ссылке.
#аналитика #openalex #ретракция
Совсем недавно Wiley, авторитетное издание с двухсотлетней историей, анонсировало закрытие 19 научных журналов. Wiley сообщило, что за последние 2 года из журналов издательства были отозваны 11 300 недобросовестных исследований, 8 000 из которых относились к издательству Hindawi (в 2021 году Hindawi было выкуплено Wiley, однако после такой массовой ретракции компания Wiley объявила, что прекратит использовать бренд Hindawi, а 200 оставшихся журналов включит в свой основной портфель).
По данным Nature в перечень лидирующих стран по количеству отозванных статей за последние два десятилетия входят Саудовская Аравия, Пакистан, Россия и Китай. Согласно приведенной в заметке статистике, в Саудовской Аравии на 10 тысяч публикаций приходится в среднем 30,6 ретракций, далее следует Пакистан (28,1) и Россия (24,9), на долю Китая приходится 23,5 ретракций. При этом медианное значение колеблется около 5 на 10 000.
В связи с постоянно растущим интересом к этой теме (заметки в Scholary Kitchen, Nature, Times, проверки отозванных статей со стороны департамента науки министерства образования Китая) мы решили проанализировать количество отозванных статей в разрезе по областям на базе OpenAlex, которая как раз в марте провела довольно масштабную работу по обновлению базы отозванных статей и исправлению ложноположительных результатов.
Самый актуальный вопрос для исследования, пожалуй, заключается в том, является ли большое количество отозванных статей в рамках издательства или журнала признаком его низкого качества? В целом, можно предположить, что если статьи массово отзываются, особенно в рамках издательства или отдельного журнала, то это означает, что постпечатная проверка (или внимание публики к вышедшим материалам) по качеству превосходит проверку перед публикацией, то есть проблемы связаны преимущественно с рецензированием.
С точки зрения областей наук тенденции вполне предсказуемые — большинство отозванных работ относятся к естественным наукам, в частности, биохимии, молекулярной биологии и медицине, почти столько же в сумме составляют публикации по инженерному делу и компьютерным наукам.
В этих областях есть много нюансов. Так, например, помимо заведомого нарушения правил подготовки публикации и недобросовестного отношения к подбору материала, многие кейсы, описанные в статьях по медицине, посвящены ранним исследованиям COVID-19. После получения более широкой выборки результаты стали заведомо неточными, и часть авторов сами отозвали свои публикации. Похожие случаи встречаются и в области компьютерных наук: например, если метод или систему, предложенные в статье, не получилось масштабировать, такие статьи также отзываются по просьбе автора. В случае несогласия авторов с решением редколлегии это, как правило, отмечается в сопутствующей заметке.
Мы сделали treemap-диаграмму по статьям, помеченным как отозванные в базе данных OpenAlex. Всего таких 46 тысяч, из них мы выбрали около 19 тысяч — те, что были написаны с 2019 по 2023 гг. С интерактивной версией диаграммы вы можете ознакомиться по ссылке.
#аналитика #openalex #ретракция
Дайджест: май 2024
Представляем свежий дайджест научных событий за последний месяц.
Научные события
- 30-31 мая проходит первая виртуальная конференция OpenAlex. Пользователи и разработчики делились опытом и планами на будущее. Презентации и запись можно будет найти на сайте и на YouTube-канале OurResearch (а мы скоро выпустим обзор по итогам).
- Объявлена тема Peer Review Week 2024: «Инновации и технологии в рецензировании». Об этом на Scholarly Kitchen написали организаторы события. К участию приглашаются все, кто так или иначе связан с процессом рецензирования. Судя по прошлому году, стоит ожидать вебинаров, хакатонов, онлайн-конференций, открытых дискуссий и не только.
Редакторская политика
- В Scientometrics вышла статья, анализирующая, влияет ли текст грантовой заявки на итог ее рассмотрения. Оказалось, что оценка заявки очень мало зависит от самого текста — если эксперты видят только короткую аннотацию, то их вердикт почти не меняется.
- Как мы (и некоторые наши коллеги) упоминали ранее, в этом месяце издательство Wiley анонсировало закрытие 19 журналов, что стало прямым следствием массового отзыва статей. Список журналов, которые прекратят выпускаться, можно найти на сайте Hindawi.
- IOP Publishing провели опрос насчет эффективности внедрения инструментов ИИ в процесс рецензирования. В опросе приняли более 3000 ученых. Согласно результатам, лишь 29% из опрошенных ученых считают, что внедрение ИИ окажет положительный эффект, 35% респондентов выказали негативное отношение к ИИ, а 36% убеждены, что внедрение ИИ не окажет никакого эффекта.
Базы данных
- В Quantitative Science Studies опубликовано достаточно подробное сравнение метаданных в восьми открытых библиометрических базах: Crossref, Dimensions, Google Scholar, Microsoft Academic, OpenAlex, Scilit, Semantic Scholar и The Lens. Авторы исследования показывают, что сторонние базы данных (Dimensions, OpenAlex, Scilit и The Lens) имеют более высокое количество и качество метаданных, чем академические поисковые системы (Google Scholar, Microsoft Academic и Semantic Scholar).
- Clarivate анонсировала новый продукт — Web of Science Research Intelligence. Судя по рекламному описанию, это инструмент для создания дэшбордов с интегрированным ИИ и рекомендательной системой.
Наука в России
- Число высокоцитируемых (по данным Clarivate) ученых из РФ сократилось до восьми, сообщает Институт статистических исследований и экономики знаний (ИСИЭЗ) НИУ ВШЭ.
- Коллеги из НЖБД подвели предварительный итог по количеству публикаций российских авторов в Scopus — их чуть больше 88 тысяч. С 2021 года их количество незначительно снижалось, при том, что количество российских журналов в Scopus за последние пять лет заметно увеличилось.
- 6 мая был утвержден перечень поручений Президента по итогам мероприятий к 300-летию РАН, а 8 мая вышел указ, в котором заявлено создание отечественной системы мониторинга публикаций в области социальных и гуманитарных наук, причем эта система должна быть независимой от зарубежных рейтингов показателей (п. 11, пп. “в”).
- Определены победители десятого конкурса программы мегагрантов: восемь проектов под руководством ведущих ученых и два проекта молодых перспективных ученых. Со списком можно ознакомиться на сайте Минобрнауки РФ.
- Электронная библиотека eLibrary добавила сервис поиска близких по тематике публикаций с применением нейросети SciRus-tiny, разработанной в Институте ИИ МГУ. Система автоматически подбирает документы, максимально близкие по тематической направленности. Поиск реализован на странице с описанием публикации (пункт «Найти близкие по тематике публикации» в панели «Инструменты»).
#дайджест #новости #редакторскаяполитика #базыданных #наукавроссии #OpenAlex #искуственныйинтеллект
Представляем свежий дайджест научных событий за последний месяц.
Научные события
- 30-31 мая проходит первая виртуальная конференция OpenAlex. Пользователи и разработчики делились опытом и планами на будущее. Презентации и запись можно будет найти на сайте и на YouTube-канале OurResearch (а мы скоро выпустим обзор по итогам).
- Объявлена тема Peer Review Week 2024: «Инновации и технологии в рецензировании». Об этом на Scholarly Kitchen написали организаторы события. К участию приглашаются все, кто так или иначе связан с процессом рецензирования. Судя по прошлому году, стоит ожидать вебинаров, хакатонов, онлайн-конференций, открытых дискуссий и не только.
Редакторская политика
- В Scientometrics вышла статья, анализирующая, влияет ли текст грантовой заявки на итог ее рассмотрения. Оказалось, что оценка заявки очень мало зависит от самого текста — если эксперты видят только короткую аннотацию, то их вердикт почти не меняется.
- Как мы (и некоторые наши коллеги) упоминали ранее, в этом месяце издательство Wiley анонсировало закрытие 19 журналов, что стало прямым следствием массового отзыва статей. Список журналов, которые прекратят выпускаться, можно найти на сайте Hindawi.
- IOP Publishing провели опрос насчет эффективности внедрения инструментов ИИ в процесс рецензирования. В опросе приняли более 3000 ученых. Согласно результатам, лишь 29% из опрошенных ученых считают, что внедрение ИИ окажет положительный эффект, 35% респондентов выказали негативное отношение к ИИ, а 36% убеждены, что внедрение ИИ не окажет никакого эффекта.
Базы данных
- В Quantitative Science Studies опубликовано достаточно подробное сравнение метаданных в восьми открытых библиометрических базах: Crossref, Dimensions, Google Scholar, Microsoft Academic, OpenAlex, Scilit, Semantic Scholar и The Lens. Авторы исследования показывают, что сторонние базы данных (Dimensions, OpenAlex, Scilit и The Lens) имеют более высокое количество и качество метаданных, чем академические поисковые системы (Google Scholar, Microsoft Academic и Semantic Scholar).
- Clarivate анонсировала новый продукт — Web of Science Research Intelligence. Судя по рекламному описанию, это инструмент для создания дэшбордов с интегрированным ИИ и рекомендательной системой.
Наука в России
- Число высокоцитируемых (по данным Clarivate) ученых из РФ сократилось до восьми, сообщает Институт статистических исследований и экономики знаний (ИСИЭЗ) НИУ ВШЭ.
- Коллеги из НЖБД подвели предварительный итог по количеству публикаций российских авторов в Scopus — их чуть больше 88 тысяч. С 2021 года их количество незначительно снижалось, при том, что количество российских журналов в Scopus за последние пять лет заметно увеличилось.
- 6 мая был утвержден перечень поручений Президента по итогам мероприятий к 300-летию РАН, а 8 мая вышел указ, в котором заявлено создание отечественной системы мониторинга публикаций в области социальных и гуманитарных наук, причем эта система должна быть независимой от зарубежных рейтингов показателей (п. 11, пп. “в”).
- Определены победители десятого конкурса программы мегагрантов: восемь проектов под руководством ведущих ученых и два проекта молодых перспективных ученых. Со списком можно ознакомиться на сайте Минобрнауки РФ.
- Электронная библиотека eLibrary добавила сервис поиска близких по тематике публикаций с применением нейросети SciRus-tiny, разработанной в Институте ИИ МГУ. Система автоматически подбирает документы, максимально близкие по тематической направленности. Поиск реализован на странице с описанием публикации (пункт «Найти близкие по тематике публикации» в панели «Инструменты»).
#дайджест #новости #редакторскаяполитика #базыданных #наукавроссии #OpenAlex #искуственныйинтеллект
Конференция OpenAlex: по горячим следам
Как мы уже упоминали, 30 и 31 мая состоялась первая онлайн-конференция OpenAlex. Мы внимательно наблюдали за ней (и даже задали пару вопросов), и хотим поделиться кратким описанием докладов и новостей, которые показались нам наиболее интересными.
День 1:
1️⃣ В первой секции сделали доклады Джессика Эдвардс (библиотекарь Columbia University) и Сильвия Орнер (библиотекарь University of Scranton). Их презентации были посвящены специфике применения OpenAlex в работе университетских библиотек. Энди Херцог (библиотекарь University of Minnesota) рассказал о том, как интегрировал OA в систему управления научной информацией в библиотеке своего университета.
2️⃣ Во второй секции был представлен доклад Дэниела Санфельда (доцент Universidade de Brasilia), посвященный Laguna — бразильскому data lake, который может строить сети цитирований с использованием облачных вычислений. Александр Гейтс (научный сотрудник University of Virginia School of Data Science) на основе данных OA проанализировал, как фрагментирование глобальной науки ограничивает распространение идей: например, как скоро концепция после упоминания в одной стране появляется в другой.
3️⃣ В третьей секции Саджад Эбрахими (Toronto Metropolitan University) презентовал работу своей компании — это Reviewer.ly, приложение для поиска рецензентов. Чем-то похоже на нынешнюю версию интерфейса OA, но с большим упором на визуализацию, в особенности сетей коллабораций и облака слов. Еще один инструмент для визуализации, Complemetrix, представил Альберт Диас-Гилера (Universidad de Barcelona). Двое докладчиков рассказывали про scite.ai: Шон Райф, сооснователь компании, предложил подход к построению рейтингов на основе OA, а Рикардо Хартли (Universidad Central de Chile) рассказал о непосредственном применении scite.
Завершили первый день конференции Кайл Демес и Джейсон Портеной из компании OurResearch, которая разработала OpenAlex. Они подвели итоги и поделились последними результатами и планами компании. В частности, буквально в последние недели были реализованы: стемминг поисковых запросов (теперь поисковой движок должен воспринимать различные словоформы) и интеграция с Retraction Watch. В ближайшее время планируется добавить: метаданные финансирующих учреждений, выбор полей для экспорта, новые опции поиска и новые фильтры, настраиваемые группы и взвешенный citation impact для различных предметных областей. Чуть позже будут реализованы визуализация и аналитические инструменты внутри OpenAlex, дополнительные поля, помимо количества, в группировке (group-by), больше источников, больше метрик, больше грантов и больше встреч пользователей.
День 2:
1️⃣ Во второй день было больше докладов от институтов и аналитических заметок. В первой секции доклады представили Самуэль Мок (библиотекарь University of Twente) и Сара Критцлер (библиотекарь Duisburg-Essen University) — они рассказали о своих проектах, посвященных унификации метаданных и созданию кастомизированных библиометрических отчетов. Присутствовал также Эрик Жанжирар, представитель Министерства высшего образования и науки Франции, команда которого работает над Works Magnet — инструментом для курирования метаданных.
2️⃣ Во второй секции была презентация Нееса Яна ван Эка (CWTS Leiden University) о визуализации данных OA при помощи VOSViewer. Ян Хан (The University of Arizona) рассказал об использовании OA для измерении вклада научных сотрудников университета.
3️⃣ В третьей секции интересный доклад представила Малгожата Лагиш (University of South Wales) — о больших научных коллективах и их вкладе в большую науку. И, наконец, Паскаль Поплен и Амели Черч (Sorbonne Université) рассказали об опыте полного перехода со Scopus на OpenAlex, который не так давно предприняла Сорбонна.
Программу конференции можно найти на сайте OpenAlex. Там же чуть позже будут размещены презентации докладчиков и запись эфира.
#openalex #конференция
Как мы уже упоминали, 30 и 31 мая состоялась первая онлайн-конференция OpenAlex. Мы внимательно наблюдали за ней (и даже задали пару вопросов), и хотим поделиться кратким описанием докладов и новостей, которые показались нам наиболее интересными.
День 1:
1️⃣ В первой секции сделали доклады Джессика Эдвардс (библиотекарь Columbia University) и Сильвия Орнер (библиотекарь University of Scranton). Их презентации были посвящены специфике применения OpenAlex в работе университетских библиотек. Энди Херцог (библиотекарь University of Minnesota) рассказал о том, как интегрировал OA в систему управления научной информацией в библиотеке своего университета.
2️⃣ Во второй секции был представлен доклад Дэниела Санфельда (доцент Universidade de Brasilia), посвященный Laguna — бразильскому data lake, который может строить сети цитирований с использованием облачных вычислений. Александр Гейтс (научный сотрудник University of Virginia School of Data Science) на основе данных OA проанализировал, как фрагментирование глобальной науки ограничивает распространение идей: например, как скоро концепция после упоминания в одной стране появляется в другой.
3️⃣ В третьей секции Саджад Эбрахими (Toronto Metropolitan University) презентовал работу своей компании — это Reviewer.ly, приложение для поиска рецензентов. Чем-то похоже на нынешнюю версию интерфейса OA, но с большим упором на визуализацию, в особенности сетей коллабораций и облака слов. Еще один инструмент для визуализации, Complemetrix, представил Альберт Диас-Гилера (Universidad de Barcelona). Двое докладчиков рассказывали про scite.ai: Шон Райф, сооснователь компании, предложил подход к построению рейтингов на основе OA, а Рикардо Хартли (Universidad Central de Chile) рассказал о непосредственном применении scite.
Завершили первый день конференции Кайл Демес и Джейсон Портеной из компании OurResearch, которая разработала OpenAlex. Они подвели итоги и поделились последними результатами и планами компании. В частности, буквально в последние недели были реализованы: стемминг поисковых запросов (теперь поисковой движок должен воспринимать различные словоформы) и интеграция с Retraction Watch. В ближайшее время планируется добавить: метаданные финансирующих учреждений, выбор полей для экспорта, новые опции поиска и новые фильтры, настраиваемые группы и взвешенный citation impact для различных предметных областей. Чуть позже будут реализованы визуализация и аналитические инструменты внутри OpenAlex, дополнительные поля, помимо количества, в группировке (group-by), больше источников, больше метрик, больше грантов и больше встреч пользователей.
День 2:
1️⃣ Во второй день было больше докладов от институтов и аналитических заметок. В первой секции доклады представили Самуэль Мок (библиотекарь University of Twente) и Сара Критцлер (библиотекарь Duisburg-Essen University) — они рассказали о своих проектах, посвященных унификации метаданных и созданию кастомизированных библиометрических отчетов. Присутствовал также Эрик Жанжирар, представитель Министерства высшего образования и науки Франции, команда которого работает над Works Magnet — инструментом для курирования метаданных.
2️⃣ Во второй секции была презентация Нееса Яна ван Эка (CWTS Leiden University) о визуализации данных OA при помощи VOSViewer. Ян Хан (The University of Arizona) рассказал об использовании OA для измерении вклада научных сотрудников университета.
3️⃣ В третьей секции интересный доклад представила Малгожата Лагиш (University of South Wales) — о больших научных коллективах и их вкладе в большую науку. И, наконец, Паскаль Поплен и Амели Черч (Sorbonne Université) рассказали об опыте полного перехода со Scopus на OpenAlex, который не так давно предприняла Сорбонна.
Программу конференции можно найти на сайте OpenAlex. Там же чуть позже будут размещены презентации докладчиков и запись эфира.
#openalex #конференция
Королевство пустых зеркал
В рамках нашей рубрики #историянаукометрии мы уже не раз показывали, что наука о науке не сразу обрела собственный предмет.
В дискуссии, получившей название «Как перестать беспокоиться и полюбить реферируемые журналы», А. Космарский отметил, что наукометрия как способ изучения работы научных практик может быть интересна в двух перспективах. С одной стороны, интерес к изучению науки как самостоятельного предмета может быть внутренней практикой самой науки, ее саморефлексией над происходящими внутри науки процессами. С другой стороны, в ней заинтересованы внешние по отношению к науке лица, например, государство, которое может прибегать к использованию продуктов наукометрии для (не-)эффективного администрирования процессов самой науки.
Т. Франссен и П. Воутерс в своем исследовании об изменениях использования библиометрии подчеркивают, что две эти перспективы в отношении гуманитарных наук последовательно сменяют друг друга: с 1960-х по 1980-е годы библиометрия является частью социологической оптики для изучения внутринаучных процессов, в то время как с 1980-х годов библиометрия начинает в большей степени рассматриваться как эмпирический материал для формирования научных политик и оценки исследований.
Учитывая наш личный интерес к теме, мы не могли пройти мимо анонса нашего коллеги Андрея Герасимова, который приглашает принять участие в конференции «Королевство пустых зеркал: социальные исследования социальных наук». Конференция, которая пройдет в Шанинке и онлайн, будет посвящена как эмпирическим исследованиям, реконструирующим путь становления наук и изменения их формы, так и теоретическим подходам к научной самообъективации. Направления конференции затронут в первую очередь разные социологические подходы, будь то исследования социо-гуманитарного знания в СССР, интеллектуалов, подходов к социальным наукам или социология социологии. Кроме того, одним из заявленных направлений, которое может особенно заинтересовать наших постоянных читателей, выступит наукометрическая перпектива (а также ее враги!): как цифры характеризуют нынешнее положение социальной науки, а также при помощи каких практик наука изучает эти цифры?
Мы же, по обыкновению, решили посмотреть, как схожие темы представлены в OpenAlex. Выборку было решено делать по концепциям, а не по недавно появившимся тематикам, поскольку только среди концепций удалось найти соответствующие пункты. Для анализа мы выбрали следующие концепции: Scientific integrity, Scientific thinking, Scientific evidence, Sociology of knowledge, Scientific modelling, Scientific reasoning, History of science, Scientific society, Scientific revolution, Scientific method, Scientometrics, Scientific progress, Science studies, Sociology of scientific knowledge, Scientific theory, Informetrics, порог балла связи (score) 0,5, временной период — с 2014 по 2024 гг. Результаты представлены на диаграмме (есть и интерактивная версия). Больше всего как цитирований, так и публикаций насчитывает наукометрия — более 3 тысяч статей были процитированы почти 25 тысяч раз. Сразу обращают на себя внимание концепции «научное доказательство» (scientific evidence) и история науки — публикаций по каждой из концепций около 2 тысяч, но при этом цитирований у первой более 20 тысяч, а у второй — всего 5479.
#конференция #OpenAlex #аналитика
В рамках нашей рубрики #историянаукометрии мы уже не раз показывали, что наука о науке не сразу обрела собственный предмет.
В дискуссии, получившей название «Как перестать беспокоиться и полюбить реферируемые журналы», А. Космарский отметил, что наукометрия как способ изучения работы научных практик может быть интересна в двух перспективах. С одной стороны, интерес к изучению науки как самостоятельного предмета может быть внутренней практикой самой науки, ее саморефлексией над происходящими внутри науки процессами. С другой стороны, в ней заинтересованы внешние по отношению к науке лица, например, государство, которое может прибегать к использованию продуктов наукометрии для (не-)эффективного администрирования процессов самой науки.
Т. Франссен и П. Воутерс в своем исследовании об изменениях использования библиометрии подчеркивают, что две эти перспективы в отношении гуманитарных наук последовательно сменяют друг друга: с 1960-х по 1980-е годы библиометрия является частью социологической оптики для изучения внутринаучных процессов, в то время как с 1980-х годов библиометрия начинает в большей степени рассматриваться как эмпирический материал для формирования научных политик и оценки исследований.
Учитывая наш личный интерес к теме, мы не могли пройти мимо анонса нашего коллеги Андрея Герасимова, который приглашает принять участие в конференции «Королевство пустых зеркал: социальные исследования социальных наук». Конференция, которая пройдет в Шанинке и онлайн, будет посвящена как эмпирическим исследованиям, реконструирующим путь становления наук и изменения их формы, так и теоретическим подходам к научной самообъективации. Направления конференции затронут в первую очередь разные социологические подходы, будь то исследования социо-гуманитарного знания в СССР, интеллектуалов, подходов к социальным наукам или социология социологии. Кроме того, одним из заявленных направлений, которое может особенно заинтересовать наших постоянных читателей, выступит наукометрическая перпектива (а также ее враги!): как цифры характеризуют нынешнее положение социальной науки, а также при помощи каких практик наука изучает эти цифры?
Мы же, по обыкновению, решили посмотреть, как схожие темы представлены в OpenAlex. Выборку было решено делать по концепциям, а не по недавно появившимся тематикам, поскольку только среди концепций удалось найти соответствующие пункты. Для анализа мы выбрали следующие концепции: Scientific integrity, Scientific thinking, Scientific evidence, Sociology of knowledge, Scientific modelling, Scientific reasoning, History of science, Scientific society, Scientific revolution, Scientific method, Scientometrics, Scientific progress, Science studies, Sociology of scientific knowledge, Scientific theory, Informetrics, порог балла связи (score) 0,5, временной период — с 2014 по 2024 гг. Результаты представлены на диаграмме (есть и интерактивная версия). Больше всего как цитирований, так и публикаций насчитывает наукометрия — более 3 тысяч статей были процитированы почти 25 тысяч раз. Сразу обращают на себя внимание концепции «научное доказательство» (scientific evidence) и история науки — публикаций по каждой из концепций около 2 тысяч, но при этом цитирований у первой более 20 тысяч, а у второй — всего 5479.
#конференция #OpenAlex #аналитика
История библиометрических баз данных и их разновидностей. Часть 1
Научные базы данных обеспечивают доступность и систематизацию растущего потока статей, материалов конференций, патентов и других исследований. Сегодня обращение к Web of Science, Scopus или другим базам данных для поиска статей — рутина любого исследователя. Мы используем базы данных, не придавая большого значения их различиям и не задумываясь об истории их появления. В сегодняшнем посте, посвященном истории наукометрии, мы посмотрим, как происходило становление баз данных, окружающих нас сегодня.
#историянаукометрии #Scopus #WoS #MAG #OpenAlex
Научные базы данных обеспечивают доступность и систематизацию растущего потока статей, материалов конференций, патентов и других исследований. Сегодня обращение к Web of Science, Scopus или другим базам данных для поиска статей — рутина любого исследователя. Мы используем базы данных, не придавая большого значения их различиям и не задумываясь об истории их появления. В сегодняшнем посте, посвященном истории наукометрии, мы посмотрим, как происходило становление баз данных, окружающих нас сегодня.
#историянаукометрии #Scopus #WoS #MAG #OpenAlex
Telegraph
История библиометрических баз данных и их разновидностей. Часть 1
Использование обширных цифровых баз данных стало неотъемлемым элементом академической деятельности. Они позволяют не только искать материалы в отдельных областях, но и отслеживать публикационную активность, а также проводить сложные аналитические исследования…
Гендерная гомофилия — исследование RSCI
Недавно мы писали об исследовании гендерной гомофилии, опубликованном в PLoS ONE. Нас заинтересовало более актуальное положение в различных научных областях, прежде всего по российским источникам. Мы решили проанализировать публикации 2023 года на предмет гендерного распределения исследователей, основываясь на данных OpenAlex. Выборка состояла из журналов RSCI (включая их переводные версии).
Наш исходный датасет включал 42 353 публикации со следующими параметрами: тип публикации "article"; не менее двух авторов, год публикации = 2023. Для определения предполагаемого пола авторов использовался пакет gender в R, который рассчитывает вероятность того, является ли имя мужским или женским, основываясь на данных за 1932-2012 гг. Для имен, которые не удалось распознать, дополнительно анализировалось родовое окончание фамилии. Всего в рассматриваемом датасете оказалось 187 303 автора, из которых 60 802 — женщины, 66 233 — мужчины, у 60 268 пол не был распознан. Последний результат частично связан с несовершенством метаданных в OpenAlex, но в большой степени со страновыми особенностями. Во-первых, пакет gender довольно часто не распознает азиатские и ближневосточные имена; во-вторых, в ряде стран (например, в Индии) принято указывать только инициалы и фамилию, что делает распознавание имени невозможным.
Итоговый массив составляет 18 238 публикаций, для которых распознан пол всех авторов. В нем мы выявили 3 079 публикаций, написанных чисто женскими коллективами, 3 940 — чисто мужскими. В 3 494 случаях число мужчин и женщин среди авторов было одинаковым. Также выяснилось, что чисто мужские коллективы обычно незначительно крупнее, чем чисто женские — 2,29 авторов-мужчин и 2,27 авторов-женщин в среднем.
Показательным также оказалось распределение по предметным областям. Наибольший разрыв по-прежнему сохраняется в инженерных дисциплинах — мужских коллективов более чем в два раза больше, чем женских, тогда как во всех науках о здоровье, включая общую медицину, число авторских женских коллективов значительно превосходит число мужских (причем это характерно только для нашей выборки по журналам RSCI — на общемировой выборке женщины имеют преимущество только в сестринском деле, общих науках о здоровье и нейронауках, причем перевес незначителен).
#аналитика #гомофилия #соавторство #OpenAlex
Недавно мы писали об исследовании гендерной гомофилии, опубликованном в PLoS ONE. Нас заинтересовало более актуальное положение в различных научных областях, прежде всего по российским источникам. Мы решили проанализировать публикации 2023 года на предмет гендерного распределения исследователей, основываясь на данных OpenAlex. Выборка состояла из журналов RSCI (включая их переводные версии).
Наш исходный датасет включал 42 353 публикации со следующими параметрами: тип публикации "article"; не менее двух авторов, год публикации = 2023. Для определения предполагаемого пола авторов использовался пакет gender в R, который рассчитывает вероятность того, является ли имя мужским или женским, основываясь на данных за 1932-2012 гг. Для имен, которые не удалось распознать, дополнительно анализировалось родовое окончание фамилии. Всего в рассматриваемом датасете оказалось 187 303 автора, из которых 60 802 — женщины, 66 233 — мужчины, у 60 268 пол не был распознан. Последний результат частично связан с несовершенством метаданных в OpenAlex, но в большой степени со страновыми особенностями. Во-первых, пакет gender довольно часто не распознает азиатские и ближневосточные имена; во-вторых, в ряде стран (например, в Индии) принято указывать только инициалы и фамилию, что делает распознавание имени невозможным.
Итоговый массив составляет 18 238 публикаций, для которых распознан пол всех авторов. В нем мы выявили 3 079 публикаций, написанных чисто женскими коллективами, 3 940 — чисто мужскими. В 3 494 случаях число мужчин и женщин среди авторов было одинаковым. Также выяснилось, что чисто мужские коллективы обычно незначительно крупнее, чем чисто женские — 2,29 авторов-мужчин и 2,27 авторов-женщин в среднем.
Показательным также оказалось распределение по предметным областям. Наибольший разрыв по-прежнему сохраняется в инженерных дисциплинах — мужских коллективов более чем в два раза больше, чем женских, тогда как во всех науках о здоровье, включая общую медицину, число авторских женских коллективов значительно превосходит число мужских (причем это характерно только для нашей выборки по журналам RSCI — на общемировой выборке женщины имеют преимущество только в сестринском деле, общих науках о здоровье и нейронауках, причем перевес незначителен).
#аналитика #гомофилия #соавторство #OpenAlex
FWCI в OpenAlex: первые пробы
12 августа 2024 OpenAlex добавил к своим показателям FWCI (Field-weighted Citation Impact — индекс цитирования, взвешенный по области науки). Рассчитывается он как и в других случаях через отношение количества цитирований за три года (плюс год публикации) к ожидаемому количеству цитирований по данному типу и предметной области (в OpenAlex используется третий по детализации уровень классификации — subfield).
Изначально FWCI появился в SciVal как одна из snowball-метрик. В Web of Science есть аналогичная метрика — CNCI (Category Normalized Citation Impact), однако исследователи давно заметили, что показатели FWCI и CNCI для одной и той же публикации различаются — иногда значительно. Это связано с рядом причин:
🔸 разный охват баз данных Web of Science и Scopus, и, следовательно, разное количество индексируемых цитат;
🔸 различия в предметных классификаторах;
🔸 способ расчета CNCI и FWCI для публикаций, которые относятся к более чем одной предметной области.
У OpenAlex есть своя специфика в расчете FWCI:
1. База в принципе содержит больше данных и включает в себя множество работ без цитирований — это снижает средние ожидаемые значения цитирования, поэтому цитируемые работы, скорее всего, будут иметь более высокие значения FWCI в OpenAlex.
2. У OpenAlex принципиально другой подход к классификации — тематика (primary topic), по которой нормализуется цитируемость, присваивается публикации, а не журналу. Поэтому FWCI/CNCI, нормализованный по предметным областям журналов, может значительно отличаться от FWCI согласно OpenAlex.
3. В OpenAlex датой публикации считается дата, когда публикация впервые появилась в сети. Однако дата выхода периодического издания может быть на год позже сетевой публикации, что влияет на окно цитируемости.
Небольшой пробный анализ мы сделали на недавнем массиве публикаций, которые мы использовали для анализа гендерной гомофилии (тип публикации "article", год публикации 2023, выборка из журналов RSCI, включая переводные версии). Общее количество таких публикаций на данный момент составляет 56 641. 47 359 (!) публикаций имеют нулевой FCWI, при этом у 2261 работы ненулевая цитируемость.
На графике визуализированы 25 наиболее популярных областей (то есть таких, в которых количество работ было наибольшим — разброс составил от 565 до 1751 публикаций: по инфекционным заболеваниям и по социологии и политическим наукам соответственно). Нулевые значения FWCI убраны из рассмотрения, поскольку сильно смещают график вниз; также удалено 46 выбросов (с FWCI от 10,03 до 146,352; наибольшее значение у статьи под названием "2021 ESC Guidelines for the diagnosis and treatment of acute and chronic heart failure", опубликованной в Российском Кардиологическим журнале).
Области, в которых основной массив публикаций располагается выше 1, можно считать достаточно авторитетными в российских журналах: это означает, что большинство тех статей, которые в принципе цитируются, цитируется чаще, чем ожидается на среднемировом уровне.
Однако выбросы, которые мы удалили (FWCI > 10), наглядно демонстрируют, что метрика должна использоваться с большой осторожностью: например, у целого ряда работ FWCI составляет 12,179 при количестве цитирований, равном 2.
#OpenAlex #Scopus #FWCI #цитируемость #визуализация
12 августа 2024 OpenAlex добавил к своим показателям FWCI (Field-weighted Citation Impact — индекс цитирования, взвешенный по области науки). Рассчитывается он как и в других случаях через отношение количества цитирований за три года (плюс год публикации) к ожидаемому количеству цитирований по данному типу и предметной области (в OpenAlex используется третий по детализации уровень классификации — subfield).
Изначально FWCI появился в SciVal как одна из snowball-метрик. В Web of Science есть аналогичная метрика — CNCI (Category Normalized Citation Impact), однако исследователи давно заметили, что показатели FWCI и CNCI для одной и той же публикации различаются — иногда значительно. Это связано с рядом причин:
🔸 разный охват баз данных Web of Science и Scopus, и, следовательно, разное количество индексируемых цитат;
🔸 различия в предметных классификаторах;
🔸 способ расчета CNCI и FWCI для публикаций, которые относятся к более чем одной предметной области.
У OpenAlex есть своя специфика в расчете FWCI:
1. База в принципе содержит больше данных и включает в себя множество работ без цитирований — это снижает средние ожидаемые значения цитирования, поэтому цитируемые работы, скорее всего, будут иметь более высокие значения FWCI в OpenAlex.
2. У OpenAlex принципиально другой подход к классификации — тематика (primary topic), по которой нормализуется цитируемость, присваивается публикации, а не журналу. Поэтому FWCI/CNCI, нормализованный по предметным областям журналов, может значительно отличаться от FWCI согласно OpenAlex.
3. В OpenAlex датой публикации считается дата, когда публикация впервые появилась в сети. Однако дата выхода периодического издания может быть на год позже сетевой публикации, что влияет на окно цитируемости.
Небольшой пробный анализ мы сделали на недавнем массиве публикаций, которые мы использовали для анализа гендерной гомофилии (тип публикации "article", год публикации 2023, выборка из журналов RSCI, включая переводные версии). Общее количество таких публикаций на данный момент составляет 56 641. 47 359 (!) публикаций имеют нулевой FCWI, при этом у 2261 работы ненулевая цитируемость.
На графике визуализированы 25 наиболее популярных областей (то есть таких, в которых количество работ было наибольшим — разброс составил от 565 до 1751 публикаций: по инфекционным заболеваниям и по социологии и политическим наукам соответственно). Нулевые значения FWCI убраны из рассмотрения, поскольку сильно смещают график вниз; также удалено 46 выбросов (с FWCI от 10,03 до 146,352; наибольшее значение у статьи под названием "2021 ESC Guidelines for the diagnosis and treatment of acute and chronic heart failure", опубликованной в Российском Кардиологическим журнале).
Области, в которых основной массив публикаций располагается выше 1, можно считать достаточно авторитетными в российских журналах: это означает, что большинство тех статей, которые в принципе цитируются, цитируется чаще, чем ожидается на среднемировом уровне.
Однако выбросы, которые мы удалили (FWCI > 10), наглядно демонстрируют, что метрика должна использоваться с большой осторожностью: например, у целого ряда работ FWCI составляет 12,179 при количестве цитирований, равном 2.
#OpenAlex #Scopus #FWCI #цитируемость #визуализация
Дискуссия недели в картинке недели: оптика OpenAlex
Решение Нобелевского комитета о награждении Джона Дж. Хопфилда и Джеффри Э. Хинтона премией по физике вызвало немало дискуссий, так как работы лауреатов, на первый взгляд, относятся в большей степени к области компьютерных наук, чем к фундаментальной физике. При этом, как заметили наши читатели, с учетом результатов премии по химии было бы странно не отметить Нобелевской премией авторов метода, который позволил совершить открытие мирового уровня. Но насколько верным было решение дать награду именно в отмеченной научной области?
Алексей Хохлов в своей заметке указывает, что «корни того, что мы называем искусственный интеллект, зародились, когда Хопфилд исследовал системы магнетиков методами теоретической физики». Здесь фактически приводится обоснование самого Нобелевского комитета, подробно разъясняющего, почему истоки нейронных сетей и машинного обучения следует искать именно в областях физики.
Мы же решили на дискуссию недели ответить рубрикой «Картинка недели». Так, мы посмотрели, какое количество различных областей науки затронула публикация Дж. Дж. Хопфилда "Neural networks and physical systems with emergent collective computational abilities" (Proceedings of the National Academy of Sciences of the USA, 1982), которую позже цитировал в своих работах Дж. Э. Хинтон, второй лауреат премии. Всего изначальная статья Хопфилда цитируется 17 884 раза. Для того, чтобы построить сеть цитирований с учетом тематик OpenAlex, мы использовали VOSviewer, и вот, что у нас получилось.
Как видно, физика по объему публикаций действительно занимает далеко не первое место, но общий вклад для этой тематической области оказывается значительным. Нейронные сети позволили значительно продвинуться в различных тематических направлениях, включая и отдельные разделы физики, при этом влияние работы на другие области также оказывается велико. Таким образом, общий вклад в науку лауреатов трудно переоценить (особенно учитывая информационный шум вокруг искусственного интеллекта в последние несколько лет) и в действительности не так существенно, по какой «статье» принято решение. Ведь, в конце концов, у Дж. Дж. Хопфилда докторская по физике. Интерактивная версия доступна по ссылке.
#нобелевскаянеделя #физика #VOSviewer #OpenAlex
Решение Нобелевского комитета о награждении Джона Дж. Хопфилда и Джеффри Э. Хинтона премией по физике вызвало немало дискуссий, так как работы лауреатов, на первый взгляд, относятся в большей степени к области компьютерных наук, чем к фундаментальной физике. При этом, как заметили наши читатели, с учетом результатов премии по химии было бы странно не отметить Нобелевской премией авторов метода, который позволил совершить открытие мирового уровня. Но насколько верным было решение дать награду именно в отмеченной научной области?
Алексей Хохлов в своей заметке указывает, что «корни того, что мы называем искусственный интеллект, зародились, когда Хопфилд исследовал системы магнетиков методами теоретической физики». Здесь фактически приводится обоснование самого Нобелевского комитета, подробно разъясняющего, почему истоки нейронных сетей и машинного обучения следует искать именно в областях физики.
Мы же решили на дискуссию недели ответить рубрикой «Картинка недели». Так, мы посмотрели, какое количество различных областей науки затронула публикация Дж. Дж. Хопфилда "Neural networks and physical systems with emergent collective computational abilities" (Proceedings of the National Academy of Sciences of the USA, 1982), которую позже цитировал в своих работах Дж. Э. Хинтон, второй лауреат премии. Всего изначальная статья Хопфилда цитируется 17 884 раза. Для того, чтобы построить сеть цитирований с учетом тематик OpenAlex, мы использовали VOSviewer, и вот, что у нас получилось.
Как видно, физика по объему публикаций действительно занимает далеко не первое место, но общий вклад для этой тематической области оказывается значительным. Нейронные сети позволили значительно продвинуться в различных тематических направлениях, включая и отдельные разделы физики, при этом влияние работы на другие области также оказывается велико. Таким образом, общий вклад в науку лауреатов трудно переоценить (особенно учитывая информационный шум вокруг искусственного интеллекта в последние несколько лет) и в действительности не так существенно, по какой «статье» принято решение. Ведь, в конце концов, у Дж. Дж. Хопфилда докторская по физике. Интерактивная версия доступна по ссылке.
#нобелевскаянеделя #физика #VOSviewer #OpenAlex
Влияет ли Википедия на науку?
Википедия была запущена в 2001 году, и уже по состоянию на 2023 год включала в себя более 55 миллионов статей примерно на 300 языках с охватом 400 млн уникальных посетителей в месяц.
В академической сфере, как правило, не принято ссылаться на статьи из Википедии в публикуемых работах, так как в отличие от традиционных энциклопедий, материалы в которых тщательно проверены экспертами, информация, опубликованная в Википедии зависит от «мудрости толпы» (wisdom of the crowds). Несмотря на это некоторые исследователи утверждают, что свободная энциклопедия все же имеет заметное влияние на формирование научного ландшафта.
Например, результаты рандомизированного контролируемого испытания, проведенного несколько лет назад, показали, что исследователи предпочитают использовать в своих научных статьях выражения и цитаты, встречаемые на страницах Википедии, т.е. статья в Википедии может влиять на то, как ученые пишут о предмете в своих собственных исследованиях.
Хотя энциклопедии в целом не всегда активно цитируются в научных статьях, результаты анализа цитирований двух краудсорсинговых и двух экспертных энциклопедий (Wikipedia, Britannica, Baidu Baike и Scholarpedia) показали, что Википедия — наиболее цитируемая энциклопедия из представленных. Так, на свободную энциклопедию ссылались в 141 991 документе Scopus (с 2002 по 2020 г.), в то время как на Британскую энциклопедию (Britannica) — в 15 929 (с 2002 по 2020 г.), на Энциклопедию Байду (Baidu Baike) — в 2934 (с 2007 по 2020 г.) и на Scholarpedia — в 8399 (с 2007 по 2020 г.).
Несмотря на то, что Википедия многоязычна, её больше читают и цитируют на английском языке (95 % всех цитирований). Чаще всего ссылаются на Википедию в США (26 % от числа всех упоминаний), далее следуют Китай (12 %), Индия (11 %), Великобритания (6 %) и Германия (4 %).
Также в последнее время растет интерес к Википедии как к объекту исследования. Результаты недавнего анализа научных статей, индексируемых в WoS с 2001 г. по 2021 г., показывают, что количество упоминаний слов 'wikipedia' и 'wiki' в заголовках, аннотациях и ключевых словах статей растет примерно на 10 % в год. А исследования, посвященные Википедии, публикуют такие журналы, как PloS ONE, Journal of the Association for Information Science and Technology, Journal of the Association for Information Science and Technology, IEEE Access и Information Processing and Management.
Кроме того, публикация научной статьи в качестве источника на Википедии значительно повышает видимость исследования, из-за чего издатели (например, Wiley) начали открывать каталоги своих публикаций для проверенных редакторов, что способствует повышению уровня доверия к опубликованной в энциклопедии информации.
Традиционно также обратим внимание и на OpenAlex, целый топик которого посвящен кластеру работ, фокусирующихся на коллаборациях и динамике взаимодействия сообщества в контексте Wiki (более 27 тысяч публикаций с 188 тысячами цитирований). И это не считая работ с указанием аффилиации Wikimedia Foundation.
Википедия пусть и не всегда явно, но все же оказывает влияние на научное поле. Она способствует открытому распространению научного знания и её несомненный вклад заключается в уменьшении неравенства в получении свободного доступа к нему, что особенно существенно в контексте завершающейся Международной недели открытого доступа.
#Wikipedia #Википедия #OpenAlex #Цитирования
Википедия была запущена в 2001 году, и уже по состоянию на 2023 год включала в себя более 55 миллионов статей примерно на 300 языках с охватом 400 млн уникальных посетителей в месяц.
В академической сфере, как правило, не принято ссылаться на статьи из Википедии в публикуемых работах, так как в отличие от традиционных энциклопедий, материалы в которых тщательно проверены экспертами, информация, опубликованная в Википедии зависит от «мудрости толпы» (wisdom of the crowds). Несмотря на это некоторые исследователи утверждают, что свободная энциклопедия все же имеет заметное влияние на формирование научного ландшафта.
Например, результаты рандомизированного контролируемого испытания, проведенного несколько лет назад, показали, что исследователи предпочитают использовать в своих научных статьях выражения и цитаты, встречаемые на страницах Википедии, т.е. статья в Википедии может влиять на то, как ученые пишут о предмете в своих собственных исследованиях.
Хотя энциклопедии в целом не всегда активно цитируются в научных статьях, результаты анализа цитирований двух краудсорсинговых и двух экспертных энциклопедий (Wikipedia, Britannica, Baidu Baike и Scholarpedia) показали, что Википедия — наиболее цитируемая энциклопедия из представленных. Так, на свободную энциклопедию ссылались в 141 991 документе Scopus (с 2002 по 2020 г.), в то время как на Британскую энциклопедию (Britannica) — в 15 929 (с 2002 по 2020 г.), на Энциклопедию Байду (Baidu Baike) — в 2934 (с 2007 по 2020 г.) и на Scholarpedia — в 8399 (с 2007 по 2020 г.).
Несмотря на то, что Википедия многоязычна, её больше читают и цитируют на английском языке (95 % всех цитирований). Чаще всего ссылаются на Википедию в США (26 % от числа всех упоминаний), далее следуют Китай (12 %), Индия (11 %), Великобритания (6 %) и Германия (4 %).
Также в последнее время растет интерес к Википедии как к объекту исследования. Результаты недавнего анализа научных статей, индексируемых в WoS с 2001 г. по 2021 г., показывают, что количество упоминаний слов 'wikipedia' и 'wiki' в заголовках, аннотациях и ключевых словах статей растет примерно на 10 % в год. А исследования, посвященные Википедии, публикуют такие журналы, как PloS ONE, Journal of the Association for Information Science and Technology, Journal of the Association for Information Science and Technology, IEEE Access и Information Processing and Management.
Кроме того, публикация научной статьи в качестве источника на Википедии значительно повышает видимость исследования, из-за чего издатели (например, Wiley) начали открывать каталоги своих публикаций для проверенных редакторов, что способствует повышению уровня доверия к опубликованной в энциклопедии информации.
Традиционно также обратим внимание и на OpenAlex, целый топик которого посвящен кластеру работ, фокусирующихся на коллаборациях и динамике взаимодействия сообщества в контексте Wiki (более 27 тысяч публикаций с 188 тысячами цитирований). И это не считая работ с указанием аффилиации Wikimedia Foundation.
Википедия пусть и не всегда явно, но все же оказывает влияние на научное поле. Она способствует открытому распространению научного знания и её несомненный вклад заключается в уменьшении неравенства в получении свободного доступа к нему, что особенно существенно в контексте завершающейся Международной недели открытого доступа.
#Wikipedia #Википедия #OpenAlex #Цитирования