Выше квартилей
2.73K subscribers
110 photos
1 video
1 file
301 links
HSE: Home of Scientometrics and Expertise

Обучение и консультирование по практическим вопросам research evaluation и управлении наукой.

Все вопросы и предложения направляйте @vyshekbot или на почту Наукометрического центра ВШЭ: scientometrics@hse.ru
Download Telegram
После того, как мы рассказали о возможностях доступа в Scopus, подписчики спросили также о доступе в SciVal.

Отвечаем: здесь никаких открытых API нет и не будет. SciVal — крайне дорогая система, приобретать которую изначально был смысл только для самых крупных российских вузов, но и для них часть модулей этой системы была избыточна. У огромного множества ведущих мировых вузов доступа к SciVal и InСites нет, что никак не мешает им развиваться гораздо быстрее нас.

В России SciVal был популярен в нескольких контекстах:
• Сравнение стран и организаций. Здесь многое можно сделать через API Scopus, о чем мы расскажем в скором времени.
• Проверка «квартилей SNIP» — не вполне научной журнальной метрики, выбранной в качестве целевой в привязке к финансированию (разработчики SNIP, узнав о таком применении, вероятно, сильно бы удивились). Здесь мы помочь не сможем. При выборе журналов опирайтесь на мнение ведущих специалистов в соответствующих областях, используя наукометрию только справочно.
• Глубокомысленное изучение цветных кружков с «прорывными фронтирами» и «горячими топиками».

Как раз для этого недавно появился крайне интересный общедоступный инструмент — карта мировой науки, построенная на огромном связном датасете Merged Academic Corpus (напоминаем о наших видео про открытые данные и идентификаторы — именно про это). 100 тысяч кластеров с динамикой, ведущими подразделами, странами, авторами, финансирующими организациями. Все открыто, красиво, ярко, есть даже большая галочка-фильтр «Extreme Growth Predicted». Иными словами, то, что нужно для подготовки презентаций руководству. Если, конечно, их не смущает изготовитель — американский Центр безопасности и новых технологий.

#scopus #журналы #россия
​​Представленность молодых ученых женщин и мужчин в областях STEMM

Сегодня расскажем вам о еще одном гендерном исследовании в академии. Коллеги исследовали женщин-ученых и мужчин-ученых, имеющих публикации с 1990 по 2021 год в областях STEMM. Всего проанализировано 4,3 миллиона ученых в различных академических возрастных группах (молодые ученые с академическим стажем менее 10 лет, опытные ученые с академическим стажем 31-50 лет) из 38 стран ОЭСР. В центре внимания анализа находится именно отдельный ученый, а не публикации. Подробнее с методами и данными можно ознакомиться в препринте; подробные визуализации представлены там же.

Среди основных результатов:

• В целом, в 2021 году в STEMM 1,5 миллиона ученых: 923 000 мужчин и 579 000 женщин (38,55%).

• Две трети женщин-ученых (63,09%), публикующих свои работы в 2021 году, сосредоточены всего в шести странах: США (176 600 женщин), Италия (51 200), Великобритания (40 300), Германия (36 700), Франция (32 000) и Испания (29 000).

• Более половины женщин-ученых (55,02%) — в медицине (MED)* и каждая седьмая (15,91%) в биохимии, генетике и молекулярной биологии (BIO). В то же время, самая высокая доля женщин-ученых была в иммунологии и микробиологии (IMMU), где половина всех ученых были женщинами (50,03%). Самая низкая доля женщин-ученых — менее 20% — наблюдалась в инженерных науках (ENG).

• В 2021 доля молодых ученых-женщин среди всех ученых-женщин превысила 50%, а доля молодых ученых-мужчин среди всех ученых-мужчин составила около 40%. Это превышение молодых ученых в случае женщин и в сравнении их с мужчинами зафиксировано для всех рассмотренных дисциплин.

• В отношении гендерного состава очень молодых ученых в 2021 году четко выделились два кластера дисциплин: дисциплины с преобладанием молодых женщин-ученых (не менее 50%): иммунология и микробиология (IMMU), фармакология (PHARM), нейронауки (NEURO) и т.д., и дисциплины с преобладанием молодых мужчин-ученых: компьютерные науки (COMP), инженерные науки (ENG), математика (MATH) и физика (PHYS). Дисциплиной, наиболее закрытой для женщин-ученых в последние десятилетия, вновь стали инженерные науки (ENG), несмотря на относительный рост общего процента женщин-ученых из года в год во всех дисциплинах.

• Гипотетически можно ожидать, что при текущих темпах паритет между мужчинами и женщинами в рамках дисциплины (то есть 50% женщин-ученых и 50% мужчин-ученых) в четырех дисциплинах если и будет достигнут, то только примерно через сто лет: через 90.5 лет для MATH (в 2112 году), 112,9 лет для COMP (в 2134 году), 118,5 лет для PHYS (в 2140 году) и 133,5 лет для ENG (в 2155 году). По всем остальным дисциплинам паритет может быть достигнут между 2027 и 2028 годами (PHARM и CHEMENG) и 2081 годом (ENER). Единственной дисциплиной, в которой гендерный паритет уже достигнут, является IMMU.

*сокращения от названия дисциплин, полные наименования в пункте 2.2.6. препринта

#обзор #scopus #женщины
Как меняется международное соавторство в российских публикациях?

Публикации 2022 года уже в основном проиндексированы в Scopus, поэтому можно попробовать ответить на этот вопрос с опорой на данную базу.

Мы подсчитали общее число публикаций в Scopus (article, review, data paper, book, book chapter) в разбивке по укрупненным группам наук и трем ключевым странам: США, Китай и Германия. Предваряя результаты, отметим: все области очень разного размера, и чем больше число публикаций, тем показательнее данные о проценте работ с той или иной страной. Четыре области, в которых за два года не набралось и тысячи российских публикаций, мы из рассмотрения исключили. Также исключена область «мультидисциплинарные исследования», на деле состоящая из публикаций в журналах типа PLOS One, которые Scopus не умеет приписывать к конкретным тематикам.

Процент работ с иностранными соавторами выбранных стран в целом мал: шкала на диаграммах не доходит до 20%. Это во многом объясняется успешным покорением Scopus сотнями российских журналов, случившимся в последние годы, и неравномерным по направлениям. Международных статей в них, увы, в среднем очень мало. С другой стороны, если вовсе исключить из рассмотрения российские журналы, картина будет тоже искажена.

Направления на диаграммах расположились по часовой стрелке по тематической близости (в понимании Scopus): науки о здоровье, затем сельскохозяйственные и биологические, технические и естественные, общественные и гуманитарные.

На графиках: общее число публикаций России в 2021-22 гг. по областям науки; процент российских работ с аффилиацией данной страны в 2021 году; процент российских работ с аффилиацией данной страны в 2022 году.

#журналы #россия #scopus #инфографика #международноесотрудничество
26 апреля в 16:00 вебинар с Алексеем Лутаем: «Наукометрия на открытых данных, или “жизнь после»

Продолжаем открытое профессиональное обсуждение важных тем с ведущими российскими наукометристами. Пригласили выступить Алексея Лутая (РЦНИ), модератор — Иван Стерлигов. Вебинар будет посвящен открытым библиографическим базам данных и качеству содержащихся в них метаданных.

Уход с российского рынка Web of Science и Scopus и последовавший за этим мораторий на учет публикационных показателей создали предпосылки для переоценки влияния наукометрии на развитие отечественной науки. Хаотичное создание новых баз данных, метрик и ГОСТов отвлекает внимание от необходимости обсуждения основополагающих вопросов, ответы на которые необходимо дать с позиции приобретенного опыта:
• какие из наукометрических практик действительно полезны для развития науки, а какие бессмысленны или, хуже того, попросту вредны?
• какие меры необходимо предпринять для создания и долгосрочного развития лучших практик?

Ответ на эти вопросы невозможен без глубокого анализа данных, обсуждения их качества и доступности. Что у нас есть прямо сейчас, а что мы сможем иметь через год?

Приглашаем на вебинар всех желающих. Трансляция будет здесь. Записи предыдущих вебинаров на нашем сайте и youtube-канале.

#анонс
#вебинары #scopus #wos
Представленность исследований на китайском языке

Говоря о представленности исследований на разных языках, мы уже писали про многоязычие в научной коммуникации на примере Хельсинкской инициативы и языковое разнообразие научных публикаций на примере хэндбука по социальным наукам, а еще про национальные предпочтения книг в открытом доступе. Результаты исследований показывают глобальный интерес к книгам с региональной направленностью. Большинство читателей, скорее, скачают либо неанглоязычную книгу, либо, если книга написана на английском, тематически актуальную для контекста страны читателя. Тем не менее, согласно данным по социальным наукам, 65% исследователей в начале карьеры (до 10 лет с момента получения PhD) публиковали работы на двух или более языках, в то время как среди исследователей со стажем более 11 лет публиковались на двух или более языках 61,5%. Среди женщин на двух или более языках публиковались 56,9%, а среди мужчин — 52%. Но национальные языки остаются актуальными как для областей STEM, так и для SSH.

Также мы уже затрагивали тему вклада китайских ученых в мировую науку. Так, например, в Китае самое большое количество студентов бакалавриата и магистратуры в области естественных и технических наук в мире. И описывали подход Китая к составлению белых и черных списков журналов.

Теперь мы решили провести свое языковое мини-исследование, приуроченное ко дню китайского языка. В базе данных Scopus за 2018-2022 годы числится 507,5 тысяч публикаций на китайском языке, что составляет чуть более 3% от общего числа публикаций этого периода. Больше всего публикаций в области инженерных наук — 186 тысяч за 5 лет (36%), медицины — 103 тысячи (20%), далее идут работы по физике и астрономии — 67 тысяч (13%) и примерно такое же количество публикаций в области материаловедения. Интересно то, что исследования в области инженерии в Китае (или написанные на китайском языке) значительно популярнее, чем инженерные исследования в целом по миру (22%).

Также мы посмотрели, сколько статей российских авторов (имеющих или имевших аффилиацию с российским вузом) написаны на китайском языке. Их оказалось всего 161 (из 507,5 тысяч), и по большей части это авторы китайского происхождения, работающие или работавшие в российских организациях.

#обзор #scopus #китай
​​SJR 2022: что изменилось для российских журналов

В начале месяца обновились данные по показателю SJR для журналов, входящих в Scopus. Всего в обновленный список вошло 27955 изданий (годом ранее — 28306 журналов). В целом, тренд на сокращение рейтингового списка сохраняется с 2017 года.

Как и в прошлом году мы решили посмотреть на изменение позиций для журналов из России. Всего таких изданий в списке 507 — на 3 больше, чем в прошлом году. Большинство журналов Q1 по максимальному квартилю сохранили свои позиции (35 из 53). Сразу 7 журналов без квартиля по итогам прошлого года попали в Q1 сейчас, но в целом доля верхних квартилей изменилась незначительно. Журналы без квартиля в прошлом году в основном попали в 4 квартиль (41 из 76).

Для наглядности вновь подготовили sankey-диаграмму, которая отражает «миграцию» журналов. Кроме того, к ней прилагается таблица с указанием квартилей журналов в 2021 и 2022 году, в которой можно отфильтровать представленные на диаграмме случаи.

#scopus #sjr #квартили #россия #журналы #инфографика
​​Что пишут о ChatGPT в Scopus и Web of Science

Из-за популярности чат-ботов и ChatGPT растет количество исследований, посвященных им. Одно из них представляет собой анализ литературы по чат-ботам и комплексный обзор научных документов по ChatGPT и фокусируется только на публикациях, индексируемых в Scopus и Web of Science.

Авторы выбрали Scopus и Web of Science, поскольку обе эти базы включают наиболее важные журналы по информатике, статистике, инженерии и математике. На первом этапе был проведен библиометрический анализ всей опубликованной литературы, включая статьи, главы книг, доклады конференций и обзоры по чатботам из баз данных Scopus (5839) и WoS (2531) за период с 1998 по 2023 год. Углубленный анализ, сосредоточенный на источниках, странах, влиянии авторов и ключевых словах, показал, что ChatGPT является мейнстримом в рамках анализа чат-ботов. На втором этапе был проведен библиометрический анализ публикаций ChatGPT, и 45 опубликованных исследований были тщательно проанализированы на предмет использованных методов, новизны и выводов. Ключевые области интересов, выявленные в ходе исследования, можно разделить на три группы: искусственный интеллект и связанные с ним технологии, разработка и оценка разговорных агентов, а также цифровые технологии и психическое здоровье.

Основные выводы:

1️⃣ Исследования чат-ботов вызывают интерес у исследователей по всему миру, в них принимают участие ученые из более чем половины стран мира. Исследования ChatGPT уже проводились в 46 странах.

2️⃣ США занимают первое место по количеству публикаций, связанных как с чат-ботами, так и с ChatGPT. Далее идут Германия и Великобритания. Они входят в первую группу стран, выпускающих публикации по чат-ботам в Scopus, и занимают второе и третье места по количеству публикаций по ChatGPT, соответственно.

3️⃣ Психическое здоровье становится все более популярной областью исследований при анализе чат-ботов, разрабатываемых в области охраны здоровья. Исследователи отмечают, чат-боты расширяют возможности реализации когнитивно-поведенческой терапии.

4️⃣ В исследованиях, связанных с ChatGPT, популярная область — здравоохранение. Исследователи изучают потенциал ChatGPT для предоставления персонализированных рекомендаций по лечению, облегчения удаленного мониторинга пациентов и помощи медицинским работникам в принятии решений.

В заключении авторы отмечают, что ChatGPT выступает ключевым направлением в исследованиях чат-ботов, при этом текущая литература в основном сосредоточена на его возможностях и ограничениях в таких областях, как исследовательская этика, медицина и социальные науки.

#обзор #искусственныйинтеллект #chatgpt #wos #scopus
Как с помощью библиометрии найти потенциально талантливых молодых людей в области естественных наук и наук о жизни?

Сегодня научно-исследовательские институты и университеты используют различные подходы к поиску перспективных молодых ученых. Есть множество процедур по отбору ученых на стипендии, позиции постдоков и т.д. В большинстве случаев учитывается не только экспертная оценка, но и библиометрические показатели. В основе подхода к выявлению молодых талантливых ученых, представленных в этом исследовании, лежат данные Scopus, позволяющие измерять индивидуальную производительность и выявлять таланты по всему миру на различных этапах карьеры.

Исходный набор данных для исследования был ограничен 1999-2020 годами и типами документов (статьи, обзоры и сборники трудов). В общей сложности — 45 709 395 публикаций. В качестве дополнительного источника использовали информацию о публикациях и грантах из Dimensions. В роли потенциально талантливых молодых ученых выступают авторы, которые к настоящему моменту провели в академической среде около десяти лет.

Для отбора использовались три показателя:

• количество статей в журналах с высоким нормализованным импакт-фактором (показатель Q1),
• общее количество статей (показатель O),
• количество статей, где автор выступал контактным лицом (показатель С).

По мнению авторов, эти показатели зарекомендовали себя в предыдущих исследованиях (см. обзор литературы) в качестве хороших предикторов успеха в науке. Авторы протестировали различные комбинации показателей для выявления талантливых ученых и обнаружили, что наиболее благоприятные результаты дает комбинация OxQ1: общее количество статей и количество статей в журналах с высоким нормализованным импакт-фактором. На этой основе создали базу данных потенциально талантливых ученых, которые опубликовали свою первую работу в период с 2007 по 2011 год и входят в топ-1% по показателям O и Q1 по крайней мере в одной широкой области классификатора ASJC.

Набор данных можно скачать бесплатно. Он содержит 46 200 потенциально талантливых ученых. Некоторые из них представлены в более чем одной широкой области ASJC. Результаты показывают, что наименьший процент молодых потенциально талантливых ученых был обнаружен в областях ветеринарии и иммунологии и микробиологии, а наибольший — в физике и астрономии, что может напрямую отражать специфику данных областей.

#обзор #scopus #базыданных
Соответствие журналов Белого списка квартилям журналов в Scopus и WoS

На страничке Белого списка (далее БС) появились уровни журналов. На представленных ниже картинках мы построили связь между старыми квартилями по двум базам и новыми уровнями.
В целом можно сказать, что уровни БС примерно соответствуют квартилям Scopus. Тогда как журналы WoS входят в основном в первые 3 уровня, а первый уровень БС соответствует 1-2 квартилю WoS.

#журналы #белыйсписок #scopus #wos #россия
​​Сегодняшний пост посвящен тому, как выделять тематические кластеры методами, не основанными на цитированиях самих публикаций. Эти подходы тестируются на массиве 13817 публикаций НИУ ВШЭ в Scopus за 2019-2023 годы.

В качестве кластеров можно использовать:
1️⃣ Авторские ключевые слова. Хорошо описывают содержание и хорошо работают как лейблы кластеров, но есть не у всех публикаций и требуют внешние метрики качества. Кластеризация через совместную встречаемость.
2️⃣ Журналы. Узкоспециализированные журналы «ловят» тематики гораздо лучше AI, но чем шире тематика издания, тем ниже ценность метода. Можно кластеризовать журналы в группы наукометрическими (ссылки и пересечения в списках литературы) и лингвистическими (совпадение ключевых слов, схожесть аннотаций и названий) методами. Важное достоинство — журнал с репутацией/цитируемостью позволяет оценить средний уровень свежих работ.
3️⃣ Автоматически выделенные ключевые слова и прочие методы, основанные на программном анализе текстов (аннотаций и названий). Сложны для интерпретации и фильтрации по релевантности. Важно, что есть открытый набор из ~60 тысяч тематик/кластеров/ключевых слов, выделенный алгоритмически в OpenAlex/Wikidata, что позволяет сравнивать полученные кластеры с общемировыми трендами.

Для измерения и сопоставления кластеров можно использовать:
• журналы (уровни в экспертных списках и метрики),
• цитирования (требуют нормализации по тематике, году и типу публикации, лаг накопления),
• средние годы выпуска для оценки роста/затухания,
• международное соавторство (рекомендуется нормализация по тематикам).

Самые часто встречающиеся ключевые слова для НИУ ВШЭ: covid-19, machine learning, higher education, culture, deep learning, china, education, innovation, subjective well-being, human capital, blockchain.

На графике представлена визуализация авторских ключевых слов, кластеризация на основе совместной встречаемости. Если сравнивать первые 50 кластеров, которые встречаются по наиболее частому ключевому слову, то по среднему возрасту они практически не отличаются, зато отличаются по среднему уровню журналов.

#инструменты #университеты #scopus #вышка
Факторы, влияющие на публикацию в открытом доступе: на примере Springer Nature

Мы уже писали о проблеме перехода к открытому доступу (OA) и связанной с ним плате за обработку статей (APC). Многие авторы не могут позволить себе оплатить эти взносы. Таким образом ОА может скорее усугублять существующее неравенство в системе публикаций, чем преодолевать его. Коллеги провели исследование и изучили 522 411 статей, опубликованных в издательстве Springer Nature, чтобы выявить взаимосвязь между авторами, принадлежащими к странам с разным уровнем дохода, их выбором модели публикации и влиянием их статей на цитируемость. Была обнаружена сильная корреляция между уровнем журнала и моделью публикации в золотых ОА-журналах, в то время как в гибридных журналах ОА-вариант в основном отсутствует. Также положительная корреляция между цитированием и публикацией в открытом доступе в 1,3 раза слабее в странах с высоким уровнем дохода, чем в других странах.

Результаты исследования показывают, что:

• авторы, имеющие право на освобождение от платы за обработку статей (APC), публикуются в золотых ОА-журналах чаще, чем другие,
• авторы, имеющие право на скидку APC, имеют наименьший коэффициент публикаций в ОА-журналах (что позволяет предположить, что данная скидка недостаточно мотивирует авторов публиковаться в золотых ОА-журналах),
• наиболее значимыми факторами при выборе модели OA являются уровень дохода в стране, трудовой стаж и опыт OA-публикаций, пол автора оказывает наименьшее влияние.

#обзор #открытыйдоступ #apc #scopus
Рост числа гиперпродуктивных авторов в РФ

Недавнее письмо Иоаннидиса в Nature (ставшее закономерным продолжением работы 2018 г.), о росте числа гиперпродуктивных авторов привлекло широкое внимание. Россия относится к числу стран с максимальным приростом таких исследователей: если в работе 2018 г. упоминался только известный специалист по рентгеноструктурному анализу М.Ю. Антипин, умерший еще в 2013 г., то в версии этого года гиперпродуктивных авторов из России уже 10. Одно из очевидных объяснений, упоминаемых Иоаннидисом с соавторами — формалистские схемы оценки научной активности по числу публикаций. Такие схемы весьма распространены в странах с аномальным ростом числа гиперпродуктивных ученых.

Мы решили дополнить данные коллег по похожей методике, также воспользовавшись базой Scopus, и делимся датасетом наиболее продуктивных авторов публикаций с российской аффилиацией и с некоторыми дополнительными фильтрами:

- во-первых, считалось общее число публикаций у автора с 2015 до 2022 г. (данные собраны в январе 2023 г. и могут быть несколько ниже актуальных на сегодня);
- во-вторых, отсекались авторы из мегаколлабораций (>100 соавторов в среднем), а для остальных приводилось среднее число соавторов, число публикаций в разбивке по типам (для РФ важны труды конференций), средний уровень журнальных публикаций по Норвежскому национальному списку (1 — нормальный журнал, 2 — ведущий, 0 — неучитываемый), а также общее число цитирований учтенных публикаций. Последняя метрика дается сугубо справочно: абсолютное число цитирований нельзя использовать для сравнения ученых из разных областей с публикациями разных лет.

Также в датасете приводятся основные тематики работ, наиболее значимые источники (журналы и т.д.) и последние аффилиации (в разрезе организаций и стран), среднее число аффилиаций у автора и среднее число российских аффилиаций. Набор данных позволяет использовать для сравнения различные индикаторы, что согласуется с современными принципами применения наукометрии.

В качестве порога установлено число публикаций — не менее 200 за 2015-2022 гг. Таких авторов нашлось 124. Все они относятся к области естественных, точных или медицинских наук. 30 авторов имеют более 300 работ, 8 — более 400. 89 ученых работают в области химии, физики и материаловедения.

Отметим, что в списке немало крупных руководителей и главных редакторов журналов, а среди наиболее популярных журналов достаточно много платных, с облегченным рецензированием; кроме того, немало и авторов, предпочитающих конференции. Многие авторы в качестве основного места работы указывают иностранные организации, и, по предварительной информации, резко снизили сотрудничество с РФ после 2022 г., а увеличение числа публикаций за счет конференций осложнилось и отчасти потеряло актуальность в связи с действующим мораторием на показатели наличия публикаций в МНБД. С учетом всего вышеперечисленного, в обозримом будущем число гиперпродуктивных авторов вряд ли будет расти.

#датасеты #scopus #гиперпродуктивность
Резкая остановка, плавное падение или незначимый фактор: о цитируемости публикаций в журналах из Scopus Discountinued Sources List

В самом начале 2024 года на RetractionWatch появилась заметка о том, что Scopus планирует провести переоценку журналов издательства MDPI, входящих в базу, в связи с отдельными вопросами к политике издательства. Несмотря на появившийся спустя несколько дней комментарий к оценке одного из флагманов MDPI — журнала “Sustainability” (к которому у Elsevier вопросов не осталось) — не лишним будет напомнить о критериях, влияющих на повторную оценку журналов, входящих в Scopus, учитывая популярность издательства MDPI в том числе у российских коллег:

1. Журнальные показатели вызывают вопросы, так как они не соответствуют ни одному из трех показателей и критериев журналов в той же предметной области (показатели цитирования, самоцитирования и CiteScore).

2. Существует обеспокоенность по поводу стандартов публикации журнала или издателя (в том числе в результате официально полученных жалоб).

3. Журнал демонстрирует необычное поведение после включения в Scopus (значимо увеличивается число публикаций, становится необычной география соавторов и т.д.).

4. По журналу есть замечания от международного консультативного совета по отбору контента (Content Selection and Advisory Board — CSAB).

Наличия одного из перечисленных критериев достаточно для проведения процедуры повторной оценки журнала или издания. Окончательное решение об исключении журнала/издательства из базы Scopus принимается CSAB — если комиссия определит, что журнал больше не соответствует стандартам Scopus, новые статьи из такого журнала прекратят индексацию. Издания, индексация которых прекращена, могут быть повторно рассмотрены на предмет включения в базу только через 5 лет после принятия решения об их исключении.

Вообще же вхождение журнала в официальные листы крупных баз данных рецензируемых изданий и национальные списки повышает привлекательность издания для авторов: как за счет повышения видимости опубликованной работы, так и нередко из-за формальной наукометрической составляющей оценки научной продуктивности. Но означает ли это, что исключение журнала из базы может значимо влиять на видимость опубликованных статей?

Ответить на этот вопрос мы попробовали с помощью открытых данных о цитируемости изданий, попавших в Scopus Discountinued Sources List в 2020 году. Отобрав среди них те журналы, по которым имелись сведения в OpenAlex о цитируемости за несколько лет, мы рассчитали 2 показателя: (1) среднюю цитируемость статей в первые 2 года после выхода; (2) число процитированных в первые 2 года после выхода статей. Визуализация представлена на графике ниже и по ссылке.

Несмотря на объективную сложность обобщения (журналы представлены в разных дисциплинах, а также отличаются с точки зрения покрытия и общего числа публикаций) можно отметить, что на публикации 2020 года нередко приходились локальные экстремумы по числу цитирований, которые в следующие периоды затухали. При этом формальное падение “до нуля” — не единственный, хотя и наиболее распространенный сценарий. По всей видимости некоторые ученые не только продолжают читать, но и цитировать статьи журналов, вызывающих вопросы с точки зрения редакционной политики (здесь оговоримся, что мы не учитывали показатели самоцитирований).

Можно ожидать, что в случае крупных издательств тенденции “затухания” цитирования будут еще более сглаженными, чем на нашем графике. Так что угроза исключения источников (в особенности на фоне развития открытых баз без учета критериев селективности (обратная сторона медали OpenAccess), в том числе SciLit от MDPI) в будущем могут не так значимо влиять на дальнейшее воспроизводство научного знания из источников, вызывающих вопросы у профессионального сообщества.

#discountinued #Scopus #RetractionWatch #OpenAlex #цитирования #визуализация
В этом году мы решили открыть новую рубрику на нашем канале — #дайджест новостей из области наукометрии за последний месяц. Подборка будет выходить в последнюю пятницу каждого месяца.

За последнее время произошло несколько интересных событий, о которых мы хотим напомнить нашим читателям:

1. Одна из главных новостей российского сегмента — проект-победитель Всероссийского гранта Росмолодежи, сервис SciCite, на который обратил внимание в своем телеграм-канале академик РАН А.Р. Хохлов. Сервис предлагает ученым цитировать определенные работы друг друга в обмен на внутреннюю виртуальную валюту. Основная проблема, по мнению некоторых экспертов, заключается в том, что мотивация к социтированию работ «за вознаграждение» искусственна и не всегда связана с действительной научной значимостью цитируемых исследований. Новость о сервисе облетела тематические телеграм-каналы, а сам проект опубликовал пост-опровержение, в котором отмечает, что площадка была создана с целью изменения традиционного подхода к поиску единомышленников и обмену научными знаниями, а виртуальная валюта является элементом геймификации.

2. На Scholarly Kitchen вышел гостевой пост о директиве European Accessibility Act, вступающей в силу с июня 2025 года. Согласно этой директиве, к широкому спектру цифровых продуктов будут предъявляться требования, касающиеся доступности для людей с ограниченными возможностями. С июля 2025 года издательствам, независимо от страны регистрации, может быть запрещено предлагать определенные цифровые продукты и издательские услуги на рынке ЕС, если они не соответствуют требованиям директивы.

3. Совсем недавно Elsevier объявил о старте продаж Scopus AI — внимание на это обратили в том числе коллеги из канала «Научные журналы и базы данных». Этот инструмент призван помочь начинающим (и не только) исследователям ориентироваться в академическом контенте, предоставляя сводную информацию на основе названий и аннотаций к статьям. У Scopus есть еще одна новость (правда, актуальная скорее для коллег, проживающих за пределами России): последние обновления интерфейса позволяют искать авторов по ключевым словам. Это поможет быстро находить исследователей для коллаборации в интересующей сфере или экспертов для консультаций по отдельным вопросам.

4. Команда OpenAlex полностью переработала интерфейс — теперь пользователям доступен поиск и фильтрация по DOI, названию статей, именам авторов, концепциям и ключевым словам, причем фильтр распознает, к какой категории относится поисковый запрос, и предлагает варианты автозаполнения. А еще реализована вполне удобная мобильная версия.

5. На новостном портале Nature опубликован пост о новой инициативе по борьбе с т.н. «бумажными фабриками» — предприятиями, засоряющими научное поле путем выпуска поддельных или некачественных статей и продажи авторских прав. В посте описывается масштаб проблемы, а также предлагается план из пяти пунктов по ее решению. Эту новость также комментирует А.Р. Хохлов.

6. В Science вышла статья о десятилетней борьбе группы независимых ученых с публикацией фальшивых исследований. С 2013 года ими были поданы жалобы на 300 публикаций, обладающих признаками фальсификации данных и других этических нарушений. Проблема заключается в том, что исследователи всё ещё не получили обратную связь по 107 подозрительным статьям, опубликованным в 41 журнале. Упомянутые статьи всё еще находятся в открытом доступе и продолжают цитироваться, несмотря на активные попытки повлиять на их исключение из источников. По мнению инициативной группы, сложившаяся ситуация напрямую связана с нежеланием издательств своевременно и оперативно реагировать на подобные запросы, что является прямым нарушением этических норм научного сообщества.

#дайджест #OpenAlex #Scopus
​​SJR 2023: ежегодное обновление

На прошлой неделе вышло обновление показателя SJR для источников, входящих в Scopus. Всего в обновленный список вошло 29165 изданий, у 28740 изданий есть квартиль (в 2022 году квартили были присвоены 27606 изданиям, а в 2021 — 26701). Таким образом, тренд на сокращение списка, сохранявшийся с 2017 года, развернулся в сторону увеличения количества изданий, что не могло не повлиять на квартильные окна (особенно в гуманитарных и социально-экономических дисциплинах, где различия в значениях SJR порой минимальны).

Мы по традиции решили рассмотреть изменение позиций российских журналов. Всего таких изданий в нынешнем списке 566, квартиль присвоен 559 (в прошлом году журналов было 565, из них квартиль был у 504). Большинство журналов Q1 по максимальному квартилю сохранили свои позиции (48 из 69). Кроме того, в Q1 вошло 2 издания, не индексировавшихся ранее.

Для наглядности мы обновили sankey-диаграмму (https://hsenc.shinyapps.io/sjr-update/), которая отражает «миграцию» журналов. Теперь в ней три столбца — 2021, 2022 и 2023 гг. соответственно. В таблице по той же ссылке можно проверить квартили для отдельных журналов за те же годы.

#scopus #sjr #квартили #россия #журналы #инфографика
Академический угон: обзор публикаций о hijacked журналах

В апрельском выпуске Journal of the Association for Information Science and Technology вышла статья Анны Абалкиной, посвященная проблемам, связанным с похищенными журналами (hijacked journals) в Scopus. Ранее мы затрагивали эту тему в контексте paper mills.

По мнению исследовательницы, уязвимость библиометрических баз данных Web of Science и Scopus, индексация в которых является показателями качества, приводит к распространению мошеннического контента. Издатели-мошенники активно используют в своих целях ошибки в системах безопасности баз данных и упущения в издательской политике редакции.

Ярким примером эксплуатации такого рода ошибок являются “похищенные” журналы. Издатели-мошенники создают копии сайтов научных журналов, которые тяжело отличить от официальных страниц. Как правило, они копируют название журнала и его ISSN, заполняют страницу настоящими данными о членах редакционной коллегии или придумывают свою, включая в неё имена настоящих и/или выдуманных ученых. Злоумышленники создают архив, чтобы убедить потенциальных авторов в том, что журнал публикуется постоянно. Архив наполняется статьями из оригинального журнала или некачественным контентом.

Как правило, жертвами “похищений” становятся определенные типы журналов:

• выпускаемые исключительно в печатном виде (где сайт-клон может служить единственным сайтом для журнала);
• узкоспециализированные или университетские журналы (кражи журналов крупных и авторитетных издателей легче отследить).

Казалось бы, потенциальные авторы могут проверить профиль журнала в библиометрических базах данных, поскольку в них размещают всю необходимую информацию, включая ссылку на домашнюю страницу, однако у мошенников есть несколько стратегий, позволяющих ввести потенциальных авторов в заблуждение:

- похищение журналов без ссылок или с неактивными ссылками на домашнюю страницу в профиле в индексируемых базах данных;

- регистрация домена журнала с истекшим сроком действия (способ позволяет мошенникам не менять ссылку на домашнюю страницу в библиографических базах данных);

- взлом официального сайта журнала;

- подделка ссылки на домашнюю страницу журнала в его профиле в библиографических базах данных (indexjacking);

- «вторая жизнь» для журналов, которые прекратили выпускаться.

Методы, с помощью которых похищенные журналы действительно проникают в библиографические базы данных и, тем более, индексируют неутвержденный контент в этих базах данных, малоизучены. По данным Elsevier в Scopus это происходит, когда «журналы обновляют URL-адреса или другие каналы контента», по мнению других исследователей, основной причиной является несвоевременная оплата домена.

К сожалению, даже крупнейшие базы данных не ведут учет случаев удаления контента, опубликованного и проиндексированного во взломанных журналах. Известно, что Scopus хранит и обновляет список журналов и изданий, индексация которых прекращена (с указанием причин), однако информация о прекращении индексации взломанных журналов отдельно не фиксируется.

Отсутствие такого списка является проблемой для академического сообщества, так как материалы из похищенных журналов потенциально не рецензируется должным образом. Исследования показывают, что на такие статьи могут ссылаться авторитетные издания. Более того, отсутствие прозрачности в учете похищенных журналов позволяет обманывать ученых даже после удаления неутвержденного контента.

Несмотря на удаление материалов из Scopus и истечения срока действия доменов похищенных журналов, статьи всё ещё можно найти в различных базах данных (ORCID, eLibrary), а также в различных онлайн-репозиториях (ResearchGate, Academia.edu) или на сайтах университетов. Кроме того, неутвержденный контент по-прежнему присутствует в Scopus за все годы с 2013 по 2023 (по состоянию на сентябрь 2023 года). В таких случаях прозрачная документация могла бы помочь преодолеть асимметрию информации и сохранить научную честность.

#обзор #hijackedjournals #scopus
​​Феномен анонимных публикаций в современности

В декабре прошлого года в Scientometrics была опубликована статья, посвященная феномену анонимного авторства. Годом ранее там же вышла публикация, согласно которой за последние сто лет было опубликовано более 1,4 миллиона статей, у которых были указаны один или несколько анонимных авторов.

В течение долгого времени публикация исследования могла требовать анонимности по соображениям безопасности, а также по культурным или религиозным причинам, но в итоге большинство таких работ не получают широкого распространения, если за ними не стоит сильный автор или авторский коллектив. В оригинальной статье рассматривается Harvard Law Review как журнал, который публикует относительно много анонимных работ, являясь при этом значимым и респектабельным в своей сфере.

Хотя авторы предыдущих работ анализируют датасеты, полученные из Web of Science, мы решили проанализировать относительно небольшую выборку работ, индексируемых в Scopus с 2021 по 2024 год, у которых поле «Автор» не содержит записей (102 414 публикаций), либо хотя бы один из авторов указан как “Anon/Anonymous” (111 публикаций). К сожалению, нет надежного способа проверить все записи с незаполненным полем авторства, но выборочная проверка показала, что в этих публикациях авторство действительно не указано, либо указано название коллектива авторов (особенно это характерно для наук о здравоохранении — это могут быть сотрудники лаборатории или компании).

Для первой части датасета (с отсутствующим указанием авторства) мы отфильтровали все записи с нулевым количеством цитирований, поскольку чаще всего это титульные страницы и страницы с оглавлением, которым присваивается отдельный DOI. Таких оказалось большинство — в итоговом датасете осталось всего 5343 записи. Больше всего публикаций без указания авторства в области наук о здравоохранении, в частности фундаментальной медицины.

С работами, где в качестве авторов указан аноним, ситуация более неопределенная. По-видимому, эта традиция постепенно изживает себя: из 111 записей за рассматриваемые годы 85 относится к материалам не-серийных конференций, для которых Scopus не определяет предметную область. Остальные работы посвящены социальным наукам (30), здравоохранению (10) и естествознанию (1).

В целом, анонимные публикации продолжают занимать определенную нишу в различных научных сферах, несмотря на то, что указание “Anonymous” в качестве автора явно уступило место отсутствию упоминания об авторе. Между тем работа, где в качестве автора указано название авторского коллектива, формально не может считаться анонимной публикацией, однако Scopus не распознает такое название, что накладывает некоторые ограничения на анализ данных об авторах.

#аналитика #scopus #анонимность
​​Data paper как самостоятельная наукометрическая единица

Не так давно Иван Бегтин, которого мы регулярно читаем, опубликовал пост о том, что следует считать наборами данных. Это могут быть как стандартные датасеты, так и другие типы данных: data paper, data report, data article и data note. В такие публикации входит не только текст статьи, но и ссылки на исходные данные или данные, полученные в результате работы.

Пока нет общего мнения, можно ли считать наборы данных отдельным типом данных и следует ли в принципе индексировать их в библиометрических системах, но, как минимум, Scopus добавил к параметру DOCTYPE допустимое значение “dp” (data paper) (правда, в справке пока что этой информации не содержится), в Web of Science data paper индексируются с 2016 года, причем им присваивается двойное значение — data paper и article, а в OpenAlex есть тип “dataset”.

Наборы данных пока не везде считаются отдельным типом данных, поэтому не во всех библиометрических базах можно выделить их однозначно, но мы сделали несколько разрезов, чтобы внимательнее рассмотреть, как распределяются публикации по годам и областям, а также — какие издательства уже публикуют работы с подобными ссылками.

В Web of Science за все годы было 15 677 публикаций с типом data paper, в Scopus немного больше — 16 146. В OpenAlex же хранится информация о более чем 7 миллионах датасетов, из которых более 4 — в открытом доступе, однако данных о data paper как о полноценных статьях, описывающих содержание датасета, пока нет.

Мы проанализировали data paper, индексируемые в Scopus, по нескольким разрезам, чтобы понять, насколько распространены подобные публикации в различных странах и областях знаний. Среди государств ожидаемо лидируют США и КНР (при этом в США было опубликовано более 3000 data paper, что почти вдвое больше, чем в Китае). Россия на 12 месте (493 data paper) и опережает, например, Нидерланды, Швейцарию и Бельгию.

По областям (если не считать ожидаемого пика у Multidisciplinary) почти наравне держатся компьютерные и социальные науки — 2516 и 2507 публикаций соответственно. За ними с незначительной разницей идут науки о принятии решений и математика — 2447 и 2410. А вот биохимия, генетика и молекулярная биология, которые часто приходят на ум при словосочетании «набор данных», имеет всего 239 data papers.

Важно отметить, что большая часть data papers размещена в открытом доступе: 14 676 публикаций из 16 146 имеют различный статус Open Access, от Gold до Hybrid.

#Scopus #openaccess #datapaper
История библиометрических баз данных и их разновидностей. Часть 1

Научные базы данных обеспечивают доступность и систематизацию растущего потока статей, материалов конференций, патентов и других исследований. Сегодня обращение к Web of Science, Scopus или другим базам данных для поиска статей — рутина любого исследователя. Мы используем базы данных, не придавая большого значения их различиям и не задумываясь об истории их появления. В сегодняшнем посте, посвященном истории наукометрии, мы посмотрим, как происходило становление баз данных, окружающих нас сегодня.
 #историянаукометрии #Scopus #WoS #MAG #OpenAlex
​​FWCI в OpenAlex: первые пробы

12 августа 2024 OpenAlex добавил к своим показателям FWCI (Field-weighted Citation Impact — индекс цитирования, взвешенный по области науки). Рассчитывается он как и в других случаях через отношение количества цитирований за три года (плюс год публикации) к ожидаемому количеству цитирований по данному типу и предметной области (в OpenAlex используется третий по детализации уровень классификации — subfield).

Изначально FWCI появился в SciVal как одна из snowball-метрик. В Web of Science есть аналогичная метрика — CNCI (Category Normalized Citation Impact), однако исследователи давно заметили, что показатели FWCI и CNCI для одной и той же публикации различаются — иногда значительно. Это связано с рядом причин:

🔸 разный охват баз данных Web of Science и Scopus, и, следовательно, разное количество индексируемых цитат;

🔸 различия в предметных классификаторах;

🔸 способ расчета CNCI и FWCI для публикаций, которые относятся к более чем одной предметной области.

У OpenAlex есть своя специфика в расчете FWCI:

1. База в принципе содержит больше данных и включает в себя множество работ без цитирований — это снижает средние ожидаемые значения цитирования, поэтому цитируемые работы, скорее всего, будут иметь более высокие значения FWCI в OpenAlex.

2. У OpenAlex принципиально другой подход к классификации — тематика (primary topic), по которой нормализуется цитируемость, присваивается публикации, а не журналу. Поэтому FWCI/CNCI, нормализованный по предметным областям журналов, может значительно отличаться от FWCI согласно OpenAlex.

3. В OpenAlex датой публикации считается дата, когда публикация впервые появилась в сети. Однако дата выхода периодического издания может быть на год позже сетевой публикации, что влияет на окно цитируемости.

Небольшой пробный анализ мы сделали на недавнем массиве публикаций, которые мы использовали для анализа гендерной гомофилии (тип публикации "article", год публикации 2023, выборка из журналов RSCI, включая переводные версии). Общее количество таких публикаций на данный момент составляет 56 641. 47 359 (!) публикаций имеют нулевой FCWI, при этом у 2261 работы ненулевая цитируемость.

На графике визуализированы 25 наиболее популярных областей (то есть таких, в которых количество работ было наибольшим — разброс составил от 565 до 1751 публикаций: по инфекционным заболеваниям и по социологии и политическим наукам соответственно). Нулевые значения FWCI убраны из рассмотрения, поскольку сильно смещают график вниз; также удалено 46 выбросов (с FWCI от 10,03 до 146,352; наибольшее значение у статьи под названием "2021 ESC Guidelines for the diagnosis and treatment of acute and chronic heart failure", опубликованной в Российском Кардиологическим журнале).

Области, в которых основной массив публикаций располагается выше 1, можно считать достаточно авторитетными в российских журналах: это означает, что большинство тех статей, которые в принципе цитируются, цитируется чаще, чем ожидается на среднемировом уровне.

Однако выбросы, которые мы удалили (FWCI > 10), наглядно демонстрируют, что метрика должна использоваться с большой осторожностью: например, у целого ряда работ FWCI составляет 12,179 при количестве цитирований, равном 2.

#OpenAlex #Scopus #FWCI #цитируемость #визуализация