О «спящих красавицах» или эффекте статей-бустеров
У научных публикаций есть стандартный паттерн цитируемости: постепенное возрастание числа цитирований в течение нескольких лет, а после пика — медленное снижение. В ряде научных областей, а также при отсутствии устаревания содержания статьи, уровень цитируемости выходит на плато. Наконец, для фундаментальных публикаций, ставших классическими в своей области, цитируемость со временем может снова постепенно возрастать.
Еще в 2004 г. ван Раан описал феномен «спящих красавиц» — статей, которые в течение долгого периода остаются незамеченными, а затем вдруг привлекают повышенное внимание благодаря одной или нескольким цитированиям. Он предложил три характеристики для таких статей: глубина «сна», продолжительность «сна» и интенсивность «пробуждения», а также выявил лидера по этим показателям и предложил метод предсказания «пробуждения».
С повышением качества метаданных в международных библиометрических базах к описанной проблеме выработался новый подход, позволяющий не только найти «пробуждающие» статьи, но и выявить общие темы, то есть выяснить, в каком направлении развивается научная мысль в данной сфере. Так, в недавней публикации в Scientometrics описывалось неожиданное изменение профиля цитируемости статьи о квантовом эффекте Холла (за эту работу Клаус фон Клитцинг получил Нобелевскую премию по физике в 1985 году). Статья фон Клитцинга, опубликованная в 1980 г., вышла на плато цитируемости (порядка 70) в 1990 г., а в 2021 г. достигла нового пика популярности — ее процитировали почти 300 раз. Это привлекло внимание авторов, которые решили найти причины возрождения интереса к описываемой проблеме. Для этого они использовали данные Web of Science и метод RPYS-CO (Reference Publication Year Spectroscopy based on co-cited papers), который позволяет выявить истоки и отследить историю разработки какой-либо научной темы.
Выяснилось, что наиболее вероятными статьями-«бустерами» (или, по ван Раану, «принцами»), которые снова привлекли внимание к классической публикации фон Клитцига, стали пять публикаций, вышедших с 2005 по 2010 г., и все они посвящены одной из тем, которые затрагивались в изначальном исследовании (а именно — топологическим изоляторам). Описанный метод можно применять для анализа других случаев нестандартного профиля цитируемости.
#webofscience #цитируемость #обзор
У научных публикаций есть стандартный паттерн цитируемости: постепенное возрастание числа цитирований в течение нескольких лет, а после пика — медленное снижение. В ряде научных областей, а также при отсутствии устаревания содержания статьи, уровень цитируемости выходит на плато. Наконец, для фундаментальных публикаций, ставших классическими в своей области, цитируемость со временем может снова постепенно возрастать.
Еще в 2004 г. ван Раан описал феномен «спящих красавиц» — статей, которые в течение долгого периода остаются незамеченными, а затем вдруг привлекают повышенное внимание благодаря одной или нескольким цитированиям. Он предложил три характеристики для таких статей: глубина «сна», продолжительность «сна» и интенсивность «пробуждения», а также выявил лидера по этим показателям и предложил метод предсказания «пробуждения».
С повышением качества метаданных в международных библиометрических базах к описанной проблеме выработался новый подход, позволяющий не только найти «пробуждающие» статьи, но и выявить общие темы, то есть выяснить, в каком направлении развивается научная мысль в данной сфере. Так, в недавней публикации в Scientometrics описывалось неожиданное изменение профиля цитируемости статьи о квантовом эффекте Холла (за эту работу Клаус фон Клитцинг получил Нобелевскую премию по физике в 1985 году). Статья фон Клитцинга, опубликованная в 1980 г., вышла на плато цитируемости (порядка 70) в 1990 г., а в 2021 г. достигла нового пика популярности — ее процитировали почти 300 раз. Это привлекло внимание авторов, которые решили найти причины возрождения интереса к описываемой проблеме. Для этого они использовали данные Web of Science и метод RPYS-CO (Reference Publication Year Spectroscopy based on co-cited papers), который позволяет выявить истоки и отследить историю разработки какой-либо научной темы.
Выяснилось, что наиболее вероятными статьями-«бустерами» (или, по ван Раану, «принцами»), которые снова привлекли внимание к классической публикации фон Клитцига, стали пять публикаций, вышедших с 2005 по 2010 г., и все они посвящены одной из тем, которые затрагивались в изначальном исследовании (а именно — топологическим изоляторам). Описанный метод можно применять для анализа других случаев нестандартного профиля цитируемости.
#webofscience #цитируемость #обзор
Спящие красавицы и статьи бустеры: (не-)удачный эксперимент
В одном из прошлых постов мы писали о «спящих красавицах» — статьях, которые долгое время после публикации оставались без внимания, а потом по различным причинам начинали активно цитироваться. Эта тема заинтересовала нас, и мы решили частично повторить опыт подобного исследования.
Предлагаем читателям поделиться своими идеями, как можно было бы улучшить предлагаемый подход, в комментариях.
#цитируемость #аналитика #визуализация
В одном из прошлых постов мы писали о «спящих красавицах» — статьях, которые долгое время после публикации оставались без внимания, а потом по различным причинам начинали активно цитироваться. Эта тема заинтересовала нас, и мы решили частично повторить опыт подобного исследования.
Предлагаем читателям поделиться своими идеями, как можно было бы улучшить предлагаемый подход, в комментариях.
#цитируемость #аналитика #визуализация
Telegraph
Спящие красавицы и статьи бустеры: (не-)удачный эксперимент
Пользуясь методом ван Раана, мы проанализировали массив российских публикаций, вышедших до 1990 года, и выявили 12 работ, подходящих под наши критерии: «Cон» должен быть глубоким — не более 2 цитирований в год вплоть до момента «пробуждения»; Долгим — не…
FWCI в OpenAlex: первые пробы
12 августа 2024 OpenAlex добавил к своим показателям FWCI (Field-weighted Citation Impact — индекс цитирования, взвешенный по области науки). Рассчитывается он как и в других случаях через отношение количества цитирований за три года (плюс год публикации) к ожидаемому количеству цитирований по данному типу и предметной области (в OpenAlex используется третий по детализации уровень классификации — subfield).
Изначально FWCI появился в SciVal как одна из snowball-метрик. В Web of Science есть аналогичная метрика — CNCI (Category Normalized Citation Impact), однако исследователи давно заметили, что показатели FWCI и CNCI для одной и той же публикации различаются — иногда значительно. Это связано с рядом причин:
🔸 разный охват баз данных Web of Science и Scopus, и, следовательно, разное количество индексируемых цитат;
🔸 различия в предметных классификаторах;
🔸 способ расчета CNCI и FWCI для публикаций, которые относятся к более чем одной предметной области.
У OpenAlex есть своя специфика в расчете FWCI:
1. База в принципе содержит больше данных и включает в себя множество работ без цитирований — это снижает средние ожидаемые значения цитирования, поэтому цитируемые работы, скорее всего, будут иметь более высокие значения FWCI в OpenAlex.
2. У OpenAlex принципиально другой подход к классификации — тематика (primary topic), по которой нормализуется цитируемость, присваивается публикации, а не журналу. Поэтому FWCI/CNCI, нормализованный по предметным областям журналов, может значительно отличаться от FWCI согласно OpenAlex.
3. В OpenAlex датой публикации считается дата, когда публикация впервые появилась в сети. Однако дата выхода периодического издания может быть на год позже сетевой публикации, что влияет на окно цитируемости.
Небольшой пробный анализ мы сделали на недавнем массиве публикаций, которые мы использовали для анализа гендерной гомофилии (тип публикации "article", год публикации 2023, выборка из журналов RSCI, включая переводные версии). Общее количество таких публикаций на данный момент составляет 56 641. 47 359 (!) публикаций имеют нулевой FCWI, при этом у 2261 работы ненулевая цитируемость.
На графике визуализированы 25 наиболее популярных областей (то есть таких, в которых количество работ было наибольшим — разброс составил от 565 до 1751 публикаций: по инфекционным заболеваниям и по социологии и политическим наукам соответственно). Нулевые значения FWCI убраны из рассмотрения, поскольку сильно смещают график вниз; также удалено 46 выбросов (с FWCI от 10,03 до 146,352; наибольшее значение у статьи под названием "2021 ESC Guidelines for the diagnosis and treatment of acute and chronic heart failure", опубликованной в Российском Кардиологическим журнале).
Области, в которых основной массив публикаций располагается выше 1, можно считать достаточно авторитетными в российских журналах: это означает, что большинство тех статей, которые в принципе цитируются, цитируется чаще, чем ожидается на среднемировом уровне.
Однако выбросы, которые мы удалили (FWCI > 10), наглядно демонстрируют, что метрика должна использоваться с большой осторожностью: например, у целого ряда работ FWCI составляет 12,179 при количестве цитирований, равном 2.
#OpenAlex #Scopus #FWCI #цитируемость #визуализация
12 августа 2024 OpenAlex добавил к своим показателям FWCI (Field-weighted Citation Impact — индекс цитирования, взвешенный по области науки). Рассчитывается он как и в других случаях через отношение количества цитирований за три года (плюс год публикации) к ожидаемому количеству цитирований по данному типу и предметной области (в OpenAlex используется третий по детализации уровень классификации — subfield).
Изначально FWCI появился в SciVal как одна из snowball-метрик. В Web of Science есть аналогичная метрика — CNCI (Category Normalized Citation Impact), однако исследователи давно заметили, что показатели FWCI и CNCI для одной и той же публикации различаются — иногда значительно. Это связано с рядом причин:
🔸 разный охват баз данных Web of Science и Scopus, и, следовательно, разное количество индексируемых цитат;
🔸 различия в предметных классификаторах;
🔸 способ расчета CNCI и FWCI для публикаций, которые относятся к более чем одной предметной области.
У OpenAlex есть своя специфика в расчете FWCI:
1. База в принципе содержит больше данных и включает в себя множество работ без цитирований — это снижает средние ожидаемые значения цитирования, поэтому цитируемые работы, скорее всего, будут иметь более высокие значения FWCI в OpenAlex.
2. У OpenAlex принципиально другой подход к классификации — тематика (primary topic), по которой нормализуется цитируемость, присваивается публикации, а не журналу. Поэтому FWCI/CNCI, нормализованный по предметным областям журналов, может значительно отличаться от FWCI согласно OpenAlex.
3. В OpenAlex датой публикации считается дата, когда публикация впервые появилась в сети. Однако дата выхода периодического издания может быть на год позже сетевой публикации, что влияет на окно цитируемости.
Небольшой пробный анализ мы сделали на недавнем массиве публикаций, которые мы использовали для анализа гендерной гомофилии (тип публикации "article", год публикации 2023, выборка из журналов RSCI, включая переводные версии). Общее количество таких публикаций на данный момент составляет 56 641. 47 359 (!) публикаций имеют нулевой FCWI, при этом у 2261 работы ненулевая цитируемость.
На графике визуализированы 25 наиболее популярных областей (то есть таких, в которых количество работ было наибольшим — разброс составил от 565 до 1751 публикаций: по инфекционным заболеваниям и по социологии и политическим наукам соответственно). Нулевые значения FWCI убраны из рассмотрения, поскольку сильно смещают график вниз; также удалено 46 выбросов (с FWCI от 10,03 до 146,352; наибольшее значение у статьи под названием "2021 ESC Guidelines for the diagnosis and treatment of acute and chronic heart failure", опубликованной в Российском Кардиологическим журнале).
Области, в которых основной массив публикаций располагается выше 1, можно считать достаточно авторитетными в российских журналах: это означает, что большинство тех статей, которые в принципе цитируются, цитируется чаще, чем ожидается на среднемировом уровне.
Однако выбросы, которые мы удалили (FWCI > 10), наглядно демонстрируют, что метрика должна использоваться с большой осторожностью: например, у целого ряда работ FWCI составляет 12,179 при количестве цитирований, равном 2.
#OpenAlex #Scopus #FWCI #цитируемость #визуализация