Выше квартилей
2.73K subscribers
110 photos
1 video
1 file
301 links
HSE: Home of Scientometrics and Expertise

Обучение и консультирование по практическим вопросам research evaluation и управлении наукой.

Все вопросы и предложения направляйте @vyshekbot или на почту Наукометрического центра ВШЭ: scientometrics@hse.ru
Download Telegram
Сравнение качества метаданных в БД CrossRef, Lens, OpenAlex, Scopus, Semantic Scholar, Web of Science Core Collection

Сейчас часто говорят о необходимости перехода на другие базы данных, помимо Scopus и Web of Science. Какие есть альтернативы? Недавно вышла статья Лутая и Любушко, в которой проведен сравнительный анализ качества метаданных научных публикаций в БД Scopus, Web of Science, CrossRef, Lens, Semantic Scholar и OpenAlex. Речь пойдет про отличия работы механизмов баз данных: почему не все данные в разных базах совпадают, отличается количество авторов и их имена и т.д. Подробнее про источники данных для анализа и ограничения читайте в самой статье.

На протяжении последних десятилетий Scopus и Web of Science считались золотым стандартом качества метаданных. Но с появлением новых открытых инструментов для поиска научных публикаций (Dimensions, Semantic Scholar, Lens, SciLit и OpenAlex) наукометристы могут охватывать гораздо большее количество публикаций.

Особенно важны для аналитики следующие метаданные: информация об авторах исследования и их месте работы, списки пристатейной литературы и цитирующих статей, информация о финансировании исследований.

Из Scopus, Wеb of Science Core Collection и CrossRef были выделены публикации с участием российских авторов, присутствующие во всех 3-х БД. Из полученного списка случайным образом сформировали 4 выборки по 15000 уникальных (по DOI) документов, опубликованных в 2021, 2020, 2019 и 2016-2018 годах.

Приводим некоторые из наблюдений статьи:

1. Отличия в написании имен авторов статьи и их количества в разных БД могут быть вызваны следующими причинами: использование названия команды исследователей вместо индивидуальных имен, включение фамилий авторов на кириллице и латинице, удвоение фамилий, разрыв составных фамилий по дефису, включение расширенного состава исследовательских групп в список авторов, включение аффилиаций в перечень имен.

2. Некоторые издатели чаще других допускают ошибки в оформлении метаданных статей. Для некоторых российских издательств (Consillium Medicum, the Russian Academy of Sciences, Tomsk State University, Ural Federal University) доля ошибок действительно высока. Из зарубежных издательств наибольший уровень различий наблюдался для Oxford University Press (5.0%), American Astronomical Society (3.8%).

3. Благодаря инициативе по открытию списков литературы, издатели начали переводить списки литературы в БД CrossRef в формат открытой лицензии. Однако, на январь 2022 не все крупные издатели перевели в открытый формат списки пристатейной литературы.

4. Суммарное количество источников в списках литературы в БД Scopus – 2213075, CrossRef– 2048947 и Web of Science Core Collection – 2194431. Во всех подгруппах (по году публикации) суммарное количество цитирований в Web of Science Core Collection меньше, чем в других БД. CrossRef опережает Web of Science Core Collection, но уступает Scopus. Количество цитирований в Lens, Semantic Scholar и OpenAlex приблизительно одинаково и больше наблюдаемого для Scopus.

6. Частота упоминаний аффилиаций в CrossRef растет от группы статей 2016-2018 годов к группе статей 2021 года, но пока на исследуемом массиве статей составляет лишь 20%. В Semantic Scholar аффилиации появляются лишь эпизодически.

7. Некоторые поля метаданных (о месте работы авторов, о финансировании, реферат) до сих пор заполнены в недостаточной степени, чтобы представить конкуренцию Scopus и Web of Science Core Collection для решения задач учета и мониторинга.

Из иллюстраций привели в пример информацию о количестве цитирований и попарное сравнение баз данных.

#обзор #инфографика #базыданных
​​OPEN ACCESS DASHBOARD

COKI (Curtin Open Knowledge Initiative) разработали интерактивную панель стран и университетов с открытым доступом. Открытый доступ к результатам исследований — небольшая, но важная часть эффективного открытого института знаний. COKI относят статью к открытому доступу, если она открыта у издателя, открыта у другой платформы или и у издателя, и на других платформах вместе.

Датасет COKI Open Access охватывает 142 страны и 5118 институций, которые имеют как минимум 1000 публикаций. Процесс работы такой:
1. Данные о публикациях берут из нескольких источников: Crossref Metadata (цитаты, название статьи, название журнала), Crossref Funder Registry (спонсор), Crossref Events (соцсети и мероприятия), Microsoft Academic Graph (MAG) (аффилиация, тема), Unpaywall (статус OA), the Research Organization Registry (ROR) (идентификаторы учреждения), Open Citations (дополнительная информация о цитировании).
2. Синтезируют их: группируют публикации по общему признаку и году издания (например, институция + год публикации).
3. Делают расчеты открытого доступа для каждой страны или учреждения.
Данные визуализируются здесь. О том, как это работает и какие у системы ограничения, можно почитать здесь.

Так, для России процент статей с открытым доступом 27% (209 тысяч публикаций). К 2021 году 22% статей с открытым доступом у издателя, 5% — с открытым доступом на других платформах, 14% — с открытым доступом и у издателя, и на других платформах.

Мы сделали срез по организациям РФ с 1000 и более публикаций в 2021 году и упорядочили их по открытому доступу, он составляет от 22 до 58 %. Подробнее на визуализации.

#открытыйдоступ #университеты #инфографика #россия
SJR 2021: изменения в квартилях Российских журналов

Несколько дней назад обновились квартили Scopus. Мы сделали динамику обновленного рейтинга 2021 по сравнению с предыдущим.
В целом число журналов растет, причем самый заметный рост произошел за счет первого (было 32 журнала — стало 53) и четвертого (было 160 — стало 181) квартилей. Остальные журналы в основном стабильны в квартилях. Уровень Q1 удалось удержать 27 российским журналам, Q2 — 44 журналам, а еще 14 журналов поднялись с Q2 на Q1. На том же уровне Q3 остались 52 журнала, на Q4 — 126 журналов. Понизили свой статус в общем 42 журнала, а повысили — 105 журналов.

#scopus #sjr #квартили #россия #журналы #инфографика
​​ORCID как цифровой паспорт ученого: прогресс по странам, областям и организациям

Задачу построения всемирной и связной системы научной информации невозможно решить без уникальных идентификаторов публикаций (doi), журналов (ISSN), организаций (ROR), и, конечно, авторов. Для последних главным и общеупотребимым идентификатором ныне безоговорочно признается ORCID — глобальный, некоммерческий и открытый, а главное, уже вовсю применяемый издательствами при публикации научных текстов (подробнее — в нашем руководстве).

Тем не менее, до полного охвата ORCID еще очень далеко, а многие из уже полученных номеров не связаны ни с какими публикациями. Насколько далеко и насколько многие? На это в своем новом исследовании отвечает Саймон Портер из Digital Science, используя принадлежащую этой компании базу Dimensions. Портер рассчитал показатели adoption (процент ученых, хотя бы одна публикация которых за данный год привязана к ORCID) и engagement (процент публикаций ученого, привязанных к его ORCID) и агрегировал их для стран и организаций, включая российские (ученый приписывался к стране и организации по аффилиации в последней работе).

Результаты — в интерактивном дэшборде.

Отрадно, что Вышка — один из российских лидеров по adoption (в два раза выше, чем у МГУ, почти в три – чем в РАН). Остается поработать над engagement.

#обзор #ORCID #dimensions #университеты #вышка #инфографика
Высшая школа экономики как сеть соавторов

Высшая школа экономики за 30 лет стала университетом, в котором работают ведущие ученые из совершенно разных областей. Неудивительно, ведь наше кредо — ориентация на науку мирового уровня, а она лучше всего развивается там, где собраны талантливые люди из разных дисциплин, обменивающиеся опытом и идеями.

При этом для ученых любые красивые слова типа вышеизложенного — просто слова, если они не подкреплены наблюдениями и фактами, особенно это касается «междисциплинарности» и прочих звучных, но подчас пустых оборотов.

К счастью, для Вышки междисциплинарность давно уже стала реальностью, и теперь, к юбилею, самое время это продемонстрировать.

Опираясь на данные Наукометрического центра, мы построили сеть соавторства действующих и бывших сотрудников НИУ ВШЭ по публикациям с 2011 г., индексируемым в международных научных базах. Предлагаем всем желающим изучить ее интерактивную версию.

Сеть лучше всего работает в десктопных браузерах. Цветом кодируется общее число публикаций в соавторстве, толщина линии отражает число совместных публикаций. Внизу экрана — интерфейс для поиска авторов, куда можно вбить фамилию (для однофамильцев — фамилию, имя и отчество в кавычках) и сразу найти себя и своих соавторов (1-step neighborhood) и соавторов их соавторов (2-step neighborhood).

Как нередко бывает в сетях соавторства, сеть Вышки имеет один гигантский компонент и много маленьких, не связанных с ним и друг с другом. В гигантском собраны представители совершенно разных областей — от физики до нейронауки, и, конечно, экономики. Можно наблюдать за тем, какие ученые являются связующими звеньями между разными направлениями.

Второй по размеру компонент Вышки состоит из части математиков и сотрудничающих с ними лингвистов и экономистов. «Отрыв» его от основного компонента логичен в силу малого среднего числа авторов в математике. За ним следует компонент факультета биологии и биотехнологии — области, где соавторство, наоборот, крайне распространено, но сам факультет возник не так давно. Остальные крупные отдельные компоненты концентрируются вокруг научных школ и региональных кампусов, можно надеяться, что они в перспективе свяжутся с остальными.

В качестве уникальных идентификаторов для построения сети использованы полные ФИО сотрудников, так что теоретически в ней возможны неточности. Учитывались только публикации с аффилиацией НИУ ВШЭ в Scopus или WoS, авторами которых были действующие на момент индексации в базах сотрудники нашего университета.

#обзор #вышка #инфографика #соавторство
​​Динамика высокоцитируемых публикаций для ВУЗов трека «Исследовательское лидерство» в программе Приоритет 2030

В методике Приоритет для ВУЗов исследовательского трека есть (был?) параметр Highly Cited Papers — высокоцитируемые публикации. Он считается по WoS Core Collection и определенному классификатору ESI и определяется как число публикаций за 5 лет в 1% по цитируемости. Согласно методике, окончательные показатели для ВУЗов фиксируются на 1 июля соответствующего года. К сожалению, в виду отключения базы в РФ, нам не удалось достать все данные, но приводим динамику основного публикационного показателя программы по 14 ВУЗам из 17. В виду особенностей расчета показателя — именно эти данные пошли бы в отчет про программе.

#рейтинг #университеты #россия #инфографика #приоритет2030
​​Публикации по философии в Scopus 2011-2021: рейтинг ВУЗов и научных организаций

Сегодня, во всемирный день философии, мы предлагаем посмотреть, как сменяли друг друга вузы и научные организации в рейтинге по числу публикаций в журналах по философии (article и review) за последние 10 лет. Приводим динамику по данным Scopus. Российские организации выделены синим цветом.

#инфографика #университеты #scopus
Год каналу «Выше квартилей»!

Сегодня нашему каналу исполняется ровно год! Чтобы отметить это событие, мы составили ТОП-10 публикаций за год по количеству просмотров.

1️⃣ Немного наукометрии в твоём кармане
2️⃣ С днём всех влюблённых!
3️⃣ SciHub сходит со сцены? Процент нелегально доступных статей ежегодно падает
4️⃣ Высшая школа экономики как сеть соавторов
5️⃣ Лидеры РФ по высокоцитируемым публикациям
6️⃣ Приглашаем всех на открытые и бесплатные вебинары по новой наукометрии!
7️⃣ Агрегаторы научных конференций
8️⃣ Новые квартили WoS
9️⃣ Динамика высокоцитируемых публикаций для ВУЗов трека «Исследовательское лидерство» в программе Приоритет 2030
🔟 Компьютерные науки в мире и России: анализ через топовые конференции

За этот год мы успели выпустить обзоры на статьи и события, визуализировали данные, сравнивали российские вузы и научные учреждения, анализировали экспертные списки. По хэштегу #обзоры можно почитать рецензии и обзоры на научные статьи и книги, по хэштегу #руководство — материалы и обновления в онлайн-руководстве по наукометрии, в группе #университеты — материалы, связанные с ВШЭ и другими университетами, а в разделах #инфографика и #инструменты — инструменты, метрики и термины, полезные для наукометрического анализа и развития учёного. Больше хэштегов для навигации закреплено в нашем первом посте.

Надеемся, что следующий год будет таким же продуктивным, и благодарим всех авторов и читателей нашего канала!
Сегодня подготовили для вас небольшую статистику по числу исследований, тематически связанных с женщинами, феминизмом и гендерным неравенством, в России и мире за последние годы (релевантные концепты OpenAlex). А всем нашим подписчицам хотим сказать: пусть формальной наукометрии в вашей жизни будет меньше, а возможностей в науке открывается все больше.

#инфографика #открытыйдоступ #исследование #женщины
Как меняется международное соавторство в российских публикациях?

Публикации 2022 года уже в основном проиндексированы в Scopus, поэтому можно попробовать ответить на этот вопрос с опорой на данную базу.

Мы подсчитали общее число публикаций в Scopus (article, review, data paper, book, book chapter) в разбивке по укрупненным группам наук и трем ключевым странам: США, Китай и Германия. Предваряя результаты, отметим: все области очень разного размера, и чем больше число публикаций, тем показательнее данные о проценте работ с той или иной страной. Четыре области, в которых за два года не набралось и тысячи российских публикаций, мы из рассмотрения исключили. Также исключена область «мультидисциплинарные исследования», на деле состоящая из публикаций в журналах типа PLOS One, которые Scopus не умеет приписывать к конкретным тематикам.

Процент работ с иностранными соавторами выбранных стран в целом мал: шкала на диаграммах не доходит до 20%. Это во многом объясняется успешным покорением Scopus сотнями российских журналов, случившимся в последние годы, и неравномерным по направлениям. Международных статей в них, увы, в среднем очень мало. С другой стороны, если вовсе исключить из рассмотрения российские журналы, картина будет тоже искажена.

Направления на диаграммах расположились по часовой стрелке по тематической близости (в понимании Scopus): науки о здоровье, затем сельскохозяйственные и биологические, технические и естественные, общественные и гуманитарные.

На графиках: общее число публикаций России в 2021-22 гг. по областям науки; процент российских работ с аффилиацией данной страны в 2021 году; процент российских работ с аффилиацией данной страны в 2022 году.

#журналы #россия #scopus #инфографика #международноесотрудничество