Выше квартилей
2.74K subscribers
110 photos
1 video
1 file
302 links
HSE: Home of Scientometrics and Expertise

Обучение и консультирование по практическим вопросам research evaluation и управлении наукой.

Все вопросы и предложения направляйте @vyshekbot или на почту Наукометрического центра ВШЭ: scientometrics@hse.ru
Download Telegram
Сравнение качества метаданных в БД CrossRef, Lens, OpenAlex, Scopus, Semantic Scholar, Web of Science Core Collection

Сейчас часто говорят о необходимости перехода на другие базы данных, помимо Scopus и Web of Science. Какие есть альтернативы? Недавно вышла статья Лутая и Любушко, в которой проведен сравнительный анализ качества метаданных научных публикаций в БД Scopus, Web of Science, CrossRef, Lens, Semantic Scholar и OpenAlex. Речь пойдет про отличия работы механизмов баз данных: почему не все данные в разных базах совпадают, отличается количество авторов и их имена и т.д. Подробнее про источники данных для анализа и ограничения читайте в самой статье.

На протяжении последних десятилетий Scopus и Web of Science считались золотым стандартом качества метаданных. Но с появлением новых открытых инструментов для поиска научных публикаций (Dimensions, Semantic Scholar, Lens, SciLit и OpenAlex) наукометристы могут охватывать гораздо большее количество публикаций.

Особенно важны для аналитики следующие метаданные: информация об авторах исследования и их месте работы, списки пристатейной литературы и цитирующих статей, информация о финансировании исследований.

Из Scopus, Wеb of Science Core Collection и CrossRef были выделены публикации с участием российских авторов, присутствующие во всех 3-х БД. Из полученного списка случайным образом сформировали 4 выборки по 15000 уникальных (по DOI) документов, опубликованных в 2021, 2020, 2019 и 2016-2018 годах.

Приводим некоторые из наблюдений статьи:

1. Отличия в написании имен авторов статьи и их количества в разных БД могут быть вызваны следующими причинами: использование названия команды исследователей вместо индивидуальных имен, включение фамилий авторов на кириллице и латинице, удвоение фамилий, разрыв составных фамилий по дефису, включение расширенного состава исследовательских групп в список авторов, включение аффилиаций в перечень имен.

2. Некоторые издатели чаще других допускают ошибки в оформлении метаданных статей. Для некоторых российских издательств (Consillium Medicum, the Russian Academy of Sciences, Tomsk State University, Ural Federal University) доля ошибок действительно высока. Из зарубежных издательств наибольший уровень различий наблюдался для Oxford University Press (5.0%), American Astronomical Society (3.8%).

3. Благодаря инициативе по открытию списков литературы, издатели начали переводить списки литературы в БД CrossRef в формат открытой лицензии. Однако, на январь 2022 не все крупные издатели перевели в открытый формат списки пристатейной литературы.

4. Суммарное количество источников в списках литературы в БД Scopus – 2213075, CrossRef– 2048947 и Web of Science Core Collection – 2194431. Во всех подгруппах (по году публикации) суммарное количество цитирований в Web of Science Core Collection меньше, чем в других БД. CrossRef опережает Web of Science Core Collection, но уступает Scopus. Количество цитирований в Lens, Semantic Scholar и OpenAlex приблизительно одинаково и больше наблюдаемого для Scopus.

6. Частота упоминаний аффилиаций в CrossRef растет от группы статей 2016-2018 годов к группе статей 2021 года, но пока на исследуемом массиве статей составляет лишь 20%. В Semantic Scholar аффилиации появляются лишь эпизодически.

7. Некоторые поля метаданных (о месте работы авторов, о финансировании, реферат) до сих пор заполнены в недостаточной степени, чтобы представить конкуренцию Scopus и Web of Science Core Collection для решения задач учета и мониторинга.

Из иллюстраций привели в пример информацию о количестве цитирований и попарное сравнение баз данных.

#обзор #инфографика #базыданных
​​OPEN ACCESS DASHBOARD

COKI (Curtin Open Knowledge Initiative) разработали интерактивную панель стран и университетов с открытым доступом. Открытый доступ к результатам исследований — небольшая, но важная часть эффективного открытого института знаний. COKI относят статью к открытому доступу, если она открыта у издателя, открыта у другой платформы или и у издателя, и на других платформах вместе.

Датасет COKI Open Access охватывает 142 страны и 5118 институций, которые имеют как минимум 1000 публикаций. Процесс работы такой:
1. Данные о публикациях берут из нескольких источников: Crossref Metadata (цитаты, название статьи, название журнала), Crossref Funder Registry (спонсор), Crossref Events (соцсети и мероприятия), Microsoft Academic Graph (MAG) (аффилиация, тема), Unpaywall (статус OA), the Research Organization Registry (ROR) (идентификаторы учреждения), Open Citations (дополнительная информация о цитировании).
2. Синтезируют их: группируют публикации по общему признаку и году издания (например, институция + год публикации).
3. Делают расчеты открытого доступа для каждой страны или учреждения.
Данные визуализируются здесь. О том, как это работает и какие у системы ограничения, можно почитать здесь.

Так, для России процент статей с открытым доступом 27% (209 тысяч публикаций). К 2021 году 22% статей с открытым доступом у издателя, 5% — с открытым доступом на других платформах, 14% — с открытым доступом и у издателя, и на других платформах.

Мы сделали срез по организациям РФ с 1000 и более публикаций в 2021 году и упорядочили их по открытому доступу, он составляет от 22 до 58 %. Подробнее на визуализации.

#открытыйдоступ #университеты #инфографика #россия
SJR 2021: изменения в квартилях Российских журналов

Несколько дней назад обновились квартили Scopus. Мы сделали динамику обновленного рейтинга 2021 по сравнению с предыдущим.
В целом число журналов растет, причем самый заметный рост произошел за счет первого (было 32 журнала — стало 53) и четвертого (было 160 — стало 181) квартилей. Остальные журналы в основном стабильны в квартилях. Уровень Q1 удалось удержать 27 российским журналам, Q2 — 44 журналам, а еще 14 журналов поднялись с Q2 на Q1. На том же уровне Q3 остались 52 журнала, на Q4 — 126 журналов. Понизили свой статус в общем 42 журнала, а повысили — 105 журналов.

#scopus #sjr #квартили #россия #журналы #инфографика
​​ORCID как цифровой паспорт ученого: прогресс по странам, областям и организациям

Задачу построения всемирной и связной системы научной информации невозможно решить без уникальных идентификаторов публикаций (doi), журналов (ISSN), организаций (ROR), и, конечно, авторов. Для последних главным и общеупотребимым идентификатором ныне безоговорочно признается ORCID — глобальный, некоммерческий и открытый, а главное, уже вовсю применяемый издательствами при публикации научных текстов (подробнее — в нашем руководстве).

Тем не менее, до полного охвата ORCID еще очень далеко, а многие из уже полученных номеров не связаны ни с какими публикациями. Насколько далеко и насколько многие? На это в своем новом исследовании отвечает Саймон Портер из Digital Science, используя принадлежащую этой компании базу Dimensions. Портер рассчитал показатели adoption (процент ученых, хотя бы одна публикация которых за данный год привязана к ORCID) и engagement (процент публикаций ученого, привязанных к его ORCID) и агрегировал их для стран и организаций, включая российские (ученый приписывался к стране и организации по аффилиации в последней работе).

Результаты — в интерактивном дэшборде.

Отрадно, что Вышка — один из российских лидеров по adoption (в два раза выше, чем у МГУ, почти в три – чем в РАН). Остается поработать над engagement.

#обзор #ORCID #dimensions #университеты #вышка #инфографика
Высшая школа экономики как сеть соавторов

Высшая школа экономики за 30 лет стала университетом, в котором работают ведущие ученые из совершенно разных областей. Неудивительно, ведь наше кредо — ориентация на науку мирового уровня, а она лучше всего развивается там, где собраны талантливые люди из разных дисциплин, обменивающиеся опытом и идеями.

При этом для ученых любые красивые слова типа вышеизложенного — просто слова, если они не подкреплены наблюдениями и фактами, особенно это касается «междисциплинарности» и прочих звучных, но подчас пустых оборотов.

К счастью, для Вышки междисциплинарность давно уже стала реальностью, и теперь, к юбилею, самое время это продемонстрировать.

Опираясь на данные Наукометрического центра, мы построили сеть соавторства действующих и бывших сотрудников НИУ ВШЭ по публикациям с 2011 г., индексируемым в международных научных базах. Предлагаем всем желающим изучить ее интерактивную версию.

Сеть лучше всего работает в десктопных браузерах. Цветом кодируется общее число публикаций в соавторстве, толщина линии отражает число совместных публикаций. Внизу экрана — интерфейс для поиска авторов, куда можно вбить фамилию (для однофамильцев — фамилию, имя и отчество в кавычках) и сразу найти себя и своих соавторов (1-step neighborhood) и соавторов их соавторов (2-step neighborhood).

Как нередко бывает в сетях соавторства, сеть Вышки имеет один гигантский компонент и много маленьких, не связанных с ним и друг с другом. В гигантском собраны представители совершенно разных областей — от физики до нейронауки, и, конечно, экономики. Можно наблюдать за тем, какие ученые являются связующими звеньями между разными направлениями.

Второй по размеру компонент Вышки состоит из части математиков и сотрудничающих с ними лингвистов и экономистов. «Отрыв» его от основного компонента логичен в силу малого среднего числа авторов в математике. За ним следует компонент факультета биологии и биотехнологии — области, где соавторство, наоборот, крайне распространено, но сам факультет возник не так давно. Остальные крупные отдельные компоненты концентрируются вокруг научных школ и региональных кампусов, можно надеяться, что они в перспективе свяжутся с остальными.

В качестве уникальных идентификаторов для построения сети использованы полные ФИО сотрудников, так что теоретически в ней возможны неточности. Учитывались только публикации с аффилиацией НИУ ВШЭ в Scopus или WoS, авторами которых были действующие на момент индексации в базах сотрудники нашего университета.

#обзор #вышка #инфографика #соавторство
​​Динамика высокоцитируемых публикаций для ВУЗов трека «Исследовательское лидерство» в программе Приоритет 2030

В методике Приоритет для ВУЗов исследовательского трека есть (был?) параметр Highly Cited Papers — высокоцитируемые публикации. Он считается по WoS Core Collection и определенному классификатору ESI и определяется как число публикаций за 5 лет в 1% по цитируемости. Согласно методике, окончательные показатели для ВУЗов фиксируются на 1 июля соответствующего года. К сожалению, в виду отключения базы в РФ, нам не удалось достать все данные, но приводим динамику основного публикационного показателя программы по 14 ВУЗам из 17. В виду особенностей расчета показателя — именно эти данные пошли бы в отчет про программе.

#рейтинг #университеты #россия #инфографика #приоритет2030
​​Публикации по философии в Scopus 2011-2021: рейтинг ВУЗов и научных организаций

Сегодня, во всемирный день философии, мы предлагаем посмотреть, как сменяли друг друга вузы и научные организации в рейтинге по числу публикаций в журналах по философии (article и review) за последние 10 лет. Приводим динамику по данным Scopus. Российские организации выделены синим цветом.

#инфографика #университеты #scopus
Год каналу «Выше квартилей»!

Сегодня нашему каналу исполняется ровно год! Чтобы отметить это событие, мы составили ТОП-10 публикаций за год по количеству просмотров.

1️⃣ Немного наукометрии в твоём кармане
2️⃣ С днём всех влюблённых!
3️⃣ SciHub сходит со сцены? Процент нелегально доступных статей ежегодно падает
4️⃣ Высшая школа экономики как сеть соавторов
5️⃣ Лидеры РФ по высокоцитируемым публикациям
6️⃣ Приглашаем всех на открытые и бесплатные вебинары по новой наукометрии!
7️⃣ Агрегаторы научных конференций
8️⃣ Новые квартили WoS
9️⃣ Динамика высокоцитируемых публикаций для ВУЗов трека «Исследовательское лидерство» в программе Приоритет 2030
🔟 Компьютерные науки в мире и России: анализ через топовые конференции

За этот год мы успели выпустить обзоры на статьи и события, визуализировали данные, сравнивали российские вузы и научные учреждения, анализировали экспертные списки. По хэштегу #обзоры можно почитать рецензии и обзоры на научные статьи и книги, по хэштегу #руководство — материалы и обновления в онлайн-руководстве по наукометрии, в группе #университеты — материалы, связанные с ВШЭ и другими университетами, а в разделах #инфографика и #инструменты — инструменты, метрики и термины, полезные для наукометрического анализа и развития учёного. Больше хэштегов для навигации закреплено в нашем первом посте.

Надеемся, что следующий год будет таким же продуктивным, и благодарим всех авторов и читателей нашего канала!
Сегодня подготовили для вас небольшую статистику по числу исследований, тематически связанных с женщинами, феминизмом и гендерным неравенством, в России и мире за последние годы (релевантные концепты OpenAlex). А всем нашим подписчицам хотим сказать: пусть формальной наукометрии в вашей жизни будет меньше, а возможностей в науке открывается все больше.

#инфографика #открытыйдоступ #исследование #женщины
Как меняется международное соавторство в российских публикациях?

Публикации 2022 года уже в основном проиндексированы в Scopus, поэтому можно попробовать ответить на этот вопрос с опорой на данную базу.

Мы подсчитали общее число публикаций в Scopus (article, review, data paper, book, book chapter) в разбивке по укрупненным группам наук и трем ключевым странам: США, Китай и Германия. Предваряя результаты, отметим: все области очень разного размера, и чем больше число публикаций, тем показательнее данные о проценте работ с той или иной страной. Четыре области, в которых за два года не набралось и тысячи российских публикаций, мы из рассмотрения исключили. Также исключена область «мультидисциплинарные исследования», на деле состоящая из публикаций в журналах типа PLOS One, которые Scopus не умеет приписывать к конкретным тематикам.

Процент работ с иностранными соавторами выбранных стран в целом мал: шкала на диаграммах не доходит до 20%. Это во многом объясняется успешным покорением Scopus сотнями российских журналов, случившимся в последние годы, и неравномерным по направлениям. Международных статей в них, увы, в среднем очень мало. С другой стороны, если вовсе исключить из рассмотрения российские журналы, картина будет тоже искажена.

Направления на диаграммах расположились по часовой стрелке по тематической близости (в понимании Scopus): науки о здоровье, затем сельскохозяйственные и биологические, технические и естественные, общественные и гуманитарные.

На графиках: общее число публикаций России в 2021-22 гг. по областям науки; процент российских работ с аффилиацией данной страны в 2021 году; процент российских работ с аффилиацией данной страны в 2022 году.

#журналы #россия #scopus #инфографика #международноесотрудничество
Сегодня, во всемирный день поэзии, предлагаем вам взглянуть на то, как обстоят дела с научными публикациями, тематически связанными с данной областью, на массиве данных OpenAlex. Рассматриваем работы за последние 10 лет (с 1 января 2013 года), у которых в списке тематик был тэг «Poetry». Таких публикаций оказалось чуть больше 200 тысяч.

Отфильтровав работы по типу публикации «journal article» и по уровню связи с тематикой, сократили их общее количество до 70 тысяч публикаций. Заметим, что следующий фильтр (по наличию хотя бы одной аффилиации) сократил список до 18 тысяч, что, на наш взгляд, демонстрирует ограниченность метаданных по аффилиациям в текущей конфигурации OpenAlex.

После итогового сведения результатов и удаления дубликатов, мы получили 1255 образовательных организаций, имеющих хотя бы одну публикацию по поэзии. Среди них у 953 есть совместная работа с другим вузом (внутриуниверситетские коллаборации не учитывались). Их можно легко визуализировать, нажав на пункт «Связи» в легенде.

Также исследовались отдельные концепты, относящиеся к различным поэтическим группам: американской, арабской, английской, латинской, русской, китайской (отдельно — классической китайской) поэзиям. Несмотря на отсутствие прямого концепта «русская поэзия» в OpenAlex, нам удалось его сформировать на основе пересечений массивов публикаций по тематикам «Poetry» и «Russian literature». Отметим, что уход на данный уровень анализа ясно показывает несовершенство автоматически формируемых тематик более низкого порядка (например, английскую поэзию в Великобритании при использованном нами подходе «не изучают»), но определенный потенциал (особенно при расширении числа метаданных) он все же имеет. Чтобы выделить конкретный концепт, дважды кликните по его названию в легенде диаграммы.

#OpenAlex #открытыйдоступ #инфографика
Обзор характеристик статей и авторов в предметных областях WoS

Сегодня расскажем вам про препринт, в котором представлен обзор характеристик статей и авторов на уровне классификаций второстепенных и основных областей науки стран ОЭСР. Анализ основан на данных Web of Science за период 2000-2020 гг. В статье приведен качественный литобзор с акцентом на том, какие показатели ранее использовались в библиометрических исследованиях, а также описаны результаты по отдельным характеристикам статей и авторов. Среди них следующие наблюдения:

1. В области естественных, сельскохозяйственных наук, медицины и здравоохранения, а также техники и технологии наиболее частыми типами документов являются журнальные статьи. В гуманитарных науках, а также в медиа и социологии важную роль играют обзоры книг. В области искусства 36,1% всех публикаций приходятся на категорию «другое».
2. В медицине и науках о здоровье, особенно в клинических исследованиях, обзоры в целом представлены в большей степени, чем в других дисциплинах, хотя в отдельных областях (химические, биологические науки, науки о животных и молочных продуктах, а также психология, медицинская инженерия и экологическая биотехнология) также имеется определенная степень вторичной литературы.
3. Наиболее стабильными с течением времени между годами публикации цитирующего и цитируемого документа выглядят инженерные области и компьютерные науки. Ученые в области компьютерных наук склонны ссылаться на более новые материалы, что может объясняться быстрым ростом в этой области. А для гуманитарных наук характерен длительный и растущий медианный возраст ссылок.
4. Области социальных наук (а также история и археология) имеют самые длинные списки ссылок, в то время как в области медицины и здравоохранения списки ссылок в целом растут медленнее, чем в других областях.
5. По длине статей медицинские и сельскохозяйственные науки, а также в некоторой степени инженерные и технологические науки находятся в конце списка с 5-10 страницами на публикацию, в то время как для естественных наук диапазон колеблется от 5 до 20 страниц. При этом в гуманитарных науках длина статей около 20 страниц, в социальных — 10-20 страниц, а в области права — в среднем около 30 страниц. Самые длинные же статьи публикуют по математике и информатике.
6. Количество ссылок на страницу статьи (плотность ссылок) может показать, являются ли статьи в данной области информационно насыщенными. Гуманитарные и большинство социальных наук, а также математика и некоторые инженерные области имеют наименьшую плотность ссылок.
7. Рост соавторов наблюдается во всех областях, за исключением математики и гуманитарных наук. Компьютерные науки и математика — единственные области, в которых в среднем на одну статью приходится менее пяти соавторов. Для социальных и гуманитарных наук длинные списки соавторства также скорее редкость.

Что касается характеристик автора, то основные выводы такие:

• Алфавитные списки авторов распространены в математике и информатике, а также в большинстве социальных и всех гуманитарных науках.
• Во многих естественных науках и инженерных областях очень мало женщин-ученых, в то время как в области здравоохранения, некоторых социальных и гуманитарных науках достигнут паритет (ранее мы уже указывали на схожие результаты в нашем предыдущем обзоре).
• Существует сильная связь между положением автора и количеством написанных им работ в областях без алфавитного порядка, за исключением гуманитарных и социальных наук (хотя психология в этом отношении больше похожа на медицину).
• Даже в областях с паритетом и в областях с алфавитным порядком (за редким исключением) чаще женщины являются первыми авторами (зачастую в начале карьеры), а мужчины — последними авторами (зачастую в старшем возрасте).

#обзор #wos #инфографика
Всемирный день искусства сквозь призму наукометрии и креативной карьеры

Архитектура, кинематограф, танец, изобразительное искусство, литература, музыка, фотография, театр — на все эти направления искусства мы сегодня решили взглянуть с помощью наукометрии. Мы проанализировали статьи из базы данных OpenAlex, которым был присвоен хотя бы один concept из специально составленных по каждой тематике списков. Количество статей варьировалось от 7600 (по архитектуре) до 175000 (по литературе). В общей сложности под результат запроса попали 412000 статей.

Мы также использовали аннотации к статьям, чтобы определить, какие словосочетания встречаются в статьях чаще других. В аннотациях мы выделили ряд биграмм и 1000 наиболее часто встречающихся по каждой тематике изобразили на картинках к посту.

Говоря об исследованиях в области искусства, нельзя не затронуть вопрос о том, как ученому и художнику представить свои достижения. На прошлой неделе прошел круглый стол «Помогающие инициативы для развития креативной карьеры», с материалами которого рекомендуем вам ознакомиться. К дискуссии были приглашены представители «помогающих инициатив», которые работают с карьерным развитием в сложных сегментах — художественном (искусство, литература, хореография) и научном.

Круглый стол прошел в рамках конференции «Теории и практики искусства и дизайна: социокультурные, экономические и политические контексты», ассоциированном мероприятии XXIV Ясинской конференции.

#OpenAlex #открытыйдоступ #инфографика
​​SJR 2022: что изменилось для российских журналов

В начале месяца обновились данные по показателю SJR для журналов, входящих в Scopus. Всего в обновленный список вошло 27955 изданий (годом ранее — 28306 журналов). В целом, тренд на сокращение рейтингового списка сохраняется с 2017 года.

Как и в прошлом году мы решили посмотреть на изменение позиций для журналов из России. Всего таких изданий в списке 507 — на 3 больше, чем в прошлом году. Большинство журналов Q1 по максимальному квартилю сохранили свои позиции (35 из 53). Сразу 7 журналов без квартиля по итогам прошлого года попали в Q1 сейчас, но в целом доля верхних квартилей изменилась незначительно. Журналы без квартиля в прошлом году в основном попали в 4 квартиль (41 из 76).

Для наглядности вновь подготовили sankey-диаграмму, которая отражает «миграцию» журналов. Кроме того, к ней прилагается таблица с указанием квартилей журналов в 2021 и 2022 году, в которой можно отфильтровать представленные на диаграмме случаи.

#scopus #sjr #квартили #россия #журналы #инфографика
День русского языка: Пушкин в научных статьях

Сегодня, в День русского языка, в Вышке будут объявлены победители Конкурса лучших русскоязычных научных и научно-популярных работ работников НИУ ВШЭ. В этом году конкурс проводится уже в третий раз, в нем представлено 259 работ по двум номинациям: научной и научно-популярной.

Учреждение Дня русского языка приурочено ко дню рождения великого русского поэта Александра Сергеевича Пушкина, отмечаемого ежегодного 6 июня. Чтобы проследить влияние поэта на исследователей и их работы, мы проанализировали статьи из базы данных OpenAlex, у которых в заголовке присутствует слово «Пушкин». Всего таких статей было 1806. Из аннотаций к ним, переведенным на русский язык, составили облако слов. Самыми часто встречающимися словами были названия его произведений: Евгений Онегин, Борис Годунов, Медный всадник, а также другие русские писатели и поэты, на многих из которых творчество Александра Сергеевича оказало непосредственное влияние, — Анна Ахматова, Борис Пастернак, Владимир Набоков, Иосиф Бродский. Конечно, встречается и профессиональная лексика таких областей, как культурология и филология: культурный код, интертекстуальный анализ, критический прием. Интересно, что среди слов-ассоциаций выделяются также дополненная реальность и итальянское кино.

#вышка #инфографика #открытыйдоступ #OpenAlex #Пушкин
​​Изменения в квартилях журналов WoS

28 июня компания Clarivate опубликовала очередной список Journal Citation Reports (JCR), в котором приводится распределение по квартилям для всех журналов, индексирующихся в Web of Science.
Как и в случае с квартилями SJR, мы проанализировали «миграцию» журналов между квартилями. Кроме того, приведены диаграммы, показывающие различия в распределении самого импакт-фактора для разных коллекций (AHCI, ESCI, SCIE и SSCI). Нужно отметить, что для журналов из коллекций Arts and Humanities Citation Index (AHCI) и Emerging Sources Citation Index (ESCI) импакт-факторы опубликованы впервые.

#wos #журналы #инфографика #квартили