Цели устойчивого развития: сравнение исследований по Web of Science и OpenAlex
С тех пор как в 2015 году ООН представила «Цели в области устойчивого развития» (ЦУР) в качестве основной повестки на период до 2030 года, классификация исследовательских работ, содействующих выполнению поставленных целей, стала еще одним широко используемым подходом при анализе научного вклада и результативности. Для того, чтобы отметить вклад исследователей в достижение этих целей, в базах Scopus и WoS были введены специальные классификаторы, указывающие на реализацию какой из 17 целей направлено конкретное исследование. Такая схема позволила ученым оценить текущие объемы исследований в разрезе не только научных областей, но и ЦУР. Однако, можно задаться вопросом, насколько репрезентативны данные классификаторы?
Так, в 2020 году вышло крупное исследование, посвященное оценке разных подходов к определению связи исследований с ЦУР. В нем авторы указывают, что любое подобное исследование должно предполагать несколько этапов подготовки: (а) предварительная интерпретация тем и концепций ЦУР, (б) определение того, что подразумевается под “вкладом” в ЦУР, (в) преобразование концепций в поисковый запрос, который позволит найти публикации, внесшие вклад, и (г) выбор базы данных.
Исследователи отобрали статьи, которые напрямую заявляют о своем вкладе в ЦУР (т.к. оценить косвенный вклад крайне сложно), и сравнили получившиеся результаты с тем, что было реализовано при помощи SciVal компанией Elsevier. В результате они обнаружили большое расхождение полученных данных. Несмотря на то, что их собственный подход выявил примерно схожее с WoS количество статей, тем не менее, найденные разными подходами статьи совпадали только в 25-50% случаев (в отношении разных целей процент совпадения варьировался). Исходя из этих результатов, авторы статьи настаивают на том, что данные WoS, посвященные ЦУР, следует оценивать критически.
При этом 13 сентября команда OpenAlex анонсировала обновление схемы базы данных: среди прочего, были добавлены поля и баллы для обозначения силы связей с целями устойчивого развития; для разметки использовалась модель машинного обучения, основанная на репозитории Aurora Universities Network. Этот репозиторий содержит размеченные поисковые запросы, касающиеся реализации ЦУР. Мы решили воспользоваться этим, чтобы расширить и дополнить анализ приведенного исследования.
С этой целью сделали собственную выборку из OpenAlex. Первоначально были отобраны более 112 тысяч статей, для которых указана тематика (concept) «sustainable development goals», а из них выделены статьи, для которых сила связей с различными целями составляет не менее 0,6. Таких статей оказалось 21 300.
Наибольшее количество статей посвящены следующим целям:
- Цель №2 «ликвидация голода» (4536),
- Цель №8 «достойная работа и экономический рост» (4078),
- Мета-цель №17 «партнерство в интересах устойчивого развития» (3642),
- Цель №9 «индустриализация, инновации и инфраструктура» (2025).
Кроме того, мы выяснили, что 52% статей находятся в открытом доступе, при этом 65% из них имеет статус Gold OA.
Следует отметить, что статьи, отобранные таким образом, все-таки составляют неполный датасет, поскольку концепции присваиваются автоматически на основании заголовка и аннотации статьи. Таким образом, если в этих полях не указывались «цели устойчивого развития» в качестве термина, статья не попадала в нашу выборку.
Результат визуализирован в приведенной диаграмме. Предлагаем читателям сравнить показатели.
#цур #wos #openalex #обзор #журналы #инфографика
С тех пор как в 2015 году ООН представила «Цели в области устойчивого развития» (ЦУР) в качестве основной повестки на период до 2030 года, классификация исследовательских работ, содействующих выполнению поставленных целей, стала еще одним широко используемым подходом при анализе научного вклада и результативности. Для того, чтобы отметить вклад исследователей в достижение этих целей, в базах Scopus и WoS были введены специальные классификаторы, указывающие на реализацию какой из 17 целей направлено конкретное исследование. Такая схема позволила ученым оценить текущие объемы исследований в разрезе не только научных областей, но и ЦУР. Однако, можно задаться вопросом, насколько репрезентативны данные классификаторы?
Так, в 2020 году вышло крупное исследование, посвященное оценке разных подходов к определению связи исследований с ЦУР. В нем авторы указывают, что любое подобное исследование должно предполагать несколько этапов подготовки: (а) предварительная интерпретация тем и концепций ЦУР, (б) определение того, что подразумевается под “вкладом” в ЦУР, (в) преобразование концепций в поисковый запрос, который позволит найти публикации, внесшие вклад, и (г) выбор базы данных.
Исследователи отобрали статьи, которые напрямую заявляют о своем вкладе в ЦУР (т.к. оценить косвенный вклад крайне сложно), и сравнили получившиеся результаты с тем, что было реализовано при помощи SciVal компанией Elsevier. В результате они обнаружили большое расхождение полученных данных. Несмотря на то, что их собственный подход выявил примерно схожее с WoS количество статей, тем не менее, найденные разными подходами статьи совпадали только в 25-50% случаев (в отношении разных целей процент совпадения варьировался). Исходя из этих результатов, авторы статьи настаивают на том, что данные WoS, посвященные ЦУР, следует оценивать критически.
При этом 13 сентября команда OpenAlex анонсировала обновление схемы базы данных: среди прочего, были добавлены поля и баллы для обозначения силы связей с целями устойчивого развития; для разметки использовалась модель машинного обучения, основанная на репозитории Aurora Universities Network. Этот репозиторий содержит размеченные поисковые запросы, касающиеся реализации ЦУР. Мы решили воспользоваться этим, чтобы расширить и дополнить анализ приведенного исследования.
С этой целью сделали собственную выборку из OpenAlex. Первоначально были отобраны более 112 тысяч статей, для которых указана тематика (concept) «sustainable development goals», а из них выделены статьи, для которых сила связей с различными целями составляет не менее 0,6. Таких статей оказалось 21 300.
Наибольшее количество статей посвящены следующим целям:
- Цель №2 «ликвидация голода» (4536),
- Цель №8 «достойная работа и экономический рост» (4078),
- Мета-цель №17 «партнерство в интересах устойчивого развития» (3642),
- Цель №9 «индустриализация, инновации и инфраструктура» (2025).
Кроме того, мы выяснили, что 52% статей находятся в открытом доступе, при этом 65% из них имеет статус Gold OA.
Следует отметить, что статьи, отобранные таким образом, все-таки составляют неполный датасет, поскольку концепции присваиваются автоматически на основании заголовка и аннотации статьи. Таким образом, если в этих полях не указывались «цели устойчивого развития» в качестве термина, статья не попадала в нашу выборку.
Результат визуализирован в приведенной диаграмме. Предлагаем читателям сравнить показатели.
#цур #wos #openalex #обзор #журналы #инфографика
Цели устойчивого развития: внутренние и международные коллаборации
В продолжение нашего предыдущего поста о ЦУР, сегодня мы затронем тему международного партнерства и коллабораций и с этой целью обратимся к недавнему исследованию, посвященному разработке инструментов по поиску партнерств для выполнения ЦУР.
В статье указывается, что с момента оформления ЦУР большая часть усилий была направлена на выявление и оценку связей между секторами, разработку инструментов и сбор данных о взаимодействии ЦУР для политики и планирования. Но намного меньше внимания уделялось разработке методов и инструментов на основе фактических данных, которые бы ставили своей целью совершенствование подходов по внедрению коллабораций для выполнения ЦУР.
Хотя партнерства для устойчивого развития стали очень популярными и распространенными за последние два десятилетия, исследования показывают, что локальные негосударственные группы (университеты, компании, небольшие неправительственные организации, местные жители и организации на местном уровне) участвуют в реализации ЦУР недостаточно активно, так как такие партнерства являются сложными и дорогостоящими.
Используя инструменты OpenAlex, мы проанализировали распределение числа внутренних и международных коллабораций в публикациях, напрямую связанных с целями устойчивого развития. Результаты представлены на диаграмме.
Подавляющее большинство статей, напрямую касающихся устойчивого развития, — от 72% (Affordable and clean energy) до 83% (Peace, Justice and strong institutions) — пишутся в рамках внутренних коллабораций. Судя по всему международное сотрудничество наиболее характерно для целей, предполагающих активный обмен опытом и напрямую связанных с общемировым благополучием — «недорогостоящая и чистая энергия», «хорошее здоровье», «борьба с изменением климата». Внутренние коллаборации, напротив, предпочтительны в направлениях, тесно связанных с политикой конкретного государства — «мир, правосудие и эффективные институты», «качественное образование», «достойная работа и экономический рост».
#цур #openalex #обзор #инфографика
В продолжение нашего предыдущего поста о ЦУР, сегодня мы затронем тему международного партнерства и коллабораций и с этой целью обратимся к недавнему исследованию, посвященному разработке инструментов по поиску партнерств для выполнения ЦУР.
В статье указывается, что с момента оформления ЦУР большая часть усилий была направлена на выявление и оценку связей между секторами, разработку инструментов и сбор данных о взаимодействии ЦУР для политики и планирования. Но намного меньше внимания уделялось разработке методов и инструментов на основе фактических данных, которые бы ставили своей целью совершенствование подходов по внедрению коллабораций для выполнения ЦУР.
Хотя партнерства для устойчивого развития стали очень популярными и распространенными за последние два десятилетия, исследования показывают, что локальные негосударственные группы (университеты, компании, небольшие неправительственные организации, местные жители и организации на местном уровне) участвуют в реализации ЦУР недостаточно активно, так как такие партнерства являются сложными и дорогостоящими.
Используя инструменты OpenAlex, мы проанализировали распределение числа внутренних и международных коллабораций в публикациях, напрямую связанных с целями устойчивого развития. Результаты представлены на диаграмме.
Подавляющее большинство статей, напрямую касающихся устойчивого развития, — от 72% (Affordable and clean energy) до 83% (Peace, Justice and strong institutions) — пишутся в рамках внутренних коллабораций. Судя по всему международное сотрудничество наиболее характерно для целей, предполагающих активный обмен опытом и напрямую связанных с общемировым благополучием — «недорогостоящая и чистая энергия», «хорошее здоровье», «борьба с изменением климата». Внутренние коллаборации, напротив, предпочтительны в направлениях, тесно связанных с политикой конкретного государства — «мир, правосудие и эффективные институты», «качественное образование», «достойная работа и экономический рост».
#цур #openalex #обзор #инфографика
Les grands embrasements naissent de petites étincelles
На сайте Сорбонны опубликована новость о том, что ведущий университет Франции прекратил свою подписку на Web of Science, а также перестанет использовать другие библиометрические инструменты Clarivate в 2024 году. На выходных эту новость подхватили многие наши коллеги после заметки Ивана Бегтина.
Такое решение обусловлено тенденцией к переходу от проприетарных продуктов к открытым и бесплатным инструментам. Вместо WoS Сорбонна будет использовать OpenAlex, с которым университет собирается заключить партнерское соглашение. В будущем ожидается, что обе стороны возьмут на себя обязательства по сотрудничеству и улучшению качества данных, относящихся к Сорбонне.
Решение Сорбонны подпадает под общий тренд последних лет, связанный с Open Access. Так, в анонсе Сорбонны упоминается Лейденский CWTS Ranking, который также заявляет о приоритетности открытых данных, стремится к полной прозрачности и воспроизводимости своих рейтингов при помощи CrossRef и OpenAlex. Кроме того, Лейденский Университет анонсирует версию «открытого издания» своего рейтинга на базе OpenAlex в 2024 году.
Про OpenAlex в качестве потенциального конкурента библиометрических баз, доступных по подписке, довольно позитивно отзываются и другие университеты:
• Библиотеки HKU, HKUST, Сингапурского университета менеджмента и Университета Калгари публиковали обзорные статьи про OpenAlex с примерами составления API-запросов;
• О преимуществах использования OpenAlex писал университет Хьюстона;
• Лаборатория Утрехтского университета предлагает использовать данные базы в проекте FAIR data;
• Университет Милана официально ссылается на данные OpenAlex в отчетах о научно-исследовательской работе;
• Политехнический университет Каталонии (BarcelonaTech) использует данные базы в рамках мониторинга открытого доступа в каталонских университетах.
Как видно из приведенных заметок, обращение к открытым данных пока ограничивается лишь рекомендациями и инструкциями. Однако уже сейчас очевидно, что инициативу Сорбонны в перспективе могут разделить и другие ведущие университеты. Ведь большие пожары зарождаются из маленьких искр.
#анонсы #новости #открытыйдоступ #университеты #openalex
На сайте Сорбонны опубликована новость о том, что ведущий университет Франции прекратил свою подписку на Web of Science, а также перестанет использовать другие библиометрические инструменты Clarivate в 2024 году. На выходных эту новость подхватили многие наши коллеги после заметки Ивана Бегтина.
Такое решение обусловлено тенденцией к переходу от проприетарных продуктов к открытым и бесплатным инструментам. Вместо WoS Сорбонна будет использовать OpenAlex, с которым университет собирается заключить партнерское соглашение. В будущем ожидается, что обе стороны возьмут на себя обязательства по сотрудничеству и улучшению качества данных, относящихся к Сорбонне.
Решение Сорбонны подпадает под общий тренд последних лет, связанный с Open Access. Так, в анонсе Сорбонны упоминается Лейденский CWTS Ranking, который также заявляет о приоритетности открытых данных, стремится к полной прозрачности и воспроизводимости своих рейтингов при помощи CrossRef и OpenAlex. Кроме того, Лейденский Университет анонсирует версию «открытого издания» своего рейтинга на базе OpenAlex в 2024 году.
Про OpenAlex в качестве потенциального конкурента библиометрических баз, доступных по подписке, довольно позитивно отзываются и другие университеты:
• Библиотеки HKU, HKUST, Сингапурского университета менеджмента и Университета Калгари публиковали обзорные статьи про OpenAlex с примерами составления API-запросов;
• О преимуществах использования OpenAlex писал университет Хьюстона;
• Лаборатория Утрехтского университета предлагает использовать данные базы в проекте FAIR data;
• Университет Милана официально ссылается на данные OpenAlex в отчетах о научно-исследовательской работе;
• Политехнический университет Каталонии (BarcelonaTech) использует данные базы в рамках мониторинга открытого доступа в каталонских университетах.
Как видно из приведенных заметок, обращение к открытым данных пока ограничивается лишь рекомендациями и инструкциями. Однако уже сейчас очевидно, что инициативу Сорбонны в перспективе могут разделить и другие ведущие университеты. Ведь большие пожары зарождаются из маленьких искр.
#анонсы #новости #открытыйдоступ #университеты #openalex
Алгоритмы анализа междисциплинарных исследований
Количественный анализ междисциплинарных исследований имеет значение при оценке степени интеграции различных гипотез, концепций, теорий и методов из двух и более областей специализированного знания.
Одним из наиболее дискуссионных подходов к изучению междисциплинарности исследований является анализ списка источников публикаций. При таком подходе список источников классифицируется по дисциплинам. Как правило, исследователи используют тематические классификаторы (например, предметные категории Web of Science) или распределяют источники по предметным категориям журналов. Такой подход базируется на информации о сходстве или «когнитивной дистанции», т.е. интеграция идей из двух схожих областей будет оказывать меньшее влияние на степень междисциплинарности, чем интеграция из двух несхожих.
Для измерения междисциплинарности публикаций ученые используют показатель разнообразия Стирлинга и/или его усовершенствованные версии. Согласно его концепции, измерение разнообразия опирается на сумму трёх основных факторов:
• Разнообразие (variety) «Разнообразие — это количество категорий, по которым распределены элементы системы и ответ на вопрос: «Сколько у нас типов вещей?».
• Баланс (balance). «Чем более равномерен баланс, тем больше разнообразие».
• Несоответствие (disparity). «Это ответ на вопрос: «Насколько отличаются друг от друга типы вещей, которые у нас есть?» (Stirling A. A, 2007)
Прежде чем приступать к анализу разнообразия и баланса, мы решили проанализировать соответствие предметных областей Citation Topic (Web of Science) и OA concepts (OpenAlex). Список Citation Topic разделяется на макро-, мезо- и микро-уровень. Микро-уровень, который мы решили рассматривать, насчитывает 2488 областей — это, пожалуй, один из самых подробных классификаторов после списка концепций OpenAlex, который содержит более 65 тысяч предметных областей пяти различных уровней. Однако только для 1871 микро-области (75%) Citation Topic нашлось достаточно точное соответствие из списка концепций OpenAlex.
Напомним, что концепции OpenAlex присваиваются публикациям автоматически на основании названия журнала, заголовка и аннотации статьи. Каждой публикации присваивается несколько концепций, а для каждой концепции указывается балл связи (score) от 0 до 1, который свидетельствует о том, с какой вероятностью статья относится к указанной предметной области.
Для анализа был взят набор из всех российских публикаций за 2023 год. В Web of Science их количество составило 40 126, в OpenAlex — 109 420. Было решено найти пересечение по DOI, и объем итогового массива составил 32 355 публикаций. Для этих публикаций были добавлены Citation Topic Micro и все концепции OA с баллом связи. Оказалось, что для большей части (26 854, или 83%) предметные области по этим классификаторам вообще не пересекаются. Результаты по оставшимся оказались, как и ожидалось, достаточно неплохими: медианное значение балла связи составило 0,65.
Итак, несмотря на то, что 75% Citation Topic Micro имеют одно или даже несколько соответствий среди концепций OpenAlex, на реальном массиве данных всего 17% статей имеют частичное совпадение в классификации.
Таким образом, применение разных типов распределения на предметные категории (Citation topics — алгоритм Лейдена, OpenAlex — Microsoft Academic Graph) будет значительно отражаться на результатах количественной оценки междисциплинарности.
#webofscience #openalex #citationtopic #междисциплинарность
Количественный анализ междисциплинарных исследований имеет значение при оценке степени интеграции различных гипотез, концепций, теорий и методов из двух и более областей специализированного знания.
Одним из наиболее дискуссионных подходов к изучению междисциплинарности исследований является анализ списка источников публикаций. При таком подходе список источников классифицируется по дисциплинам. Как правило, исследователи используют тематические классификаторы (например, предметные категории Web of Science) или распределяют источники по предметным категориям журналов. Такой подход базируется на информации о сходстве или «когнитивной дистанции», т.е. интеграция идей из двух схожих областей будет оказывать меньшее влияние на степень междисциплинарности, чем интеграция из двух несхожих.
Для измерения междисциплинарности публикаций ученые используют показатель разнообразия Стирлинга и/или его усовершенствованные версии. Согласно его концепции, измерение разнообразия опирается на сумму трёх основных факторов:
• Разнообразие (variety) «Разнообразие — это количество категорий, по которым распределены элементы системы и ответ на вопрос: «Сколько у нас типов вещей?».
• Баланс (balance). «Чем более равномерен баланс, тем больше разнообразие».
• Несоответствие (disparity). «Это ответ на вопрос: «Насколько отличаются друг от друга типы вещей, которые у нас есть?» (Stirling A. A, 2007)
Прежде чем приступать к анализу разнообразия и баланса, мы решили проанализировать соответствие предметных областей Citation Topic (Web of Science) и OA concepts (OpenAlex). Список Citation Topic разделяется на макро-, мезо- и микро-уровень. Микро-уровень, который мы решили рассматривать, насчитывает 2488 областей — это, пожалуй, один из самых подробных классификаторов после списка концепций OpenAlex, который содержит более 65 тысяч предметных областей пяти различных уровней. Однако только для 1871 микро-области (75%) Citation Topic нашлось достаточно точное соответствие из списка концепций OpenAlex.
Напомним, что концепции OpenAlex присваиваются публикациям автоматически на основании названия журнала, заголовка и аннотации статьи. Каждой публикации присваивается несколько концепций, а для каждой концепции указывается балл связи (score) от 0 до 1, который свидетельствует о том, с какой вероятностью статья относится к указанной предметной области.
Для анализа был взят набор из всех российских публикаций за 2023 год. В Web of Science их количество составило 40 126, в OpenAlex — 109 420. Было решено найти пересечение по DOI, и объем итогового массива составил 32 355 публикаций. Для этих публикаций были добавлены Citation Topic Micro и все концепции OA с баллом связи. Оказалось, что для большей части (26 854, или 83%) предметные области по этим классификаторам вообще не пересекаются. Результаты по оставшимся оказались, как и ожидалось, достаточно неплохими: медианное значение балла связи составило 0,65.
Итак, несмотря на то, что 75% Citation Topic Micro имеют одно или даже несколько соответствий среди концепций OpenAlex, на реальном массиве данных всего 17% статей имеют частичное совпадение в классификации.
Таким образом, применение разных типов распределения на предметные категории (Citation topics — алгоритм Лейдена, OpenAlex — Microsoft Academic Graph) будет значительно отражаться на результатах количественной оценки междисциплинарности.
#webofscience #openalex #citationtopic #междисциплинарность