Взаимоцитирования США и Китая в области искусственного интеллекта
В последние годы ландшафт исследований в области машинного обучения изменился ввиду значительного роста числа китайских исследований в области искусственного интеллекта. В настоящее время Китай занимает стабильное второе место по количеству публикаций на NeurIPS (о которой мы упоминали в предыдущем посте) после США. В 2021 году материалы с аффилиациями китайских институтов составили 17,5% от всех публикаций в рамках NeurIPS. При этом несмотря на положение Китая как одного из лидеров развития ИИ сотрудничество между китайскими и американскими институтами происходит реже, чем, например, между американскими и западноевропейскими институтами.
Используя данные о цитировании конференционных материалов NeurIPS, авторы проанализировали взаимовлияние работ американских и китайских институтов. В то время как американские доклады составляют 60% общего набора данных, на них приходится только 34% ссылок от китайских коллег. Показатели цитирования китайских авторов от исследователей из США еще более драматичны: в то время как китайские материалы составляют 34% от всего набора данных, на них приходится только 9% цитирований от американских коллег. Кроме того, исследователи каждого из рассмотренных регионов намного чаще предпочитают внутрирегиональное цитирование межстрановому: разница между двумя показателями составляет 21% для Китая, 41% для США и 14% для Европы.
Таким образом, несмотря на то, что американские и китайские исследователи публикуются в одних и тех же сборниках и выступают на одних и тех же конференциях, они представляют собой во многом два параллельных сообщества, каждое из которых публикует работы, имеющие ограниченное влияние на соседей. В какой-то степени этот разрыв может объясняться интересом к разным темам и различными приоритетами исследований. Однако для компьютерных наук и областей, связанных с искусственным интеллектом, развитие коммуникации между странами, вносящими значимый вклад в данные области, может значительно ускорить достижение новых прорывных результатов.
#обзор #цитирования #китай #сша #искусственныйинтеллект
В последние годы ландшафт исследований в области машинного обучения изменился ввиду значительного роста числа китайских исследований в области искусственного интеллекта. В настоящее время Китай занимает стабильное второе место по количеству публикаций на NeurIPS (о которой мы упоминали в предыдущем посте) после США. В 2021 году материалы с аффилиациями китайских институтов составили 17,5% от всех публикаций в рамках NeurIPS. При этом несмотря на положение Китая как одного из лидеров развития ИИ сотрудничество между китайскими и американскими институтами происходит реже, чем, например, между американскими и западноевропейскими институтами.
Используя данные о цитировании конференционных материалов NeurIPS, авторы проанализировали взаимовлияние работ американских и китайских институтов. В то время как американские доклады составляют 60% общего набора данных, на них приходится только 34% ссылок от китайских коллег. Показатели цитирования китайских авторов от исследователей из США еще более драматичны: в то время как китайские материалы составляют 34% от всего набора данных, на них приходится только 9% цитирований от американских коллег. Кроме того, исследователи каждого из рассмотренных регионов намного чаще предпочитают внутрирегиональное цитирование межстрановому: разница между двумя показателями составляет 21% для Китая, 41% для США и 14% для Европы.
Таким образом, несмотря на то, что американские и китайские исследователи публикуются в одних и тех же сборниках и выступают на одних и тех же конференциях, они представляют собой во многом два параллельных сообщества, каждое из которых публикует работы, имеющие ограниченное влияние на соседей. В какой-то степени этот разрыв может объясняться интересом к разным темам и различными приоритетами исследований. Однако для компьютерных наук и областей, связанных с искусственным интеллектом, развитие коммуникации между странами, вносящими значимый вклад в данные области, может значительно ускорить достижение новых прорывных результатов.
#обзор #цитирования #китай #сша #искусственныйинтеллект
Гендерный разрыв среди высокоцитируемых исследователей
Так называемые «элитные» исследователи, т.е. те, чьи работы больше всего цитируются, оказывают большое влияние на свое окружение и часто выступают в качестве ролевых моделей и наставников, обогащая социальный и интеллектуальный капитал своих коллег и студентов. Вопрос представленности женщин среди высокоцитируемых исследователей в мире изучается в недавней работе коллег. Авторы статьи взяли данные за 2014-2021 годы и рассмотрели 8 факторов гендерной диспропорции среди высокоцитируемых исследователей: производительность исследований и их влияние, журналы для публикаций, научное сотрудничество, соавторство, нехватка женщин в области STEM, демографическая инерция, эффект Матфея и эффект Матильды.
Женщины-исследователи по разным причинам обычно публикуются и цитируются меньше, чем мужчины в большинстве областей. Если смотреть на 10%, 5% и 1% лучших по продуктивности и цитированиям исследователей, то здесь наблюдается наиболее значительный гендерный разрыв. Для достижения аналогичного успеха в карьере женщинам необходимо иметь более высокий уровень научных исследований, чем мужчинам.
Среди выводов исследования:
• С 2014 по 2021 год на долю женщин пришлось 1855 или 15,7% от всех 11842 высокоцитируемых исследователей. Ежегодно доля высокоцитируемых женщин увеличивается: с 13,1% в 2014 году до 14,0% в 2021 году.
• Гендерный разрыв среди высокоцитируемых исследователей наиболее велик в химии, информатике, инженерных науках, математике, физике и астрономии, где на женщин приходится 4-7% всех высокоцитируемых исследователей, хотя они составляют 25-35% авторов этих областей.
• Наиболее представлены женщины в экономических, социальных науках и науках о здоровье, где они составляют 17-21% всех высокоцитируемых исследователей.
• Женщины реже сохраняют свой статус высокоцитируемых исследователей: более 1 года в этом статусе были 62% женщин против 69% мужчин.
• В Северной Америке, Океании, Северной, Южной и Западной Европе проживает 1656 (или 89%) из 1855 женщин, работающих в сфере исследований в области здравоохранения. Доля женщин среди всех высокоцитируемых исследователей в этих пяти регионах колеблется от 15% до 18%, в то время как в среднем по миру она составляет 13,7%.
• В Латинской Америке и Карибском бассейне (где проживает 8% населения мира) женщины составляют более 26% всех высокоцитируемых исследователей в регионе, но на их долю приходится лишь 1% или 19 из 1855 высокоцитируемых женщин-исследователей в мире.
• Гендерный разрыв среди высокоцитируемых исследователей наиболее выражен в Южной Азии, Восточной Азии, Ближнем Востоке и Северной Африке, а также Восточной Европе, где представленность женщин среди всех высокоцитируемых исследователей в соответствующих регионах варьируется от максимальных 10% до минимальных 6%.
• Из 50 стран, в которых представлены высокоцитируемые женщины-исследователи, только 16 имеют более 1% от общемировой доли всех высокоцитируемых исследователей, и только 13 стран имеют более 1% от общемировой доли высокоцитируемых женщин-исследователей.
• В число стран, в которых женщины представлены крайне непропорционально, входят Тайвань, Южная Корея и Иран.
• Швейцария — единственная страна, в которой примерно равное соотношение женщин-исследователей и высокоцитируемых женщин-исследователей.
Доля женщин-авторов во всем мире значительно увеличилась, и сейчас в большинстве стран превышает 30%. Безусловно, есть барьеры на пути к равенству, разнообразию и инклюзии, чем и объясняется нехватка женщин-исследователей в академии. И поэтому необходимо изменение практик в области публикационного процесса для устранения гендерного дисбаланса.
#обзор #женщины #цитирования
Так называемые «элитные» исследователи, т.е. те, чьи работы больше всего цитируются, оказывают большое влияние на свое окружение и часто выступают в качестве ролевых моделей и наставников, обогащая социальный и интеллектуальный капитал своих коллег и студентов. Вопрос представленности женщин среди высокоцитируемых исследователей в мире изучается в недавней работе коллег. Авторы статьи взяли данные за 2014-2021 годы и рассмотрели 8 факторов гендерной диспропорции среди высокоцитируемых исследователей: производительность исследований и их влияние, журналы для публикаций, научное сотрудничество, соавторство, нехватка женщин в области STEM, демографическая инерция, эффект Матфея и эффект Матильды.
Женщины-исследователи по разным причинам обычно публикуются и цитируются меньше, чем мужчины в большинстве областей. Если смотреть на 10%, 5% и 1% лучших по продуктивности и цитированиям исследователей, то здесь наблюдается наиболее значительный гендерный разрыв. Для достижения аналогичного успеха в карьере женщинам необходимо иметь более высокий уровень научных исследований, чем мужчинам.
Среди выводов исследования:
• С 2014 по 2021 год на долю женщин пришлось 1855 или 15,7% от всех 11842 высокоцитируемых исследователей. Ежегодно доля высокоцитируемых женщин увеличивается: с 13,1% в 2014 году до 14,0% в 2021 году.
• Гендерный разрыв среди высокоцитируемых исследователей наиболее велик в химии, информатике, инженерных науках, математике, физике и астрономии, где на женщин приходится 4-7% всех высокоцитируемых исследователей, хотя они составляют 25-35% авторов этих областей.
• Наиболее представлены женщины в экономических, социальных науках и науках о здоровье, где они составляют 17-21% всех высокоцитируемых исследователей.
• Женщины реже сохраняют свой статус высокоцитируемых исследователей: более 1 года в этом статусе были 62% женщин против 69% мужчин.
• В Северной Америке, Океании, Северной, Южной и Западной Европе проживает 1656 (или 89%) из 1855 женщин, работающих в сфере исследований в области здравоохранения. Доля женщин среди всех высокоцитируемых исследователей в этих пяти регионах колеблется от 15% до 18%, в то время как в среднем по миру она составляет 13,7%.
• В Латинской Америке и Карибском бассейне (где проживает 8% населения мира) женщины составляют более 26% всех высокоцитируемых исследователей в регионе, но на их долю приходится лишь 1% или 19 из 1855 высокоцитируемых женщин-исследователей в мире.
• Гендерный разрыв среди высокоцитируемых исследователей наиболее выражен в Южной Азии, Восточной Азии, Ближнем Востоке и Северной Африке, а также Восточной Европе, где представленность женщин среди всех высокоцитируемых исследователей в соответствующих регионах варьируется от максимальных 10% до минимальных 6%.
• Из 50 стран, в которых представлены высокоцитируемые женщины-исследователи, только 16 имеют более 1% от общемировой доли всех высокоцитируемых исследователей, и только 13 стран имеют более 1% от общемировой доли высокоцитируемых женщин-исследователей.
• В число стран, в которых женщины представлены крайне непропорционально, входят Тайвань, Южная Корея и Иран.
• Швейцария — единственная страна, в которой примерно равное соотношение женщин-исследователей и высокоцитируемых женщин-исследователей.
Доля женщин-авторов во всем мире значительно увеличилась, и сейчас в большинстве стран превышает 30%. Безусловно, есть барьеры на пути к равенству, разнообразию и инклюзии, чем и объясняется нехватка женщин-исследователей в академии. И поэтому необходимо изменение практик в области публикационного процесса для устранения гендерного дисбаланса.
#обзор #женщины #цитирования
Резкая остановка, плавное падение или незначимый фактор: о цитируемости публикаций в журналах из Scopus Discountinued Sources List
В самом начале 2024 года на RetractionWatch появилась заметка о том, что Scopus планирует провести переоценку журналов издательства MDPI, входящих в базу, в связи с отдельными вопросами к политике издательства. Несмотря на появившийся спустя несколько дней комментарий к оценке одного из флагманов MDPI — журнала “Sustainability” (к которому у Elsevier вопросов не осталось) — не лишним будет напомнить о критериях, влияющих на повторную оценку журналов, входящих в Scopus, учитывая популярность издательства MDPI в том числе у российских коллег:
1. Журнальные показатели вызывают вопросы, так как они не соответствуют ни одному из трех показателей и критериев журналов в той же предметной области (показатели цитирования, самоцитирования и CiteScore).
2. Существует обеспокоенность по поводу стандартов публикации журнала или издателя (в том числе в результате официально полученных жалоб).
3. Журнал демонстрирует необычное поведение после включения в Scopus (значимо увеличивается число публикаций, становится необычной география соавторов и т.д.).
4. По журналу есть замечания от международного консультативного совета по отбору контента (Content Selection and Advisory Board — CSAB).
Наличия одного из перечисленных критериев достаточно для проведения процедуры повторной оценки журнала или издания. Окончательное решение об исключении журнала/издательства из базы Scopus принимается CSAB — если комиссия определит, что журнал больше не соответствует стандартам Scopus, новые статьи из такого журнала прекратят индексацию. Издания, индексация которых прекращена, могут быть повторно рассмотрены на предмет включения в базу только через 5 лет после принятия решения об их исключении.
Вообще же вхождение журнала в официальные листы крупных баз данных рецензируемых изданий и национальные списки повышает привлекательность издания для авторов: как за счет повышения видимости опубликованной работы, так и нередко из-за формальной наукометрической составляющей оценки научной продуктивности. Но означает ли это, что исключение журнала из базы может значимо влиять на видимость опубликованных статей?
Ответить на этот вопрос мы попробовали с помощью открытых данных о цитируемости изданий, попавших в Scopus Discountinued Sources List в 2020 году. Отобрав среди них те журналы, по которым имелись сведения в OpenAlex о цитируемости за несколько лет, мы рассчитали 2 показателя: (1) среднюю цитируемость статей в первые 2 года после выхода; (2) число процитированных в первые 2 года после выхода статей. Визуализация представлена на графике ниже и по ссылке.
Несмотря на объективную сложность обобщения (журналы представлены в разных дисциплинах, а также отличаются с точки зрения покрытия и общего числа публикаций) можно отметить, что на публикации 2020 года нередко приходились локальные экстремумы по числу цитирований, которые в следующие периоды затухали. При этом формальное падение “до нуля” — не единственный, хотя и наиболее распространенный сценарий. По всей видимости некоторые ученые не только продолжают читать, но и цитировать статьи журналов, вызывающих вопросы с точки зрения редакционной политики (здесь оговоримся, что мы не учитывали показатели самоцитирований).
Можно ожидать, что в случае крупных издательств тенденции “затухания” цитирования будут еще более сглаженными, чем на нашем графике. Так что угроза исключения источников (в особенности на фоне развития открытых баз без учета критериев селективности (обратная сторона медали OpenAccess), в том числе SciLit от MDPI) в будущем могут не так значимо влиять на дальнейшее воспроизводство научного знания из источников, вызывающих вопросы у профессионального сообщества.
#discountinued #Scopus #RetractionWatch #OpenAlex #цитирования #визуализация
В самом начале 2024 года на RetractionWatch появилась заметка о том, что Scopus планирует провести переоценку журналов издательства MDPI, входящих в базу, в связи с отдельными вопросами к политике издательства. Несмотря на появившийся спустя несколько дней комментарий к оценке одного из флагманов MDPI — журнала “Sustainability” (к которому у Elsevier вопросов не осталось) — не лишним будет напомнить о критериях, влияющих на повторную оценку журналов, входящих в Scopus, учитывая популярность издательства MDPI в том числе у российских коллег:
1. Журнальные показатели вызывают вопросы, так как они не соответствуют ни одному из трех показателей и критериев журналов в той же предметной области (показатели цитирования, самоцитирования и CiteScore).
2. Существует обеспокоенность по поводу стандартов публикации журнала или издателя (в том числе в результате официально полученных жалоб).
3. Журнал демонстрирует необычное поведение после включения в Scopus (значимо увеличивается число публикаций, становится необычной география соавторов и т.д.).
4. По журналу есть замечания от международного консультативного совета по отбору контента (Content Selection and Advisory Board — CSAB).
Наличия одного из перечисленных критериев достаточно для проведения процедуры повторной оценки журнала или издания. Окончательное решение об исключении журнала/издательства из базы Scopus принимается CSAB — если комиссия определит, что журнал больше не соответствует стандартам Scopus, новые статьи из такого журнала прекратят индексацию. Издания, индексация которых прекращена, могут быть повторно рассмотрены на предмет включения в базу только через 5 лет после принятия решения об их исключении.
Вообще же вхождение журнала в официальные листы крупных баз данных рецензируемых изданий и национальные списки повышает привлекательность издания для авторов: как за счет повышения видимости опубликованной работы, так и нередко из-за формальной наукометрической составляющей оценки научной продуктивности. Но означает ли это, что исключение журнала из базы может значимо влиять на видимость опубликованных статей?
Ответить на этот вопрос мы попробовали с помощью открытых данных о цитируемости изданий, попавших в Scopus Discountinued Sources List в 2020 году. Отобрав среди них те журналы, по которым имелись сведения в OpenAlex о цитируемости за несколько лет, мы рассчитали 2 показателя: (1) среднюю цитируемость статей в первые 2 года после выхода; (2) число процитированных в первые 2 года после выхода статей. Визуализация представлена на графике ниже и по ссылке.
Несмотря на объективную сложность обобщения (журналы представлены в разных дисциплинах, а также отличаются с точки зрения покрытия и общего числа публикаций) можно отметить, что на публикации 2020 года нередко приходились локальные экстремумы по числу цитирований, которые в следующие периоды затухали. При этом формальное падение “до нуля” — не единственный, хотя и наиболее распространенный сценарий. По всей видимости некоторые ученые не только продолжают читать, но и цитировать статьи журналов, вызывающих вопросы с точки зрения редакционной политики (здесь оговоримся, что мы не учитывали показатели самоцитирований).
Можно ожидать, что в случае крупных издательств тенденции “затухания” цитирования будут еще более сглаженными, чем на нашем графике. Так что угроза исключения источников (в особенности на фоне развития открытых баз без учета критериев селективности (обратная сторона медали OpenAccess), в том числе SciLit от MDPI) в будущем могут не так значимо влиять на дальнейшее воспроизводство научного знания из источников, вызывающих вопросы у профессионального сообщества.
#discountinued #Scopus #RetractionWatch #OpenAlex #цитирования #визуализация
Анализ цитирований в российских публикациях в Web of Science
В последнем выпуске Journal of Scientometric Research в соавторстве с Дарьей Мальцевой (ВШЭ) вышла статья, посвященная библиометрическому анализу российской науки на базе 1,38 млн публикаций российских (со)авторов.
В основе работы — использование метода спектроскопии года публикации цитируемых работ (RPYS — Reference Publication Year Spectroscopy), разработанного в 2013 Вернером Марксом. Этот метод, как правило, применяется для более ограниченных датасетов (например, для публикаций одного исследователя, журнала или научной дисциплины). Для обработки миллионов записей данных метод был масштабирован авторами исследования с использованием СУБД, что позволило проанализировать исторические корни российской науки.
В качестве исходных данных был взят массив статей, индексированных в WoS до мая 2022 года, у которых хотя бы один из авторов имеет российскую аффилиацию, в виде текстовых файлов. Почти все статьи приходятся на период с 1992 по 2022 гг, до 1992 публикаций крайне мало. Общее количество ссылок в описанном массиве — более 32 млн, при этом 1,66 млн ведут на статьи, входящие в исходный датасет.
Согласно результатам исследования:
🔹 Количество ссылок в статьях заметно возросло с течением времени: если в 1992 г. в публикации приводилось в среднем 15 ссылок, то в 2022 г. их было 47.
🔹 Один из основных объектов анализа — разница в «возрасте» между статьей и публикациями, которая она цитирует. Подавляющее большинство ссылок приходится на группу 20+ лет — это означает, что российская наука в значительной степени опиралась на более «старые» фундаментальные исследования.
🔹 Общий средний возраст цитируемых статей составил 14,5 лет, и в рассматриваемый период (с 1992 по 2022) он увеличился примерно на 14%. Следует отметить и динамику: так, средний возраст достигает пика (15,5 лет) в 2014 г., а затем снижается. Таким образом, авторы публикаций, написанных после 2014 года, начинают чаще цитировать более «свежие» статьи.
Если говорить о научных журналах, то во все периоды чаще всего цитировались Physical Review Letters, Physical Review B, Physical Review D, The Astrophysical Journal, The Journal of Chemical Physics и Journal of the American Chemical Society, а также Nature и Science. До 2000 года в топ-10 входили также «Доклады Академии Наук СССР», но после 2000-х цитировать их практически перестали.
Так или иначе, подавляющее число цитирований приходится на долю естественных наук, что отмечают и сами авторы.
#обзор #цитирования #RPYS #WebofScience
В последнем выпуске Journal of Scientometric Research в соавторстве с Дарьей Мальцевой (ВШЭ) вышла статья, посвященная библиометрическому анализу российской науки на базе 1,38 млн публикаций российских (со)авторов.
В основе работы — использование метода спектроскопии года публикации цитируемых работ (RPYS — Reference Publication Year Spectroscopy), разработанного в 2013 Вернером Марксом. Этот метод, как правило, применяется для более ограниченных датасетов (например, для публикаций одного исследователя, журнала или научной дисциплины). Для обработки миллионов записей данных метод был масштабирован авторами исследования с использованием СУБД, что позволило проанализировать исторические корни российской науки.
В качестве исходных данных был взят массив статей, индексированных в WoS до мая 2022 года, у которых хотя бы один из авторов имеет российскую аффилиацию, в виде текстовых файлов. Почти все статьи приходятся на период с 1992 по 2022 гг, до 1992 публикаций крайне мало. Общее количество ссылок в описанном массиве — более 32 млн, при этом 1,66 млн ведут на статьи, входящие в исходный датасет.
Согласно результатам исследования:
🔹 Количество ссылок в статьях заметно возросло с течением времени: если в 1992 г. в публикации приводилось в среднем 15 ссылок, то в 2022 г. их было 47.
🔹 Один из основных объектов анализа — разница в «возрасте» между статьей и публикациями, которая она цитирует. Подавляющее большинство ссылок приходится на группу 20+ лет — это означает, что российская наука в значительной степени опиралась на более «старые» фундаментальные исследования.
🔹 Общий средний возраст цитируемых статей составил 14,5 лет, и в рассматриваемый период (с 1992 по 2022) он увеличился примерно на 14%. Следует отметить и динамику: так, средний возраст достигает пика (15,5 лет) в 2014 г., а затем снижается. Таким образом, авторы публикаций, написанных после 2014 года, начинают чаще цитировать более «свежие» статьи.
Если говорить о научных журналах, то во все периоды чаще всего цитировались Physical Review Letters, Physical Review B, Physical Review D, The Astrophysical Journal, The Journal of Chemical Physics и Journal of the American Chemical Society, а также Nature и Science. До 2000 года в топ-10 входили также «Доклады Академии Наук СССР», но после 2000-х цитировать их практически перестали.
Так или иначе, подавляющее число цитирований приходится на долю естественных наук, что отмечают и сами авторы.
#обзор #цитирования #RPYS #WebofScience