Мегасоавторство и научная аналитика

Совсем недавно Институт научной информации Мегасоавторство и научная аналитика(The Institute for Scientific Information, ISI) опубликовал отчет «Multi-authorship and research analytics» (Мегасоавторство и научная аналитика) посвященный теме мегасоавторства – то есть тем статьям, в качестве авторов которых указаны более одного человека. Выводы после анализа таких статей и приводятся в этом отчете. Мы не стали переводить на русский язык весь отчет, однако подготовили для вас резюме основных тезисов проведенного анализа.

Загрузить сам отчет можно по адресу: «Multi-authorship and research analytics».


Мегасоавторство и научная аналитика

Web of Science Group уже давно отмечает рост количества авторов и аффилиаций в научных публикациях. До 2000 года максимальное количество авторов на одну статью редко превышало 500 человек. В 2004 году был преодолен рекорд в 1000 авторов, когда появилась статья с 2 500 авторами. Количество таких статей продолжает расти, максимум был достигнут в статье 2015 года группой ATLAS на бозоне Хиггса с 5 153 авторами и более чем 500 аффилиациями (Aad et al., 2015; Маллапаты, 2018).

Количество стран, указанных в аффилиациях, также выросло. Международное сотрудничество было относительно редким в 1980-х годах, но быстро возросло: сейчас в более половине статей каждой страны есть соавтор из другой страны. (Адамс, 2013).

Количество авторов в публикации ставит перед аналитиками и администраторами три вопроса. Первый – зафиксировать и понять природу изменения количества авторов в публикации, а также определить, являются ли они глобальными или специфичными для определенных научных областей. Второй – выяснить, есть ли связь между научной значимостью статьи и ростом количества авторов и стоит ли публикации с большим авторским коллективом оценивать отдельно. Третий – возможность определить роль отдельного автора в большой коллаборации, однако этот вопрос остается за рамками нашего отчета.

Сколько авторов? Сколько стран?

Чтобы определить общий тренд и распределение количества авторов на данный момент, мы проанализировали 15,7 млн. документов типа «статья» в журналах, проиндексированных в Web of Science в 2009-2018 годах. В 2009-2013 году было 6,9 млн. статей, в 2014-2018 – 8,8 млн. статей.

Число статей по количеству соавторов (слева) и по количеству стран, указанных в аффилиациях к одной статье (справа) за 10 лет (2009-2018), проиндексированных в Web of Science.
Рисунок 1: Число статей по количеству соавторов (слева) и по количеству стран, указанных в аффилиациях к одной статье (справа) за 10 лет (2009-2018), проиндексированных в Web of Science.

Самое частотное количество авторов на статью – три (Рисунок 1), у более 10 млн. статей (более 2/3 от общего количества) не более 5 соавторов, а у 14,9 млн. статей (почти 95%) не более 10 соавторов. Это важная информация для общего понимания ситуации, поскольку хотя налицо рост авторских коллективов, подавляющее большинство статей написано небольшими группами авторов.

Распределение по странам (Рисунок 1) показывает, что на данный момент в большинстве статей присутствуют авторы только из одной страны. Следует отметить, что хотя международные коллаборации и типичны для европейских стран, две трети публикаций в США и более трех четвертых публикаций Китая имеют аффилиации только внутри страны.

Изменение профилей соавторов по количеству авторов и стран на публикацию. Данные по статьям, проиндексированным в Web of Science в 2009-2013 и 2014-2018 годах.
Рисунок 2: Изменение профилей соавторов по количеству авторов и стран на публикацию. Данные по статьям, проиндексированным в Web of Science в 2009-2013 и 2014-2018 годах.

Рассмотрим изменения, сравнив периоды 2014-2018 и 2009-2013 (Рисунок 2). Общий объем статей возрос во всех группах, однако рост в группе с 1-5 авторами значительно ниже, чем во всех остальных, а самый заметный прирост наблюдается в группе с 1000+ соавторами, что говорит об увеличении мегасоавторства.

Если говорить об изменениях в количестве стран среди авторов одной статьи, то в интервале 1-5 стран рост заметно ниже, чем в интервале 6-30, тогда как в группе 31-40 наблюдается небольшое падение. Однако количество статей с авторами из более чем 40 стран резко возросло: до 2013 года было всего три статьи с адресами из более чем 50 стран, с 2014 года это начало расти, а также появились статьи коллабораций из более чем 100 стран.

Во всех ли областях есть мегасоавторство?

Относительное количество соавторов на статью (как доля в указанной категории) для статей, проиндексированных в Web of Science (2009-2018) и сгруппированных по категориям Essential Science Indicators.
Таблица 1: Относительное количество соавторов на статью (как доля в указанной категории) для статей, проиндексированных в Web of Science (2009-2018) и сгруппированных по категориям Essential Science Indicators.

Чтобы ответить на этот вопрос, мы разбили все публикации на основные категории в соответствии с Essential Science Indicators: 21 предметная область и 1 мультидисциплинарная категория для учета статей из таких журналов как Science и Nature (Таблица 1).

Между категориями есть заметные различия. В основном во всех областях у большинства статей 1-5 авторов, но в биомедицине эта цифра выше. Например, в клинической медицине, микробиологии и молекулярной биологии у более 10% статей более 10 авторов, а в иммунологии такое количество авторов у более 20% статей. Напротив, в науках о растениях и животных только в 3% статей более 10 авторов.

Отличительной чертой физики и наук о космосе является небольшое количество авторов в большинстве работ (74% и 66% соответственно с количеством авторов не более 5), а также сравнительно высокий процент работ с большими коллективами соавторов (0,6% и 1,5% соответственно с количеством авторов более 50).

Эти модели говорят о различных традициях в разных научных областях. Так, для биомедицины более характерны большие коллективы, тогда как в физике чаще работают небольшие команды, если не брать в расчет многотысячные коллаборации. Для общественных наук, математики и технических наук также типичны небольшие группы соавторов, однако стоит обратить внимание на то, что в общественных науках более 1% статей написано коллективами из более чем 10 авторов.

Относительное количество стран, указанных в аффилиациях, на статью (как доля в указанной категории) для статей, проиндексированных в Web of Science (2009-2018) и сгруппированных по категориям Essential Science Indicators.
Таблица 2: Относительное количество стран, указанных в аффилиациях, на статью (как доля в указанной категории) для статей, проиндексированных в Web of Science (2009-2018) и сгруппированных по категориям Essential Science Indicators.

Во всех ли областях растет размер международных коллабораций?

Можно было бы предположить, что количество стран в аффилиациях авторов одной статьи также возрастает, однако это число остается в интервале от 1 до 5 для 99% статей во всех категориях, кроме иммунологии и наук о космосе (Таблица 2).

Как коллаборации влияют на количество цитирований?

Изменение показателя нормализованной цитируемости по категории в соответствии с количеством соавторов и стран.
Рисунок 3: Изменение показателя нормализованной цитируемости по категории в соответствии с количеством соавторов и стран.

Наши данные подтвердили установленную ранее связь между количеством авторов и цитируемостью статьи (Гланзель и Шуберт 2004, Уолтмэн и ван Эк 2015), причем появление дополнительной страны оказывает большее влияние, чем дополнительного автора.

Приведем сравнение цитируемости публикаций по показателю Нормализованной цитируемости по категории (CNCI), чтобы исключить влияние возраста статьи (в среднем, более старые публикации имеют большее количество цитирований). CNCI нормализует количество цитирований отдельной статьи по среднему значению цитирований для научной дисциплины в определенном году. За среднемировое значение принимается 1 (Рисунок 3).

Влияние на некоторые страны больше, чем на другие?

Количество соавторов на статью и нормализованная цитируемость в 6 странах различного размера. Данные отражают количество статей с разным количеством соавторов во всех научных областях (сверху) и ящичковая гистограмма, которая демонстрирует соответствующее значение нормализованной цитируемости. Треугольники показывают медианное значение.
Рисунок 8: Количество соавторов на статью и нормализованная цитируемость в 6 странах различного размера. Данные отражают количество статей с разным количеством соавторов во всех научных областях (сверху) и ящичковая гистограмма, которая демонстрирует соответствующее значение нормализованной цитируемости. Треугольники показывают медианное значение.

Для крупных экономик, например Великобритании и Германии, количество статей, сгруппированных по числу авторов, довольно большое во всех группах, а распределение схоже. С ростом количества авторов растет нормализованная цитируемость до предела в 50 авторов, после которого она начинает незначительно снижаться (Рисунок 8).

Небольшое количество статей, написанных в мегаколлаборациях, может привлекать сравнительно высокую цитируемость, однако на национальном уровне эффект от этого может быть разным, так как среднее значение CNCI для таких статей не всегда выше, чем у статей с меньшим количеством авторов. Тем не менее очевидно, что в статьях с большим количеством авторов из разных стран не просто высокая нормализованная цитируемость, но этот показатель может быть обманчивым по сравнению с более традиционными статьями. Это особенно очевидно в небольших странах.

Почти 95% статей, опубликованных за 2009-2028 годы, имеют не больше 10 авторов, их мы можем отнести к одной группе и считать более типичными, а оставшиеся 5% анализировать отдельно.

В крупных международных экономиках эти 5% статей с большим количеством авторов имеют нормализованную цитируемость, которая в 2,5 раза превышает цитируемость остальных статей. Такие статьи составляют около 10% общего объема в данных странах, поскольку ученые участвуют во многих международных проектах, и значительно повышают среднюю нормализованную цитируемость.

В Китае ситуация несколько другая. Здесь нормализованная цитируемость статей, написанных в мегаколлаборациях, в два раза выше средней нормализованной цитируемости остальных статей, но они составляют лишь 10% от общего объема (около 75% статей имеют только китайские аффилиации), поэтому их влияние на уровне страны сравнительно невелико.

В небольших странах влияние статей, написанных в мегасоавторстве, больше, чем в крупных экономиках. Как правило, в таких странах средняя нормализованная цитируемость ниже среднемировой, соответственно соотношение с работами больших коллабораций выше, а самих работ относительно много, так что общая нормализованная цитируемость может значительно возрастать. Например, в Шри-Ланке CNCI составляет 0,65 для 7 436 статей с количеством авторов не больше 10, а для 1000 работ с большим количеством соавторов почти 7, что делает среднюю нормализованную цитируемость для страны выше, чем в Англии и США. Эту особенность необходимо учитывать при описании и интерпретации данных.

Рекомендации ISI

Если в выборке есть статьи с более чем 10 авторами, они должны быть отдельно описаны, поскольку в противном случае это может привести к неверной интерпретации. Хотя мегасоавторство приводит к более высокой цитируемости публикаций, эта зависимость является прямой и равномерной для большинства (но не для всех) дисциплинарных категорий, а для некоторых областей такой зависимости нет или практически нет. В этом случае нет необходимости вносить изменения в анализ данных.

Статьи с мегасоавторством, участием более 100 авторов и / или 30 стран, должны рассматриваться отдельно.

Эти статьи могут оказывать на выборку непредсказуемое влияние. Есть веские аргументы в пользу удаления таких данных из аналитики на национальном, а также на институциональном уровне. Самое большое количество искажений наблюдается в клинической медицине и физике частиц. Эффект от влияния таких публикаций не вписывается в более общую модель и не повторяется во всех дисциплинах. Наличие таких статей может быть особенно значимым на уровне отдельной организации и привести к неверным заключениям.

Литература

Aad, G. et al. (ATLAS Collaboration, CMS Collaboration) (2015). Combined measurement of the Higgs boson mass in pp collisions at root s=7 and 8 TeV with the ATLAS and CMS experiments. Physical Review Letters, 114, 191803, doi:10.1103/PhysRevLett.114.191803.

Mallapaty, S. (2018). Paper authorship goes hyper. Nature Index. January 30. https://www.natureindex.com/news-blog/paper-authorship-goes-hyper.

Adams, J. (2013). The Fourth Age of research. Nature, 497, 557-560, doi:10.1038/497557a.

Glänzel, W. and Schubert, A. (2004). Analyzing scientific networks through co-authorship. In Moed, H. F., Glänzel, W. and Schmoch, U. (eds.), Handbook of Quantitative Science and Technology Research: The Use of Publication and Patent Statistics in Studies of S&T Systems, Dordrecht: Kluwer Academic Publishers, pp 257-276.

Waltman, L. and van Eck, N. J. (2015). Fieldnormalized citation impact indicators and the choice of an appropriate counting method. Journal of Informetrics, 9, 872-894, doi:10.1016/j.joi.2015.08.001.