Когда трава была зеленее, учёные были менее дёргаными: написал статью и свободен. Сейчас жизнь поменялась: по ваши публикации приходит наукометрия и начинает считать индексы цитирования и Хирши, без которых ваша научная карьера сложится печально.
Вообще говоря, это довольно недавнее изобретение. Индекс цитирования для научных публикаций появился только в 1960 г. в институте научной информации ISI. Причём слово “индекс” в данном выражении означает отнюдь не число, а каталог, в котором можно для каждой публикации можно узнать, кто на неё ссылается. Сейчас кажется абсолютно естественным, что можно узнать, кто на тебя сослался, но вообще говоря, за этим стоит титаническая работа.
Список литературы устанавливает ссылки в одну сторону: на более старые работы. Благодаря ему узнать, на кого ссылаетесь вы - тривиально. Но чтобы узнать, кто ссылается на вас, необходимо прочитать списки литературы каждой статьи и книги, вышедшей после вашей - и посмотреть, нет ли там ссылки на вашу работу.
Кстати, первые индексы цитирований применялись отнюдь не для научных изысканий. За один-два века до учёных этим пользовались юристы в англосаксонском мире прецедентного права, которым необходимо было знать правоприменительную практику по каждому закону и “апдейты” касательно решения какого-то суда. А с 12-го века толкователи иудаизма создавали индексы цитирования Библии.
Крупнейшие индексы цитирования сейчас - это Scopus, Web of Science и Google scholar. Есть и индексы поменьше типа отечественного РИНЦ или CiteSeerX - индекса статей в области computer science. Одна из важных проблем с индексами состоит в том, что маленький индекс никому не нужен, поэтому порог входа в область наукометрии - гигантский.
Что интересно, ни один существующий индекс не покрывает все научные публикации. WoS ограничивается публикациями от 1900 года (а где-то и более поздними), Scopus и того меньше. Тезисы конференций стали индексировать сравнительно недавно. Проиндексировать публикации, к которым нет доступа - и вовсе проблематично. Автоматизированно проиндексировать публикации с плохо оформленным списком литературы может быть проблематично, а если это ещё и сканы статей - то ситуация ещё более грустная. В довершение ко всему, WoS и Scopus не индексируют журналы, которые считают некачественными. Заметьте, не просто не учитывают при подсчёте метрик, а не индексируют. Google scholar индексирует иногда совсем странные документы, в действительности ссылок не имеющие, да и индексирует небыстро.
Ах, да! WoS и Scopus доступны только по подписке (для организаций, естественно). Гугл.академия работает бесплатно, но узнать их источники или? тем более, получить дамп данных от гугла вы не сможете.
Индексы цитирования нужны не только для наукометрии, но и для того чтобы исследователи могли посмотреть, кто на них ссылается - т.е. узнать, кто и как опирается на их работы, либо напротив, критикует их. Кроме того, это открывает путь для анализа трендов в науке, поиска связей между областями и подобных работ по мета-анализу науки. Граф цитирований может помочь издательству в поиске рецензентов и в обнаружении конфликта интересов. Для начинающего (в данной области науки) исследователя, он содержит ценнейшую информацию о том, как устроена эта область науки, какие работы в ней считаются классическими итд.
Монополию на подобные данные у WoS и Scopus пытается вырвать некоммерческая организация Crossref. Вообще, исходно они занимались регистрацией doi-адресов, но в качестве побочного продукта они завели собственный индекс. Они предлагают издателям сделку: вы отдаёте нам списки цитирований статей вашего журнала, а мы даём вам кнопку “Cited by”, с помощью которой ваши читатели смогут посмотреть, кто их цитирует (https://www.crossref.org/services/cited-by/). Сделка честная и выгодная, однако ещё полтора года назад Crossref покрывал лишь 1% публикаций.
Чтобы исправить это положение вещей, была организована кампания Initiative for Open Citations (https://i4oc.org), которая убеждает издателей не только отдать машиночитаемые метаданные в Crossref, но и опубликовать их в public domain по лицензии CC0. Не представляю, как они этого добились, но за полгода они смогли договориться со множеством издательств и покрыть 40% публикаций, а ещё за полгода довели цифру до 48%. Почти половина всех статей! В списке сотрудничающих издательств ожидаемо нет Elsevier, публикующего чуть ли не треть мировой науки, а также… владеющего Scopus.
Благодаря тому, что в рамках инициативы I4OC издатели делают метаданные публичным достоянием, пополняется не только индекс Crossref, но и открытый корпус цитирований OpenCitations (http://opencitations.net/). Они дают интерфейс для получения данных о цитированиях в RDF-формате при помощи SPARQL-запросов, а также ежемесячно публикуют дампы своей базы цитирований (более 6 миллионов публикаций, около 12 миллионов цитирований). Кстати, сегодня должен появиться очередной дамп. Любой желающий может скачать и поанализировать граф мировой науки, там много увлекательного.
Раз уж начал, в ближайшее время постараюсь рассказать про некоторые инициативы, касащиеся цитирований, которые продвигает фонд Wikimedia.