
Methods for promoting information resources
Шорин О.Н.
Abstract: The prerequisites for the promotion of separate scientometric databases and full-text scientific resources within the centralized subscription are discussed. The hypothesis for possibility to organize the promotion of certain information resources among library readers by analogy of search results in Internet search engines is substantiated. Some examples of experiments that influenced readers’ strategies for finding and reading documents are provided.
Keywords: ACCESS, CENTRALIZED SUBSCRIPTION, INFORMATION RESOURCE, SEARCH, STATISTICS
Citation: Shorin, O.N. Methods for promoting information resources. // Vestnik VNIIDAD. — 2021. — No. 3. — P. 88-93.
Информационные ресурсы
Лицензионный доступ российских научных и образовательных организаций к информационным наукометрическим базам данных и полнотекстовым научным ресурсам осуществляется в рамках проекта Министерства науки и высшего образования Российской Федерации по национальной и централизованной подписке. В 2020 году функции оператора проекта по национальной и централизованной подписке осуществлял Российский фонд фундаментальных исследований (РФФИ) [3]. Национальная подписка предполагает, что доступ к подписанным ресурсам осуществляется со всех ip-адресов, относящихся к российскому сегменту интернета. Централизованная подписка предполагает, что лицензионный доступ к международным базам данных научных ресурсов получают не все организации. В рамках выделенного бюджета оператор должен соблюсти баланс между востребованностью информационного ресурса той или иной научной организацией и стоимостью лицензии для доступа к этому ресурсу.
Для отбора организаций, которым будет предоставлена централизованная подписка к информационным ресурсам, в РФФИ разработана многоступенчатая система ранжирования организаций. В основном, эта система основана на статистике использования организацией того или иного ресурса. Очевидно, что создать единое правило, на основании которого принимается решение о подписке организации на ресурс, практически невозможно, поскольку и организаций много, большинство из них имеют свою специфику в работе с ресурсами, и ресурсов тоже много, и они тоже имеют свою специфику. Поэтому система отбора является многоступенчатой, и содержит разного рода исключения. Например, межведомственным советом по организации предоставления доступа к информационным наукометрическим базам данных и полнотекстовым научным ресурсам было принято решение о том, что из-за специфики организации своей работы национальные и федеральные библиотеки должны быть подписаны на все доступные ресурсы без исключения. Для остальных организаций разработаны три критерия, основанные на регулярности и интенсивности обращений к полнотекстовым документам и осуществления поисковых запросов и просмотров страниц [1]. При этом из рассмотрения удаляются организации, которые осуществляют «накрутку» статистики с использованием автоматизированных средств.
В частности, в РФФИ разработаны три различных критерия:
Критерий №1: в зависимости от типа ресурса устанавливаются пороговые значения по:
- Количеству обращений к полнотекстовым документам;
- Количеству поисковых запросов;
- Количеству просмотренных страниц.
Критерий №2: в зависимости от издательства устанавливаются пороговые значения минимального количества изданий, к которым выполнено минимум 10 обращений.
Критерий №3: в зависимости от издательств устанавливаются пороговые значения минимального количества обращений к полнотекстовым документам.
Организации, которые для какого-либо ресурса превышают пороговые значения по всем 3 критериям, рекомендуются к включению в централизованную подписку на этот ресурс в следующем году. Превышение пороговых значений по двум из трех критериев означает, что данная организация будет включена в централизованную подписку на данный ресурс в случае, если будет такая возможность. Превышение пороговых значений только по одному критерию означает, что на следующий год для данной организации не будет осуществляться централизованная подписка на этот ресурс. В случае появления какой-то новой базы данных или полнотекстового ресурса РФФИ сперва организует тестовый доступ к этой базе данных или этому ресурсу и впоследствии анализирует востребованность этого ресурса для той или иной организации.
В принципе, выстроена достаточно логичная система, при которой те организации, чьи научные сотрудники достаточно активно пользуются тем или иным полнотекстовым ресурсом или наукометрической базой данных, считаются нуждающимися именно в этом ресурсе или базе данных и попадают в централизованную подписку на этот ресурс в следующем году.
Однако, если спуститься на уровень отдельного научного сотрудника, эта логичная система начинает давать сбои. Дело в том, что зачастую отдельно взятый научный сотрудник в организации не имеет четкого представления о том, какие именно наукометрические базы данных и полнотекстовые ресурсы ему доступны на текущий момент. Скорее всего, он знает о паре-тройке ресурсов, которыми он пользовался до этого или о которых он слышал от коллег. Но согласно отчету РФФИ, в 2020 году в рамках централизованной подписки осуществлялся доступ к 33 различным базам данных и был предоставлен тестовый доступ еще к 68 базам данных [1]. Каким образом отдельно взятый научный сотрудник может узнать о том, что у него есть доступ к такому огромному количеству баз данных, и как он может понять, что именно искать в той или иной базе данных?
Весной 2018 года в Российской национальной библиотеке (РНБ) был проведен эксперимент: среди всех ресурсов, на которые подписана РНБ, случайным образом был выбран один, и для этого ресурса было напечатано 200 информационных буклетов, в которых содержалась информация о том, что РНБ имеет подписку к данному ресурсу, а также о том, доступ к каким материалам получает читатель РНБ в рамках подписки на этот ресурс. Подобные информационные буклеты раздавались в течение нескольких месяцев случайным читателям, которые впервые записывались в библиотеку. Через три месяца количество поисковых запросов к документам этого ресурса увеличилось на 62%. Этот небольшой пример показывает то, насколько статистика обращения к тому или иному ресурсу зависит от информированности конечного читателя.
Напомню, в 2020 году в рамках централизованной подписки доступ осуществлялся к 33 базам данных, а тестовый доступ был предоставлен к 68 базам данных. Скорее всего, часть баз данных, к которым в 2020 году осуществлялся тестовый доступ, войдут в основной список в 2021 году. И это вполне логично, так как количество научных публикаций, а, следовательно, и количество ресурсов, растет с каждым годом [4]. А количество научных сотрудников в России не то что не растет такими же темпами, а наоборот – уменьшается [4, 5]. В связи с этим, для отдельно взятого издательства становится очень важным донести информацию о своем ресурсе до научных сотрудников, поскольку от этого зависит статистика использования ресурса, а от этого, в свою очередь, зависит, попадет ли этот ресурс в централизованную подписку или нет. Если ресурс не попадет в централизованную подписку, это означает, что издательство не получит деньги от РФФИ.
На данный момент количество ресурсов, к которым можно получить доступ, уже превышает 100. И дальше их будет только больше. Информировать каждого научного сотрудника о каждом доступном ему ресурсе уже невозможно. Требуется некий системный подход для решения этой задачи. В качестве, как мне кажется, временного решения этой проблемы представители издательств проводят обучающие семинары для библиотечных сотрудников, на которых рассказывают о возможностях и преимуществах своих ресурсов. Тем самым, представители издательств надеются, что библиотечные работники будут некими агентами влияния, которые будут подсказывать читателям что и где искать.
Однако, библиотечные работники – это тоже люди, и ориентироваться в сотнях различных ресурсах им всё сложнее и сложнее. В качестве решения этой проблемы могут выступать метапоисковые системы и/или discovery сервисы, которые аггрегируют в себе информацию из множества различных ресурсов и позволяют осуществлять поиск информации по всем ним одновременно с помощью одного унифицированного поискового интерфейса [6]. Казалось бы, это выход, но и тут не всё так просто.
В 2018 году в РНБ был проведен еще один эксперимент. На тот момент поисковая система РНБ индексировала четыре различных источника данных: электронный каталог РНБ, электронную библиотеку РНБ и электронные каталоги 2 издательств, на которые РНБ была подписана и которые предоставили доступ к свои электронным каталогам в автоматизированном режиме – IPRBooks и Лань. Используя настройки по умолчанию, поисковая система при прочих равных ранжировала все источники в случайном порядке, то есть если на n-ную позицию в поисковой выдаче претендовали документы из разных источников, то решение о том, какой документ займет n-ную позицию, а какой n+1, принимал датчик случайных чисел. Специалисты РНБ немного поменяли этот алгоритм таким образом, чтобы документы издательства IPRBooks при прочих равных условиях не участвовали в случайном розыгрыше в борьбе за n-ную позицию в поисковой выдаче, а сразу же отображались на этой позиции, а претендовавшие на эту же позицию документы из других издательств помещались на n+1 позицию. То есть алгоритм ранжирования был изменен совсем немного: в принципе, у документов и так была 50% вероятность занять вакантное место (либо переместиться всего лишь на одну позицию ниже в противном случае). Однако, этого стало достаточным для того, чтобы количество просмотренных страниц из документов издательства IPRBooks за несколько недель значительно выросло (рис. 1).

Получается, что единый унифицированный поисковый интерфейс для всех ресурсов – это отличный инструмент для продвижения документов отдельных издательств за счет документов других правообладателей. Легально ли это? Юристы утверждают, что это абсолютно легально, так как уставы большинства библиотек прямо или косвенно разрешают оказывать платные услуги издательствам по информированию, продвижению или даже рекламе их ресурсов. Вспомним эксперимент по раздаче информационных буклетов новым читателям РНБ: если делать это бесплатно, то это просто стандартная практика работы большинства библиотек. Что принципиально меняется от того, если издатель проплатил за раздачу подобных пусть уже не информационных, а рекламных буклетов? Уставами большинства библиотек это не запрещено. А если перенести эту же логику в электронное пространство: что изменится от того, что в электронном каталоге начнут выдаваться документы, которые специальным образом будут помечены, так как за продвижение этих документов правообладатель заплатил библиотеке? По большому счету, ничего – пользователь уже давно привык к такому поведению поисковых систем.
Рассуждая таким образом, мы приходим к бизнес-схеме, которая используется во всех поисковых и информационных системах коммерчески успешных компаний – Google, Яндекс, Yahoo, Mail.ru, Facebook и др.: размещение в результатах поисковой выдачи или в ленте пользователя рекламных ссылок, соответствующих поисковому запросу или интересам этого пользователя.
Если посмотреть немного глубже на бизнес-процессы, происходящие в вышеупомянутых коммерческих компаниях, можно увидеть, что основной ценностью для этих компаний является детальная информация о людях – потребителях услуг. В принципе, библиотеки обладают подобной информацией о своих читателях, и даже пытаются выстроить процесс обслуживания читателя, исходя из его потребностей – анализируют его прошлые заказы, поисковые запросы аналогичных читателей. Встроить в этот процесс информирование об отдельных ресурсах на финансовой основе – не такой уж и сложный технический вопрос, и он может быть решен в течение нескольких лет.
Учитывая то, что:
- издательствам необходимо, чтобы их ресурсы были востребованными, иначе они разорятся;
- количество ресурсов постоянно растет;
- количество научных сотрудников постоянно уменьшается;
- дискуссии по поводу открытого доступа возникают всё чаще и чаще [2];
возникает вопрос: кто в ком больше заинтересован – читатели в доступе к информационным наукометрическим базам данных и полнотекстовым научным ресурсам или правообладатели в доступе к научным сотрудникам, чтобы последние читали документы, расположенные именно в их базах данных?
Очевидно, что ситуация, при которой РФФИ не платит деньги зарубежным правообладателям за их контент, а наоборот – получает от них деньги за организацию чтения их ресурсов за счет централизованной подписки, невозможна. Экономическая целесообразность не позволит бизнесу платить деньги и не зарабатывать на этом. Но вполне возможно, что в ближайшие годы несколько издательств попытаются «поиграть» с продвижением своих информационных ресурсов для того, чтобы набрать более существенную статистику на фоне своих конкурентов, и тем самым получить повышенное финансирование в последующие периоды за счет перераспределения денег от «менее востребованных» издательств. Все необходимые предпосылки для этого уже созданы.
Литература и источники
- Белявский О.В., Лутай А.В. Об итогах организации подписки на информационные ресурсы в 2020 г. // Заседание Межведомственного совета по организации предоставления доступа к информационным наукометрическим базам данных и полнотекстовым научным ресурсам.— 05.03.2021.
- Земсков А.И. Пути научно-технических библиотек к открытому доступу // Научные и технические библиотеки.— 2019.— No 1.— С. 63–79.— DOI 10/33186/1027-3689-2019-63-79.
- О национальной и централизованной подписке на научные информационные ресурсы в 2020 году // Российский фонд фундаментальных исследований : [офиц. портал].— Электрон. дан.— [Москва, 2021].— Режим доступа: https://podpiska.rfbr.ru , свободный.— Загл. с экрана.
- Российская наука в цифрах / Власова В.В., Гохберг Л.М., Дьяченко Е.Л., Кузнецова И.А., Кузнецова Т.Е., Мартынова С.В., Нефедова А.И., Ратай Т.В., Рудь В.А., Сагиева Г.С., Стрельцова Е.А., Суслов А.Б., Фурсов К.С.— М.: НИУ ВШЭ, 2018.— 42 с.
- Цветкова В.А., Мохначева Ю.В. Научная среда и публикационная активность: риски библиометрических оценок // Культура: теория и практика (Электронный журнал: http://theoryofculture.ru/ ).— 2020.— No 2 (35).— URL: http://theoryofculture.ru/issues/113/1344/ (дата обращения 05.04.2021).
- Шорин О. Н. Современные тенденции поиска и анализа информации / О. Н. Шорин // Национальная библиотека.— 2015.— No1(04).— С. 34-39.
References
- Belyavskiy O.V., Lutay A.V. (2020) Ob itogax organizacii podpiski na informacionny'e resursy' v 2020 g. [On the Results of Information Resources Subscription Activity in 2020]. Russian Foundation for Basic Research (RFBR) – official portal. URL: https://podpiska.rfbr.ru (accessed: 20.05.2021). (In Russian).
- Zemskov A. (2019) Puti nauchno-texnicheskix bibliotek k otkry`tomu dostupu [Sci-tech Libraries’ Routes to Open Access (IATUL-2018)]. Scientific and Technical Libraries. No 1. Pp. 63-79. DOI 10/33186/1027-3689-2019-63-79. (In Russian).
- O nacional'noj i centralizovannoj podpiske na nauchny'e informacionny'e resursy' v 2020 godu. Russian Foundation for Basic Research (RFBR) – official portal. URL: https://podpiska.rfbr.ru (accessed: 20.05.2021). (In Russian).
- Vlasova V., Gokhberg L., Dyachenko E. et al. (2018) Rossijskaya nauka v cifrax [Russian Science and Technology in Figures]. Moscow: HSE. 42 p. (In Russian).
- Tsvetkova V.A., Mokhnacheva Yu.V. (2020) Nauchnaya sreda i publikacionnaya aktivnost': riski bibliometricheskix ocenok [Scientific Environment and Publication Activity: Risks of Bibliometric Estimates]. Culture: Theory and Practice. No 2 (35). URL: http://theoryofculture.ru/issues/113/1344/ (accessed: 05.04.2021). (In Russian).
- Shorin O.N. (2015) Sovremenny`e tendencii poiska i analiza informacii [Modern Trends in Information Retrieval and Analysis]. National Library. No 1 (04). Pp. 34–39. (In Russian).