
Russian libraries will have their own cloud
O.N. Shorin
Abstract: A reader's query in the National Library of Russia search engine might look like this: 'A book about a big man who ended up in a country of little people.' We have no idea what technology is used to make the system recognise that we are talking about Gulliver's Travels. Library programmers, who understand this technology, began gathering at international conferences 12 years ago to exchange experiences. This year, the forum, which brought together more than 400 specialists from 38 countries, was held for the first time in Russia, in St Petersburg. Following the event, we spoke with Oleg Shoriny, one of the conference organisers and Deputy Director of the National Library of Russia for Informatisation.
Citation: O.N. Shorin. Russian libraries will have their own cloud // Sankt-Peterburgskiye vedomosti. — № 181(6043). — 27.09.2017. — 2017.
- Олег Николаевич, не всякий библиотекарь понял бы доклады на этой конференции...
- Да, конференция такая... полупрограммистская. Многие считают, что основная задача нашей библиотеки - выдавать книги, но это не совсем так. Наша задача как национальной библиотеки состоит и в том, чтобы принимать новые книги, каталогизировать их и хранить. Если книга неправильно внесена в каталог - считайте, ее нет. Вы ее не найдете.
По закону об обязательном экземпляре, в РНБ каждый год поступает около полумиллиона экземпляров печатной продукции - книги, газеты, карты и т. д. Рабочих дней в году около 250 - нетрудно посчитать, что в каждый из них в библиотеку поступает около 2 тысяч экземпляров. Все надо обработать и поставить на полку. Это и есть процесс каталогизации - создание описания книги, в котором содержится информация об авторе, названии, количестве страниц, годе издания, издательстве и прочем. При этом описание книг отличается от описания других видов печатной продукции.
В одних странах для каталогизации используют одно специализированное программное обеспечение, в других - другое, но игроков на этом поле - всего два-три. На данный момент лидер - компания Ex Libris, этот софт внедрен во многих национальных библиотеках мира, и уже 12 лет библиотекари разных стран, пользователи этого программного обеспечения, встречаются на конференциях и обмениваются опытом: софт сложный, его надо настраивать, «докручивать».
В нашей библиотеке это программное обеспечение было внедрено четыре года назад, участие в подобных конференциях помогло нам избежать ошибок - не наступить на грабли, на которые наши коллеги из других стран уже наступали. Например, когда мы обдумывали, какой должна быть архитектура серверов, чтобы читатель моментально и безотказно получал информацию о книге, нам помогли советы британских коллег, которые еще лет десять назад перепробовали разные конфигурации.
Серверы, которые принимают читательские запросы; серверы для интеллектуальной обработки этих запросов; серверы, которые следят, чтобы вся система была пропорционально загружена; сервер, с помощью которого наши администраторы настраивают всю систему, - это многоуровневая архитектура с возможностью балансировки и автоматического «переноса» задач с сервера, давшего сбой, на действующий. И эта структура позволяет оперировать громаднейшими данными. На открытии нашей конференции вице-президент компании Ex Libris Офер Моссери сказал, что РНБ за эти четыре года достигла феноменальных результатов - по количеству обрабатываемых запросов в единицу времени, количеству каталогизированных книг, уровню технической экспертизы.
- Как происходит каталогизация? Вот получает сотрудник экземпляр книги...
- Это конвейер. Один сотрудник вбивает в программу имя автора - допустим, «Достоевский», и передает книгу дальше. Берет следующую: «Пушкин», передает. Второй сотрудник отвечает за название: он, получив книгу от предшествующего коллеги, вбивает «Преступление и наказание», потом - «Руслан и Людмила». Дальше - сотрудники, вбивающие количество страниц, издательство, год издания и т. д. В итоге книжка встает на определенную полку в зависимости от направленности, от того, российская она или зарубежная, в зависимости даже от высоты корешка.
- Это ж сколько человек задействованы?
- Сейчас в системе зарегистрированы 719 сотрудников. Одновременно в среднем 519 человек заносят данные в систему. Сейчас в базе больше 11 млн 260 записей.
Надо отметить, что система работает в круглосуточном режиме. Если она начнет сбоить, то перестанет работать электронный каталог, поиск станет невозможен, не будет работать электронная библиотека, читатель не сможет читать наши оцифрованные книги. Более того: поскольку в Российской национальной библиотеке располагается, пожалуй, половина всех ресурсов Национальной электронной библиотеки, эта половина станет недоступной и в ней.
- Такое бывало?
- РНБ подключена к системе SiteUptime: каждую минуту делается автоматический запрос на наш сайт из трех различных точек мира. Допустим, из Лондона, Сан-Франциско и Сингапура. И если запрос остается без ответа, наши системные администраторы тут же получают уведомление и могут отреагировать.
Были ли простои? Были: за 2016 год - три. Пять минут, 55 минут и 2,5 часа. Но это были запланированные простои: в санитарные дни, чтобы подключить новое оборудование. Таким образом, беспрерывное рабочее время составило за год 99,960%. А среднее время отклика сервиса на поступающий запрос - менее одной десятой секунды.
- Что было сложнее всего во внедрении этой системы?
- Обучить сотрудников. Библиотека - очень консервативное учреждение. Иногда человек говорил: понимаю, что так лучше, но я привык работать в старой программе. Все прекрасно знали, что старая программа, к примеру, не поддерживала юникод (стандарт кодирования символов. - Ред.), поэтому можно было вводить данные только для книг, написанных кириллицей и/или латиницей. А для того чтобы каталогизировать книги с греческими символами, или иероглифами, или с арабской вязью - выкручивались, создавали параллельные базы данных. Единого поиска по ним не было. Когда мы переходили на нынешний софт, пришлось в единое хранилище загружать данные из 26 различных баз! Уже тогда сотрудники компании Ex Libris говорили, что по этому параметру наша инсталляция, установка, крупнейшая в мире.
- Возвращаясь к конференции: она ежегодная, проходит почти неделю, на нескольких площадках - так много нужно обсудить?
- Программное и аппаратное обеспечение развиваются семимильными шагами. Постоянно появляются новые подходы - сейчас, например, все движется в облачные структуры. Но позиция библиотек России такова: мы, скорее всего, не будем загружать наши данные во всемирное облако.
- Почему?
- Причин много. Самая простая - условно политическая: Россия не расположена загружать весь свой «книжный мир» в облако, которое контролирует не она.
Но есть и другие резоны. Государство создает специальные учреждения - библиотеки, чтобы эти самые библиотеки все хранили у себя вечно. Для этого они должны проводить исследования, разрабатывать новые методы хранения информации, тестировать новые технологии и прочее. А если станут все закачивать в облако, возникнет вопрос: зачем содержать всю эту систему библиотек?
Но за облачными технологиями будущее. Например, мы сейчас хотим внутри страны построить свое общенациональное библиотечное облако. Кстати, так поступила Австрия, и на прошедшей конференции австрийские коллеги поделились с нами своим опытом.
Мы хотим предложить библиотекам России облачный сервис каталогизации: библиотекам не нужно будет обзаводиться оборудованием, специальным софтом, держать системных администраторов - мы можем делать все это «из центра».
- Библиотеки на это пойдут?
- Я летом на конференции, которая проходила в Судаке, анонсировал создание такого сервиса. И ко мне подходили представители разных библиотек. У библиотек ведь сейчас очень непростая ситуация: оптимизация, сокращение финансирования и т. д. Думаю, в этом году мы в пилотном режиме попробуем такое сотрудничество с несколькими учреждениями.
- Нынешний читатель РНБ - это...
- Студент и научный работник. Если посмотреть на географию запросов, то это весь мир. Очень много зарубежных запросов идет из университетов, в которых есть кафедры истории России или русской литературы. У студенческих запросов колоссальный всплеск, конечно, перед сессией, причем ночами.
- «Не студенту» и «не научному работнику» делать в РНБ нечего?
- На самом деле «есть что делать». Например, я в последнее время заинтересовался экономикой. Я математик, изучал статистику, вычислительные методы и много чего другого, связанного с анализом функций. Мне сейчас интересно соотносить, как те или иные показатели различных индексов влияют друг на друга. Ну хотя бы на бытовом уровне: имеет ли смысл при текущем уровне безработицы в Европе покупать валюту для поездки в отпуск или дождаться публикации нового статистического отчета? И вообще взаимосвязаны ли эти вещи? На этот предмет есть множество исследований, однако большинство из них публикуются в журналах с платным доступом. Но РНБ подписана на множество различных ресурсов, баз данных, и для читателя, находящегося в стенах библиотеки, все эти исследования и статьи - бесплатны. Государство за них уже заплатило.