
Efficiency of using cloud corporate cataloguing
Shorin, O.N.
Abstract: This scientific article discusses the topic of creation doublet bibliographic records during cataloguing process in libraries. Examples of various solutions to this problem in the world and in Russia are given, and an analysis of the shortcomings of these solutions is also carried out. The article describes the cloud corporate cataloguing system used in LNS RAS, also provides statistics on the borrowing of bibliographic records from this system by various research institutions.
Keywords: cataloguing, bibliographic record, doublet, integrated library management system, union catalog, cloud storage, borrowing of bibliographic records
Citation: Shorin, O.N. Efficiency of using cloud-based enterprise cataloguing // Public Administration and Development of Russia: Civilisational Challenges and National Interests: Collection of Articles and Materials of the Conference Session IGSU RANEPA (May 2023). Vol. IV. – M.: Publisher “Scientific Counsellor”, 2023. – 348 с. – P. 232-239.
ВВЕДЕНИЕ
Для обеспечения развития человека в статье 12 Закона Российской Федерации от 09.10.1992 г. № 3612-I «Основы законодательства Российской Федерации о культуре» каждому человеку гарантируется «право на доступ к государственным библиотечным, музейным, архивным фондам, иным собраниям во всех областях культурной деятельности». В статье 5 главы 2 Федерального закона от 29.12.1994 г. № 78-ФЗ «О библиотечном деле» указано, что «каждый гражданин независимо от пола, возраста, национальности, образования, социального положения, политических убеждений, отношения к религии имеет право на библиотечное обслуживание на территории Российской Федерации». Для раскрытия своих фондов посредством использования информационно-коммуникационной сети Интернет библиотеки создают и предоставляют доступ к электронным каталогам, в которых хранится информация об имеющихся в библиотеке экземплярах книг. Для этого на каждый экземпляр литературы в библиотеке создается библиографическая запись, которая содержит основные сведения о книге: автор(ы), название, год издания, издательство, количество страниц и т.п. Процесс создания библиографической записи называется каталогизацией.
Проблема дублетности
Издание книг осуществляется тиражами, вследствие чего одна и та же книга из тиража поступает в различные библиотеки России и впоследствии проходит каталогизацию. По сути, на одну и ту же книгу в различных библиотеках создают практически идентичные библиографические записи. Стоит отметить, что процесс каталогизации является трудоемким и дорогостоящим. В частности, значение нормативов затрат, установленное Министерством культуры Российской Федерации, на осуществление государственной работы по библиографической обработке документов и созданию каталогов (уникальный номер работы в федеральном перечне государственных услуг и работ: 910100Ф.99.1.АГ66АА00000) в 2019 году составлял 1 483 рубля 97 копеек.
В соответствии с государственным заданием № 054-00009-21-00 на 2021 год и на плановый период 2022 и 2023 годов, утвержденным 25 декабря 2020 года, Российская государственная библиотека в 2021 году должна была создать 240 тысяч библиографических записей на поступающую в РГБ литературу. Поскольку РГБ является получателем всей издаваемой на территории Российской Федерации литературы, в соответствии с Федеральным законом от 29.12.1994 г. № 77-ФЗ «Об обязательном экземпляре документов», очевидно, что РГБ производит каталогизацию всей литературы, издаваемой в России. Каталогизация этой же литературы остальными библиотеками является дублированием той работы, которая проводится в РГБ.
Мировой опыт
В 1967 году Frederick G. Kilgour основал крупнейшую в мире библиографическую базу данных – WorldCat. Эта база данных создается совместными усилиями более чем 72 тысячами библиотек из 170 стран мира. Любая библиотека может заимствовать из этой базы данных записи, чтобы не создавать их с нуля. Среди недостатков этого каталога можно выделить следующие:
(1) Наполнение базы данных WorldCat осуществляется достаточно большим сообществом, но по сравнению с общим количеством библиотек в мире количество энтузиастов, принимающих участие в создании и редактировании библиографических записей в WorldCat, не так уж и велико.
(2) WorldCat представляет собой отдельно расположенную базу данных, которую достаточно проблематично встроить в технологическую цепочку каталогизации отдельно взятой библиотеки. Усилия, затрачиваемые на поиск и выгрузку записи из WorldCat, сопоставимы с трудозатратами на создание этой записи с нуля.
В области разработки, внедрения и поддержки программного обеспечения для автоматизации функционирования библиотек существует безусловный мировой лидер – компания Ex Libris. Эта компания появилась в 1980 году в качестве внутреннего проекта по автоматизации деятельности библиотеки Еврейского университета в Иерусалиме. Впоследствии Ex Libris начала продавать, внедрять и поддерживать свои решения в различных библиотеках мира. В качестве примера можно привести следующую статистику: в 2020 году 49% академических библиотек США работало под управлением систем компании Ex Libris.
Самым успешным продуктом компании Ex Libris была система Aleph, которая устанавливалась в отдельно взятой организации. Используя накопленный опыт в области автоматизации библиотек, Ex Libris в 2011 году выпустила совершенно новое программное обеспечение – Alma, которое представляет собой облачный сервис, построенный по модели SaaS (Software As A Service – программное обеспечение в виде сервиса). На данный момент Alma расположена в 8 географически распределенных центрах обработки данных, этой системой пользуются более 5500 учреждений из более 90 стран мира.
Система Alma имеет ряд существенных преимуществ по сравнению с другими системами. Остановимся на двух из них:
(1) Система Alma является облачной и не требует для работы установки специального клиентского приложения – достаточно обыкновенного браузера. Такой подход позволяет библиотекарям работать откуда угодно, а не только на своем рабочем месте, где установлено и настроено специализированное программное обеспечение, что существенным образом облегчило жизнь системным администраторам библиотек в период пандемии новой коронавирусной инфекции COVID-19, когда большинство сотрудников находились на самоизоляции и работали удаленно.
(2) Все библиографические записи, создаваемые всеми пользователями системы Alma, хранятся в облачном хранилище, к которому осуществляется совершенно прозрачный доступ изо всех компонентов системы Alma. Уровень интеграции инструментов Alma и облачного хранилища настолько высок, что при попытке создания новой библиографической записи производится поиск похожих записей в облачном хранилище, и в случае положительного результата, происходит автоматическое заимствование уже имеющейся записи.
Таким образом, учреждения, работающие в системе Alma, автоматически пополняют облачное хранилище создаваемыми библиографическими записями, а также используют встроенные инструменты по заимствованию готовых записей.
Российский опыт
В 2003 году в России был запущен проект по созданию Сводного каталога библиотек России (СКБР), который представлял собой российский аналог мировой библиографической базы данных WorldCat. Оператором СКБР был назначен национальный информационно-библиотечный центр «Либнет» . Основная идея состояла в том, чтобы встроить в технологические процессы каталогизации в библиотеках России взаимодействие со сводным каталогом: в начале каталогизации должен был осуществляться поиск аналогичных записей в сводном каталоге и заимствование записи в случае успешного обнаружения, или же должна была происходить выгрузка готовой записи в конце каталогизации, если такая запись отсутствовала в сводном каталоге.
У СКБР было несколько проблем, мешавших активному развитию. Одна из проблем заключалась в использовании устаревшей системы управления базами данных (СУБД) Adabas. Из-за ограничений этой СУБД в СКБР долгое время были недоступны некоторые функции, например, поддержка стандарта кодирования символов юникод (Unicode) появилась в СКБР только в 2012 году. Из-за того, что в СКБР используется такая экзотичная система, в России очень сложно найти разработчиков, способных развивать и поддерживать проекты с использованием этой СУБД.
Также в СКБР была финансовая проблема: оператором СКБР – центром «Либнет» была реализована своя внутренняя экономика, когда за каждую загруженную в СКБР запись библиотека имела право бесплатно заимствовать 7 библиографических записей, остальные записи, заимствованные из СКБР, необходимо было оплачивать. Из-за этого библиотеки, участвующие в СКБР, поделились на две неравные группы. В первую группу входили библиотеки, которые в большинстве случаев лишь поставляли записи в СКБР, например, РГБ и РНБ, и никогда их не заимствовали. А во вторую - библиотеки, которые практически не имели возможности поставлять записи в СКБР, так как эти записи уже были загружены туда библиотеками из первой группы, и вынуждены были только заимствовать библиографические записи на платной основе.
Данные проблемы привели к тому, что в 2015 году Министерство культуры Российской Федерации приняло решение сменить оператора сводного каталога библиотек России, назначив вместо центра «Либнет» свою подведомственную организацию – Главный информационно-вычислительный центр Министерства культуры Российской Федерации. Лишившись финансирования от Минкульта России, центр «Либнет» переименовал СКБР в Систему Корпоративной Каталогизации (СКК) и продолжил развивать её за свой счет. На данный момент в СКК участвуют 297 библиотек, количество библиографических записей в СКК в конце 2021 года составляло 13 892 771, за период с 2003-го по 2021-ый год в общей сложности из СКБР (а впоследствии из СКК) было заимствовано 9 413 336 библиографических записей.
SaaS-решение в БЕН РАН
Постановлением Президиума Академии наук СССР от 22 марта 1973 г. № 226 «Об организации Центральной Библиотеки Академии наук СССР по естественным наукам», подписанного президентом Академии наук СССР, академиком М.В. Келдышем, было установлено организовать новую библиотеку с 5 апреля 1973 г. в г. Москве на базе Сектора специальных библиотек Академии наук СССР. В сеть Центральной библиотеки Академии наук СССР по естественным наукам в момент ее образования были включены свыше 70 библиотек институтов Москвы и Московского региона, свыше 40 библиотек научных учреждений, находившихся в других городах Советского Союза, и несколько десятков библиотек при научных станциях и научных базах в системе Академии наук. В общей сложности новая библиотека стала осуществлять комплектование фондов 185 библиотек ее сети. В январе 1974 г. Центральная библиотека АН СССР по естественным наукам была переименована в Библиотеку по естественным наукам (БЕН) АН СССР. Постановлением Президиума РАН от 13 декабря 2011 г. № 262 библиотека получила новое наименование: Федеральное государственное бюджетное учреждение науки Библиотека по естественным наукам Российской академии наук (БЕН РАН).
За годы существования БЕН РАН количество отделов существенно сократилось, но библиотека сохранила свой распределенный характер работы. На начало 2020 года в БЕН РАН насчитывалось более 50 отделов, находящихся в различных районах Москвы, Московской и Калужской областях. Аудит использовавшихся на тот момент программных средств в БЕН РАН показал, что информация об изданиях в фонде БЕН РАН содержалась в 24 различных системах и базах данных, которые не были объединены между собой. Назрела острая необходимость внедрения единой автоматизированной библиотечной интегрированной системы (АБИС).
Система Alma компании Ex Libris не рассматривалась в качестве претендента на внедрение в БЕН РАН по нескольким причинам:
- Использование облачного хранилища, принадлежащего частной иностранной компании, оставляет открытым вопрос о том, кому именно принадлежат загруженные в систему данные;
- Стоимость лицензии на использование системы Alma в несколько раз превышает годовой бюджет БЕН РАН;
- Руководство компании Ex Libris, начиная с 2018 года, неоднократно заявляло об уходе компании из России.
После анализа мирового рынка программного обеспечения в области автоматизации библиотечной деятельности в БЕН РАН было принято решение о миграции на свободно распространяемую АБИС с открытым исходным кодом – Koha. Помимо отсутствия какой-либо платы за использование этой АБИС, у Koha есть ряд преимуществ, из которых стоит выделить следующие:
- Как и в системе Alma, у Koha отсутствует клиентское приложение. Вся работа осуществляется через любой современный браузер на сервере, который можно установить в своей организации.
- Koha поддерживает возможность работы в режиме коллективной аренды (multi-tenancy).
Режим коллективной аренды – это свойство архитектуры программного обеспечения, при которой единый экземпляр приложения, запущенного на сервере провайдера, одновременно работает с несколькими арендаторами (компаниями-клиентами). По этому принципу устроен сервис публичного облака. Режим коллективной аренды является противоположностью архитектуры, состоящей из большого числа элементов, где для каждой компании-клиента создается отдельная инфраструктура для размещения программного обеспечения.
Режим коллективной аренды в Koha позволяет в рамках одной установленной системы разместить множество экземпляров (instances) системы Koha, каждый из которых будет выглядеть, как отдельно установленная система, но при этом будет обеспечена возможность бесшовного обмена данными между этими экземплярами. В качестве успешных сценариев использования такого режима в Koha можно привести Финляндию, где все университетские библиотеки используют единственную инсталляцию Koha, а также Турцию, где абсолютно все библиотеки вне зависимости от их размера, ведомственной подчиненности и специализации работают в режиме коллективной аренды в системе Koha.
В БЕН РАН миграция в АБИС Koha началась в мае 2021 года. Отдельные модули системы вводились поэтапно и постепенно внедрялись во всех отделах распределенной сети БЕН РАН. Параллельно с этим осуществлялись сбор данных из разрозненных систем БЕН РАН, их подготовка, очистка, конвертация и загрузка в Koha. Поскольку Koha использует опыт работы библиотек мира, в БЕН РАН были произведены технологические изменения как в самой АБИС, так и в методике обработки литературы в библиотеке. Также была создана исчерпывающая документация и проведено обучение сотрудников по работе в новой системе. 26 сентября 2022 года в отделах сети БЕН РАН был внедрен последний модуль Koha – модуль книговыдачи. Именно эту дату можно считать началом полноценного использования всех модулей Koha во всех отделах БЕН РАН.
В БЕН РАН инсталляция Koha функционирует в режиме Сети библиотек. Это означает, что во всех отделах осуществляется общая каталогизация – библиографические записи являются общими, но каждый отдел имеет свои отдельные экземпляры, привязанные к общим записям. Читатели также прикреплены к своему отделу, но теперь они имеют возможность искать и заказывать литературу изо всех отделов БЕН РАН без ограничений. Эта возможность является полной противоположностью тому, когда читатели работали с локальными базами данных своего отдела и не имели возможности поискать литературу в остальных базах данных.
Кроме того, благодаря наличию режима коллективной аренды в Koha БЕН РАН развивает SaaS-решение для других библиотек. Внутри АБИС Koha создаются отдельные экземпляры, которые предоставляются другим библиотекам. На данный момент в АБИС Koha, установленной в БЕН РАН, помимо самой БЕН РАН со всеми своими отделами, в отдельных экземплярах полноценно работают:
- Институт общей физики имени А.М. Прохорова Российской академии наук – ИОФ РАН (с февраля 2022 года);
- Тобольская комплексная научная станция Уральского отделения Российской академии наук – ТКНС УРО РАН (с марта 2022 года);
- Институт прикладной математики имени М.В. Келдыша Российской академии наук – ИПМ РАН (с мая 2022 года).
Осуществляется миграция данных для Института океанологии имени П.П. Ширшова Российской академии наук, также ведутся переговоры об использовании SaaS-решения БЕН РАН в двух других научно-исследовательских учреждениях.
Использование такого подхода позволяет библиотекам этих учреждений экономить на покупке, установке и эксплуатации программного и аппаратного обеспечения, на оплате труда системных администраторов и программистов, настраивающих и обслуживающих программно-аппаратный комплекс, на котором базируется и функционирует система Koha. Помимо этого, происходит существенная экономия трудозатрат при каталогизации, поскольку все экземпляры системы работают с использованием единого электронного каталога.
В таблицах №1, №2 и №3 приведена статистика заимствований библиографических записей библиотеками научных институтов из облачного электронного каталога в сравнении с общим количеством новых библиографических записей (стоит учитывать, что периодически записи загружаются в пакетном режиме из старых баз данных библиотек).
| Месяц | Количество заимствованных записей | Всего новых записей |
|---|---|---|
| 02.2022 | 0 | 5 634 |
| 03.2022 | 82 | 88 |
| 04.2022 | 468 | 542 |
| 05.2022 | 451 | 550 |
| 06.2022 | 130 | 405 |
| 07.2022 | 280 | 313 |
| 08.2022 | 152 | 187 |
| 09.2022 | 219 | 342 |
| 10.2022 | 68 | 97 |
| 11.2022 | 89 | 209 |
| 12.2022 | 44 | 177 |
| 01.2023 | 30 | 98 |
| 02.2023 | 21 | 79 |
| 03.2023 | 40 | 55 |
| 04.2023 | 157 | 157 |
| Месяц | Количество заимствованных записей | Всего новых записей |
|---|---|---|
| 03.2022 | 287 | 5 518 |
| 04.2022 | 1 | 11 |
| 05.2022 | 13 | 33 |
| 06.2022 | 56 | 84 |
| 07.2022 | 11 | 12 |
| 08.2022 | 31 | 47 |
| 09.2022 | 21 | 39 |
| 10.2022 | 35 | 47 |
| 11.2022 | 32 | 42 |
| 12.2022 | 9 | 9 |
| 01.2023 | 40 | 45 |
| 02.2023 | 43 | 52 |
| 03.2023 | 74 | 87 |
| 04.2023 | 112 | 138 |
| Месяц | Количество заимствованных записей | Всего новых записей |
|---|---|---|
| 05.2022 | 1 | 6 846 |
| 06.2022 | 0 | 0 |
| 07.2022 | 0 | 0 |
| 08.2022 | 0 | 117 |
| 09.2022 | 0 | 81 |
| 10.2022 | 3 | 187 |
| 11.2022 | 2 | 37 |
| 12.2022 | 5 | 1 300 |
| 01.2023 | 4 | 22 |
| 02.2023 | 13 | 1 500 |
| 03.2023 | 2 | 91 |
| 04.2023 | 0 | 48 |
Выводы
В современном мире интеллектуальный труд человека является дорогостоящим, поэтому необходимо искать пути для оптимизации и сокращения выполнения дублирующих друг друга операций. В области каталогизации библиотечного фонда много десятилетий используется механизм создания и использования сводных каталогов, который имеет ряд недостатков и ограничений. На смену этому подходу пришел современный метод использования облачной корпоративной каталогизации, который позволяет в значительной мере экономить трудозатраты каталогизаторов различных библиотек.
Библиографический список
- Основы законодательства Российской Федерации о культуре: закон Российской Федерации от 09.10.1992 No 3612-I // Ведомости Съезда народных депутатов Российской Федерации и Верховного Совета Российской Федерации, 1992, № 46. – Ст. 2615.
- Федеральный Закон Российской Федерации от 29.12.1994 № 77 «Об обязательном экземпляре документов» // Собрание законодательства РФ. – 1995. – № 1 – Ст. 1.
- БЕН РАН: 50 лет на благо российской науки. – М.: Наука, 2023. – 283 с. – ISBN 978-5-02-040965-1.
- М.А. Ионов. Опыт миграции БЕН РАН на АБИС Koha. // Электронный век науки. Информационное и ресурсное обеспечение научной деятельности в контексте цифровой трансформации. Материалы I международной научно-практической конференции. Библиотека по естественным наукам Российской академии наук; Дагестанский Государственный Университет. – № 1. – 2021. – С.12-16.
- Государственное задание № 054-00009-21-00 на 2021 год и на плановый период 2022 и 2023 годов. [Электронный ресурс] // URL: https://www.rsl.ru/photo/!_ORS/1-O-BIBLIOTEKE/7-documenty/fin-hoz/Государственное%20задание%20на%202021%20год%20и%20на%20плановый%20период%202022%20и%202023%20годов.pdf
- Общая информация / Официальный сайт национального информационно-библиотечного центра «Либнет» [Электронный ресурс] // URL: http://nilc.ru/?p=center
- Отчет о деятельности Центра Либнет за 2003-2023 гг. / Официальный сайт национального информационно-библиотечного центра «Либнет» [Электронный ресурс] // URL: http://nilc.ru/?p=stat
- Перечни государственных (муниципальных) работ и услуг / Единый портал бюджетной системы Российской Федерации «Электронный бюджет». [Электронный ресурс] // URL: https://budget.gov.ru/Госсектор/Государственные-услуги/Перечни-классификаторы-государственных-и-муниципальных-услуг-и-работ/Федеральные-перечни-классификаторы-услуг-и-работ/Реестровые-записи
- Что такое Unicode? [Электронный ресурс] // URL: http://www.unicode.org/standard/translations/russian.html
- A.K. Tyagi, V. Senthil. Library Automation in India: Assessment of Library Services Platforms // Journal of Library & Information Technology. - Vol. 35. - № 6. - November 2015. - pp. 408-416
- Federico Leva. Finland successfully migrates university libraries to free software backend. [Электронный ресурс] // URL: https://joinup.ec.europa.eu/collection/open-source-observatory-osor/news/koha-conquers-finland
- Margalit Fox. Frederick G. Kilgour, Innovative Librarian, Dies at 92 / Официальный сайт The New York Times [Электронный ресурс] // URL: https://www.nytimes.com/2006/08/02/us/02kilgour.html
- Marshall Breeding. 2020 Library Systems Report: Fresh opportunities amid consolidation: [Электронный ресурс] // URL: https://americanlibrariesmagazine.org/2020/05/01/2020-library-systems-report/
- Our story / Официальный сайт компании Ex Libris [Электронный ресурс] // URL: https://exlibrisgroup.com/about-us/our-story-about-ex-libris/
- S.M. Deen. Fundamentals of Data Base Systems. — 1977. — С. 174. — ISBN 1349158437
- Turkey’s Koha installation [Электронный ресурс] // URL: https://kohapakistan.org/wp-content/uploads/2019/03/56041518_338716899977823_7558736200381397202_n.mp4