Олег Шорин
Научно-техническая информация. Серия 1: Организация и методика информационной работы. · 21 сентября 2023 г. · RU
Обложка журнала Scientific and Technical Information Processing

Возможные направления применения искусственного интеллекта в библиотеках и информационных центрах

О.Н. Шорин

Аннотация: Показаны возможности использования нейронных сетей в библиотечной деятельности для автоматического аннотирования и поиска похожих документов, каталогизации изображений, анализа библиографических ссылок в научных статьях. В свою очередь, информация, хранящаяся в библиотеках, может быть полезна для обучения нейронных сетей.

Ключевые слова: библиотека, искусственный интеллект, нейронная сеть, обучение нейронной сети, аннотирование, поиск, генеративные трансформеры

Библиографическое описание: О.Н. Шорин. Возможные направления применения искусственного интеллекта в библиотеках и информационных центрах / О. Н. Шорин // Научно-техническая информация. Серия 1: Организация и методика информационной работы. – 2023. – № 11. – С. 15-19. – DOI 10.36535/0548-0019-2023-11-2.

ВВЕДЕНИЕ

К середине XX в. возможности электронных вычислительных машин достигли такого уровня, что скорость выполняемых на них операций превзошла человеческие возможности. Поскольку лидерство в выполнении рутинных вычислительных операций окончательно перешло к компьютерам, то вопрос об осуществлении ими творческой деятельности оставался открытым. И если до этого момента только философы задавались вопросом о том, способны ли будут машины мыслить как человек, то в середине прошлого столетия к обсуждению этого вопроса активно подключились математики, программисты и инженеры. Появилось понятие «искусственный интеллект», которое имеет множество толкований, но в контексте настоящей статьи уместно использовать следующее: искусственный интеллект – свойство искусственных систем выполнять творческие функции, которые традиционно считаются прерогативой человека [1].

В 1950 г. Алан Тьюринг предложил тест, с помощью которого можно определить, превосходит ли машина по разумности человека или нет [2]. Суть теста заключалась в следующем: человек взаимодействует с одним человеком и одним компьютером, при этом все участники не видят друг друга; человек задает вопросы и получает ответы от человека и от компьютера. По этой беседе человек должен определить с кем он разговаривает: с человеком или с компьютерной программой. Задача компьютера состоит в том, чтобы ввести человека в заблуждение, заставив его сделать неверный выбор. Этот тест Тьюринга представляет собой значительное сужение творческой составляющей вычислительных систем, поэтому достаточно быстро появились инструменты, которые помогли компьютерам успешно его пройти. В частности, поскольку тест основан на серии вопросов и ответов, то появление языка программирования LISP (LISt Processing language), в основу которого положена удобная работа со списками, в том числе и строковыми, в совокупности с использованием нехитрых приемов построения беседы позволило компьютерной программе формально пройти тест Тьюринга, но очевидно, что это не имеет ничего общего с творческой составляющей мыслительного процесса.

Другой классической вехой в развитии искусственного интеллекта принято считать турнир по шахматам, который состоялся в мае 1997 г. между Гарри Каспаровым и компьютером Deep Blue фирмы IBM. В том турнире компьютер одержал победу над человеком, но, как и в случае с успешным прохождением теста Тьюринга, здесь не совсем уместно говорить об искусственном интеллекте. Дело в том, что компания IBM создала очень хороший алгоритм для решения одной конкретной задачи, и этот алгоритм был основан на переборе и сравнении возможных позиций в ходе партии с последующим отсечением тех направлений развития игры, которые ведут к ухудшению положения компьютера [3]. Затем в программу были встроены дополнительные оптимизации по использованию сценариев из других партий, которые применялись в начале и в заключении игры. Всё это позволило компьютеру одержать верх над человеком, но, тем не менее, в основе алгоритма лежал банальный перебор комбинаций, что свидетельствует о потрясающей скорости работы вычислительной машины, но нисколько – о творческой составляющей компьютерной программы.

НЕЙРОННЫЕ СЕТИ

Спустя некоторое время после появления термина «искусственный интеллект» были разработаны различные подходы к созданию программно-аппаратных комплексов, которые позволили бы компьютерам достичь определенных успехов в творческой деятельности. Одним из таких подходов стала технология машинного обучения с использованием нейронных сетей, которая получила мощное развитие в последние несколько лет.

Нейронная сеть является попыткой смоделировать процессы, происходящие в мозгу человека. Она состоит из множества простых процессоров, каждый из которых способен получать сигнал, как-то на него воздействовать и отправлять этот сигнал дальше. Все процессоры объединены в сложную структуру, на вход которой можно подать данные: эти данные, пройдя через сеть процессоров, каким-то образом будут преобразованы и выведены в качестве результата [4].

Работа с нейронной сетью состоит из двух этапов: обучения и использования. В процессе обучения на вход нейронной сети подаются специально подобранные данные, а полученный результат оценивается, исходя из того, насколько он приближен к желаемому. В зависимости от этой оценки нейронная сеть изменяет коэффициенты воздействия отдельных процессоров своей сети, стараясь подобрать их таким образом, чтобы результат был максимально приближен к желаемому. С математической точки зрения, обучение – это многопараметрическая задача нелинейной оптимизации.

В процессе эксплуатации корректно обученная нейронная сеть сможет при получении сходных, но не эквивалентных, входных данных выдать результат, приближенный к тому, которому её обучили. Нейронные сети успешно используются в таких задачах, как распознавание образов. Например, нейронная сеть, обученная находить кошку на картинке, с большой долей вероятности сможет найти кошку, если ей на вход подать изображение, которое не участвовало в обучении сети.

И это может быть одним из таких направлений применения нейронных сетей в библиотеках, как автоматическое проставление тэгов в зависимости от того, что изображено на иллюстрациях произведений, хранящихся в электронной библиотеке, для облегчения последующего поиска по изображениям.

Самое сложное в работе нейронных сетей – это их обучение. В процессе обучения может возникнуть множество проблем. Часть из них связана с настройками и параметрами обучения. Например, сеть может быть обучена не оптимально. Это означает, что решением задачи нелинейной оптимизации является некий локальный экстремум, а не глобальный. Но при обучении нейронной сети большинство проблем связано с данными, на которых её обучают.

Одна из проблем – это недостаточность данных для обучения сети. В этом случае сеть фактически «запоминает» правильные ответы, а не учится искать некую взаимосвязь в подаваемых на вход данных. Проблемой является и плохое качество данных, на которых происходит обучение. Эта проблема известна под названием «мусор на входе, мусор в результате» (Garbage In, Garbage Out – GIGO). Дело в том, что нейронная сеть, обученная на некачественных данных, не способна выдать что-то стоящее при получении на вход качественных данных, поскольку она с ними никогда не сталкивалась и не обучена тому, как правильно на них реагировать.

Таким образом, для правильного обучения нейронной сети требуется большое количество качественных данных. Это как раз то, в чем сильны библиотеки – они хранят огромное количество информации, которая прошла редакторскую правку , а научные публикации – ещё и рецензирование. Следовательно, еще одно возможное пересечение деятельности библиотек и развития нейронных сетей – это предоставление большого объема качественной информации, хранящейся в библиотеках, для обучения сетей [5].

Развитие нейронных сетей

Идеи об устройстве и функционировании нейронных сетей возникли в середине XX в., однако большое распространение они получили в начале XXI в. Скорее всего, это связано с развитием производства элементной базы для микрочипов. Технологии достигли такого уровня, что уже практически в каждом современном телефоне есть встроенный нейропроцессор, содержащий миллиарды узлов в своей нейронной сети. На развитие нейронных сетей сильное влияние оказало появление языков программирования, направленных на оптимизацию человеческих усилий при их обучении.

Оба этих фактора привели к тому, что даже инженеры и программисты, которые создают нейронные сети, подбирают данные для обучения, пишут алгоритмы, проводят обучение и тестируют их, не могут предсказать, что выдаст сеть, если ей на вход подать те или иные данные. Дело в том, что в нейронных сетях между процессом создания и процессом использования появляется процесс обучения, результат которого просчитать человеку невозможно, поскольку он чисто физически не способен проанализировать работу миллиардов нейронов.

Возможно, из-за такой непредсказуемости конечного результата, а также из-за доступности и удобства использования нейронные сети и получили столь широкое распространение. Человеку даже из любопытства может быть интересно ввести какой-то запрос на телефоне или в специальной программе на компьютере и получить результат, который он не мог спрогнозировать, но который, как минимум, не противоречит его запросу. Этот «вау-эффект» подогревает интерес общества к внедрению технологии нейронных сетей в различные аспекты жизнедеятельности.

В 2017 г. в Российской национальной библиотеке (РНБ) был проведен эксперимент с использованием нейронной сети Watson, разработанной компанией IBM. На тот момент в РНБ возникла идея, что поиск научных публикаций должен отличаться от поиска художественных произведений. Зачастую поиск осуществляется по ключевым словам, которые пользователь вводит в качестве поискового запроса. Дополнительно он может ввести ограничения по ряду параметров: год издания, издательство, название произведений, фамилия автора и т.п. Но в любом случае поиск осуществляется по ключевым словам. Допустим, что научный сотрудник, являясь специалистом в какой-то определенной области и имея публикации по этой теме, заинтересован в поиске публикаций, которые каким-то образом пересекаются с полем его интересов. В этом случае вместо того, чтобы вычленять ключевые слова из своей публикации, вводить их в качестве поискового запроса, а потом пытаться проранжировать результаты поиска, этот сотрудник может подать в качестве данных для поиска какую-нибудь свою статью, нейронная сеть её проанализирует и подберет те публикации, которые схожи с исходной.

В 2017 г. нейронная сеть Watson проанализировала все авторефераты по истории, которые хранились в электронной библиотеке РНБ. В качестве поискового запроса Watson’у были предложены случайным образом выбранные из того же множества авторефераты по истории. Очевидно, что на первом месте в списке результатов появлялся тот же самый автореферат, который был подан в качестве запроса. В подавляющем большинстве случаев дальше шел список, который по мнению специалистов, был не очень сильно релевантен исходному автореферату, но достаточно редко нейронная сеть выдавала результат, который был не ожидаем для экспериментаторов.

В частности, можно привести пример, когда на вход был подан автореферат по экономике забайкальского края в 1921–1924 гг. Ожидаемо, что на первом месте оказался сам этот автореферат, на последующих местах – шли авторефераты, посвященные экономике забайкальского края, но в другие годы, например, 1918–1921 гг. или 1924–1927 гг. Но экспериментаторов поразило, что на следующих позициях поискового результата Watson выдал авторефераты, посвященные экономике соседних краёв того же или смежных периодов: например, экономика прибайкальского края в 1921–1924 гг.

К сожалению, такие поразительно неожиданные результаты выдавались Watson’ом лишь в менее 10% случаев, что было катастрофически недостаточным для внедрения этой технологии поиска в промышленную эксплуатацию в тот момент. С тех пор количество узлов, используемых в нейронных сетях, значительно выросло, а технологии обучения, тестирования и фильтрации заведомо неподходящих результатов вышли на качественно новый уровень, что позволяет вернуться к экспериментам по поиску литературы в библиотеках не только с использованием ключевых слов, но и по поиску схожих текстов.

Генеративные трансформеры

В середине второго десятилетия XXI в. исследователи стали направлять свои усилия на создание генеративных предварительно обученных трансформеров (Generative Pre-trained Transformer – GPT). GPT – это тип больших языковых моделей, которые обучаются на больших наборах текстовых данных и способны генерировать текст, схожий с человеческим. Пионером в этом направлении стала основанная в 2015 г. Илоном Маском и Сэмюэлем Олтменом компания OpenAI [6]. В конце 2022 г. этой компанией был запущен чат-бот с искусственным интеллектом ChatGPT, который вызвал всплеск интереса за счет больших возможностей по ведению диалога с пользователем, учету контекста и генерации текстов, которые практически невозможно отличить от человеческой речи.

ChatGPT основан на языковой модели GPT-3.5, которая является улучшенной версией модели GPT-3. В свою очередь, в модели GPT-3 для обучения использовались наборы данных на различных языках общим объемом 570 ГБ текстов. Разработчики GPT-3 обучили восемь различных моделей, архитектуры которых были схожи друг с другом, но различались по количеству параметров машинного обучения. У максимальной модели количество параметров машинного обучения составляет 175 миллиардов [7]. Это привело к тому, что GPT-3 умеет отвечать на вопросы по прочитанному тексту, сочинять стихотворения в заданном стиле, решать математические примеры, генерировать тексты на заданную тему.

В 2015–2016 гг. в РНБ было проведено масштабное исследование, посвященное тому как пользователи читают книги, размещенные в электронной библиотеке РНБ. Исследование проводилось с 10 марта 2015 г . по 31 августа 2016 г. За этот период в электронной библиотеке РНБ было открыто 1 932 603 книги и просмотрено 20 376 397 страниц. Таким образом, в среднем пользователи просматривают 10,54 страницы в одной книге. Можно сделать вывод о том, что основной сценарий работы пользователя выглядит следующим образом: поиск книг в электронном каталоге с использованием поискового запроса, выбор нескольких книг в результатах поиска, открытие выбранных книг, ознакомление с несколькими первыми страницами, на которых располагаются аннотация и оглавление, закрытие книги. Подобное поведение пользователя сигнализирует о том, что информации, представленной в результатах поиска, недостаточно для принятия решения о необходимости прочтения книги: человеку требуется открыть её и ознакомиться с несколькими первыми страницами. Тогда и возникла идея о том, что размещение небольшой аннотации на странице с результатами поиска помогло бы пользователю более осознанно принимать решение о необходимости прочтения книги.

В 2016 г. в РНБ был проведен эксперимент с использованием нейронной сети Watson компании IBM по автоматической генерации аннотаций на основе текста книги. Тогда этот эксперимент был признан провальным, поскольку сгенерированные тексты были бессвязными, содержали большое количество ошибок и вызывали раздражение у читателей.

Недавние исследования показывают, что ChatGPT превосходит людей в задаче аннотирования текстов. Например, в эксперименте, проведенном в марте-мае 2023 г., на 6 183 твитах и газетных статьях, ChatGPT превзошел нанятых сотрудников в задачах определения значимости текста, занятой политической позиции, предмета обсуждения и выявления структуры сообщения [8]. Вполне возможно, что имеет смысл вернуться к эксперименту по автоматическому аннотированию текстов, проведенному в РНБ в 2016 г., но уже с использованием современных моделей нейронных сетей.

Таким образом, еще одно из возможных направлений использования искусственного интеллекта в библиотеках – это автоматическое создание аннотаций для электронных книг с использованием генеративных предварительно обученных трансформеров.

Создание научных статей

В современных редакторах изображений зачастую встроена опция, позволяющая «улучшить» ту или иную фотографию с использованием искусственного интеллекта. Более того, в последних поколениях смартфона iPhone компании Apple подобный функционал встроен в стандартное приложение «Камера» и является неотключаемым. Возникает вопрос: каким образом программное обеспечение понимает, что представляет собой улучшение, а что нет? Ведь все люди разные, и то, что для одного пользователя является улучшением, например, уменьшение носа и увеличение губ, для другого абсолютно неприемлемо.

Скорее всего, функция «улучшения» настраивается индивидуальным образом и зависит от истории редактирования пользователем своих фотографий. Если человек на всех своих исходных фотографиях изменяет одну и ту же часть, то можно сделать вывод, что именно это преобразование и является «улучшением» в его понимании. Программное обеспечение может сохранять исходную версию изображения и версию, созданную пользователем, и, сравнивая эти версии, выделить некий шаблон изменений, который человек использует раз за разом. Возможно, применив этот шаблон к только что сделанной фотографии, получится изображение, которое с большей вероятностью понравится владельцу телефона.

Подобно тому, как пользователь телефона раз за разом редактирует свои фотографии, доводя их до совершенства, точно так же и научный сотрудник работает над своими публикациями, изменяя структуру, расположение блоков текста, дополняя статью фактами и перефразируя различные стилистические обороты. Теоретически можно создать нейронную сеть и обучить её на массиве промежуточных вариантов публикаций автора для того, чтобы сеть смогла выделить характерные шаблоны изменений, присущие именно этому автору, и в дальнейшем была бы способна применять эти шаблоны для «улучшения» статей еще на этапе авторского редактирования.

Еще один рутинный процесс при создании научных статей – это работа со списками библиографических ссылок. Нейронные сети вполне способны понять, в каком месте научной статьи автор ссылается на данные из другой статьи, корректно оформить цитату или ссылку на источник, а в библиографический список добавить упоминание исходной статьи в том стандарте, который принят правилами журнала или учреждения, в котором работает автор. Нейронные сети могут автоматически проверить все встречающиеся в статье библиографические ссылки на точность, корректность, соответствие источникам, а также на непротиворечивость приводимой информации с данными из статьи, на которую дана ссылка.

ЗАКЛЮЧЕНИЕ

За последние десять лет в развитии нейронных сетей произошел значительный прогресс. То, что они выдают на запросы пользователей, поражает воображение и, одновременно, обескураживает. Тексты, генерируемые нейронными сетями, невозможно отличить от тех, которые пишет человек. А связность текста, логичность повествования, соблюдение причинно-следственных связей в этих текстах позволяет им претендовать на звание научной статьи.

К сожалению, невозможно утверждать, что искусственный интеллект может выполнять творческие функции. На самом деле, он всего лишь научился работать с огромными массивами информации, вычленять из них какие-то данные, компоновать их между собой и предоставлять человеку в том виде, который ему привычен и удобен.

Используя принцип самоприменимости, среди исследователей стало модным спрашивать, например, у того же ChatGPT, что он думает о той или иной проблеме, связанной с искусственным интеллектом. В частности, на вопрос о том, способен ли искусственный интеллект написать научную статью, ChatGPT честно ответил, что он лишь способен сгенерировать большой объем текста на заданную тему, но это никоим образом не будет оригинальным исследованием, поскольку этот текст будет основан на существующих разработках, т. е. этот сгенерированный текст не будет содержать каких-либо новых идей, подходов и выводов [9]. Таким образом, пока рано говорить, что искусственный интеллект и нейронные сети, как один из видов реализации искусственного интеллекта, способны к действительно творческой деятельности в максимально широком значении этого понятия.

Тем не менее, на современном этапе развития нейронных сетей можно предположить, что они могут облегчить библиотекарям выполнение операций, которые напрямую не связаны с творческой составляющей, а именно:

  • автоматическое проставление тэгов в зависимости от того, что изображено на иллюстрациях, хранящихся в электронной библиотеке произведений, для облегчения последующего поиска по изображениям;
  • поиск по электронному каталогу не только с использованием ключевых слов, но и поиск схожих документов на основе полного текста;
  • автоматическое аннотирование научных статей и книг, хранящихся в электронной библиотеке;
  • использование шаблонов редактирования статей, характерных для того или иного научного сотрудника;
  • анализ библиографических ссылок на точность, корректность, соответствие источникам и непротиворечивость.

В свою очередь, библиотеки могут выступать поставщиками больших массивов проверенных данных, которые необходимы нейронным сетям для обучения.

Таким образом, можно предположить, что в течение ближайших лет мы станем свидетелями взаимно выгодного сотрудничества библиотечного сообщества и программно-аппаратных комплексов, основанных на использовании систем искусственного интеллекта.

СПИСОК ЛИТЕРАТУРЫ

  1. Аверкин А.Н., Гаазе-Рапопорт М.Г., Поспелов Д.А. Толковый словарь по искусственному интеллекту. – Москва: Радио и связь, 1992. – 256 с.
  2. Turing A.M. Computing machinery and intelligence // Mind. – 1950. – Vol. LIX, Issue 236 (October). – P. 433–460. DOI:  https://doi.org/10.1093/mind/LIX.236.433 .
  3. Campbell M., Hoane A.J.Jr., Feng-Hsiung Hsu. Deep Blue // Artificial Intelligence. – 2002. – Vol. 134, № 1. – P. 57-83. DOI:10.1016/S0004-3702(01)00129-1.
  4. Orlov I.I., Larskikh E.L. Neural networks are a new milestone in the developtment of science and designe. Brief overview or the problem // 25 апреля 2021 года, 2021. – P. 77-81. DOI: 10.37539/SRP296.2021.13.83.005.
  5. Каптерев А.И. Когнитивный менеджмент и искусственный интеллект в библиотеках: возможности и особенности // Научные и технические библиотеки. – 2023. – № 6. – С. 113-137. DOI:  https://doi.org/10.33186/1027-3689-2023-6-113-137 .
  6. Официальный сайт компании OpenAI. – URL:  https://openai.com  (дата обращения: 18.08.2023).
  7. Brown T. et al. Language models are few-shot learners // Advances in neural information processing systems. – 2020. – Vol. 33. – Р. 1877-1901. DOI:  https://doi.org/10.48550/arXiv.2005.14165 .
  8. Gilardi F., Alizadeh M., Kubli M. Chatgpt outperforms crowd-workers for text-annotation tasks // arXiv preprint arXiv:2303.15056. – 2023. DOI:  https://doi.org/10.48550/arXiv.2303.15056 .
  9. Grimaldi G., Ehrler B. et al. Machines Are About to Change Scientific Publishing Forever // ACS Energy Letters. – 2023. – Vol. 8(1). – Р. 878-880. DOI: 10.1021/acsenergylett.2c02828.

Сведения об авторе

ШОРИН Олег Николаевич – кандидат технических наук, директор Библиотеки по естественным наукам Российской академии наук (БЕН РАН), Москва

e-mail: shorin@benran.ru