Нумизматика и цифровизация (ч. 3)

Независимо от разработки EAD для монет и проекта оцифровки в Университете Вирджинии, Себастьян Хит и Эндрю Медоуз из Американского нумизматического общества в ходе серии семинаров, финансируемых Советом по исследованиям в области искусств и гуманитарных наук Великобритании в 2006–2007 годах, разработали список рекомендуемых нумизматических полей для баз данных. Этот список, названный Стандартом нумизматической базы данных (NUDS), содержал множество полей, которые не были включены в EAD. Некоторые из них были связаны с происхождением и управлением коллекцией: история аукционов, лот и цена продажи, владелец и т. д. Другие были связаны с описанием самих монет: художники и гравёры, символы и надчеканки, описания гурта и места находок. Многие из этих полей, такие как «художник» и «гравер», могут быть выражены для монеты в целом или, более конкретно, для аверса или реверса монеты. Поля NUDS были предложены с учётом системы управления базами данных, поэтому иерархическая сложность и повторение не могут быть легко или эффективно представлены. Более того, обозначение неопределённости на любом уровне записи также затруднительно. Подходы EAD и NUDS имели чёткие преимущества и недостатки, и Американское нумизматическое общество стремилось устранить различия между ними, чтобы прийти к решению, которое отвечало бы требованиям для всех реализаций модели.
Летом 2011 года началась работа над моделью данных, использующей поля NUDS, переосмысленные в XML-схеме, специально разработанной для нумизматики. К июню 2012 года модель, хотя всё ещё считалась черновиком, стала стабильной, и на её основе было построено несколько проектов. NUDS остаётся названием для XML-реализации этих полей, хотя аббревиатура теперь расшифровывается как «Стандарт нумизматического описания». На модель влияют другие распространённые XML-стандарты, используемые в библиотечном, архивном и музейном деле, такие как EAD, Encoded Archival Context – Corporate, Personal, and Family (EAC-CPF), VRA Core, Metadata Encoding and Transmission Standard (METS), Metadata Object Description Schema (MODS) и Text Encoding Initiative (TEI). Как и некоторые из этих стандартов, NUDS использует атрибуты xlink Консорциума Всемирной паутины для семантического связывания, позволяя создавать ссылки на URI концептов Nomisma, места на Geonames.org и личные и корпоративные названия, определённые VIAF. Запись NUDS/XML по сути является «связанными данными», поскольку представляет собой электронную запись, которая ссылается на другие ресурсы в Интернете, хотя это не связанные данные в том смысле, в каком многие из нас могут это понимать или как определяет сам Бернерс-Ли — RDF в хранилище триплетов с конечной точкой SPARQL для запросов. Как и в традиционных архитектурах связанных данных, запросы к машиночитаемым данным поддерживаются в Numishare и будут обсуждаться далее.
После введения модели данных NUDS/XML теперь можно обсудить приложения, составляющие Numishare, — как они функционируют и как пользователь взаимодействует с открытым интерфейсом. Как упоминалось ранее, существует четыре приложения с открытым исходным кодом на основе Java, которые работают в Apache Tomcat. По сути, Numishare — это код, который связывает эти отдельные приложения в единый программный комплекс. XSLT — основной язык сценариев в Numishare, а Javascript и CSS используются для улучшения пользовательского взаимодействия. Apache Cocoon — основная платформа веб-публикации, на которой построен открытый интерфейс Numishare. Карта сайта Cocoon определяет множество конвейеров, которые представляют собой взаимосвязь Модель-Представление-Контроллер в разработке XML-приложений. Выходная сериализация формируется путем объединения модели данных (в некоторых случаях NUDS/XML) и контроллера и/или представления (обычно таблицы стилей XSLT). Выходная сериализация документа NUDS/XML может быть представлена в формате HTML пользователю интерфейса Numishare в его браузере, но таблицы стилей XSLT также могут генерировать KML для отображения на картах или просто выводить сам XML-документ пользователю, заинтересованному в использовании необработанных, несериализованных данных. Документы NUDS хранятся в XML-базе данных eXist, поэтому Cocoon считывает модель непосредственно через интерфейс веб-сервиса eXist (или REST, интерфейс передачи репрезентативного состояния).
Cocoon также управляет взаимодействием пользователя с поисковым индексом Solr. Согласно официальному сайту Solr, «его основные функции включают мощный полнотекстовый поиск, подсветку результатов, фасетный поиск, динамическую кластеризацию, интеграцию с базами данных, расширенную обработку документов (например, Microsoft Word, PDF) и геопространственный поиск. Solr обладает высокой масштабируемостью, обеспечивает распределенный поиск и репликацию индекса, а также поддерживает функции поиска и навигации многих крупнейших интернет-сайтов мира». Netflix был одним из первых, кто внедрил его в частном секторе, и с тех пор он стал фактическим стандартом поискового индекса в библиотечном сообществе США. Он служит индексом для Blacklight, VuFind и различных реализаций репозиториев Fedora, а также для бесчисленного множества других проектов. Solr входит в состав пакета приложений Numishare с 2007 года.
Ниже приведено краткое описание функциональности интерфейсов поиска и просмотра в Numishare: Solr принимает запросы, соответствующие синтаксису Lucene, отправленные пользователем через интерфейс, и отвечает через свой REST API, предоставляя результаты запроса в виде XML (хотя он также поддерживает вывод в формате JSON). Cocoon объединяет эту XML-модель с таблицей стилей XSLT, которая отображает результаты в виде HTML, удобного для восприятия человеком. Результаты запросов также могут быть сериализованы в несколько других форматов. Результаты могут быть представлены в виде канала Atom, который позволяет пользователям подписываться на изменения, вносимые в монеты, соответствующие их ключевой области интересов (например, монеты Адриана). Что ещё более важно, канал Atom является основным средством для сбора данных из Numishare программными средствами. Лента содержит 100 переходов на страницу со ссылками на следующую и предыдущую страницы, а также на альтернативы HTML-сериализации по умолчанию для типа монеты, такие как RDF, KML и NUDS/XML. Таким образом, скрипт может просматривать всю коллекцию и извлекать машиночитаемые метаданные NUDS. Помимо каналов Atom на основе Solr, Numishare также поддерживает сериализацию результатов поиска Solr в форматы KML и CSV. В то время как Cocoon обрабатывает вывод для общедоступного пользовательского интерфейса, приложения XForms, обрабатываемые Orbeon, который также работает в Tomcat, составляют основу закрытого административного интерфейса.
XForms — это спецификация W3C для веб-форм нового поколения, которые соответствуют философии «Модель-Представление-Контроллер». Orbeon используется в административной бэкэнд-системе для редактирования сложных XML-метаданных и взаимодействия с REST-сервисами. Приложения XForms обращаются к различным веб-API для расширения контролируемого словаря и управления операциями создания, чтения, обновления и удаления (CRUD) между базой данных eXist и индексом Solr.
Онлайн-ресурс «Монеты Римской империи» (OCRE), http://numismatics.org/ocre/, представляет собой открытый онлайн-аналог монет Римской империи, основанный на идентификаторах типов монет RIC, установленных Nomisma.org. Хотя данные, предоставляемые Nomisma и OCRE для типов монет империи, практически идентичны, пользовательский интерфейс на базе Numishare предоставляет пользователю более интерактивный опыт, чем Nomisma. Разработка OCRE началась в начале 2011 года, а официальнзапуск проекта состоялся в июле 2012 года.
|
</> |