Сохранение метаданных: стратегии внедрения - Preservation Metadata: Implementation Strategies

Метаданные PREservation: стратегии внедрения (PREMIS) является стандартом де-факто цифрового сохранения метаданных [1].

Метаданные цифрового сохранения определяют информацию, которая необходима для обеспечения долгосрочного использования цифровых объектов, чтобы они были доступны в той или иной форме в будущем. Метаданные цифрового хранения особенно важны для репозиториев, мест, где информационные объекты хранятся и управляются в течение длительного времени. Простого хранения цифровых объектов на носителе данных недостаточно, чтобы их можно было использовать. Им необходимо управлять в репозитории, чтобы они были защищены от случайного или преднамеренного повреждения и чтобы можно было создать полноценную вычислительную среду, в которой к ним можно было бы получить доступ и понять, когда они понадобятся. [2].

Информационные объекты имеют описательные метаданные, информацию об объекте, которую можно использовать для обнаружения, доступа и идентификации цифрового объекта. Однако этих метаданных недостаточно для сохранения цифровых объектов в долгосрочной перспективе. Например, цифровой объект формат файла могут стать устаревшими и непригодными для использования в будущих программных приложениях. Для этого потребуется либо преобразовать старый формат в новый (миграция), либо воспроизвести исходный опыт с помощью более новых технологий (эмуляция). Обе стратегии потребуют дополнительной информации, такой как технические метаданные об исходных файлах, информации о старом оборудовании и программном обеспечении, на котором они работали, а также информации о действиях, которые со временем преобразовали цифровой объект. Все это типы метаданных сохранения. Таким образом, метаданные сохранения поддерживают действия, призванные обеспечить долгосрочное использование цифрового ресурса.[3]

В начале 2000-х стало ясно, что для обеспечения долгосрочного сохранения постоянно растущих цифровых ресурсов необходим стандарт метаданных общего сообщества. Эксперты из ключевых институтов памяти и разработчики репозиториев объединились, чтобы определить его, в результате чего был создан Словарь данных PREMIS для метаданных сохранения, который стал де-факто стандартом, определяющим основные метаданные, необходимые для большинства репозиториев для сохранения.

Использование стандартов важно, поскольку оно поддерживает развитие сообщества передовой практики; он помогает практикам учиться на мнениях других, чтобы они случайно не упустили ключевые метаданные в своей собственной практике; он позволяет разрабатывать инструменты, упрощающие создание метаданных и управление ими; и это позволяет организациям более легко обмениваться информацией друг с другом.

История

Рабочая группа PREMIS была создана для продолжения работы более ранней инициативы, спонсируемой Интернет-центр компьютерной библиотеки OCLC и Группа исследовательских библиотек RLG: рабочая группа Preservation Metadata Framework (PMF). В 2001–2002 годах рабочая группа PMF определила типы информации, которая должна быть связана с заархивированным цифровым объектом. Их отчет, Платформа метаданных для поддержки сохранения цифровых объектовРамки), предложил список прототипов элементов метаданных. На данном этапе эти предложенные элементы не могли быть реализованы, и требовалась дополнительная работа. В 2003 году рабочую группу PREMIS попросили развить выводы группы PMF и разработать словарь с данными основных метаданных для архивных цифровых объектов, а также в качестве руководства и рекомендаций для управление: создание, управление и использование метаданных в системах хранения. PREMIS было «поручено определить набор семантических единиц, которые не зависят от реализации, практически ориентированы и могут потребоваться большинству репозиториев сохранения».[4].

Рабочая группа состояла из многонационального списка из более чем тридцати представителей культурного, государственного и частного секторов. [5]. Он стремился понять, как хранилища хранения на самом деле реализуют метаданные сохранения. Опрос был проведен среди 70 организаций, которые, как считается, активно или заинтересованы в сохранении цифровых данных. В декабре 2004 года рабочая группа PREMIS опубликовала свой отчет, Создание хранилищ цифровых материалов: текущая практика и новые тенденции в сообществе культурного наследия.

Ранее Рамки и словарь данных PREMIS, основанный на Открытая архивная информационная система (OAIS) эталонная модель. Информационная модель OAIS обеспечивает концептуальную основу в виде таксономии информационных объектов и пакетов для архивных объектов, а также структуры связанных с ними метаданных. В Рамкиза счет глубоко детализированного сопоставления метаданных сохранения с этой концептуальной структурой, может рассматриваться как разработка OAIS. Словарь данных PREMIS, с другой стороны, можно рассматривать как перевод Рамки в набор реализуемых семантических единиц. Словарь данных и OAIS иногда различаются по использованию терминологии, и они указаны в Глоссарии. Различия обычно отражают тот факт, что семантические единицы PREMIS требуют большей специфичности, чем определения OAIS, чего следует ожидать при переходе от концептуальная основа к реализации.[6]

В мае 2005 года PREMIS выпустила Словарь данных по сохранению метаданных: окончательный отчет рабочей группы PREMIS. Этот 237-страничный отчет включает: Словарь данных PREMIS 1.0: исчерпывающий практический ресурс для внедрения метаданных сохранения в системы цифрового архивирования; сопроводительный отчет (с указанием контекста, модели данных, предположений); специальные темы, глоссарий, примеры использования; набор из Схема XML который был разработан для поддержки использования словаря данных.[7]

Текущая версия PREMIS 3.0 была выпущена в июне 2015 года.[8]

Сущности

Модель данных PREMIS состоит из четырех взаимосвязанных объектов:

  1. Объект (разделен на три подтипа)
  2. Мероприятие
  3. Агент
  4. Права

С каждой семантической единицей в словаре данных, отнесенной к одной из этих областей.[9]

An Интеллектуальный объект entity - это тип объекта. Это набор контента, который составляет дискретную, связную интеллектуальную единицу, такую ​​как книга или база данных. Это могут быть составные объекты, содержащие другие интеллектуальные объекты, и могут иметь несколько цифровых представлений.[10] На этом уровне обычно применяются описательные метаданные; Учитывая распространение конкурирующих схем, рабочая группа не определяла никаких дополнительных описательных семантических единиц[11] и разрешена возможность взаимодействия через «контейнеры расширения» (контейнеры содержат связанную группу семантических единиц), которые могут использоваться для внешних схем.[10]

Большинство семантических единиц, перечисленных в словаре данных, относятся к Объект и Мероприятие сущностей, причем первые делятся на три подтипа файл, битовый поток, и представление. А файл - это уровень, на котором большинство конечных пользователей привыкло работать, «именованная и упорядоченная последовательность байтов, известная операционной системе». Он включает в себя множество атрибутов файловой системы, что делает ее понятной для операционной системы, включая битовые потоки, которые представляют собой «непрерывные или несмежные данные в файле, который имеет значимые общие свойства для целей сохранения». А представление в некотором смысле является «высшим уровнем» этой модели, поскольку он может включать в себя несколько файлов для правильного отображения структуры и содержимого интеллектуальной сущности. Не все репозитории будут заботиться о сохранении представлений,[12] в зависимости от их целей и потребности кураторского органа в сохранении того, что можно было бы считать цифровой «внутренней ценностью» организации. Кроме того, интеллектуальные объекты могут иметь несколько представлений в репозитории. События взаимодействуют с объектами, поскольку они включают действия, которые влияют на них или агенты («человек, организация или программное обеспечение ... связанные с Событиями ... или с Правами, прикрепленными к объекту»), связанные с объектом.[10]

Наконец, включение права субъекты реагируют на возросшую осведомленность и озабоченность законными требованиями авторского права и лицензирования. Он также включает информацию о конкретных разрешенных действиях; например, семантическая единица 4.1.6.1, действие, «действие, которое разрешено выполнять хранилищу сохранения», включает такие предлагаемые значения, как репликация, миграция и удаление.[13]

Словарь с данными

Записи словаря данных PREMIS включают двенадцать полей атрибутов, не все из которых применяются к каждой семантической единице (аналогично «элементу» в других схемах метаданных). Помимо названия и определения единицы, в полях записываются такие вещи, как обоснование включения единицы, примечания по использованию и примеры того, как значение может быть заполнено. Четыре атрибута - категория объекта, применимость, повторяемость и обязательство - связаны, поскольку последние три определены для каждого уровня сущности объекта: файл, поток битов и представление. Словарь иерархический; одни семантические единицы содержатся внутри других. Например, 1.3 preservationLevel включает четыре семантических компонента, таких как 1.3.1 preservationLevelValue и 1.3.2 preservationLevelRole.[14]

Смотрите также

Рекомендации

  1. ^ Словарь данных PREMIS (полный документ), версия 3.0 https://www.loc.gov/standards/premis/v3/premis-3-0-final.pdf
  2. ^ Дапперт, Анджела; Гюнтер, Ребекка Сквайр; Пейрар, Себастьен (2016). Метаданные цифрового сохранения для практиков. DOI: 10.1007 / 978-3-319-43763-7. ISBN  978-3-319-43761-3.
  3. ^ Библиотека Конгресса. «PREMIS для цифрового хранения». http://www.digitalpreservation.gov/series/challenge/premis.html, 2010.
  4. ^ Каплан П. и Гюнтер Р. (2005). Практическая консервация: Опыт PREMIS. Библиотечные тенденции, 54, (1), 111-124.
  5. ^ «Деятельность по сохранению метаданных PREMIS». Библиотека Конгресса США. Получено 10 октября, 2013.
  6. ^ Библиотека Конгресса. "Словарь данных PREMIS". https://www.loc.gov/standards/premis/v2/premis-2-0.pdf, стр.3
  7. ^ PREMIS Preservation Metadata Maintenance Activity (Библиотека Конгресса) https://www.loc.gov/standards/premis/
  8. ^ Редакционный комитет PREMIS. (2015). Словарь данных PREMIS для сохранения метаданных, версия 3.0. URL-адрес, доступ к которому осуществлен 11 ноября 2015 г.
  9. ^ Редакционный комитет PREMIS. (2008). Словарь данных PREMIS для сохранения метаданных, версия 2.0., 5-6. URL просмотрен 28 апреля 2008 г.
  10. ^ а б c Редакционный комитет PREMIS. (2008). Словарь данных PREMIS для сохранения метаданных, версия 2.0., 6. URL, по состоянию на 28 апреля 2008 г.
  11. ^ Редакционный комитет PREMIS. (2008). Словарь данных PREMIS для сохранения метаданных, версия 2.0., 23-4. URL просмотрен 28 апреля 2008 г.
  12. ^ Редакционный комитет PREMIS. (2008). Словарь данных PREMIS для сохранения метаданных, версия 2.0., 7-8. URL просмотрен 28 апреля 2008 г.
  13. ^ Редакционный комитет PREMIS. (2008). Словарь данных PREMIS для сохранения метаданных, версия 2.0., 6, 181. URL-адрес доступен 28 апреля 2008 г.
  14. ^ Редакционный комитет PREMIS. (2008). Словарь данных PREMIS для сохранения метаданных, версия 2.0., 22-194. URL просмотрен 28 апреля 2008 г.

внешняя ссылка