EIDR - EIDR

Ассоциация регистрации идентификаторов развлечений
EIDR Logo 1.png
Формирование2010
Тип501 (c) (6) некоммерческая членская корпорация
Штаб-квартираРедвуд-Сити, Калифорния
Исполнительный директор
Кип Уэлч
Интернет сайтwww.eidr.org

В Реестр идентификаторов развлечений, или же EIDR, является глобальным уникальный идентификатор система для широкого спектра аудиовизуальных объектов, включая кинофильмы, телевидение, и радио программы. Система идентификации решает идентификатор к метаданные запись, связанная с заголовками верхнего уровня, правками, DVD, кодировки, клипы и мэшапы. EIDR также предоставляет идентификаторы для поставщиков видеоуслуг, таких как вещательные и кабельные сети.

По состоянию на июнь 2020 года EIDR содержит более 2 миллионов записей, в том числе почти 400 тысяч фильмов и почти один миллион эпизодов из более чем 40 000 телесериалов.

EIDR - это реализация идентификатор цифрового объекта (DOI).

История

Системы идентификации медиаактивов существуют десятилетиями. Общей мотивацией для их создания является обеспечение возможности управления медиаресурсами посредством присвоения уникального идентификатора набору метаданных, представляющих основные характеристики каждого актива. Со временем такие системы имеют тенденцию к распространению, и каждая из них решает определенный набор проблем. В результате существуют значительные различия между системами с точки зрения того, какие активы классифицируются, какие метаданные связаны с каждым активом, и по самому определению актива. Чтобы назвать несколько примеров, следует ли "режиссерская версия "фильма отличаться от оригинального театрального релиза? Как следует учитывать региональные различия (например, перевод названия или диалога на иностранные языки)? Дальнейшие сложности включают процедуры (и необходимые учетные данные) для добавления новых ресурсов, редактирования существующих ресурсов , и создание производных активов.

EIDR был создан для решения этих, а также других проблем, возникающих в видеоресурсах. рабочие процессы, как в бизнес для бизнеса контекст и внутренняя пост-продакшн деятельность производителей контента. EIDR имеет следующие характеристики:

  • Центральный реестр доступен для всех участников
  • Возможность легко регистрировать новые активы
  • Неизменяемый идентификатор актива (в частности, в отношении изменений в праве собственности на актив или местонахождении метаданных или самого актива)
  • Обнаружение / предотвращение дублирования одного и того же создаваемого актива
  • Возможность создания набора видеоресурсов на основе абстрактного произведения (например, оригинальный театральный релиз, режиссерская версия, языковые варианты)
  • Возможность группировать видеоресурсы по более общим отношениям (например, эпизоды сезона сериала)
  • Основной набор метаданных для различения активов, даже если они тесно связаны
  • Масштабируемый, неизменный, постоянный

EIDR предназначен для дополнения, а не замены существующих систем идентификации активов. Напротив, ключевой особенностью является разрешение записи EIDR включать ссылки на идентификатор этого актива в других системах. Эта функция особенно полезна для кино- и телеархивов, позволяя им легко сопоставлять свои фонды с другими источниками работ и метаданными о них. По своей конструкции EIDR не копирует функции других систем идентификации активов, например коммерческие системы, которые стремятся повысить ценность за счет расширенных метаданных (например, сводок сюжетов, деталей производства). Это также не является целью отслеживания информации о владении и правах, которая, однако, может быть реализована в виде приложений, использующих идентификатор EIDR.

Модель контента

EIDR основан на наборе записей (которые далее подразделяются на поля), которые хранятся в центральном реестре. На эти записи ссылаются извне с помощью DOI, которые присваиваются при создании записи, и каждый идентификатор после этого остается неизменным. Система разрешения идентификаторов, лежащая в основе DOI, - это Система ручки Таким образом, каждый собственный идентификатор содержимого EIDR представляет собой дескриптор, отформатированный с повышенной специфичностью для обработки стандартов DOI и EIDR.

Формат Content ID

В каноническая форма идентификатора содержимого EIDR является экземпляром дескриптора и имеет формат:

10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C

куда

  • 10.5240 - префикс DOI для актива EIDR. «10» указывает, что дескриптор является DOI; другие префиксы присваиваются другим типам активов (например, академические публикации ). Цифры между "." и "/" образуют субпрефикс, который указывает, какое регистрационное агентство в рамках Международного фонда DOI (IDF) имеет права управлять этими дескрипторами. «5240» присвоен ассоциации EIDR.
  • XXXX-XXXX-XXXX-XXXX-XXXX-C суффикс DOI. Каждый «X» обозначает шестнадцатеричная цифра (A-F), а «C» - это ISO 7064 Мод 37,36[1] контрольная цифра.

Существует также 96-битная компактная двоичная форма, предназначенная для встраивания в небольшие полезные данные, такие как водяные знаки. Эта форма генерируется из канонического формата следующим образом:

  • 16-битный субпрефикс: генерируется путем интерпретации субпрефикса как двоичного значения, например B'0001010001111000 '
  • 80-битный суффикс: часть суффикса, отличная от контрольной суммы, представленная как 10 байтов.

В Единое имя ресурса форма для EIDR ID указана в RFC  7302.

Для использования в Интернете идентификатор содержимого EIDR может быть представлен как URI в одной из следующих форм:

  • https://doi.org/10.5240/XXXX-XXXX-XXXX-XXXX-XXXX-C: это идентификатор EIDR, представленный как ссылка прокси-сервера DOI (он будет перенаправлен из DOI в реестр EIDR)
  • информация: doi: 10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C [устарело]: это идентификатор EIDR, представленный как RFC 4452 совместимый "информационный" URI (помня, что все идентификаторы EIDR также являются идентификаторами DOI, но не наоборот).

Типы записей

Есть четыре типа записей содержимого, каждый из которых связан с зарезервированным префиксом:

  • Content ID (10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C): связан с развлекательным активом, таким как фильм или сериал. Записи контента имеют иерархическую структуру, что позволяет выражать отношения, такие как Серии, дочерними элементами которых будут Сезоны, а потомками - отдельные эпизоды. Поддерживаются многие другие отношения, как описано ниже. Записи содержимого составляют основную часть данных в реестре EIDR.
  • Идентификатор партии (10.5237 / XXXX-XXXX): идентифицирует такие лица, как зарегистрированные лица, производители контента и распространители.
  • ID видеосервиса (10.5239 / XXXX-XXXX): идентифицирует видеоуслугу, в просторечии известную как «канал» или «сеть»: (обычно) линейная последовательность контента, запланированная для трансляции в определенное время (например, идентификатор услуги для Cartoon Network 10.5239 / 8BE5-E3F6). Видеоуслуги являются иерархическими: например, родитель может иметь несколько детей, чтобы учитывать региональные или языковые различия).
  • ID пользователя (10.5238 / [0-9a-zA-Z _. # ()] {2-32}): идентифицирует пользователя, используя строку из 2–32 буквенно-цифровых и выбранных специальных символов (показано здесь с помощью Perl синтаксис). Пользователь - это прежде всего административное понятие, подчиненное Сторонам (от которых они наследуют права доступа). В отличие от других DOI EIDR, User ID можно использовать только в EIDR (например, API программирования).

Подпрефиксы 5237, 5238, 5239 и 5240 присвоены ассоциации EIDR.

Записи содержимого

Записи содержимого - это объекты, классифицированные по их типам и отношениям. У каждого есть три разных (ортогональных) типа:

  • Тип объекта: всего их 10. Первый - это базовый тип, который имеет минимальное количество полей, необходимых для описания записи содержимого. Остальные 9 являются производными от основного типа и содержат дополнительные поля для описания более сложных объектов.
  • Структурный Тип: они различают представления произведения и перечислены в порядке возрастания специфичности:
    • Абстракция: Используется для объектов, не имеющих реальности, таких как контейнер серии или самая основная концепция оригинальной работы. Это соответствует Международный стандартный музыкальный рабочий код (ISWC) для музыкальных произведений Международный стандартный текстовый код (МНТЦ) для текстовых произведений или Международный стандартный аудиовизуальный номер (ISAN) для аудиовизуальных произведений.
    • Спектакль: Используется для элементов, которые являются конкретными версиями произведения, такими как оригинальная театральная версия или режиссерская версия фильма, или версия телешоу, подвергшаяся местной цензуре. Это примерно соответствует Международный стандартный код записи (ISRC) для музыкальных произведений и для некоторых видов использования версии ISAN (V-ISAN) для аудиовизуальных произведений.
    • Цифровой: Конкретное цифровое представление произведения, например MPEG-2 кодирование фильма. Это соответствует некоторым видам использования V-ISAN.
  • Тип референта: тип ресурса контента, не зависящий от конкретного проявления (например, фильм, показанный по телевизору, остается фильмом):
    • Серии: Абстракция, содержащая упорядоченные или неупорядоченные отдельные элементы.
    • Время года: Второй уровень группировки под серией, обычно охватывающий временной интервал.
    • телевидение: Контент, впервые появившийся в эфир.
    • Фильм: Длинное содержание, впервые появившееся в кинотеатре или театре.
    • короткий: Свободно определяется, чтобы охватить произведение продолжительностью 40 минут или меньше, например музыкальные видео театральный кинохроника, или театральные, или мультфильмы ДТВ.
    • Интернет: Контент, впервые появившийся в сети. Это отличается от контента из других источников, который был доступен в Интернете.
    • Интерактивный материал: Контент, который не является строго аудиовизуальным. Он охватывает меню DVD, интерактивные ТВ-наложения, индивидуальные проигрыватели и т. Д.
    • Компиляция: Контент, состоящий из множества других ресурсов, которые невозможно описать более точно, например бокс-сет франшизы фильма.
    • Дополнительный: Этот тип предназначен для вторичного контента, основной целью которого является поддержка, расширение или продвижение другого контента. Примеры включают в себя трейлеры, отрывки и рекламные документальные фильмы ("изготовление из пьес").

Основные метаданные

Следующие поля (взятые из большего набора) содержат данные базового объекта записи содержимого:

  • Структурный Тип: например Абстракция
  • Режим: например AudioVisual (для фильма или телепрограммы); «Аудио» для радиопрограммы; «Визуал» для тихой работы.
  • Тип референта: например Фильм
  • Заголовок: основное название. Заголовки и альтернативные титулы также различаются по:
    • Lang: язык названия, выраженный как ISO 639-1 код
    • Учебный класс: релиз или региональный
  • Альтернативный заголовок 1..N: одно или несколько альтернативных названий (часто региональные или языковые варианты)
  • Исходный язык: язык оригинальной версии, выраженный в виде кода ISO 639-1.
  • Связанная организация 1..N: Идентификаторы партии продюсера, студии и т. Д.
  • Дата выхода: дата первоначального выпуска названия
  • Страна происхождения: ISO 3166-1 альфа 2 код с расширениями для несуществующих стран
  • Приблизительная длина: выражается как XML-схема xs: duration[2] тип данных
  • Альтернативный ID 1..N: один или несколько эквивалентных идентификаторов, выраженных в другой системе идентификаторов активов (см. обсуждение ниже).
  • Кредиты: предоставляются только скелетные титры, обычно ограниченные режиссером и до четырех основных актеров. Как уже отмечалось, цель EIDR - не конкурировать с проприетарными системами с обширными метаданными (например, сводками графиков). Основная цель - помочь устранить неоднозначность в названии и помочь в проверке и устранении дубликатов.
  • Регистрант: сторона, создавшая эту запись содержания (например, "10.5237 / superparty")
  • Дата создания: дата создания этой записи содержимого
  • Положение дел: обычно "действителен" (есть особые случаи для удаленных записей)
  • Дата последнего изменения: последний раз эта запись содержания была изменена

Удаленные записи содержимого

Идентификатор EIDR должен быть всегда разрешимым, поэтому при нормальных обстоятельствах соответствующая запись содержимого будет постоянной. Доступны два механизма для работы с ошибками или другими необычными обстоятельствами. Предпочтительным является использование псевдонимов, при котором идентификатор EIDR прозрачно перенаправляется на другую запись содержимого. Псевдонимы обычно используются для двукратной регистрации актива.

Другой механизм - использование записей-надгробий. Это используется, когда запись содержимого повреждена или случайно был зарегистрирован недействительный ресурс. В этом случае идентификатор будет привязан к специальной записи надгробия. Приложение может распознать надгробие, поскольку в его поле EIDR ID будет задано отличительное значение "10.5240 / 0000-0000-0000-0000-0000-X". Обратите внимание, что" X "означает 24-я буква латинского алфавита (ASCII 0x58 или Unicode U + 0058).

Альтернативный идентификатор

Наличие богатого набора альтернативных идентификаторов для контента - одна из основных целей EIDR. Это позволяет использовать идентификаторы EIDR ID везде в рабочих процессах контента; если требуется альтернативный идентификатор, его можно найти в метаданных для идентификатора EIDR. EIDR поддерживает включение как проприетарных, так и других стандартных (например, ISAN) ссылок на идентификаторы. Дополнительные альтернативные идентификаторы могут быть добавлены при необходимости (например, сторонами, желающими поддерживать новые рабочие процессы). Ниже приведен пример альтернативных идентификаторов для актива EIDR. 10.5240 / EA73-79D7-1B2B-B378-3A73-M (фильм Бегущий по лезвию ). Если альтернативный идентификатор можно разрешить алгоритмически, например, поместив его соответствующим образом в URL-адрес шаблона, EIDR делает эту ссылку доступной.

Альтернативные идентификаторы для 10.5240 / EA73-79D7-1B2B-B378-3A73-M
Альтернативный идентификатор0000-0000-14A9-0000-K-0000-0000-E
Тип: ЯВЛЯЕТСЯ
Альтернативный ID # 289
Тип: IVA
Альтернативный ID # 3B000SW4DLM
Тип: Проприетарный Домен: amazon.com
Альтернативный ID # 412886
Тип: Проприетарный Домен: flixster.com
Альтернативный ID # 515042
Тип: Проприетарный Домен: thecinemasource.com
Альтернативный ID # 6tt0083658
Тип: IMDB Связь: IsSameAs
Альтернативный ID # 7E0087486000
Тип: Проприетарный Домен: spe.sony.com/MPM
Альтернативный ID # 83929
Тип: Проприетарный Домен: spe.sony.com/ProductID
Альтернативный ID # 92002029
Тип: Проприетарный Домен: warnerbros.com/MPM
Альтернативный ID # 10389785
Тип: Проприетарный Домен veronicamagazine.nl
Альтернативный ID # 11B001EC2J1G
Тип: Проприетарный Домен: amazon.com
Альтернативный ID # 12150002645
Тип: Проприетарный Домен: bfi.org.uk

Альтернативные идентификаторы делятся на непатентованные и проприетарные. Первые различают предопределенные типы (например, выпущенные ISAN, IMDb, и IVA), тогда как все проприетарные идентификаторы относятся к типу "Собственные" и дополнительно различаются по соответствующему домену DNS. По состоянию на июль 2017 года через EIDR напрямую доступно более 2 миллионов альтернативных идентификаторов.

Отношения между объектами

Объекты содержимого могут быть связаны друг с другом в соответствии со следующей таблицей. Эти отношения выражаются в виде дополнительных полей в записи содержимого и, таким образом, относятся к этому объекту. Обратите внимание, что субъектный объект является дочерним, а цель - родительским (например, субъектом является <тип отношения> родительского). Дополнительные ограничения указаны в таблице.

Отношения по наследству: Объект, для которого существует связь, может наследовать основные поля метаданных от объекта, к которому относится связь. Для объекта может существовать только одно отношение наследования. Эти отношения создают древовидную структуру, основанную на идентификаторе EIDR для абстракции.
isSeasonOfГруппа серий сериалов, выпущенных за непрерывный промежуток времени (например, год трансляции), например 10.5240 / AB95-8734-5D98-A282-2DF0-C («Сезон 9») - сезон 10.5240 / C272-DA64-E2B5-0A78-2AC3-Z ("Секретные материалы")
isEpisodeOfнапример 10.5240 / E008-224D-0397-0560-6300-8 ("Солнечные дни") - эпизод 10.5240 / AB95-8734-5D98-A282-2DF0-C («Сезон 9»).
isEditOfЭкземпляр заголовка с уникальными характеристиками, которые отличают его от любой другой версии. Например, 10.5240 / 7290-C8AD-12BA-4F93-3B07-7 («Бегущий по лезвию: Режиссерская версия») является редакцией 10.5240 / EA73-79D7-1B2B-B378-3A73-M.
isManifestationOfПроявление - это более конкретный экземпляр произведения, которое можно продавать, передавать, передавать или воспроизводить. Родителем проявления должно быть редактирование. Например, 10.5240 / 9CE1-DE39-5F3E-073D-4307-7 это ультрафиолетовый стандартный CFF (стандартное разрешение, английское аудио и субтитры) для "Бегущего по лезвию: Режиссерская версия". Это проявление абстрактной работы 10.5240 / EA73-79D7-1B2B-B378-3A73-M.
isClipOfОдин (и только один) непрерывный фрагмент актива.
Отношения зависимости: Объекты, к которым относится отношение, имеют сильное отношение к основной природе объекта, на котором существует связь. Это означает, что объекты, указанные в связи, должны приниматься во внимание при проверке дубликатов при создании или изменении объекта. Эти отношения создают ориентированные графы внутри и между деревьями.
isCompositeOfОдно произведение, состоящее из частей нескольких других записей.
isCompilationOfСобрание нескольких целых произведений, которое не поддается более точному описанию.
Легкие отношения: Наследования нет; объекты, к которым они относятся, не влияют на основную природу объекта, на котором существует связь. Эти отношения используются в основном при перемещении по дереву объектов и соединении деревьев объектов друг с другом, создавая ориентированный граф по элементам этих деревьев.
isPackagingOfДля создания коллекции активов, которые выпускаются вместе, например 10.5240 / F219-975E-5990-4570-BA75-2 («Ханна Монтана и Майли ...») - это упаковка 10.5240 / 9ABE-2BF1-ACE7-EBA2-8E57-N.
isPromotionOfРекламные объекты, например, трейлер.
isSupplementToВспомогательный материал, который можно найти на DVD, например, отрывок из фильма или закулисный фильм.
isAlternateContentForКонтент, синхронизированный с основным активом, например звук или альтернативный ракурс камеры.

Использование в стандартах и ​​приложениях

EIDR включен во многие стандарты. Некоторые из наиболее значимых перечислены здесь:

  • SMPTE / AMWA: Рекомендуемая практика SMPTE RP 2079[3] стандартизирует использование EIDR в MXF медиа-контейнеры, в основе рабочих процессов профессионального контента, включая AMWA AS-03[4] и AS-11[5] технические характеристики. Рекомендуемая практика SMTPE 2021-5[6] позволяет переносить идентификатор EIDR везде, где BXF используется для обмена данными между системами вещания.
  • Европейский вещательный союз (EBU): EBUCore[7] представляет собой общий базовый набор описательных и технических метаданных, которые описывают медиаресурсы (аудио, видео, неподвижные изображения, субтитры и т. д.). Сотрудники EBU и EIDR создали сопоставление EBUCore для базовых записей с корневыми объектами EIDR: .. EIDR и EBU совместно работают в рабочей группе SMPTE Core над определением описательных метаданных для спецификаций и рабочих процессов на основе SMPTE. EIDR - один из стандартов, поддерживаемых EBU Core.
  • DVB: EIDR упоминается в проекте спецификаций DVB для сопутствующих экранов[8] (тм-см-css-0017r14).
  • MPEG: EIDR был предложен в качестве идентификатора контента в формате приложения для сохранения мультимедиа.[9] который определяется для архивного использования.
  • CableLabs (США): EIDR является частью метаданных CableLabs[10] стандарт распространения видео по запросу. EIDR - это один из идентификаторов программы, который может присутствовать в SCTE-35 2013.[11] дескриптор сегментации, стандарт, используемый в распределении IP по кабелю. EIDR также используется в продуктах с динамической вставкой рекламы (DAI) с использованием SCTE 130.[12] стандартная архитектура.
  • EIDR и альтернативные идентификаторы: Для обеспечения взаимодействия EIDR с широким спектром систем, EIDR включает поле «AlternateID» для перекрестных ссылок на существующие системы идентификаторов. Альтернативные идентификаторы могут включать, например, CRID (RFC 4078 ), ISAN, ISRC, UPC, или же URI, а также коммерческие системы идентификации, такие как Ad-ID, Baseline, IMDb и т. Д. В настоящее время около половины записей EIDR содержат идентификатор, по крайней мере, от одной другой системы.
  • Сопоставление других стандартных метаданных и идентификаторов с EIDR: Другие системы метаданных и идентификаторов могут быть напрямую отображены в EIDR:
    • EN 15907 и EN 15744: Эти стандарты находятся под эгидой Европейский комитет по стандартизации CEN / TC 372 и filmstandards.org.[13] Для корневых объектов EN 15907 и EN 15744 доступны передовые методы и сопоставления. EIDR также работает с архивами фильмов, чтобы расширить совместимость с этими стандартами до более детального уровня детализации, включая проект с Британским институтом кино (BFI) по регистрации своих записей на основе EN 15907 в EIDR.
    • Международный стандартный аудиовизуальный номер (ISAN): ISAN широко используется в системах управления правами и сбора информации. Доступно полное сопоставление регистрации ISAN с регистрацией EIDR. UK Audio-Visual Registration Agency, совместное предприятие EIDR и ISAN-UK, предоставляет услуги совместной регистрации для обоих идентификаторов. Предшественники этой службы использовались для получения идентификаторов EIDR и ISAN для широковещательного контента от ITV (коммерческая телевизионная сеть в Соединенном Королевстве).

Идентификаторы EIDR находят свое применение во все большем числе коммерческих приложений. Ниже приведены некоторые преимущества использования EIDR:

  • Интеграция Warner Brothers-Xbox: EIDR использовался для улучшения реализации Электронные продажи (EST) система доставки фильмов Warner Theatrical в Microsoft Xbox Live клиенты. Для работы электронной витрины требуется несколько групп в Warner Brothers, которые координируют свои действия с командой Xbox. Исходящая сторона цепочки распространения включала публикацию «Avails» (названия, доступные для продажи) и отслеживание выполнения заказов; входящая сторона включала размещение заказов. Другие функции, такие как отчеты, охватывают обе стороны цепочки распределения. Исходная система требовала ручного вмешательства и контроля, особенно на границах между организациями. Примером необходимости ручной обработки может быть проверка того, что была доставлена ​​правильная версия актива (которая может варьироваться в зависимости от субтитров или контента). В новой системе Warner Brothers создали новый идентификатор EIDR для каждого варианта содержания, который использовался на всех последующих этапах обработки. Это устранило двусмысленность и упростило автоматизацию входящих и исходящих этапов. Еще одним преимуществом была возможность создавать отчеты на лету.
  • Интеграция Swisscom EPG: Swisscom предоставляет услугу платного телевидения в Швейцарии. В 2014 году завершено развертывание Электронное руководство по программированию (EPG) для своих клиентов на основе EIDR.[14] Это сквозная система, в которой идентификаторы EIDR используются для представления активов, отображаемых в EPG. Ключевым элементом системы было то, что идентификаторы EIDR также использовались в метаданных руководства, предоставленных Swisscom через media-press.tv. Это включало настройку системы назначения идентификаторов EIDR для активов, которых еще нет в реестре. Ключевым преимуществом использования EIDR является отсутствие необходимости преобразования между разными системами идентификаторов.

Операции и администрирование

EIDR находится в ведении некоммерческой ассоциации EIDR, основанной в октябре 2010 г. MovieLabs, CableLabs, Comcast и Рови. С тех пор количество участников неуклонно росло: по состоянию на конец 2014 года в нем 79 участников, разделенных между уровнями промоутеров и участников отрасли. Самая быстрорастущая категория - это неамериканские компании, на которые сейчас приходится около 20% членства. Ассоциация EIDR управляет двумя реестрами EIDR: производственным и песочницей. Первый является официальным сайтом, а второй зарезервирован для тестирования и разработки. Обе системы общедоступны в Интернете, но не гарантируется, что содержимое песочницы будет правильным, полным или даже относится к существующим активам. Только члены ассоциации EIDR могут изменять реестр.

Постановка на учет

Регистрация новых активов может производиться индивидуально или массово (до 100 000 активов за раз). В любом случае рабочий процесс состоит из комбинации автоматизированных (для выполнения четко определенных, но утомительных задач) и ручных (где требуется человеческое суждение) процессов. Он также является итеративным, поскольку первоначальный процесс сопоставления может выявить множество пробелов и ошибок, которые необходимо устранить.

Регистрация новых активов - сложный процесс, требующий некоторой подготовки, особенно в случае массовой подачи. Автоматизированные процессы проверят синтаксис, обеспечат предоставление основных метаданных и соблюдение любых зависимостей (например, записей сериалов, созданных до составных эпизодов). Ручные шаги включают в себя проверку того, что с активом связаны правильные стороны. Один из наиболее важных шагов - убедиться, что новый актив еще не существует в реестре: это рассматривается в следующем разделе.

Чтобы зарегистрировать новый актив, пользователь должен быть связан с стороной, которой оператором EIDR была предоставлена ​​роль «Регистрант». Регистрант может быть основным агентом, таким как студия или студия кодирования, но это также может быть Сторона, осуществляющая массовую регистрацию элементов бэк-каталога, или Сторона, действующая от имени кого-то еще. Также требуется, чтобы регистрант был членом EIDR. В общем, владение контентом, авторитет метаданных и возможность регистрации - это отдельные и не связанные между собой концепции.

Дедупликация

Это относится к пометке активов, представленных в реестр, как относящихся к одной из следующих трех категорий:

  • Актив-кандидат уникален (по сравнению с существующими активами реестра).
  • Актив-кандидат - это копия существующей записи.
  • Актив-кандидат имеет высокую вероятность дублирования.

Эта оценка основана на применении (большого) набора правил к активу-кандидату, что приводит к числовой оценке. Группирование происходит в результате сравнения оценки с двумя пороговыми значениями:

  • Низкий порог: любой актив с рейтингом ниже этого значения не считается дубликатом. Это единственный случай, когда предложенное добавление или изменение записи будет успешным.
  • Высокий порог: любой актив с рейтингом выше этого значения считается (почти наверняка) дубликатом. Предлагаемое добавление / изменение записи не будет продолжено, и будет возвращен статус ошибки. Регистранты обычно используют уже существующий идентификатор для элемента, который они пытались зарегистрировать, и могут добавлять недостающую информацию и альтернативные идентификаторы к существующей записи.

Считается, что активы, попадающие между нижним и верхним порогом, имеют высокую вероятность дублирования: предлагаемое добавление / изменение записи не будет продолжено до тех пор, пока персонал EIDR не проверит вручную.

Архитектура

Компоненты системы EIDR показаны ниже.

Архитектура реестра EIDR

Основные функциональные блоки:

  • Основной реестр: Этот модуль представляет собой настройку и конфигурацию репозитория цифровых объектов CNRI. Он выполняет различные функции, включая регистрацию, создание уникальных идентификаторов, индексацию, управление хранилищем объектов и контроль доступа.
  • Репозиторий: Это сохраняет и обеспечивает доступ к зарегистрированным объектам; для EIDR эти объекты представляют собой коллекции метаданных, а не сами медиаресурсы. Метаданные включают стандартную информацию об объекте, отношения и настройки контроля доступа.
  • ОТДЫХ APЯ ОТДЫХ интерфейс, обеспечивающий доступ ко всему набору неадминистративных функций реестра. Службы могут выполнять индивидуальные или групповые вызовы, которые могут отправляться синхронно или асинхронно. Общий синтаксис запроса позволяет извлекать (а в некоторых случаях изменять) записи реестра, удовлетворяющие набору критериев, заданных вызывающей стороной.
    • EIDR SDK: это предоставляется разработчикам, чтобы облегчить создание сторонних приложений (обычно для поддержки B2B или внутреннего рабочего процесса). Он состоит из Java SDK, .NET SDK и примеров программ, созданных на основе этих двух SDK. Рекомендуется использовать SDK вместо прямых вызовов REST API.
    • Инструменты командной строки: это простые приложения Java и .NET, построенные на SDK, каждое из которых предоставляет одну функцию, такую ​​как разрешение, запрос, сопоставление и регистрация.
    • Веб-интерфейс: веб-интерфейс пользователя, в первую очередь для поиска, просмотра и просмотра иерархии объектов. Он также поддерживает простую регистрацию.
  • Прокси-сервер DOI: Используя префикс дескриптора, это перенаправляет запросы разрешения EIDR DOI в реестр EIDR.
  • Система ручки: Предоставляет услуги распределенного поиска и разрешения

Связь с DOI и системой обработки

EIDR ID - это специализированный пример идентификатора цифрового объекта (DOI), который, в свою очередь, построен на основе системы обработки, разработанной Корпорация национальных исследовательских инициатив (CNRI). Аспекты нижних уровней, специфичные для EIDR, более подробно описаны ниже.

Идентификатор цифрового объекта (аспекты EIDR)

Идентификатор цифрового объекта, стандартизированный как ISO 26324,[15] стремится однозначно идентифицировать широкий спектр цифровых артефактов, включая книги, записи, данные исследований и другой цифровой контент. Цель состоит не только в том, чтобы идентификаторы были уникальными, но и в том, чтобы они были постоянными и неизменными. В отличие от URL-адресов идентификаторы DOI остаются неизменными, даже если объекты перемещаются в другое место или становятся принадлежащими другой организации. Вот некоторые характеристики DOI:

  • Международный фонд DOI (IDF) применяет ранее согласованные правила для входящих в состав регистрационных агентств (например, EIDR) для обеспечения непрерывности. В частности, если RA прекращает работу, имена, которые он размещает, будут переданы другому RA.
  • IDF определяет правила, которым должны соответствовать все имена DOI (какие типы объектов могут быть названы конкретным RA)
  • Система DOI предоставляет модель данных, основанную на словаре данных, чтобы обеспечить структурированные средства выражения метаданных (и межобъектных отношений).
  • Система DOI имеет собственный распределенный набор дескрипторов и прокси-серверов с высокой степенью резервирования.
  • Все префиксы DOI имеют форму «10.NNNN», где 10 - это индикатор каталога, а «NNNN» - это код регистранта в диапазоне 1-65535 (например, использование записей содержимого EIDR - 10,5240).

Модель данных DOI предоставляет средства для связывания метаданных с каждым объектом, а также политики, регулирующие их использование. Говоря словами DOI Handbook, метаданные могут включать «имена, идентификаторы, описания, типы, классификации, местоположения, время, измерения, взаимосвязи и любую другую информацию, относящуюся к [объекту]». Метаданные передаются между следующими объектами:

  • Провайдер ресурсов: обычно владелец медиаресурса, который отвечает за ввод метаданных в систему.
  • Регистрационное агентство: объекты, которые служат хранилищем активов (и связанных метаданных). Как уже отмечалось, DOI поддерживает федерацию независимых RA, каждый из которых отвечает за набор активов. EIDR - одно из таких RA. Другие включают CrossRef для научных статей, DataCite для данных исследований и OPOCE для официальных публикаций Европейского Союза.
  • Пользователь службы: объекты, выполняющие запросы к RA, получают метаданные, связанные с активами. Структура разрешения DOI отвечает за отправку запроса соответствующему RA (пользователю службы не обязательно знать об этом).

Чтобы способствовать взаимодействию между RA, в DOI есть концепция ядра метаданных. Это основной набор метаданных, которые должны иметь все объекты, хранящиеся в структуре DOI. Полный набор можно найти в справочнике DOI. Совместимость - большая тема, выходящая за рамки EIDR, но следующее подмножество особенно актуально для активов EIDR:

  • референт: объект, поддерживаемый в системе DOI.
  • referentName: имя референта (например, название фильма)
  • primaryReferentType: Для EIDR это включает создание (например, развлекательные объекты) и вечеринку (например, их создателя).
  • структурный тип: это взаимоисключающие категории, которые определяют форму актива. Два особенно актуальных для ресурсов EIDR - это абстракция (объект, такой как фильм, который может существовать в нескольких формах) и производительность (конкретный экземпляр объекта, например Director's Cut).
  • основным агентом: для творений - сущность, которая несет основную ответственность за свое существование.
  • registrationAuthorityCode: обозначает агентство, выдавшее DOI. Это будет RA EIDR для активов EIDR.

Метаданные EIDR доступны в стандартном формате метаданных ядра DOI, а также в форматах, специфичных для EIDR. DOI для схемы метаданных DOI: DOI: 10.1000 / 276 .

Система управления (аспекты EIDR)

DOI, в свою очередь, реализован поверх системы управления - распределенной, хорошо масштабируемой службы разрешения имен. Дескриптор определяется как:

<Handle> ::= <Handle Naming Authority> "/" <Handle Local Name>

Центр именования является глобально уникальным и определяет как административное пространство, так и синтаксис Обработки локального имени. Для EIDR в приведенном выше определении «10.5240» является органом по присвоению имен EIDR и отвечает за разрешение суффикса (включая его соответствие ожидаемому синтаксису для актива EIDR). The range of allowable Naming Authorities is more general than is employed by DOI (or EIDR).

The distributed nature of the Handle System allows each local namespace to be hosted on multiple geographically distributed service sites. This is a federated model where each local name space has complete control over the placement and operation of its service sites. Furthermore, each service site may contain multiple resolution servers: requests directed to a particular service site will be dispatched evenly across its constituent servers.

The data model of the Handle System is simple but flexible. An arbitrary number of values may be associated with each handle. Over time, these values may be created, modified, and destroyed. Each such datum has the following attributes:

  • индекс: an unsigned integer that identifies a data value from the others that may exist for this handle.
  • тип: a UTF-8 string identifying the type. The type system is extensible and common types are maintained as handles in the "0.TYPE" naming authority. There are no restrictions on the creation of new types, although using resolvable handles as type names is recommended best practice. Common types include URL for a single of indirection, "10320/loc" for a set of context-based resolution alternatives, and various administrative types for Handle System management, all of which are based on handle resolution.
  • данные: the value itself, represented as a sequence of octets which are interpreted in the context of the associated type
  • разрешение: access rights to this particular value. Note that different data values of a handle may have different permissions
  • TTL: an integer that specifies how long a value may be cached
  • timestamp: an integer (expressed as milliseconds from the Unix epoch) that records the last time the value was updated
  • ссылка: a list of references to other handle values. These are usually used to add credentials (e.g. a digital signature).

Accessing the Handle System is done via a wire protocol defined in RFC 3652; EIDR applications don't have to be concerned with this because of the layering of protocols.

Смотрите также

дальнейшее чтение

  1. R. Kroon, R. Drewry, A. Leigh, S. McConnachie. "Content Identification for Audiovisual Archives". International Association of Sound and Audiovisual Archives Journal, Summer 2015 (No. 45).
  2. R. Kroon. "Bringing Order to Digital Identifiers". Media and Entertainment Journal Winter 2014-2015: 148–150.
  3. R. Drewry, D. Dulchinos. "Transforming Entertainment Through Technology". Media and Entertainment Journal Winter 2013-2014: 81–88.
  4. D. Agranoff, W. Michel, T. Wakai. "Streamlined Content Metadata Integration and Management Using Entertainment ID Registry (EIDR)". SCTE Cable-Tec Expo 2012.

внешняя ссылка

Рекомендации

  1. ^ ISO/IEC 7064:2003: Information technology -- Security techniques -- Check character systems. 2002 г.
  2. ^ W3C XML Schema Part 2: Datatypes Second Edition
  3. ^ SMPTE RP 2079. DOI Name and EIDR Identifier Representation.
  4. ^ Advanced Media Workflow Association AS-03 MXF Program Delivery Specification.
  5. ^ Advanced Media Workflow Association AS-11 MFX for Contribution Specification.
  6. ^ SMPTE RP 2021-5:2013. Using Ad-ID and EIDR as Alternate Identifiers in SMPTE BXF and ATSC PMCP.
  7. ^ EBU TECH 3293. EBU CORE METADATA SET Version 1.5.
  8. ^ DVB Document A167-2.Digital Video Broadcasting (DVB);Companion Screens and Streams; Part 2: Content Identification and Media Synchronisation, July, 2014. p. 52.
  9. ^ ISO/IEC CD 23000-15. Information technology - Multimedia application format (MPEG-A) -- Part 15: Multimedia preservation application format.
  10. ^ MD-SP-AMIv3.0-I02-121210 В архиве 2015-04-02 at the Wayback Machine. CableLabs Asset Management Interface 3.0 Specification.
  11. ^ ANSI/SCTE 35 2013. Digital Program Insertion Cueing Message for Cable.
  12. ^ SCTE 130-10 2013. Digital Program Insertion – Advertising Systems Interfaces, Part 10.
  13. ^ TC 372 Workshop Compendium. How EN 15744 and EN 15907 came into being.
  14. ^ Press Release. Swisscom completes the first European deployment of the Entertainment ID Registry with media-press.tv.
  15. ^ ISO 26324:2012: Information and documentation -- Digital object identifier system, 2012.