Двоичный XML - Binary XML
Разные двоичный форматы были предложены как компактные представления для XML (расширяемый язык разметки). Использование двоичного формата XML обычно снижает многословие XML-документов, что также снижает стоимость синтаксического анализа,[1] но мешает использовать обычные текстовые редакторы и сторонние инструменты для просмотра и редактирования документа. Существует несколько конкурирующих форматов, но ни один из них еще не стал стандарт де-факто, Хотя Консорциум World Wide Web принял EXI в качестве рекомендации от 10 марта 2011 г.[2]
Двоичный XML обычно используется в приложениях, где производительность стандартного XML недостаточна, но есть возможность преобразовать документ в форму (XML) и обратно. является ценится легко просматриваемая и редактируемая. Другие преимущества могут включать возможность произвольный доступ и индексация XML-документов.
Основная задача двоичного XML - создать единый широко распространенный стандарт. В Международная организация по стандартизации (ISO) и Международный союз электросвязи (ITU) опубликовал Быстрый информационный набор стандарт в 2007 и 2005 годах соответственно. Другой стандарт (ISO / IEC 23001-1), известный как двоичный формат MPEG для XML (БиМ ), был стандартизирован ISO в 2001. БиМ используется многими ETSI стандарты цифрового ТВ и мобильного ТВ. В Открытый геопространственный консорциум предоставляет спецификацию двоичного кодирования XML (в настоящее время документ о передовой практике), оптимизированный для гео-связанных данных (GML), а также эталонный тест для сравнения производительности Fast InfoSet, EXI, BXML и сдувать кодировать / декодировать AIXM.[3]
Альтернативы двоичному XML включают использование традиционных методов сжатия файлов в XML-документах (например, gzip ); или используя существующий стандарт, такой как ASN.1. Однако традиционные методы сжатия предлагают только преимущество уменьшения размера файла без преимущества уменьшения времени анализа или произвольного доступа. ASN.1 / PER составляет основу Быстрый информационный набор, который является одним из двоичных стандартов XML. Также существуют гибридные подходы (например, VTD-XML ), которые прикрепляют к XML-документу небольшой индексный файл, чтобы избежать дополнительных затрат на синтаксический анализ.[4]
Работа с двоичным XML
Проекты и форматы файлов, связанные с понятием двоичного XML, включают:
- БиМ Стандарт, от ISO, разработанная MPEG рабочая группа
- Быстрый информационный набор, стандарт, опубликованный ISO / IEC и ITU-T
- Эффективный обмен XML (EXI) Рекомендация W3C, основанная на работе Эффективный XML от AgileDelta, Inc.
- Расширяемый двоичный метаязык (EBML) из Матроска
- Двоичный XML WAP (WBXML)
- Двоичный формат .NET: структура данных XML из Microsoft; реализация включена в .NET Framework 3.0 и новее.
Другие проекты, которые имеют функциональные возможности, связанные с бинарными представлениями (или конкурирующие с ними), включают:
- VTD-XML из проекта XimpleWare и VTD-XML
- Буферы протокола из Google
- Apache Thrift
- Служба распространения данных из мой Бог
- Apache Avro для больших данных
- Пакет приложений для Android использует недокументированный двоичный формат XML.[5]
Смотрите также
Рекомендации
- ^ Проблема с производительностью двоичного XML http://webservices.sys-con.com/read/250512.htm В архиве 2008-05-20 на Wayback Machine
- ^ Джон Шнайдер, Такуки Камия, редакторы, «Эффективный формат обмена XML (EXI) 1.0», Рекомендация W3C от 10 марта 2011 г. [1]
- ^ Тестирование сжатия AIXM 5.1: как конкурируют EXI, FI, BXML и deflate при работе с географическими данными?
- ^ «Индексирование XML-документов с помощью VTD-XML». Архивировано из оригинал на 2008-07-04. Получено 2007-11-28.
- ^ «Где документирован двоичный XML-формат Android?». Обмен стеками обратного проектирования.