Архитектура содержания документа - Document Content Architecture

DCA
РазработанIBM
Тип форматаФормат файла документа
Расширен доМО: DCA

В Архитектура содержания документа, или же DCA для краткости, это стандарт, разработанный IBM для текстовых документов в начале 1980-х. DCA использовался на мэйнфрейм и iSeries систем, и легли в основу DisplayWrite формат файла. DCA позже был расширен как МО: DCA (Архитектура содержимого документов со смешанными объектами), в которую добавлены встроенные файлы данных, такие как графика.

Первоначальная цель DCA состояла в том, чтобы предоставить общий формат документа, который можно было бы использовать на нескольких платформах обработки текстов IBM, таких как IBM PC, Мэйнфреймы IBM, то Специальный текстовый процессор Displaywriter, а Административная система IBM 5520.[1]

DCA определяет два типа документов:[2][3]

  • Текст в видимой форме (DCA / RFT), который можно редактировать.
  • Окончательный текст (DCA / FFT), который «отформатирован для конкретного устройства вывода и не может быть изменен».

Описание

DCA определяет поток данных, представляющий документ.

Документы могут содержать шрифты, наложения и другие объекты ресурсов, необходимые во время презентации для правильного представления данных. Наконец, документы могут содержать объекты ресурсов, такие как указатель документа и элементы тегов, поддерживающие поиск и навигацию по данным документа, для различных целей приложения.[4]:2

МО: DCA - это обертка или контейнер для различных объекты что может составить документ. Каждый объект определяется своей собственной подчиненной архитектурой. Архитектуры:[4]:4

  • Архитектура содержимого текстовых объектов презентации (PTOCA) описывает форматированный текст, включая текстовые атрибуты, такие как шрифт или цвет.
  • Архитектура содержимого объекта изображения (IOCA) описывает изображения, не зависящие от разрешения.
  • Архитектура содержимого графических объектов (GOCA) описывает векторная графика изображений. Вариант GOCA, AFP GOCA, используется в Презентация расширенных функций среды.
  • Архитектура содержимого объекта штрих-кода (BCOCA ™) описывает штрих-коды в различных форматах.
  • Архитектура содержимого объекта шрифта (FOCA) описывает шрифты, которые будут использоваться в документе.
  • Архитектура содержимого объекта управления цветом ™ (CMOCA ™) описывает необходимую информацию для управления цветом.

Каждая архитектура использует серию двоичных структурированных полей для описания соответствующего объекта.

Текст в видимой форме

Текст в видимой форме
РазработанIBM
Тип форматаФормат файла документа

Текст в видимой форме (сокращенно RFT или же RFT-DCA) является частью DCA. Иногда его называют Повторяемый формат текста. Он использовался IBM DisplayWrite 4 и 5 текстовые процессоры на Система / 360 и 370 мэйнфреймы, и OfficeVision / 400 для передачи форматированных документов в другие системы.[нужна цитата ]

RFT имеет аналог Окончательный текст (сокращенно БПФ или же БПФ-DCA), который не предназначен для редактирования и предназначен только для вывода.

История

Стремление к введению международных стандартов для DCA было начато в 1980 году на предприятии IBM в Рочестере. Собрана команда, состоящая из двух архитекторов MODCA, архитектора RTOCA и архитектора PTOCA. Эти архитекторы, как их называли, были ответственны за объединение консенсуса IBM в отношении проектирования потоков данных и за то, чтобы вывести работу на арену международных стандартов. Были предприняты согласованные усилия по вовлечению международного сообщества в разработку. Это решение было частично основано на опыте, накопленном при принятии GML в качестве международного стандарта SGML. Чтобы избежать долгой задержки создания архитектуры, они хотели вовлечь всех как можно раньше. SGML [5]На разработку стандартизации ушло много лет и человеко-часов. Работа IBM с содержимым документа была продиктована потребностями основных компьютеров, где использовались GML и DCA, но этот опыт указывал на потребность в стандартизованных архитектурах компонентов, в частности, для редактируемого и неизменяемого текста.

В 1981 году, вскоре после создания, группа была переведена вместе с распределенной системой данных IBM 5280 в IBM Austin недалеко от Раунд-Рока, штат Техас, где работа продолжалась с переменным успехом. По мере того, как архитектуры становились все более прочными на международной арене, команда снова была переведена в 1987 году в Центр программирования IBM в Далласе недалеко от Роанок, Техас (Westlake), где в 1998 году он был распущен и работа над архитектурами DCA прекращена в основном из-за компьютерного сообщества, которое по необходимости пошло в другом направлении. Архитектура DCA была полностью завершена, но не полностью согласована в деталях через 18 лет. И никаких активных внедрений в поле зрения не было.

Мир ПК решил HTML (считается применением SGML международного стандарта) и использовал его части для своих целей, Microsoft Word в конечном итоге использовал аналогичный поток данных для внутреннего рабочего потока данных для хранения редактируемого контента. Несмотря на то, что стандарт SGML был доступен, было непрактично использовать полную реализацию анализатора SGML, поэтому его потенциальное подмножество стало фактическим стандартом для изменяемого текста, используемого сегодня на арене ПК.

Примерно в то же время Adobe Systems разработала и произвела кодировку документов для печати, названную PDF который стал стандартом для печатных документов, производимых на ПК. Международный стандарт был установлен в 2008 году без какого-либо участия кого-либо, кроме пользователей, которые решили использовать продукты, предлагаемые в большем количестве, чем менеджеры архитекторов потоков данных когда-либо мечтали. Решение было продиктовано потребностью в продукте, и найденное решение было гораздо более приемлемым, чем комитеты по стандартам могли разработать в качестве стандарта в те временные рамки, в которых было необходимо это решение. Более 10 лет работы не привели к созданию приемлемого метода, и компьютерное сообщество создало то, что им было нужно, за меньшее время.

Попытки достичь консенсусного потока данных документа были быстро обойдены доступным и пригодным для использования контентом, предоставленным компаниями, которые не пытались поделиться с другими, но создали работоспособное решение и продали его пользователям - и им это понравилось. Таким образом, выходные данные программного обеспечения для обработки текстов «распечатываются» в формате PDF, предоставляемом наиболее часто используемым презентационным продуктом. То есть, например, Microsoft Word предоставляет выбор принтера «Microsoft Print to PDF» для получения требуемого вывода для документа PDF - очень приемлемое решение для большинства пользователей. Аналогичный метод можно было бы использовать для создания международного стандарта, если бы он в конечном итоге появился.

Когда IBM распустила свой Центр программирования в Далласе в 1998 году, весь штат архитекторов ушел на пенсию и покинул компанию, за исключением менеджера, который был переведен в другое место и на другую должность, завершив проект архитектуры DCA в IBM в обозримом будущем.

Смотрите также

Рекомендации

  1. ^ Хенкель, Том (21 мая 1984 г.), «IBM выбирает путь стандартизации к DPP», Computerworld, IDG Enterprise, 18 (21), с. 7, ISSN  0010-4841
  2. ^ "Энциклопедия журнала PC". Получено 25 июля, 2012.
  3. ^ де ла Божардиер, Жан Мари (1988). «Отлаженные форматы обмена документами». Управление документами и типографика: материалы Международной конференции по электронным публикациям, управлению документами и типографике, Ницца (Франция) 20-22 апреля 1988 г.. CUP Архив. п. 83. ISBN  978-0-521-36294-8.
  4. ^ а б Корпорация IBM (май 2006 г.). Справочник по архитектуре содержимого документа со смешанными объектами (PDF). Получено 7 февраля, 2020.
  5. ^ http://www.sgmlsource.com/

внешняя ссылка