Оцифровка - Digitization - Wikipedia

Оцифровка[1] это процесс преобразования информации в цифровой (т.е. машиночитаемый) формат, в котором информация организована в биты.[1][2] Результатом является представление объекта, изображение, звук, документ или же сигнал (обычно аналоговый сигнал ) путем генерации серии чисел, описывающих дискретный набор точек или образцы. Результат называется цифровой представление или, более конкретно, цифровое изображение, для объекта и цифровая форма, для сигнала. В современной практике оцифрованные данные имеют вид двоичные числа, которые облегчают компьютерную обработку и другие операции, но, строго говоря, оцифровка означает просто преобразование аналогового исходного материала в числовой формат; то десятичный или любой другой система счисления это можно использовать вместо этого.

Оцифровка имеет решающее значение для обработки, хранения и передачи данных, поскольку она «позволяет передавать информацию всех видов во всех форматах с одинаковой эффективностью, а также смешивать».[3] Хотя аналоговые данные, как правило, более стабильны, цифровые данные могут быть более легко доступны для совместного использования и доступа, и теоретически могут распространяться бесконечно без потерь в генерации при условии, что при необходимости перешел на новые стабильные форматы. Вот почему это излюбленный способ хранения информации для многих организаций по всему миру.

Процесс

Термин оцифровка часто используется, когда различные формы информации, такие как объект, текст, звук, изображение или голос, преобразуются в единое целое. бинарный код. Ядро процесса - это компромисс между устройством захвата и устройством воспроизведения, так что визуализированный результат представляет исходный источник с максимально возможной точностью, а преимуществом оцифровки является скорость и точность, с которой эта форма информации может быть передана. без ухудшения качества по сравнению с аналоговой информацией.

Цифровая информация представлена ​​одной из двух цифр, 0 или 1. Они известны как биты (сокращение двоичные цифры), а последовательности нулей и единиц, составляющие информацию, называются байты.[4]

Аналоговые сигналы непрерывно переменной, как по количеству возможных значений сигнала в данный время, а также по количеству точек в сигнале в заданный период времени. Однако цифровые сигналы дискретный в обоих отношениях - обычно это конечная последовательность целых чисел - поэтому оцифровка с практической точки зрения может быть только приближение сигнала, который он представляет.

Оцифровка происходит в двух частях:

Дискретность
Чтение аналогового сигнала А, а через равные промежутки времени (частота ), отбор проб значение сигнала в точке. Каждое такое чтение называется образец и на данном этапе может считаться имеющим бесконечную точность;
Квантование
Выборки округляются до фиксированного набора чисел (например, целых чисел), этот процесс известен как квантование.

Как правило, они могут происходить одновременно, хотя концептуально они различны.

Ряд цифровых целых чисел может быть преобразован в аналоговый выход, который приближается к исходному аналоговому сигналу. Такое преобразование называется Преобразование DA. В частота выборки и количество битов, используемых для представления целых чисел, объединяются, чтобы определить, насколько близко такое приближение к аналоговому сигналу будет оцифровка.

Примеры

Оцифровка первого номера эстонского научно-популярного журнала Horisont, опубликованного в январе 1967 года.

Этот термин используется для описания, например, сканирование аналоговых источников (например, печатных фото или скотчем ролики ) в компьютеры для редактирования, 3D-сканирование, которое создает 3D моделирование поверхности объекта, и аудио (где частота дискретизации часто измеряется в килогерц ) и карта текстуры трансформации. В этом последнем случае, как и на обычных фотографиях, частота дискретизации относится к разрешающая способность изображения, часто измеряемого в пиксели на дюйм.

Оцифровка - это основной способ хранения изображений в форме, подходящей для коробка передач и компьютер обработки, будь то сканирование с двухмерных аналоговых оригиналов или снятие с помощью датчик изображений -оборудованное устройство, такое как цифровая камера, томографический инструмент, такой как CAT-сканер, или получение точных размеров от реального объекта, такого как машина, используя 3D сканирование устройство.[5]

Оцифровка играет центральную роль в создании цифровых представлений географических объектов с использованием растровых или векторных изображений в географическая информационная система, т.е. создание электронные карты, либо из различных географических и спутниковых изображений (растровых), либо путем оцифровки традиционной бумаги карты или же графики[6][7] (вектор).

«Оцифровка» также используется для описания процесса заполнения базы данных с файлами или данными. Хотя такое использование технически неточно, оно происходит от ранее правильного использования этого термина для описания той части процесса, которая включает оцифровку аналоговых источников, таких как печатные изображения и брошюры, перед загрузкой в ​​целевые базы данных.

Оцифровка может также использоваться в области одежды, где изображение может быть воссоздано с помощью оцифровка вышивки программные инструменты и сохранены как вышивальная машина код. Этот машинный код вводится в вышивальную машину и наносится на ткань. Наиболее поддерживаемый формат - файл DST. Компании по производству одежды также оцифровывают выкройки одежды.[нужна цитата ][8]

Аналоговые сигналы в цифровые

Аналоговые сигналы - это непрерывные электрические сигналы; цифровые сигналы не являются непрерывными. Аналоговые сигналы можно преобразовать в цифровые с помощью аналого-цифровой преобразователь.[9]

Почти вся музыка была оцифрована. Около 12 процентов из более чем 500 000 фильмов, перечисленных в База данных фильмов в Интернете оцифрованы на DVD.[10][11]

Обработка аналогового сигнала становится простой[согласно кому? ] когда он оцифровывается, потому что сигнал оцифровывается перед модуляцией и передачей. Процесс преобразования аналогового сигнала в цифровой состоит из двух процессов: дискретизации и квантования.

Оцифровка личных мультимедиа, таких как домашние фильмы, слайды, и фотографии - популярный метод сохранения старых репозиториев и обмена ими. Слайды и фотографии можно сканировать с помощью сканер изображений, но видео сложнее.[12] Слайды могут быть оцифрованы с помощью различных пленочных сканеров Nikon такие как Nikon Coolscan 5000ED.

Другой пример оцифровки: VisualAudio швейцарский Фонотека Национале в Лугано, которые извлекают и восстанавливают звук из изображения записи с высоким разрешением.

Аналоговые тексты в цифровые

По состоянию на 2006 год не более 1 из 20 текстов был оцифрован.[13]

Сканируются старые печатные книги и оптическое распознавание символов технологии применялись академическими и публичными библиотеками, фондами и частными компаниями, такими как Google.[14]

Неопубликованные текстовые документы на бумаге, которые имеют непреходящую историческую или исследовательскую ценность, оцифровываются библиотеки и архивы, хотя часто гораздо медленнее, чем для книг (см. электронные библиотеки ). Во многих случаях, архивы заменили микрофильмирование с оцифровкой как средством сохранения и обеспечения доступа к уникальным документам.

Подразумеваемое

Переход к оцифровке в мире современных средств массовой информации имеет последствия для традиционных средств массовой информации. Однако эти «ограничения все еще очень неясны».[15] Чем больше развиваются технологии, тем более конвергентной становится сфера средств массовой информации с меньшей потребностью в традиционных коммуникационных технологиях. Например, Интернет изменил многие нормы общения, повысив эффективность не только для частных лиц, но и для предприятий. Тем не мение, МакКуэйл предполагает, что традиционные средства массовой информации также извлекли большую пользу из новых средств массовой информации, что позволило использовать более эффективные и действенные ресурсы.[15]

Сохранение библиотеки

В контексте библиотек, архивов и музеев оцифровка - это средство создания цифровых суррогатов аналоговых материалов, таких как книги, газеты, микрофильм и видеозаписи, предлагает множество преимуществ, включая расширение доступа, особенно для посетителей на расстоянии; содействие развитию коллекций посредством совместных инициатив; повышение потенциала для исследований и образования; и поддержка деятельности по сохранению.[16] Оцифровка может обеспечить средства сохранения содержания материалов путем создания доступного факсимиле объекта, чтобы уменьшить нагрузку на и без того хрупкие оригиналы. Что касается звуков, то оцифровка устаревших аналоговых записей является важной страховкой от технологического устаревания.[17] Фундаментальный аспект планирования проектов оцифровки - обеспечение сохранения и доступности самих цифровых файлов;[18] период, термин "цифровое сохранение, "в самом простом смысле" относится к ряду действий, предпринимаемых для поддержания доступа к цифровым материалам с течением времени.[19]

Преобладающая Хрупкие книги Проблема, с которой сталкиваются библиотеки во всем мире, решается с помощью цифрового решения для долгосрочного хранения книг.[20] С середины 1800-х годов книги печатались на древесно-целлюлозная бумага, который при распаде становится кислым. Ухудшение может привести к тому, что книга станет полностью непригодной для использования. Теоретически, если эти широко распространенные названия не будут обработаны процессами обезвреживания, материалы на этих кислотных страницах будут потеряны. По мере развития цифровых технологий она становится все более предпочтительной в качестве метода сохранения этих материалов, главным образом потому, что она может обеспечить более простые точки доступа и значительно снизить потребность в физическом пространстве для хранения.

Библиотека Кембриджского университета работает над Кембриджская цифровая библиотека, который первоначально будет содержать оцифрованные версии многих из его наиболее важных работ, касающихся науки и религии. К ним относятся такие примеры, как лично аннотированное Исааком Ньютоном первое издание его книги. Philosophiæ Naturalis Principia Mathematica[21] а также тетради колледжа[22][23] и другие документы,[24] и некоторые исламские рукописи, такие как Коран[25] из библиотеки Типу Сахиб.

Google, Inc. предприняла шаги к попытке оцифровывать каждый заголовок с помощью "Поиск книг Google ".[26] Хотя некоторые академические библиотеки заключили контракт с этой службой, проблемы с нарушением закона об авторском праве могут сорвать проект.[27] Тем не менее, он обеспечивает - по крайней мере - онлайн-консорциум для библиотек для обмена информацией и для исследователей для поиска названий, а также для просмотра материалов.

Оцифровка против цифрового сохранения

Существует распространенное заблуждение, что оцифровка чего-либо - это то же самое, что цифровое сохранение. Оцифровать что-либо - значит преобразовать что-то из аналогового в цифровой формат.[28] Примером может быть сканирование фотографии и получение цифровой копии на компьютере. По сути, это первый шаг к сохранению цифровых данных. Сохранить что-то в цифровом виде - значит поддерживать это в течение длительного периода времени.[29][30]

Сохранение цифровых данных сложнее, потому что технологии меняются так быстро, что формат, который использовался для сохранения чего-то много лет назад, может стать устаревшим, например, дисковод для гибких дисков 5 1/4 дюйма. Компьютеры больше не производятся с ними, и требуется оборудование для преобразования файл из устаревшего формата в более новый может быть дорогостоящим. В результате процесс обновления должен выполняться каждые 2–5 лет,[31] или по мере того, как новые технологии становятся доступными, но до того, как старые технологии станут недоступны. Библиотека Конгресса предоставляет множество ресурсов и советов для людей, желающих практиковать оцифровку и цифровое хранение своих личных коллекций.[32]

Цифровое сохранение также может применяться к изначально цифровым материалам. Примером чего-то, что изначально является цифровым, является документ Microsoft Word, сохраненный в виде файла .docx, или публикация в социальной сети. Напротив, оцифровка применяется только к аналоговым материалам. Рожденные в цифровом виде материалы представляют собой уникальную проблему для цифрового хранения не только из-за технологического устаревания, но и из-за изначально нестабильной природы цифрового хранения и обслуживания. Большинство веб-сайтов существуют от 2,5 до 5 лет, в зависимости от цели, для которой они были созданы.[33]

Многие библиотеки, архивы и музеи, а также другие учреждения пытаются наверстать упущенное и оставаться в курсе как в отношении оцифровки, так и в отношении цифрового хранения. Оцифровка - это трудоемкий процесс, особенно в зависимости от состояния хранилищ до оцифровки. Некоторые материалы настолько хрупкие, что процесс оцифровки может нанести им непоправимый ущерб; свет от сканера может повредить старые фотографии и документы. Несмотря на потенциальный ущерб, одна из причин оцифровки некоторых материалов заключается в том, что они настолько интенсивно используются, что оцифровка поможет сохранить исходную копию намного дольше, чем она была бы в качестве физического хранилища.

Оцифровка также может быть довольно дорогой. Учреждения хотят лучшего качества изображений в цифровых копиях, чтобы при их преобразовании из одного формата в другой сохранялась только высококачественная копия. Небольшие учреждения могут быть не в состоянии позволить себе такое оборудование. Персонал на многих объектах также ограничивает объем материала, который можно оцифровать. Архивисты и библиотекари должны иметь представление о том, что их клиенты хотят видеть больше всего, и стараться расставить приоритеты и удовлетворить эти потребности в цифровом формате.

Трудовые ресурсы и финансирование также ограничивают цифровую сохранность во многих учреждениях. Стоимость обновления оборудования или программного обеспечения каждые несколько лет может быть чрезмерно высокой. Еще одна проблема - обучение, поскольку многие библиотекари и архивисты не имеют опыта работы в области информатики. Интеллектуальный контроль над цифровыми активами представляет собой еще одну проблему, которая иногда возникает, когда физические активы еще не полностью обработаны. Один из предлагаемых сроков для полной переписывания цифровых активов - каждые десять-двадцать лет, что делает процесс непрерывным и трудоемким.

Наконец, сохранение цифровых активов в течение длительного времени является сложной задачей. По сути, вы храните огромный набор единиц и нулей. Эти сигналы могут быть физически записаны на носители, такие как компакт-диски, или сохранены магнитным способом на жестких дисках. В любом случае механизмы хранения со временем ухудшаются. Физические материалы разлагаются до тех пор, пока нельзя будет разглядеть отметки 1 или 0. Магнитный носитель разлагается и теряет заряд. Если вы измените всего одну единицу или один 0, вы можете значительно изменить запись. Таким образом, целостность данных с оцифрованными активами в хранилище является большой проблемой.

Цифровое переформатирование

Цифровое переформатирование представляет собой процесс преобразования аналоговых материалов в цифровой формат как суррогат оригинала. Цифровые суррогаты выполняют функцию сохранения, сокращая или исключая использование оригинала. Цифровое переформатирование осуществляется в соответствии с установленными передовыми методами, чтобы гарантировать высочайшее качество преобразования материалов.

Цифровое переформатирование в Библиотеке Конгресса

В Библиотека Конгресса активно переформатирует материалы для своих Американская память проект и разработал лучшие стандарты и практики, касающиеся обработки книг в процессе оцифровки, разрешения сканирования и предпочтительных форматов файлов.[34] Некоторые из этих стандартов:

  • Использование ISO 16067-1 и ISO 16067-2 для разрешающая способность требования.
  • Рекомендуется 400 ppi разрешение для OCR 'ed печатный текст.
  • Использование 24-битный цвет когда цвет является важным атрибутом документа.
  • Использование максимального разрешения сканирующего устройства для цифрового воспроизведения фотографий
  • TIFF как стандартный формат файла.
  • Приложение описательных, структурных и технических метаданные ко всем оцифрованным документам.

Список архивных стандартов для цифрового хранения можно найти на ARL интернет сайт.[35]

Библиотека Конгресса учредила Программу сохранения цифрового переформатирования.[36] Три основных компонента программы включают:

  • Критерии выбора цифрового переформатирования
  • Принципы и характеристики цифрового переформатирования
  • Управление жизненным циклом цифровых данных LC

Оцифровка и переформатирование аудио

Аудио носители предлагают богатый источник исторической этнографической информации, причем самые ранние формы записанного звука относятся к 1890 году.[37] По данным Международной ассоциации звуковых и аудиовизуальных архивов (IASA), эти источники аудиоданных, а также устаревшие технологии, используемые для их воспроизведения, находятся под неминуемой угрозой безвозвратной потери из-за ухудшения качества и устаревания.[38] Эти первичные источники называются «носителями» и существуют в различных форматах, включая восковые цилиндры, магнитную ленту и плоские диски с рифлеными носителями, среди прочего. Некоторые форматы подвержены более серьезной или более быстрой деградации, чем другие. Например, лаковые диски страдают от расслоение. Аналоговая лента может испортиться из-за синдром липкого сарая.

1/4-дюймовая аналоговая кассета, воспроизводимая на магнитофоне Studer A810 для оцифровки в Smithsonian Folkways Recordings.

[39]

Процесс архивирования и стандартизация файлов были разработаны, чтобы минимизировать потерю информации с исходного носителя в итоговый цифровой файл в процессе оцифровки. Для большинства форматов, подверженных риску (магнитная лента, рифленые цилиндры и т. Д.), Можно наблюдать аналогичный рабочий процесс. Осмотр исходного носителя поможет определить, какие шаги необходимо предпринять для ремонта материала перед транспортировкой. Аналогичная проверка должна быть проведена для воспроизводящих машин. Если удовлетворительные условия выполняются как для носителя, так и для устройства воспроизведения, передача может происходить под контролем аналого-цифровой преобразователь.[40] Затем цифровой сигнал визуально представляется переводчику в виде цифровая звуковая рабочая станция, например Audacity, WaveLab или ProTools. Копии справочного доступа могут быть сделаны с меньшей частотой дискретизации. Для целей архивирования стандартным является передача с частотой дискретизации 96 кГц и глубиной цвета 24 бита на канал.[37]

Бережливая философия

Широкое использование Интернета и растущая популярность бережливое производство также расширилось использование и значение слова «оцифровка» для описания повышения эффективности организационных процессов. Под философией бережливого производства понимается подход, который рассматривает любое использование времени и ресурсов, не ведущее непосредственно к созданию продукта, как отходы и, следовательно, цель для устранения. Это часто будет включать в себя какой-то процесс бережливого производства, чтобы упростить процессные операции, с целью внедрения новых «экономичных и средних» процессов путем оцифровки данных и действий. Оцифровка может помочь избежать потери времени за счет расширения доступа к данным или внедрения систем планирования ресурсов предприятия.

Вымысел

В произведениях научной фантастики часто встречается термин оцифровать как акт превращения людей в цифровые сигналы и отправив их в цифровая технология. Когда это происходит, люди исчезают из реальный мир и появиться в виртуальный мир (как показано в культовый фильм Трон, то мультсериал Код Лиоко, или сериал конца 1980-х годов Капитан Пауэр и солдаты будущего ). в видео игра За гранью добра и зла, то главные герои голографический друг оцифровывает инвентарь игрока Предметы. Один Супер друзья показан эпизод мультфильма Удивительная женщина и Джейна освобождение мужчин мира (включая мужчин-супергероев) на компьютерную ленту женщиной-злодейкой Медулой.[41]

Смотрите также

Рекомендации

  1. ^ а б Определение оцифровки на WhatIs.com
  2. ^ «Оцифровка / оцифровка» в словаре английского языка Collins
  3. ^ McQuail, D (2000) Теория массовой коммуникации McQuail (4-е издание), Sage, London, стр. 16–34.
  4. ^ Летал, Терри. 2008. Новые СМИ Введение. Южный Мельбурн. 3-е издание. Южный Мельбурн: издательство Оксфордского университета.
  5. ^ Digimation для 3D-моделей, 3D-программного обеспечения и творческих услуг
  6. ^ "Engauge Digitizer с открытым исходным кодом для оцифровки графиков".
  7. ^ «Программа оцифровки графиков DigitizeIt».
  8. ^ Хедстрем, Маргарет (1 мая 1997 г.). «Сохранение в цифровом виде: бомба замедленного действия для электронных библиотек» (PDF). Компьютеры и гуманитарные науки. 31 (3): 189–202. Дои:10.1023 / А: 1000676723815. HDL:2027.42/42573. ISSN  1572-8412.
  9. ^ «Аналоговые и цифровые сигналы». 3 марта 2008 г. Архивировано с оригинал на 2008-03-03.
  10. ^ Ли, Кьонг-Хо; Слэттери, Оливер; Лу, Ричанг; Тан, Сяо; МакКрари, Виктор (2002). «Современное состояние и практика цифрового хранения». Журнал исследований Национального института стандартов и технологий. 107 (1): 93–106. Дои:10.6028 / jres.107.010. ISSN  1044-677X. ЧВК  4865277. PMID  27446721.
  11. ^ Вальдфогель, Джоэл (август 2017 г.). «Как оцифровка создала золотой век музыки, фильмов, книг и телевидения» (PDF). Журнал экономических перспектив. 31 (3): 195–214. Дои:10.1257 / jep.31.3.195. ISSN  0895-3309.
  12. ^ Пауль Хельцель. «Прощай, VHS; привет, DVD».
  13. ^ Келли, Кевин (14 мая 2006 г.). "Отсканируйте эту книгу! ". Нью-Йорк Таймс. Проверено 26 октября 2016.
  14. ^ "Пресс-релиз Google Checks Out Library Books" (Пресс-релиз). 14 декабря 2004 г.
  15. ^ а б Маккуэйл, Денис (2000). Теория массовой коммуникации МакКуэйла. 4-е изд. Таузенд-Оукс, Калифорния: Sage. п. 28.
  16. ^ Хьюз, Лорна М. (2004). Оцифровка коллекций: стратегические вопросы для информационного менеджера. Лондон: Facet Publishing. ISBN  1-85604-466-1. Глава 1, «Зачем оцифровка? Затраты и преимущества оцифровки», стр. 3-30; здесь, особенно п. 9-17.
  17. ^ «Руководство по созданию и сохранению цифровых аудиообъектов (веб-издание)». iasa-web.org.
  18. ^ Хьюз (2004), стр. 204.
  19. ^ Каплан, Присцилла (февраль – март 2008 г.). «Что такое цифровое сохранение?». Отчеты по библиотечным технологиям. 44 (2): 7. Получено 2016-10-26.
  20. ^ Клунан, М. и Санетт, С. «Сохранение цифрового контента», Библиотеки и Академия. Vol. 5, № 2 (2005): 213–37.
  21. ^ Ньютон, Исаак. "Philosophi Mat Naturalis Principia Mathematica". Цифровая библиотека Кембриджского университета. Получено 10 января 2012.
  22. ^ Ньютон, Исаак. "Записная книжка Тринити-колледжа". Цифровая библиотека Кембриджского университета. Получено 10 января 2012.
  23. ^ Ньютон, Исаак. "Записная книжка колледжа". Цифровая библиотека Кембриджского университета. Получено 10 января 2012.
  24. ^ Ньютон, Исаак. "Бумаги Ньютона". Цифровая библиотека Кембриджского университета. Получено 10 января 2012.
  25. ^ "аль-Коран". Цифровая библиотека Кембриджского университета. Получено 10 января 2012.
  26. ^ Google Книги.
  27. ^ Баксик К. «Добросовестное использование или эксплуатация? Противоречие в Поиске книг Google», Библиотеки и Академия. Vol. 6, № 2 (2006): 399–415.
  28. ^ «почему оцифровка не является цифровым сохранением». 7 октября 2011 г.
  29. ^ Росс, Симус (2000). Смена поезда в Уигане: сохранение цифровых данных и будущее стипендий (PDF) (1-е изд.). Лондон: Британская библиотека (Национальное бюро по сохранению).
  30. ^ «Оцифровка отличается от сохранения в цифровом виде: помогите предотвратить появление цифровых сирот!». loc.gov.
  31. ^ «Оцифровка против сохранения». prairienet.org.
  32. ^ «Цифровое сохранение». digitalpreservation.gov.
  33. ^ «Продолжительность жизни веб-сайта и вы». Orbit Media Studios.
  34. ^ «Библиотека Конгресса. (2007 г.). Технические стандарты цифрового преобразования текстовых и графических материалов» (PDF).
  35. ^ «Поиск публикаций - Ассоциация исследовательских библиотек® - ARL®» (PDF). www.arl.org.
  36. ^ Библиотека Конгресса (2006 г.). Программа сохранения цифрового переформатирования. https://www.loc.gov/preserv/prd/presdig/presintro.html
  37. ^ а б "Руководство ARSC по сохранению аудио" (PDF).
  38. ^ Кейси, Майк (январь 2015 г.). "Почему сохранение СМИ не может ждать: надвигающаяся буря" (PDF). Журнал IASA. 44: 14–22.
  39. ^ "Руководство ARSC по сохранению аудио" (PDF). Получено 2019-05-04.
  40. ^ Институт охраны природы Канады (14 сентября 2017 г.). "Оцифровка аудиокассет - Технический бюллетень 30". эм. Получено 2019-05-04.
  41. ^ Девы разума. Вышел в эфир 5 ноября 1977 года по сети ABC вместе с другими сегментами.

дальнейшее чтение