Качество данных - Data quality

Качество данных относится к состоянию качественный или количественный кусочки информации. Существует множество определений качества данных, но данные обычно считаются высококачественными, если они «подходят для [своего] предполагаемого использования в операции, принятие решений и планирование ".[1][2] Более того, данные считаются высококачественными, если они правильно представляют реальную конструкцию, к которой они относятся. Кроме того, помимо этих определений, по мере увеличения количества источников данных возникает вопрос о внутренних согласованность данных становится значительным, независимо от пригодности для использования с какой-либо конкретной внешней целью. Мнения людей о качестве данных часто могут расходиться, даже если обсуждают один и тот же набор данных, используемых для одной и той же цели. В этом случае управление данными используется для формирования согласованных определений и стандартов качества данных. В таких случаях, очистка данных, включая стандартизацию, может потребоваться для обеспечения качества данных.[3]

Определения

Определение качества данных в предложении затруднено из-за множества контекстов, в которых используются данные, а также из-за различных точек зрения конечных пользователей, производителей и хранителей данных.[4]

С точки зрения потребителя качество данных - это:[4]

  • "данные, пригодные для использования потребителями данных"
  • данные "соответствуют или превосходят ожидания потребителей"
  • данные, которые «удовлетворяют требованиям использования по назначению»

С точки зрения бизнеса качество данных - это:

  • данные, которые «пригодны для использования» в их предполагаемых операциях, принятии решений и других ролях »или которые демонстрируют« соответствие установленным стандартам, так что пригодность к использованию достигается »[5]
  • данные, которые «подходят для предполагаемого использования в операциях, принятии решений и планировании»[6]
  • «способность данных удовлетворять заявленным бизнес-требованиям, системным и техническим требованиям предприятия»[7]

С точки зрения стандартов качество данных - это:

  • «степень, в которой набор неотъемлемых характеристик объекта соответствует требованиям»[8][4]
  • «полезность, точность и правильность данных для его применения»[9]

Возможно, во всех этих случаях «качество данных» представляет собой сравнение фактического состояния конкретного набора данных с желаемым состоянием, при этом желаемое состояние обычно называется «пригодным для использования», «спецификацией», соответствие ожиданиям потребителей "," без дефектов "или" соответствие требованиям ". Эти ожидания, спецификации и требования обычно определяются одним или несколькими людьми или группами, организациями по стандартизации, законами и нормативными актами, бизнес-политиками или политиками разработки программного обеспечения.[4] При дальнейшем изучении этих ожиданий, спецификаций и требований формулируются характеристики или размеры данных, например:[4][5][6][7]

  • доступность или наличие
  • точность или правильность
  • сопоставимость
  • полнота или полнота
  • последовательность, последовательность или ясность
  • авторитет, надежность или репутация
  • актуальность, уместность или полезность
  • своевременность или задержка
  • уникальность
  • обоснованность или разумность

История

До подъема недорогих компьютерное хранилище данных, массивный мэйнфрейм компьютеры использовались для хранения данных об именах и адресах служб доставки. Это было сделано для того, чтобы почта могла быть правильно направлена ​​к месту назначения. В мэйнфреймах использовались бизнес-правила для исправления распространенных орфографических ошибок и опечаток в данных имени и адреса, а также для отслеживания клиентов, которые переехали, умерли, попали в тюрьму, женились, развелись или пережили другие события, изменившие их жизнь. Государственные учреждения начали предоставлять почтовые данные нескольким сервисным компаниям для сопоставления данных клиентов с Национальным реестром смены адресов. (NCOA). Эта технология сэкономила крупным компаниям миллионы долларов по сравнению с ручным исправлением данных о клиентах. Крупные компании сэкономили на почтовых услугах, поскольку счета и материалы прямого маркетинга более точно доходили до предполагаемого покупателя. Первоначально продаваемое как услуга, качество данных перешло в границы корпораций, когда стали доступны недорогие и мощные серверные технологии.[нужна цитата ]

Компании, специализирующиеся на маркетинге, часто сосредотачивают свои усилия на обеспечении качества на информации об именах и адресах, но качество данных признается[кем? ] как важное свойство всех типов данных. Принципы качества данных могут применяться к данным цепочки поставок, транзакционным данным и почти ко всем другим категориям найденных данных. Например, приведение данных цепочки поставок в соответствие с определенным стандартом имеет ценность для организации за счет: 1) предотвращения затоваривания аналогичных, но немного отличающихся запасов; 2) избежание ложного дефицита; 3) улучшение понимания покупок поставщика для ведения переговоров о скидках за объем; и 4) избежание затрат на логистику при хранении и доставке запчастей в крупной организации.[нужна цитата ]

Для компаний, проводящих значительные исследования, качество данных может включать в себя разработку протоколы для методов исследования, уменьшая погрешность измерения, проверка границ данных, Кросстабуляция, моделирование и выброс обнаружение, проверка целостность данных, так далее.[нужна цитата ]

Обзор

Существует ряд теоретических основ для понимания качества данных. Теоретико-системный подход, основанный на американском прагматизме, расширяет определение качества данных, чтобы включить в него качество информации, и подчеркивает всеохватность фундаментальных измерений точности и точности на основе теории науки (Иванов, 1972). Одна структура, получившая название «Данные без дефектов» (Hansen, 1991), адаптирует принципы статистического управления процессом к качеству данных. Другая структура стремится интегрировать перспективу продукта (соответствие спецификациям) и оказание услуг перспектива (удовлетворение ожиданий потребителей) (Kahn et al. 2002). Другой фреймворк основан на семиотика для оценки качества формы, значения и использования данных (Price and Shanks, 2004). Один в высшей степени теоретический подход анализирует онтологический природа информационные системы строго определять качество данных (Wand and Wang, 1996).

Значительный объем исследований качества данных включает изучение и описание различных категорий желаемых атрибутов (или измерений) данных. Было идентифицировано около 200 таких терминов, и нет согласия по их природе (это концепции, цели или критерии?), Их определениям или критериям (Wang et al., 1993). Программные инженеры могут распознать в этом проблему, аналогичную проблеме "способности ".

Массачусетский технологический институт имеет программу полного управления качеством данных под руководством профессора Ричарда Ванга, которая выпускает большое количество публикаций и проводит важную международную конференцию в этой области (Международная конференция по качеству информации, ICIQ). Эта программа выросла из работы, проделанной Хансеном над фреймворком «Без дефектных данных» (Hansen, 1991).

На практике качество данных является проблемой для профессионалов, работающих с широким спектром информационных систем, начиная от хранилище данных и бизнес-аналитика к управление взаимоотношениями с клиентами и система управления цепями поставок. Согласно одному отраслевому исследованию, общая стоимость проблем с качеством данных для экономики США составляет более 600 миллиардов долларов США в год (Eckerson, 2002). Неверные данные, включающие недействительную и устаревшую информацию, могут поступать из разных источников данных - путем ввода данных или перенос данных и конверсионные проекты.[10]

В 2002 году USPS и PricewaterhouseCoopers опубликовали отчет, в котором говорилось, что 23,6 процента всей отправляемой почты США отправляются неправильно.[11]

Одна из причин, по которой контактные данные в средней базе данных очень быстро устаревают - более 45 миллионов американцев меняют свой адрес каждый год.[12]

На самом деле проблема настолько серьезна, что компании начинают создавать управление данными команда, единственная роль которой в корпорации - отвечать за качество данных. В некоторых[кто? ] организации, это управление данными функция была создана как часть более широкой функции соблюдения нормативных требований - признание важности данных / качества информации для организаций.

Проблемы с качеством данных возникают не только из-за неверный данные; непоследовательный данные также являются проблемой. Устранение системы теневого копирования данных а централизация данных в хранилище - одна из инициатив, которые компания может предпринять для обеспечения согласованности данных.

Предприятия, ученые и исследователи начинают участвовать в сообществах по курированию данных, чтобы улучшить качество своих общих данных.[13]

Рынок каким-то образом пытается обеспечить контроль качества данных. Ряд поставщиков создают инструменты для анализа и исправления некачественных данных. на местепоставщики услуг могут очищать данные на контрактной основе, а консультанты могут давать советы по исправлению процессов или систем, чтобы в первую очередь избежать проблем с качеством данных. Большинство инструментов качества данных предлагают ряд инструментов для улучшения данных, которые могут включать в себя некоторые или все из следующего:

  1. Профилирование данных - первоначальная оценка данных для понимания их текущего состояния, часто включая распределение значений
  2. Стандартизация данных - a механизм бизнес-правил что гарантирует соответствие данных стандартам
  3. Геокодирование - для именных и адресных данных. Корректирует данные в соответствии с географическими стандартами США и мира
  4. Соответствие или связывание - способ сравнить данные, чтобы можно было выровнять похожие, но немного разные записи. Сопоставление может использовать «нечеткую логику» для поиска дубликатов в данных. Часто признается, что «Боб» и «Ббо» могут быть одним и тем же человеком. Например, он может управлять «домашним хозяйством» или находить связи между супругами по одному адресу. Наконец, он часто может создать «лучшую в своем классе» запись, взяв лучшие компоненты из нескольких источников данных и создав единую суперзапись.
  5. Мониторинг - отслеживание качества данных с течением времени и создание отчетов об изменении качества данных. Программное обеспечение также может автоматически корректировать варианты на основе заранее определенных бизнес-правил.
  6. Пакетная обработка и режим реального времени. После первоначальной очистки данных (пакетной обработки) компании часто хотят встроить процессы в корпоративные приложения, чтобы поддерживать их чистоту.

Есть несколько известных авторов и самозваных экспертов, среди которых Ларри Инглиш, пожалуй, самый популярный. гуру. К тому же, IQ International - Международная ассоциация по информации и качеству данных была основана в 2004 году, чтобы служить координатором для профессионалов и исследователей в этой области.

ISO 8000 это международный стандарт качества данных.[14]

Обеспечение качества данных

Обеспечение качества данных - это процесс профилирование данных для обнаружения несоответствий и других аномалий в данных, а также выполнения очистка данных[15][16] действия (например, удаление выбросы, отсутствует интерполяция данных) для повышения качества данных.

Эти действия могут быть предприняты как часть хранилище данных или как часть администрирование базы данных существующего куска программное обеспечение.[17]

Контроль качества данных

Контроль качества данных это процесс управления использованием данных для приложения или процесса. Этот процесс выполняется как до, так и после Data Гарантия качества (QA) процесс, который состоит из обнаружения несоответствия данных и исправления.

Перед:

  • Ограничивает ввод

После процесса контроля качества собирается следующая статистика для руководства Контроль качества (QC) процесс:

  • Серьезность несоответствия
  • Неполнота
  • Точность
  • Точность
  • Отсутствует / неизвестно

Процесс контроля качества данных использует информацию из процесса контроля качества, чтобы принять решение об использовании данных для анализа, в приложении или бизнес-процессе. Общий пример: если процесс контроля качества данных обнаруживает, что данные содержат слишком много ошибок или несоответствий, он предотвращает использование этих данных для предполагаемого процесса, который может вызвать сбой. Конкретный пример: предоставление неверных результатов измерений от нескольких датчиков для функции автопилота на самолете может привести к его аварии. Таким образом, создание процесса контроля качества обеспечивает защиту использования данных.[нужна цитата ]

Оптимальное использование качества данных

Качество данных (DQ) - это нишевая область, необходимая для обеспечения целостности управления данными за счет устранения пробелов в данных. Это одна из ключевых функций, которые помогают управлять данными, отслеживая данные для поиска исключений, не обнаруженных текущими операциями управления данными. Проверки качества данных могут быть определены на уровне атрибута, чтобы иметь полный контроль на этапах исправления.[нужна цитата ]

Проверки DQ и бизнес-правила могут легко совпадать, если организация не обращает внимания на объем DQ. Бизнес-команды должны тщательно понимать объем DQ, чтобы избежать дублирования. Проверки качества данных излишни, если бизнес-логика охватывает те же функции и выполняет ту же цель, что и DQ. Объем DQ организации должен быть определен в стратегии DQ и хорошо реализован. Некоторые проверки качества данных могут быть переведены в бизнес-правила после неоднократных исключений в прошлом.[нужна цитата ]

Ниже приведены несколько областей потоков данных, которые могут нуждаться в постоянных проверках DQ:

Полнота и точность Проверки DQ для всех данных могут выполняться в точке входа для каждого обязательного атрибута из каждой исходной системы. После первоначального создания транзакции создается несколько значений атрибутов; в таких случаях администрирование этих проверок становится сложным и должно выполняться сразу после того, как определенное событие источника этого атрибута и другие условия основного атрибута транзакции выполнены.

Все данные, имеющие атрибуты, относящиеся к Справочные данные в организации могут быть проверены по набору четко определенных действительных значений справочных данных для обнаружения новых или противоречивых значений с помощью период действия Проверка DQ. Результаты могут быть использованы для обновления Справочные данные управляется под Управление основными данными (MDM).

Все данные получены из сторонний внутренним командам организации могут точность (DQ) проверка по сторонним данным. Эти результаты проверки DQ ценны при администрировании данных, которые прошли несколько переходов после точки ввода этих данных, но до того, как эти данные будут авторизованы или сохранены для корпоративной аналитики.

Все столбцы данных, относящиеся к Основные данные может быть подтверждено последовательность проверять. Проверка DQ, проводимая для данных в точке входа, обнаруживает новые данные для процесса MDM, но проверка DQ, проводимая после точки входа, обнаруживает нарушение (а не исключения) согласованности.

По мере преобразования данных фиксируются множественные временные метки и положения этих временных меток, и их можно сравнивать друг с другом и с их возможностями для проверки их значения, убытков, эксплуатационной значимости с определенным SLA (соглашением об уровне обслуживания). Эта своевременность Проверка DQ может использоваться для уменьшения скорости затухания значений данных и оптимизации политик временной шкалы перемещения данных.

В организации сложная логика обычно разделяется на более простую логику нескольких процессов. Разумность DQ проверяет такую ​​сложную логику, приводящую к логическому результату в определенном диапазоне значений или статических взаимосвязях (агрегированные бизнес-правила), может быть проверено, чтобы обнаружить сложные, но важные бизнес-процессы и выбросы данных, их отклонение от BAU (обычный бизнес) ожидания, и могут предоставить возможные исключения, в конечном итоге приводящие к проблемам с данными. Эта проверка может быть простым общим правилом агрегации, охватываемым большим объемом данных, или может быть сложной логикой для группы атрибутов транзакции, относящейся к основному бизнесу организации. Эта проверка DQ требует высокого уровня деловых знаний и сообразительности. Обнаружение проблем разумности может помочь в изменении политики и стратегии со стороны бизнеса или управления данными, либо того и другого.

Соответствие чеки и проверки целостности не обязательно покрывать все потребности бизнеса, это строго зависит от архитектуры базы данных.

В перемещении данных есть много мест, где проверки DQ могут не потребоваться. Например, проверка DQ на полноту и точность ненулевых столбцов является избыточной для данных, полученных из базы данных. Точно так же данные должны быть проверены на их точность относительно времени, когда данные сшиваются из разрозненных источников. Однако это бизнес-правило, и оно не должно входить в сферу действия DQ.[нужна цитата ]

К сожалению, с точки зрения разработки программного обеспечения, DQ часто рассматривается как нефункциональное требование. И поэтому ключевые проверки / процессы качества данных не учитываются в окончательном программном решении. В сфере здравоохранения носимые технологии или Сети тела, генерировать большие объемы данных.[18] Уровень детализации, необходимый для обеспечения качества данных, чрезвычайно высок и часто недооценивается. Это также верно для подавляющего большинства mHealth Программы, Электронные записи и другие программные решения, связанные со здоровьем. Однако существуют некоторые инструменты с открытым исходным кодом, которые проверяют качество данных.[19] Основная причина этого заключается в дополнительных затратах и ​​добавлении более высокой степени строгости в архитектуре программного обеспечения.

Безопасность и конфиденциальность данных о здоровье

Использование мобильных устройств в сфере здравоохранения или мобильного здравоохранения создает новые проблемы для данные о здоровье безопасность и конфиденциальность, которые напрямую влияют на качество данных.[2] Мобильное здравоохранение становится все более важной стратегией оказания медицинских услуг в странах с низким и средним уровнем доходов.[20] Мобильные телефоны и планшеты используются для сбора, составления отчетов и анализа данных почти в реальном времени. Однако эти мобильные устройства обычно используются и для личных целей, что делает их более уязвимыми для угроз безопасности, которые могут привести к утечке данных. Без надлежащих мер безопасности такое использование в личных целях может поставить под угрозу качество, безопасность и конфиденциальность данные о здоровье.[21]

Качество данных в общественном здравоохранении

В последние годы качество данных стало основным направлением программ общественного здравоохранения, особенно в связи с ростом требований к подотчетности.[22] Работа по достижению амбициозных целей, связанных с борьбой с такими заболеваниями, как СПИД, туберкулез и малярия, должна основываться на сильных системах мониторинга и оценки, которые производят качественные данные, связанные с реализацией программ.[23] Эти программы и программные аудиторы все чаще ищут инструменты для стандартизации и оптимизации процесса определения качества данных,[24] проверять качество отчетных данных и оценивать базовые системы управления данными и отчетности для индикаторов.[25] Примером может служить Инструмент обзора качества данных ВОЗ и MEASURE Evaluation.[26] ВОЗ, Глобальный фонд, ГАВИ и MEASURE Evaluation совместно разработали согласованный подход к обеспечению качества данных по различным заболеваниям и программам.[27]

Качество открытых данных

Существует ряд научных работ, посвященных анализу качества данных в открытые данные источники, такие как Википедия, Викиданные, DBpedia и другие. В случае с Википедией анализ качества может относиться ко всей статье.[28] Моделирование качества там осуществляется различными методами. Некоторые из них используют сбор данных алгоритмы, в том числе Случайный лес[29] Машина опорных векторов[30] и другие. Методы оценки качества данных в Викиданных, DBpedia и др. LOD источники различаются.[31]

Профессиональные ассоциации

IQ International - Международная ассоциация по информации и качеству данных[32]
IQ International - это некоммерческая профессиональная ассоциация, не зависящая от поставщиков, созданная в 2004 году и занимающаяся развитием профессии в области качества информации и данных.

ECCMA (Ассоциация управления кодами электронной торговли)[33]

Ассоциация управления кодами электронной торговли (ECCMA) - это международная некоммерческая ассоциация, состоящая из членов, приверженная делу повышения качества данных за счет внедрения международных стандартов. ECCMA в настоящее время является руководителем проекта по разработке ISO 8000 и ISO 22745, которые являются международными стандартами качества данных и обмена основными данными материалов и услуг, соответственно.

ECCMA предоставляет платформу для сотрудничества между предметными экспертами по качеству данных и управлению данными по всему миру для создания и поддержки глобальных словарей открытых стандартов, которые используются для однозначной маркировки информации. Существование этих словарей этикеток позволяет передавать информацию от одной компьютерной системы к другой без потери смысла.

Смотрите также

использованная литература

  1. ^ Редман, Томас К. (30 декабря 2013 г.). На основе данных: получение прибыли от вашего самого важного бизнес-актива. Harvard Business Press. ISBN  978-1-4221-6364-1.
  2. ^ а б Фадахунси, Кайоде Филип; Акинлуа, Джеймс Тосин; О’Коннор, Шивон; Варк, Петра А; Галлахер, Джозеф; Кэрролл, Кристофер; Маджид, Азим; О’Донохью, Джон (март 2019 г.). «Протокол для систематического обзора и качественного синтеза структур качества информации в электронном здравоохранении». BMJ Open. 9 (3): e024722. Дои:10.1136 / bmjopen-2018-024722. ISSN  2044-6055. ЧВК  6429947. PMID  30842114.
  3. ^ Смоллвуд, Р.Ф. (2014). Информационное управление: концепции, стратегии и передовой опыт. Джон Уайли и сыновья. п. 110. ISBN  9781118218303. В архиве из оригинала на 30.07.2020. Получено 2020-04-18. Наличие стандартизированной программы управления данными означает очистку поврежденных или дублированных данных и предоставление пользователям чистых и точных данных в качестве основы для бизнес-приложений и аналитики поддержки принятия решений в приложениях бизнес-аналитики (BI).
  4. ^ а б c d е Фюрбер, К. (2015). «3. Качество данных». Управление качеством данных с помощью семантических технологий. Springer. С. 20–55. ISBN  9783658122249. В архиве из оригинала 31 июля 2020 г.. Получено 18 апреля 2020.
  5. ^ а б Herzog, T.N .; Scheuren, F.J .; Винклер, W.E. (2007). «Глава 2: Что такое качество данных и почему нам это нужно?». Качество данных и методы связывания записей. Springer Science & Business Media. С. 7–15. ISBN  9780387695020. В архиве из оригинала 31 июля 2020 г.. Получено 18 апреля 2020.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  6. ^ а б Fleckenstein, M .; Стипендиаты, Л. (2018). «Глава 11: Качество данных». Современная стратегия обработки данных. Springer. С. 101–120. ISBN  9783319689920. В архиве из оригинала 31 июля 2020 г.. Получено 18 апреля 2020.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  7. ^ а б Маханти, Р. (2019). «Глава 1: Данные, качество данных и цена низкого качества данных». Качество данных: измерения, измерение, стратегия, управление и руководство. Качественная пресса. С. 5–6. ISBN  9780873899772. В архиве из оригинала 23 ноября 2020 г.. Получено 18 апреля 2020.
  8. ^ Международная организация по стандартизации (сентябрь 2015 г.). «ISO 9000: 2015 (en) Системы менеджмента качества - Основы и словарь». Международная организация по стандартизации. В архиве из оригинала 19 мая 2020 г.. Получено 18 апреля 2020.
  9. ^ Открытая рабочая группа NIST по большим данным, Подгруппа по определениям и таксономии (октябрь 2019 г.). «Структура взаимодействия больших данных NIST: Том 4, Безопасность и конфиденциальность» (PDF). Специальная публикация NIST 1500-4r2 (3-е изд.). Национальный институт стандартов и технологий. Дои:10.6028 / NIST.SP.1500-4r2. В архиве (PDF) из оригинала 9 мая 2020 г.. Получено 18 апреля 2020. Под действительностью понимается полезность, точность и правильность данных для их применения. Традиционно это называется качеством данных.
  10. ^ «Ответственность и кредитное плечо - аргументы в пользу качества данных». Управление информацией. Август 2006 г. В архиве из оригинала 27.01.2011. Получено 2010-06-25.
  11. ^ "Управление адресами для почтовых отправлений и розничной торговли". Журнал "Направления". Архивировано из оригинал на 2005-04-28. Получено 2010-06-25.
  12. ^ "USPS | PostalPro" (PDF). В архиве (PDF) из оригинала от 15.02.2010. Получено 2010-06-25.
  13. ^ Э. Карри, А. Фрейтас и С. О'Риайн, «Роль управления данными для предприятий», В архиве 2012-01-23 в Wayback Machine в Связывание корпоративных данных, Д. Вуд, Под ред. Бостон, Массачусетс: Springer US, 2010, стр. 25-47.
  14. ^ «ISO / TS 8000-1: 2011 Качество данных - Часть 1: Обзор». Международная организация по стандартизации. В архиве из оригинала 21 декабря 2016 г.. Получено 8 декабря 2016.
  15. ^ "Можете ли вы доверять качеству ваших данных?". spotlessdata.com. Архивировано из оригинал на 2017-02-11.
  16. ^ «Что такое очистка данных? - Качество данных Experian». 13 февраля 2015. В архиве из оригинала 11 февраля 2017 г.. Получено 9 февраля 2017.
  17. ^ «Лекция 23: Учебное пособие по концепциям качества данных - хранилище данных». Посмотреть бесплатное обучающее видео онлайн. Получено 8 декабря 2016.
  18. ^ О'Донохью, Джон и Джон Герберт. «Управление данными в средах мобильного здравоохранения: датчики пациента, мобильные устройства и базы данных». Журнал качества данных и информации (JDIQ) 4.1 (2012): 5.
  19. ^ Хузер, Войтех; ДеФалко, Фрэнк Дж; Schuemie, Martijn; Райан, Патрик Б. Шан, Нин; Велес, Марк; Пак, Рэй Вун; Бойс, Ричард Д; Герцог, Джон; Кхаре, Риту; Утиджян, Левон; Бейли, Чарльз (30 ноября 2016 г.). «Многоузловая оценка инструмента качества данных для наборов клинических данных на уровне пациента». eGEMs. 4 (1): 24. Дои:10.13063/2327-9214.1239. ЧВК  5226382. PMID  28154833.
  20. ^ MEASURE Оценка. (2017) Повышение качества данных в мобильных информационных системах здравоохранения на базе сообществ: Руководство по разработке и внедрению (тр-17-182). Чапел-Хилл, Северная Каролина: оценка MEASURE, Университет Северной Каролины. Полученное из https://www.measureevaluation.org/resources/publications/tr-17-182 В архиве 2017-08-08 в Wayback Machine
  21. ^ Вамбугу С. и Виллелла К. (2016). Мобильное здравоохранение для информационных систем здравоохранения в странах с низким и средним уровнем доходов: проблемы и возможности в области качества данных, конфиденциальности и безопасности (ТР-16-140). Чапел-Хилл, Северная Каролина: оценка MEASURE, Университет Северной Каролины. Полученное из https://www.measureevaluation.org/resources/publications/tr-16-140 В архиве 2017-08-08 в Wayback Machine
  22. ^ ИЗМЕРЕНИЕ Оценка. (2016) Качество данных для систем мониторинга и оценки (fs-16-170). Чапел-Хилл, Северная Каролина: оценка MEASURE, Университет Северной Каролины. Полученное из https://www.measureevaluation.org/resources/publications/fs-16-170-en В архиве 2017-08-08 в Wayback Machine
  23. ^ MEASURE Оценка. (2016). Регулярные информационные системы здравоохранения: учебная программа по основным концепциям и практике - Syllabus (sr-16-135a). Чапел-Хилл, Северная Каролина: оценка MEASURE, Университет Северной Каролины. Полученное из https://www.measureevaluation.org/resources/publications/sr-16-135a В архиве 2017-08-08 в Wayback Machine
  24. ^ «Инструменты обеспечения качества данных». ИЗМЕРЕНИЕ Оценка. В архиве с оригинала 8 августа 2017 г.. Получено 8 августа 2017.
  25. ^ «Модуль 4: Качество данных RHIS». ИЗМЕРЕНИЕ Оценка. В архиве с оригинала 8 августа 2017 г.. Получено 8 августа 2017.
  26. ^ ИЗМЕРЕНИЕ Оценка. "Качество данных". ИЗМЕРЕНИЕ Оценка. В архиве с оригинала 8 августа 2017 г.. Получено 8 августа 2017.
  27. ^ Всемирная организация здравоохранения (ВОЗ). (2009). Мониторинг и оценка укрепления систем здравоохранения. Женева, Швейцария: ВОЗ. Полученное из http://www.who.int/healthinfo/HSS_MandE_framework_Nov_2009.pdf В архиве 2017-08-28 в Wayback Machine
  28. ^ Месгари, Мостафа; Читу, околи; Мехди, Мохамад; Финн Оруп, Нильсен; Ланамяки, Арто (2015). ""Сумма всех человеческих знаний ": систематический обзор научных исследований содержания Википедии" (PDF). Журнал Ассоциации информационных наук и технологий. 66 (2): 219–245. Дои:10.1002 / asi.23172. S2CID  218071987. В архиве (PDF) из оригинала 2020-05-10. Получено 2020-01-21.
  29. ^ Варнке-Ван, Мортен; Косли, Дэн; Ридл, Джон (2013). Расскажите подробнее: действенная модель качества для Википедии. WikiSym '13 Материалы 9-го Международного симпозиума по открытому сотрудничеству. Дои:10.1145/2491055.2491063. ISBN  9781450318525. S2CID  18523960.
  30. ^ Хасан Далип, Даниэль; Андре Гонсалвеш, Маркос; Кристо, Марко; Каладо, Павел (2009). «Автоматическая оценка качества контента, созданного совместно веб-сообществами». Материалы совместной международной конференции по электронным библиотекам - JCDL '09 2009 г.. п. 295. Дои:10.1145/1555400.1555449. ISBN  9781605583228. S2CID  14421291.
  31. ^ Фарбер, Майкл; Барчерер, Фредерик; Менне, Карстен; Реттингер, Ахим (30 ноября 2017 г.). «Качество связанных данных DBpedia, Freebase, OpenCyc, Wikidata и YAGO». Семантическая сеть. 9 (1): 77–129. Дои:10.3233 / SW-170275. В архиве из оригинала от 22.01.2018.
  32. ^ «IQ International - Международная ассоциация по информации и качеству данных». Сайт IQ International. В архиве с оригинала на 2017-05-10. Получено 2016-08-05.
  33. ^ "Главная". ECCMA. В архиве из оригинала на 2018-08-19. Получено 2018-10-03.

дальнейшее чтение

  • Башкарада, S; Корониос, А (2014). «Система критических факторов успеха для управления качеством информации». Управление информационными системами. 31 (4): 1–20. Дои:10.1080/10580530.2014.958023. S2CID  33018618.
  • Бааманн, Катарина, "Аспекты качества данных при обеспечении доходов", Статья
  • Экерсон, В. (2002) "Специальный отчет по хранилищам данных: качество данных и итоги", Статья
  • Иванов, К. (1972) «Контроль качества информации: О концепции достоверности информации в банках данных и в информационных системах управления». Стокгольмский университет и Королевский технологический институт. Докторская диссертация.
  • Хансен, М. (1991) Данные об отсутствии дефектов, Массачусетский технологический институт. Дипломная работа [1]
  • Кан, Б., Стронг, Д., Ван, Р. (2002) «Контрольные показатели качества информации: производительность продуктов и услуг», Коммуникации ACM, апрель 2002 г., стр. 184–192. Статья
  • Прайс Р. и Шанкс Г. (2004) Семиотическая структура качества информации, Proc. Международная конференция IFIP по системам поддержки принятия решений (DSS2004): Поддержка принятия решений в неопределенном и сложном мире, Прато. Статья
  • Редман, Т. К. (2008) На основе данных: получение прибыли от наших самых важных бизнес-активов
  • Wand, Y. и Wang, R. (1996) "Закрепление параметров качества данных в онтологических основаниях", Сообщения ACM, ноябрь 1996 г., стр. 86–95. Статья
  • Ван, Р., Кон, Х. и Мадник, С. (1993), Анализ и моделирование требований к качеству данных, Девятая международная конференция по разработке данных, Вена, Австрия. Статья
  • Фурнель Мишель, Accroitre la qualité et la valeur des données de vos customers, éditions Publibook, 2007. ISBN  978-2-7483-3847-8.
  • Даниэль Ф., Касати Ф., Палпанас Т., Чайка О., Каппиелло К. (2008) «Обеспечение принятия лучших решений с помощью отчетов о качестве», Международная конференция по качеству информации (ICIQ), Массачусетский технологический институт. Статья
  • Джек Э. Олсон (2003 г.), «Качество данных: измерение точности», издательство Morgan Kaufmann Publishers
  • Вудалл П., Оберхофер М. и Борек А. (2014), «Классификация методов оценки и улучшения качества данных». Международный журнал качества информации 3 (4), 298–321. DOI: 10.1504 / ijiq.2014.068656.
  • Вудалл П., Борек А. и Парликад А. (2013), «Оценка качества данных: гибридный подход». Информация и управление 50 (7), 369–382.

внешние ссылки