Этика больших данных - Big data ethics
Эта статья написано как личное размышление, личное эссе или аргументированное эссе который излагает личные чувства редактора Википедии или представляет оригинальный аргумент по теме.Декабрь 2019 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
Этика больших данных также известный как просто этика данных относится к систематизации, защите и рекомендациям концепций правильного и неправильного поведения в отношении данные, особенно личные данные.[1] С самого начала Интернет количество и качество данных резко возросло и продолжает расти в геометрической прогрессии. Большое количество данных описывает этот большой объем данных, который настолько объемен и сложен, что традиционное прикладное программное обеспечение для обработки данных не может справиться с ними. Недавние инновации в области медицинских исследований и здравоохранения, такие как высокопроизводительное секвенирование генома, визуализация с высоким разрешением, электронные медицинские карты пациентов и множество подключенных к Интернету медицинских устройств, вызвали поток данных который в ближайшем будущем достигнет эксабайтного диапазона. Этика данных приобретает все большее значение по мере увеличения количества данных из-за масштаба воздействия.
Этика больших данных отличается от информационная этика потому что в центре внимания информационной этики больше внимания интеллектуальная собственность и проблемы, касающиеся библиотекарей, архивистов и специалистов в области информации, в то время как этика больших данных больше касается сборщиков и распространителей структурированный или же неструктурированные данные Такие как брокеры данных, правительства и крупные корпорации.
Принципы
Этика данных связана со следующими принципами:[оригинальное исследование? ]
- Владение - Физические лица владеют собственными данными.
- Прозрачность транзакции - Если используются личные данные отдельных лиц, они должны иметь прозрачный доступ к дизайну алгоритма, используемому для генерации совокупных наборов данных.
- Согласие - Если физическое или юридическое лицо желает использовать персональные данные, необходимо информированное и четко выраженное согласие владельца данных на то, какие персональные данные кому, когда и с какой целью передаются.
- Конфиденциальность - Если транзакции с данными происходят, необходимо приложить все разумные усилия для сохранения конфиденциальности.
- Валюта - Физические лица должны знать о финансовых транзакциях, связанных с использованием их личных данных, и о масштабах этих транзакций.
- Открытость - Наборы агрегированных данных должны быть в свободном доступе
Владение
Кому принадлежат данные? Право собственности включает определение прав и обязанностей в отношении собственности. Концепция владения данными связана со способностью человека контролировать и ограничивать совместное использование собственных данных. Если один человек записывает свои наблюдения за другим человеком, которому принадлежат эти наблюдения? Наблюдатель или наблюдаемый? Какие обязанности наблюдателя и наблюдаемого несут по отношению друг к другу? В связи с массовым масштабом и систематизацией наблюдений за людьми и их мыслями в результате Интернета, эти вопросы становятся все более важными для решения. Рабство, собственность человека, объявлено вне закона во всех признанных странах. Вопрос о праве собственности на персональные данные находится на неизвестной территории между корпоративной собственностью, интеллектуальной собственностью и рабством. Кому принадлежит цифровая идентичность ?
Европейские законы, Общие правила защиты данных, указывают на то, что отдельные лица владеют своими личными данными. [2]
Персональные данные - это наборы данных, описывающие человека, начиная от физических характеристик и заканчивая их предпочтениями и поведением. Примеры личных данных включают: данные генома, Местоположение по GPS, письменное общение, устное общение, списки контактов, привычки просмотра интернета, финансовые транзакции, расходы супермаркетов, налоговые платежи, судимость, запись объектива камеры ноутбука и мобильного телефона, записи микрофона устройства, привычки вождения через автомобильные трекеры, мобильные и медицинские записи, фитнес-активность, питание, употребление психоактивных веществ, сердцебиение, режим сна и другие жизненно важные показатели. Совокупность личных данных одного человека формирует цифровую идентичность (или, возможно, более подходящим является цифровое альтер-эго). Цифровая идентичность включает в себя все наши личные данные, которые скрывают, представляют и связаны с нашим физическим и идеологическим «я». Различие между категориями данных не всегда четко очерчено. Например, данные о здоровье и банковские данные взаимосвязаны, потому что о поведении и образе жизни можно судить по банковским данным, и они имеют огромное значение для прогнозирования риска хронических заболеваний. Следовательно, банковские данные - это также данные о здоровье. Данные о здоровье могут указывать на то, сколько человек тратит на здравоохранение, поэтому данные о здоровье также являются банковскими данными. Эти совпадения существуют и между другими категориями данных, например, данные о местоположении, данные о просмотре веб-страниц, налоговые данные, по сути, все касаются физических лиц.
Защита личных неимущественных прав человека основана на представлении о том, что личные данные являются прямым выражением личности человека: личные неимущественные права, следовательно, являются личными для человека и не могут быть переданы другому лицу, кроме как по завещанию в случае его смерти. . Моральные права включают право быть указанным в качестве источника данных и право возражать против любого искажения или искажения данных, которое может нанести ущерб его или ее чести или репутации. Эти моральные права на личные данные бессрочные.
Ключевым компонентом владения персональными данными является уникальный и контролируемый доступ, то есть эксклюзивность. Право собственности подразумевает исключительность, особенно в отношении абстрактных концепций, таких как идеи или точки данных. Недостаточно просто иметь копию собственных данных. Другим следует ограничить доступ к тому, что им не принадлежит. Знать, какие данные хранят другие, практически невозможно. Более простой подход - скрыть себя бессмысленной информацией. Чтобы гарантировать, что корпорации или учреждения не имеют копии, можно посылать шум, чтобы запутать данные, которые у них есть. Например, робот может случайным образом искать термины, которые обычно используются, что делает данные, полученные поисковой системой, бесполезными из-за путаницы (см. «Track Me Not» New York University).
Право собственности делает упор на возможность удобно перемещать данные из одной службы в другую, т. Е. Переносимость. Когда личные данные принадлежат человеку, у него есть возможность просто удалить их и перенести на другой сайт, если он недоволен службой. Отдельным лицам должна быть предложена высокая степень удобной переносимости, позволяющая переключаться на альтернативы без потери архивных данных, описывающих предпочтения продуктов и личные разговоры. Например, можно выбрать переключение на альтернативное приложение для обмена сообщениями, и это должно быть возможно без потери записей предыдущих разговоров и контактов. Предоставление людям возможности переключать сервисы без неудобств, связанных с потерей исторических данных, означает, что сервисы должны удовлетворять клиентов, предоставляя качественные услуги, а не блокируя их из-за несовместимости с альтернативами.
Для переносимости выражение данных должно быть стандартизировано таким образом, чтобы это могло происходить без проблем. Например, если описать единицу измерения как «килограммы», а не «кг», это означает, что роботы распознают их как разные, хотя они одинаковы. Эти небольшие вариации могут привести к беспорядочным данным, которые нельзя легко объединить или перенести в новую систему, которая не сможет их распознать. В настоящее время Apple заявляет, что они предоставляют услуги конфиденциальности, однако извлекать данные из систем Apple сложно, что затрудняет переход на альтернативу. В рамках торговли персональными данными выражение данных будет стандартизировано для облегчения переноса одним нажатием кнопки. Стандартизация также упростит создание механизмов очистки данных, необходимых для установки сдержек и противовесов, подтверждающих качество данных. Объединив несколько источников, можно будет идентифицировать ошибочные или неверно введенные данные.
Кому принадлежат данные сегодня? Сегодня данные находятся под контролем и, следовательно, принадлежат владельцу датчиков. Человек, производящий запись, или объект, владеющий датчиком, по умолчанию контролирует, что происходит с этими данными. Например, банки контролируют банковские данные, исследователи контролируют данные исследований, а больницы контролируют данные медицинских карт. По историческим причинам текущий сценарий таков, что исследовательские институты хранят данные о фрагменте данных, описывающих часть человека. Данные медицинских исследований в Европе существуют фрагментарно и контролируются различными учреждениями. Категории данных часто больше описывают, кто контролирует эти данные и где они хранятся, чем то, что данные описывают или приложение, к которому они могут быть применены. Хотя Интернет никому не принадлежит, корпорации стали контролировать большую часть личных данных, создавая ценность, используя сбор данных, поисковые системы и средства связи.[3] По умолчанию в качестве побочного эффекта владения интеллектуальной собственностью, составляющей инструменты Интернета, эти корпорации собирают наши цифровые идентификаторы в качестве сырья для услуг, предоставляемых другим компаниям с прибылью. Большая часть данных, собранных через Интернет-сервисы, - это личные данные, описывающие людей. Традиционно медицина собирает данные вокруг человека, потому что это позволяет понять здоровье. При изучении эпидемиологии данные групп по-прежнему организованы вокруг человека. Многие из процессов, которые становятся более эффективными, касаются индивидуальной и групповой динамики. Однако данные не обязательно организованы вокруг человека, скорее, данные контролируются владельцем датчиков.
В Китае данные в основном принадлежат правительству. В одной китайской провинции данные использовались для расчета социального индекса на человека, основанного на индивидуальном поведении в сети и офлайн, таком как прогулка по улице и количество туалетной бумаги, используемой в общественном туалете. Социальный индекс определяет доступ к определенным государственным услугам.
Прозрачность транзакции
Высказывались опасения по поводу того, как предубеждения могут быть интегрированы в разработку алгоритмов, что приведет к систематическому подавлению.[4] Дизайн алгоритма должен быть прозрачно раскрыт. Следует приложить все разумные усилия для учета различий между людьми и группами, не упуская из виду равенство. Дизайн алгоритма должен быть инклюзивным.
С точки зрения управления, этика больших данных касается того, какие типы выводов и прогнозов следует делать с использованием технологий больших данных, таких как алгоритмы.[5]
Опережающее управление - это практика использования прогнозная аналитика чтобы оценить возможное поведение в будущем.[6] Это имеет этические последствия, поскольку дает возможность ориентироваться на определенные группы и места, которые могут способствовать предубеждениям и дискриминации.[6] Например, предсказательная полицейская деятельность выделяет определенные группы или районы, за которыми следует наблюдать более пристально, чем за другими, что ведет к усилению санкций в этих областях и более тщательному надзору за теми, кто соответствует тем же характеристикам, что и те, к которым применяются санкции.[3]
Термин «контрольная ползучесть» относится к данным, которые были созданы с определенной целью, но которые были перепрофилированы.[6] Подобная практика прослеживается с данными авиационной отрасли, которые были перепрофилированы для профилирования и управления рисками безопасности в аэропортах.[6]
Что касается персональных данных, физическое лицо имеет право знать:
- Зачем собираются данные?
- Как это будет использоваться?
- Как долго он будет храниться?
- Как это может быть исправлено заинтересованным лицом?
Примеры этичного использования транзакций данных включают:
- Установленные законом цели: весь сбор и использование личных данных государством должны быть полностью прозрачными и подпадать под формальную лицензию, согласованную до начала сбора данных. В этом гражданско-правовом договоре между физическим лицом и ответственными органами излагаются условия, на которых физическое лицо выдает разрешение на использование своих данных ответственным органам в соответствии с вышеуказанными принципами прозрачности.
- Социальные цели: любое использование личных данных в социальных целях должно быть разрешено, а не отказано. Они должны соответствовать принципам прозрачности.
- Преступление: для предотвращения преступности необходимо разработать и широко опубликовать четкий набор общих принципов сбора и использования личных данных. Руководящий орган государства должен рассмотреть и одобрить эти принципы.
- Торговля: Персональные данные, используемые в коммерческих целях, принадлежат физическому лицу и не могут использоваться без лицензии от лица, в которой указаны все разрешенные виды использования. Сюда входят данные, собранные со всех веб-сайтов, посещения страниц, переходы с сайта на сайт и другие действия в Интернете. Физические лица имеют право решать, как, где и должны ли их личные данные использоваться в коммерческих целях, в зависимости от конкретного случая или категории.
- Исследование: личные данные, используемые для исследовательских целей, принадлежат физическому лицу и должны быть лицензированы пользователем в соответствии с условиями формы личного согласия, которая соответствует всем принципам прозрачности, изложенным выше.
- Внеправовые цели: Персональные данные могут использоваться только в незаконных целях с явного предварительного согласия правообладателя.
Согласие
Если физическое или юридическое лицо желает использовать персональные данные, необходимо информированное и четко выраженное согласие на то, какие персональные данные кому, когда и с какой целью передаются от субъекта данных. Субъект информации имеет право знать, как были использованы его данные.
Транзакцию данных нельзя использовать в качестве козырной карты для несвязанного или лишнего вопроса согласия, например, для улучшения маркетинговых рекомендаций при попытке связаться с родственником. Хотя существуют службы, в которых требуется совместное использование данных, эти транзакции не следует преувеличивать, и их следует проводить в контексте. Например, человеку необходимо поделиться данными, чтобы получить адекватные медицинские рекомендации, однако эти медицинские данные не должны автоматически передаваться в медицинская страховка провайдер. В конечном итоге решение в отношении своих данных ложится на человека. Это отдельные транзакции данных, которые следует рассматривать как таковые. Подразумеваемое согласие на передачу права собственности на данные из-за использования приложения чата не считается действительным.
Полный объем и масштабы транзакции должны быть подробно описаны лицу, которому должна быть предоставлена разумная возможность участвовать в процессе оценки того, хотят ли они участвовать. Время имеет решающее значение. то есть ... этими проблемами следует заниматься в спокойный момент и время для размышлений, а не в момент срочной покупки или возникновения неотложной медицинской помощи.
Разрешение должно быть дано в явном, а не подразумеваемом формате. Тот факт, что приложение было выбрано для чата, не означает, что необходим доступ к списку контактов. Кнопка, на которую нажимают, чтобы дать разрешение, не должна быть спроектирована таким образом, чтобы было задействовано автоматическое поведение. Например, в двоичных вариантах, если одна кнопка меньше другой, или если одна кнопка скрыта в дизайне и другая выскакивает, или если одна кнопка требует нескольких нажатий, тогда как другая - одного нажатия.
В то время как человек может дать согласие по общей теме, чтобы быть непрерывным, всегда должна быть возможность отозвать это разрешение для будущих транзакций. Аналогичным образом, для согласия на сексуальную активность отозвать согласие на передачу данных в прошлом невозможно. Например, физическое лицо может дать согласие на использование своих личных данных для любой цели, продвигающей лечение сердечно-сосудистых заболеваний до дальнейшего уведомления. Пока человек не передумает, эти транзакции могут продолжаться беспрепятственно без участия человека.
Динамическое согласие в контексте здравоохранения и геномных исследований может быть более подходящим подходом к согласию, чем разовое или широкое информированное согласие, с точки зрения вопросов, изложенных выше.
Конфиденциальность
Если транзакции с данными происходят, необходимо приложить все разумные усилия для сохранения конфиденциальности.
«Никто не должен подвергаться произвольному вмешательству в его частную жизнь, семью, жилище или корреспонденцию, а также посягательствам на его честь и репутацию. Каждый имеет право на защиту закона от такого вмешательства или посягательств». - Декларация прав человека Организации Объединенных Наций, статья 12.
Почему важна конфиденциальность? Данные полезны для повышения эффективности систем; однако определение конечной цели этой эффективности важно для оценки этичности использования данных.
Использование государственного мониторинга данных для наблюдения за гражданами требует явного разрешения в соответствующем судебном процессе. Возможно, было бы даже эффективнее наблюдать за относительно небольшим количеством преступников вручную, чем отслеживать относительно большое количество преступников. Сплошное наблюдение за жителями со стороны национальных правительств и корпораций - это скользкий путь к оруэлловскому стилю управления. Конфиденциальность - это не о сохранении секретов, это о выборе, правах человека, свободе и свободе. Например, обмен медицинскими данными с врачом при том понимании, что они будут использоваться для улучшения здоровья, является этически обоснованным, даже если врач раскрывает эти данные другому врачу. Однако, когда те же данные передаются маркетинговому агентству, как это только что произошло с британской национальной системой здравоохранения и компанией Google DeepMind, занимающейся искусственным интеллектом, этические последствия становятся еще более неопределенными (Google DeepMind и здравоохранение в эпоху алгоритмов Джулии Поулз и Хэла Ходсона) . Конфиденциальность - это выбор контекста; какие данные передаются, с кем, с какой целью и когда. Конфиденциальность в настоящее время не применяется, возможно, потому, что личная власть и выгода от невыполнения этого действия действуют как сдерживающий фактор как для частных компаний, так и для правительств. Кроме того, использование данных для измерения фактического социального воздействия может выявить неэффективность, которая будет неудобна для вовлеченных политиков или заявлений компаний.
Публичные дебаты о конфиденциальности часто незаслуженно затушевываются чрезмерно упрощенным бинарным выбором между конфиденциальностью и научным прогрессом. Маркетинговые кампании даже отвергли критику централизованного сбора данных как сопротивление прогрессу и приверженность прошлому. Однако выгоды от научного прогресса с помощью данных могут быть достигнуты в соответствии с ценностями конфиденциальности, как это исторически происходило в эпидемиологических исследованиях. Извлечение ценности из данных без нарушения конфиденциальности личных данных, безусловно, возможно технологически; например, за счет использования гомоморфного шифрования и алгоритмического проектирования, что затрудняет обратное проектирование.
Гомоморфное шифрование позволяет объединять различные службы в цепочку, не раскрывая данные каждой из служб. Даже инженеры-программисты, работающие над программным обеспечением, не смогут обойти пользователя. Схемы гомоморфного шифрования пластичны по конструкции, что означает, что их можно использовать в среде облачных вычислений, обеспечивая при этом конфиденциальность обрабатываемых данных. Этот метод позволяет проводить аналитические вычисления с зашифрованным текстом, таким образом, генерируя зашифрованные результаты, которые при расшифровке совпадают с результатами операций, выполняемых в виде обычного текста.
Результаты аналитики могут быть представлены таким образом, чтобы соответствовать цели без ущерба для конфиденциальности личных данных. Например, продажа данных, в которой говорится, что «20% жителей Амстердама ест мюсли на завтрак», будет передавать аналитическую ценность данных без ущерба для конфиденциальности, в то время как утверждение, что «Ана ест мюсли на завтрак» не сохранит конфиденциальность. Алгоритмический дизайн и размер выборочной группы имеют решающее значение для минимизации возможностей обратного проектирования статистики и отслеживания целевых лиц. Одним из технических решений обратного проектирования агрегированных показателей является введение фальшивых данных о вымышленных людях, которые не изменяют конечный результат, например процент группы, которая ест мюсли.
Конфиденциальность была представлена как ограничение на использование данных, что также может считаться неэтичным.[7] Например, обмен медицинскими данными может пролить свет на причины заболеваний, влияние лечения и может позволить проводить индивидуальный анализ, основанный на потребностях людей.[7] Это имеет этическое значение в области этики больших данных, потому что, хотя многие ценят конфиденциальность, возможность обмена данными также весьма ценна, хотя может противоречить концепции конфиденциальности. Отношение к обмену данными может быть основано на ощущении потери контроля над данными и опасении использования личных данных.[7] Однако можно извлечь ценность данных без ущерба для конфиденциальности.
Некоторые ученые, такие как Джонатан Х. Кинг и Нил М. Ричардс, пересматривают традиционное значение приватности, а другие задаются вопросом, существует ли приватность до сих пор.[5] В статье 2014 г. Обзор закона Wake Forest, Кинг и Ричард утверждают, что конфиденциальность в цифровую эпоху можно понимать не с точки зрения секретности, а с точки зрения правил, регулирующих и контролирующих использование личной информации.[5] В Европейском Союзе право на забвение дает странам ЕС право принудительно удалять или отключать личные данные из баз данных по запросу отдельного лица, если информация считается неактуальной или устаревшей.[8] По словам Эндрю Хоскинса, этот закон демонстрирует моральную панику членов ЕС по поводу предполагаемой потери конфиденциальности и способности управлять личными данными в эпоху цифровых технологий.[9] В США граждане имеют право удалять добровольно предоставленные данные.[8] Это сильно отличается от права на забвение, поскольку большая часть данных, полученных с использованием технологий и платформ больших данных, не предоставляется добровольно.[8]
Валюта
Бизнес-модели, управляющие технологическими гигантами, открыли возможность сделать человеческую идентичность продуктом, который нужно потреблять. Хотя технические услуги, включая поисковые системы, каналы связи и карты, предоставляются бесплатно, новая валюта, которая была обнаружена в процессе, - это личные данные.
Существуют разные мнения о том, этично ли получать деньги в обмен на доступ к личным данным. Были проведены параллели между сдачей крови, когда процент сдачи инфекционной крови снижается, когда нет финансовых транзакций для донора крови. Возникают дополнительные вопросы относительно того, кто должен получать прибыль от транзакции данных?
Сколько стоят данные?
Каков курс обмена личных данных на деньги? Данные ценны, потому что они позволяют пользователям действовать более эффективно, чем когда они предполагают или действуют методом проб и ошибок. Есть два элемента данных, которые имеют ценность: тенденции и данные в реальном времени. Сбор исторических данных позволяет нам делать прогнозы на будущее на основе тенденций. Данные в реальном времени имеют ценность, потому что действия могут выполняться мгновенно.
Сколько на самом деле стоят такие технические услуги, как поисковая система, канал связи и цифровая карта, например, в долларах? Разница в стоимости услуг, предоставляемых технологическими компаниями, и стоимости капитала этих технологических компаний - это разница в обменном курсе, предлагаемом гражданам, и «рыночном курсе» стоимости их данных. С научной точки зрения, в этом элементарном расчете есть много дыр: финансовые показатели компаний, уклоняющихся от уплаты налогов, ненадежны, будет ли доход или прибыль более подходящими, как определяется пользователь, требуется большое количество людей для того, чтобы данные были ценно, была бы многоуровневая цена для разных людей в разных странах, не все доходы Google поступают от Gmail и т. д. Хотя эти расчеты, несомненно, грубые, они помогают сделать денежную ценность данных более ощутимой. Другой подход - найти ставки торговли данными на черном рынке. RSA ежегодно публикует список покупок по кибербезопасности, в котором используется этот подход.[10]Приведенные примеры охватывают только конкретные случаи, но если мы распространим прибыль от продаж данных на другие области, такие как здравоохранение, ежемесячная прибыль на человека увеличится.
Это поднимает экономический вопрос о том, являются ли бесплатные технические услуги в обмен на личные данные целесообразным неявным обменом для потребителя. В модели торговли личными данными владелец может продавать свои личные данные и удерживать прибыль, а не компании, продающие данные.[11] Торговля личными данными - это структура, которая дает людям возможность владеть своей цифровой идентификацией и заключать отдельные соглашения о совместном использовании данных через Интернет. В отличие от нынешней модели, допускающей, чтобы компании продавали личные данные с целью получения прибыли, при торговле личными данными люди будут продавать свои личные данные известным сторонам по своему выбору и сохранять прибыль. По сути, это попытка повторно децентрализовать Интернет. В отличие от нынешней модели, допускающей, чтобы компании продавали личные данные с целью получения прибыли, при торговле личными данными отдельные люди будут напрямую владеть и сознательно продавать свои личные данные известным сторонам по своему выбору, сохраняя при этом прибыль. Торговля личными данными добавляет четвертый механизм распределения богатства, остальные три - это заработная плата через рабочие места, владение собственностью и владение компанией. Конечными целями модели торговли персональными данными являются: более справедливое глобальное распределение ресурсов и более сбалансированное голосование при распределении глобальных ресурсов. Торговля личными данными отдельными лицами в предлагаемой системе приведет к распределению прибыли среди населения, но также может иметь радикальные последствия для структур власти в обществе. В настоящее время широко признано, что нынешний централизованный дизайн данных усугубляет идеологические эхо-камеры и имеет далеко идущие последствия для, казалось бы, несвязанных процессов принятия решений, таких как выборы. Скорость обмена данными не только денежная, но и идеологическая. Должны ли институциональные процессы компрометироваться централизованным использованием средств коммуникации на основе свободно собираемых личных данных?
Хотя изначально можно предположить, что данные будут продаваться за деньги, можно представить будущее, в котором данные будут продаваться за данные. Сценарий «Я покажу вам ваш, если вы покажете мою шахту» может полностью заменить деньги. Важно отметить, что это будущий сценарий, и первый шаг - сосредоточиться на обмене личными данными в существующей денежной валюте.
Открытость
Идея открытых данных основана на аргументе о том, что данные должны быть в свободном доступе и не должны иметь ограничений, запрещающих их использование, таких как законы об авторском праве. По состоянию на 2014 г.[Обновить] многие правительства начали переходить к публикации открытых наборов данных в целях прозрачности и подотчетности.[12] Это движение получило поддержку благодаря «активистам открытых данных», которые призвали правительства сделать доступными наборы данных, чтобы позволить гражданам самим извлекать смысл из данных и самостоятельно выполнять проверки и противовесы.[12][5] Кинг и Ричардс утверждали, что этот призыв к прозрачности включает противоречие между открытостью и секретностью.[5]
Активисты и ученые также утверждали, что, поскольку эта модель оценки данных с открытым исходным кодом основана на добровольном участии, доступность открытых наборов данных оказывает демократизирующее влияние на общество, позволяя участвовать любому гражданину.[13] Некоторым доступность определенных типов данных рассматривается как право и важная часть деятельности гражданина.[13]
Фонд открытых знаний (OKF) перечисляет несколько типов наборов данных, которые должны быть предоставлены правительствами, чтобы они действительно были открытыми.[14] У OFK есть инструмент под названием Global Open Data Index (GODI), который представляет собой краудсорсинговое исследование для измерения открытости правительств,[14] согласно Открытое определение. Цель GODI - предоставить правительствам инструмент для предоставления важной обратной связи о качестве их открытых наборов данных.[15]
Готовность поделиться данными варьируется от человека к человеку. Были проведены предварительные исследования факторов, определяющих готовность делиться данными. Например, некоторые предположили, что бэби-бумеры менее охотно делятся данными, чем миллениалы.[16]
Персональные данные детей
Родители или опекуны несовершеннолетних несут ответственность за данные своих детей. Хотя родители или опекуны несовершеннолетних младше 18 лет несут ответственность за данные детей, они не могут использовать данные своего ребенка в обмен на деньги. Скорее, транзакциями с данными могут быть только пожертвования, что открывает возможность использования данных детей в таких контекстах, как общественное здравоохранение и образование.
Роль институтов
Национальные государства
Под суверенитетом данных понимается контроль правительства над данными, которые создаются и собираются в стране.[17] Проблема суверенитета данных обострилась, когда Эдвард Сноуден просочился правительством США о ряде правительств и лиц, за которыми шпионило правительство США.[17] Это побудило многие правительства пересмотреть свой подход к суверенитету данных и безопасности данных своих граждан.[17]
Дж.Де Йонг-Чен указывает, как ограничение потока данных может препятствовать научным открытиям, что наносит ущерб многим, но особенно развивающимся странам.[17] Это вызывает серьезную озабоченность с точки зрения этики больших данных из-за противоречия между двумя важными вопросами кибербезопасности и глобального развития.
банки
Банки занимают в обществе положение хранителей ценностей. Их политика данных не должна ставить под угрозу доверительные отношения с их клиентами как хранителями ценностей. Например, если банк делится данными об одном мяснике с другим мясником, это может поставить под угрозу их доверительные отношения из-за раскрытия данных конкурентам.
Актуальные новости об этике данных
В Эдвард Сноуден Разоблачение 5 июня 2013 г. стало поворотным моментом в публичных дебатах по этике данных. Продолжающаяся публикация просочившихся документов раскрыла ранее неизвестные подробности об аппарате глобального наблюдения, управляемом АНБ США в тесном сотрудничестве с тремя из его партнеров Five Eyes: Австралийским ASD, GCHQ Великобритании и CSEC Канады.
В Нидерландах ING Bank сделал публичное заявление о своих намерениях в отношении использования данных.
В Скандал с данными Facebook и Cambridge Analytica включает сбор личных данных не более чем 87 миллионов пользователей Facebook в попытке повлиять на мнение избирателей. И голосование за Брексит 2016 года, и кампании американских политиков Дональда Трампа и Теда Круза в 2015/6 заплатили Cambridge Analytica за использование информации из утечки данных для влияния на мнение избирателей.
Соответствующее законодательство об этике данных
26 октября 2001 г. в США вступил в силу «Патриотический акт» в ответ на широкую обеспокоенность американцев по поводу терактов 11 сентября. В общих чертах, Патриотический акт проложил путь, позволивший силам безопасности осуществлять наблюдение за гражданами, подозреваемыми в причастности к террористическим актам.
25 мая 2018 года в Европейском союзе вступил в силу Общий регламент защиты данных 2016/679 (GDPR). GDPR решает проблемы прозрачности от контроллеров данных по отношению к физическим лицам, называемым субъектами данных, и необходимость получения разрешения от субъектов данных на обработку их личных данных.
Манифесты, декларации и союзы
Существует несколько манифестов, касающихся этики данных при сборе подписей сторонников.
Название манифеста данных, декларации или союза | Описание | Основные авторы, редакторы или спонсоры |
---|---|---|
Мис Датос Сон Миос | Союз данных о правах потребителей | Organización de Consumidores y Usuarios |
Датавакбонд | Объединение данных | Под руководством члена Европейского парламента |
Тада | Манифест, принятый городом Амстердамом | Экономический совет Амстердама |
Лидеры данных | Неизвестный | Неизвестный |
Манифест пользовательских данных | Неизвестный | Неизвестный |
Мои данные | 3 основных автора, написавших декларацию в качестве первого шага к созданию сообщества для конференции | Организаторы конференции MyData |
Манифест операций с данными | Неизвестный | Неизвестный |
Манифест данных Королевского статистического общества | Неизвестный | Королевское статистическое общество |
Смотрите также
Сноски
- ^ Китчин, Роб (18 августа 2014 г.). Революция данных: большие данные, открытые данные, инфраструктуры данных и их последствия. МУДРЕЦ. п. 27. ISBN 9781473908253.
- ^ van Ooijen, I .; Врабец, Елена У. (11 декабря 2018 г.). «Усиливает ли GDPR контроль потребителей над личными данными? Анализ с точки зрения поведения». Журнал потребительской политики. 42 (1): 91–107. Дои:10.1007 / s10603-018-9399-7. ISSN 0168-7034. S2CID 158945891.
- ^ а б Цвиттер, А. (2014). «Этика больших данных». Большие данные и общество. 1 (2): 4. Дои:10.1177/2053951714559253.
- ^ О'Нил, Кэти (2016). Оружие математического разрушения. Корона Книги. ISBN 978-0553418811.
- ^ а б c d е Ричардс и Кинг, Н. М. и Дж. Х. (2014). «Этика больших данных». Обзор закона Wake Forest. 49: 393–432. SSRN 2384174.
- ^ а б c d Китчин, Роб (2014). Революция данных: большие данные, открытая инфраструктура данных и их последствия. Публикации SAGE. С. 178–179.
- ^ а б c Косткова, Патти; Брюэр, Хелен; де Лузиньян, Симон; Фоттрелл, Эдвард; Голдакр, Бен; Харт, Грэм; Кочан, Фил; Рыцарь, Питер; Марсолье, Коринн; МакКендри, Рэйчел А .; Росс, Эмма; Сассе, Анджела; Салливан, Ральф; Чайтор, Сара; Стивенсон, Оливия; Велью, Ракель; Тук, Джон (17 февраля 2016 г.). «Кому принадлежат данные? Открытые данные для здравоохранения». Границы общественного здравоохранения. 4: 7. Дои:10.3389 / fpubh.2016.00007. ЧВК 4756607. PMID 26925395.
- ^ а б c Уокер, Р. К. (2012). «Право на забвение». Hastings Law Journal. 64: 257–261.
- ^ Хоскинс, Эндрю (4 ноября 2014 г.). "Исследования цифровой памяти |". memorystudies-frankfurt.com. Получено 28 ноября, 2017.
- ^ ЮАР (2018). «Список покупок по кибербезопасности 2018» (PDF).
- ^ Ласло, Митци (1 ноября 2017 г.). «Приложение для торговли персональными данными на получение премии New Shape Prize от Global Challenges Foundation». онлайн: Global Challenges Foundation. п. 27.
- ^ а б Калин, Ян (2014). «Политика открытых данных улучшает демократию». Обзор международных отношений SAIS. 34 (1): 59–70. Дои:10.1353 / sais.2014.0006. S2CID 154068669.
- ^ а б Баак, Стефан (27 декабря 2015 г.). «Датафикация и расширение прав и возможностей: как движение за открытые данные по-новому формулирует концепции демократии, участия и журналистики». Большие данные и общество. 2 (2): 205395171559463. Дои:10.1177/2053951715594634. S2CID 55542891.
- ^ а б Знание, открытое. «Методология - Глобальный индекс открытых данных». index.okfn.org. Получено 23 ноября, 2017.
- ^ Знание, открытое. «О компании - Глобальный индекс открытых данных». index.okfn.org. Получено 23 ноября, 2017.
- ^ Электронная торговля. "Бэби-бумеры Willen Gegevens Niet Delen". Emerce.nl. Получено 12 мая, 2016.
- ^ а б c d де Йонг-Чен, Дж. (2015). «Суверенитет данных, кибербезопасность и вызовы глобализации». Джорджтаунский журнал международных отношений: 112–115. ProQuest 1832800533.
Рекомендации
- Баак, Стефан (27 декабря 2015 г.). «Датафикация и расширение прав и возможностей: как движение за открытые данные по-новому формулирует концепции демократии, участия и журналистики». Большие данные и общество. 2 (2): 205395171559463. Дои:10.1177/2053951715594634. S2CID 55542891.
- Дэвис, Корд; Паттерсон, Дуг (2012). Этика больших данных. O'Reilly Media Inc. ISBN 9781449311797.
- де Чен-Чен, Цзин (2015). «Суверенитет данных, кибербезопасность и вызовы глобализации». Джорджтаунский журнал международных отношений: 112–122. ProQuest 1832800533.
- Хоскинс, А. (4 ноября 2014 г.). «Исследования цифровой памяти». www.memorystudies-frankfurt.com. Проверено 28 ноября 2017.
- Калин, Ян (2014). «Политика открытых данных улучшает демократию». Обзор международных отношений SAIS. 34 (1): 59–70. Дои:10.1353 / sais.2014.0006. S2CID 154068669. ProQuest 1552151732.
- Китчин Р. Революция данных: большие данные, открытые данные, инфраструктуры данных и их последствия (стр. 165–183). Публикации SAGE. Kindle Edition.
- Косткова, Патти; Брюэр, Хелен; де Лузиньян, Симон; Фоттрелл, Эдвард; Голдакр, Бен; Харт, Грэм; Кочан, Фил; Рыцарь, Питер; Марсолье, Коринн; МакКендри, Рэйчел А .; Росс, Эмма; Сассе, Анджела; Салливан, Ральф; Чайтор, Сара; Стивенсон, Оливия; Велью, Ракель; Тук, Джон (17 февраля 2016 г.). «Кому принадлежат данные? Открытые данные для здравоохранения». Границы общественного здравоохранения. 4: 7. Дои:10.3389 / fpubh.2016.00007. ЧВК 4756607. PMID 26925395.
- Майер-Шенбергер, Виктор; Cukier, Кеннет (2013). Большие данные: революция, которая изменит то, как мы живем, работаем и думаем. Houghton Mifflin Harcourt. ISBN 9780544002692.
- Richards, Neil M .; Кинг, Джонатан (19 мая 2014 г.). «Этика больших данных». Обзор закона Wake Forest. SSRN 2384174.
- Уокер, Роберт (1 декабря 2012 г.). «Примечание - право быть забытым». Hastings Law Journal. 64 (2): 257.
- Цвиттер, Андрей (10 июля 2014 г.). «Этика больших данных». Большие данные и общество. 1 (2): 205395171455925. Дои:10.1177/2053951714559253. S2CID 54923673.
- «Информационные работники мира, объединяйтесь». Экономист. 7 июля 2018.
- Круз, Клеменс Скотт; Госвами, Риши; Раваль, Йеша; Марави, Сара (21 ноября 2016 г.). «Проблемы и возможности больших данных в здравоохранении: систематический обзор». JMIR Медицинская информатика. 4 (4): e38. Дои:10.2196 / medinform.5359. ЧВК 5138448. PMID 27872036.