Обмен данными - Data sharing

Решение о том, следует ли и как обмениваться данными, часто остается за исследователями.

Обмен данными - это практика предоставления другим исследователям доступа к данным, используемым в научных исследованиях. Многие финансирующие агентства, учреждения и места публикации имеют политику в отношении обмена данными, поскольку прозрачность и открытость многие считают частью научный метод.[1]

Ряд финансирующих агентств и научных журналов требуют авторов рецензируемый документы, чтобы поделиться любой дополнительной информацией (необработанные данные, Статистические методы или исходный код ) необходимо понимать, развивать или воспроизводить опубликованное исследование. Многие научные исследования не подчиняются требованиям совместного использования данных, и многие из этих правил имеют либеральные исключения. В отсутствие каких-либо обязательных требований обмен данными остается на усмотрение самих ученых. Кроме того, в определенных ситуациях правительства[2] и учреждения запрещают или строго ограничивают обмен данными для защиты интересов собственности, национальной безопасности и конфиденциальности субъектов / пациентов / жертв. Обмен данными также может быть ограничен для защиты учреждений и ученых от использования данных в политических целях.

Данные и методы могут быть запрошены у автора спустя годы после публикации. Для поощрения обмена данными[3] и предотвратить потерю или повреждение данных, ряд финансовых агентств и журналов разработали политику в отношении архивирование данных. Доступ к публично заархивированным данным - недавняя разработка в история науки стало возможным благодаря технологическому прогрессу в области связи и информационные технологии. Чтобы в полной мере воспользоваться преимуществами современной быстрой связи, может потребоваться консенсусное соглашение о критериях, лежащих в основе взаимного признания соответствующих вкладов. Известные модели улучшения своевременного обмена данными для более эффективного реагирования на возникающие угрозы инфекционных заболеваний включают механизм обмена данными, введенный GISAID Инициатива.[4][5]

Несмотря на политику в отношении совместного использования и архивирования данных, утаивание данных по-прежнему имеет место. Авторы могут не архивировать данные или архивировать только часть данных. Отсутствие архивирования данных само по себе не является удержанием данных. Когда исследователь запрашивает дополнительную информацию, автор иногда отказывается ее предоставить.[6] Когда авторы утаивают подобные данные, они рискуют потерять доверие научного сообщества.[7]

Совместное использование данных может также указывать на обмен личной информацией на платформе социальных сетей.

Политика правительства США

Федеральный закон

9 августа 2007 г. президент Буш подписал Закон Америки КОНКУРЕНУЕТ (или Закон «Америка, создающий возможности для значимого продвижения передового опыта в области технологий, образования и науки»), требующий от гражданских федеральных агентств предоставления руководящих принципов, политики и процедур для облегчения и оптимизации открытого обмена данными и исследованиями между агентствами, общественностью и политики. См. Раздел 1009.[8]

Политика обмена данными NIH

Заявление о политике предоставления грантов Национального института здравоохранения (NIH) определяет «данные» как «записанную информацию, независимо от формы или носителя, на котором они могут быть записаны, и включает в себя письменные материалы, фильмы, звукозаписи, графические репродукции, рисунки, рисунки и т. Д. или другие графические изображения, инструкции по процедурам, формы, диаграммы, рабочие схемы, описания оборудования, файлы данных, обработка данных или компьютерные программы (программное обеспечение), статистические записи и другие данные исследований ".

— Совет по связям с государством[9]

В Заключительном заявлении NIH об обмене данными исследований говорится:

«NIH подтверждает свою поддержку концепции обмена данными. Мы считаем, что обмен данными необходим для ускоренного преобразования результатов исследований в знания, продукты и процедуры для улучшения здоровья человека. NIH одобряет обмен окончательными данными исследований для достижения этих и других важных научных целей. NIH ожидает и поддерживает своевременный выпуск и совместное использование окончательных данных исследований, поддерживаемых NIH, для использования другими исследователями. «NIH признает, что исследователи, которые собирают данные, имеют законный интерес в получении выгоды от вложенных ими времени и усилий. Поэтому мы пересмотрели наше определение «своевременной публикации и обмена», сделав это не позднее принятия к публикации основных результатов из окончательного набора данных. NIH продолжает ожидать, что первоначальные исследователи могут извлечь выгоду из первого и непрерывного использования, но не от длительного исключительного использования ».

Политика NSF из Общих условий гранта

36. Обмен выводами, данными и другими продуктами исследований.

а. NSF… ожидает, что исследователи поделятся с другими исследователями не более чем за дополнительную плату и в разумные сроки данными, образцами, физическими коллекциями и другими вспомогательными материалами, созданными или собранными в ходе работы. Он также побуждает победителей делиться программным обеспечением и изобретениями или иным образом действовать, чтобы внедряемые в них инновации были широко полезными и пригодными для использования.

б. Могут быть разрешены корректировки и, где это необходимо, исключения для защиты прав отдельных лиц и субъектов, достоверности результатов или целостности коллекций или для удовлетворения законных интересов исследователей.

— "Национальный научный фонд: Общие условия гранта (GC-1) », 1 апреля 2001 г. (стр. 17).

Управление честности исследований

Обвинения в неправомерном проведении медицинских исследований имеют серьезные последствия. Министерство здравоохранения и социальных служб США создало офис для надзора за расследованиями заявлений о неправомерном поведении, включая утаивание данных. Сайт определяет миссию:

"Office of Research Integrity (ORI) продвигает честность в биомедицинских и поведенческих исследованиях, поддерживаемых Службой общественного здравоохранения США (PHS), примерно в 4000 учреждениях по всему миру. ORI отслеживает институциональные расследования неправомерных действий в исследованиях и способствует ответственному проведению исследований (RCR) посредством просветительская, профилактическая и регулирующая деятельность ».

Идеалы в обмене данными

Некоторые исследовательские организации особенно серьезно относятся к обмену данными. Стэнфордского университета WaveLab придерживается философии воспроизводимости исследования и раскрытия всех алгоритмов и исходного кода, необходимых для воспроизведения исследования. В статье под названием «WaveLab и воспроизводимые исследования» авторы описывают некоторые проблемы, с которыми они столкнулись, пытаясь воспроизвести собственное исследование по прошествии определенного периода времени. Во многих случаях это было настолько сложно, что они отказывались от усилий. Этот опыт убедил их в важности раскрытия исходного кода.[11] Философия описана:

Идея такова: статья о вычислительной науке в научном издании - это не сама стипендия, это просто реклама стипендии. Фактическая стипендия - это полная среда разработки программного обеспечения и полный набор инструкций, по которым были получены цифры.[12][13]

В Сеть наблюдения за данными для Земли (DataONE ) и сохранение данных[14] проекты, поддерживаемые Национальный научный фонд для поощрения и облегчения обмена данными между учеными-исследователями и лучшей поддержки метаанализ. В области наук об окружающей среде исследовательское сообщество признает, что для крупных научных достижений, связанных с интеграцией знаний в разных областях, потребуется, чтобы исследователи преодолели не только технологические барьеры для обмена данными, но и исторически укоренившиеся институциональные и социологические барьеры.[15] Д-р Ричард Дж. Ходс, директор Национальный институт старения заявил, что «старая модель, в которой исследователи ревностно охраняли свои данные, больше не применима».[16]

Альянс за доступ налогоплательщиков - это группа организаций, которые поддерживают открытый доступ к исследованиям, спонсируемым государством. Группа представила «Заявление о принципах», объясняющее, почему они считают открытый доступ важным.[17] Они также перечисляют ряд международных политик общественного доступа.[18] Это не более чем своевременная передача важной информации для эффективного реагирования на чрезвычайные ситуации в области здравоохранения.[19] Хотя архивы общественного достояния использовались для хранения данных, в основном после официальной публикации, они не способствовали быстрому обмену данными во время чрезвычайных ситуаций в области здравоохранения, в том числе при Эболе.[20] и Зика,[21][22] вспышки. Требуются более четко определенные принципы для признания интересов тех, кто генерирует данные, при одновременном разрешении свободного, неограниченного доступа к данным и их использования (до публикации) для исследований и практического применения, например, те, которые приняты Инициативой GISAID для противодействия возникающим угрозам. от гриппа.[23][24]

Международная политика

Проблемы обмена данными в академических кругах

Генетика

Утаивание данных стало обычным явлением в генетика что исследователи в Массачусетская больница общего профиля опубликовал в журнале статью на эту тему. Исследование показало, что «из-за того, что им было отказано в доступе к данным, 28% генетиков сообщили, что не смогли подтвердить опубликованные исследования».[25]

Психология

В исследовании 2006 г. было замечено, что из 141 автора публикации из Американская психологическая ассоциация (APA) 103 (73%) не предоставили свои данные в течение 6-месячного периода.[26] В ходе последующего исследования, опубликованного в 2015 году, было обнаружено, что 246 из 394 авторов статей в журналах APA не предоставили свои данные по запросу (62%).[27]

Археология

В исследовании 2018 г. сообщалось об исследовании случайной выборки из 48 статей, опубликованных в период с февраля по май 2017 г. в Журнал археологической науки который нашел в открытом доступе необработанные данные по 18 статьям (53%), причем данные о составе и датировке являются наиболее распространенными типами. В том же исследовании авторам статей об экспериментах с каменными артефактами, опубликованных в 2009 и 2015 годах, были отправлены электронные письма с запросом данных, касающихся этих публикаций. Они связались с авторами 23 статей и получили 15 ответов, что дало 70% ответов. Они получили пять ответов, которые включали файлы данных, что дает общий коэффициент обмена 20%.[28]

Ученые на стажировке

Исследование обучаемых ученых показало, что многие из них уже сталкивались с сокрытием данных.[29] Это исследование вызвало опасения, что будущее поколение ученых не будет придерживаться установленной практики.

Разные подходы в разных сферах

Требования к обмену данными чаще предъявляются учреждениями, финансирующими агентствами и изданиями в области медицинских и биологических наук, чем в области физических наук. Требования сильно различаются в зависимости от того, должны ли данные вообще передаваться, кому они должны быть предоставлены и кто должен нести расходы по обмену данными.

Финансирующие организации, такие как NIH и NSF, как правило, требуют большего обмена данными, но даже эти требования, как правило, признают озабоченность по поводу конфиденциальности пациентов, затрат, понесенных при обмене данными, и законности запроса. Частные интересы и государственные учреждения, занимающиеся вопросами национальной безопасности (оборона и правоохранительные органы), часто препятствуют обмену данными и методами посредством соглашений о неразглашении.

Обмен данными создает определенные проблемы в совместный мониторинг инициативы, например, когда лесные сообщества собирают данные о местных социальных и экологических условиях. В этом случае правозащитный подход к разработке протоколов обмена данными может быть основан на принципах свободное, предварительное и осознанное согласие, и уделять приоритетное внимание защите прав тех, кто создал данные, и / или тех, кто потенциально может пострадать от совместного использования данных.[30]

Смотрите также

использованная литература

  1. ^ «Глобальная эпидемия здравоохранения - это бомба замедленного действия, но вирусные базы данных могут и помогают спасать жизни». HuffPost UK. Получено 2017-09-06.
  2. ^ «Снимок прозрачности». Экономист. 2006-08-10. ISSN  0013-0613. Получено 2017-09-06.
  3. ^ «Как поощрить правильное поведение». Природа. 416 (6876): 1. 2002. Bibcode:2002Натура 416Р ... 1.. Дои:10.1038 / 416001b. PMID  11882850.
  4. ^ Макколи, Джон В. (23 февраля 2017 г.). «Вирусы: модель ускорения противодействия эпидемии». Природа. 542 (7642): 414. Bibcode:2017Натура.542..414М. Дои:10.1038 / 542414b. PMID  28230113.
  5. ^ «Нет бесплатного обеда, министры здравоохранения G20 находят на первом заседании». Интеллектуальная собственность Watch. 2017-05-20. Получено 2017-09-06.
  6. ^ Сэвидж CJ, Викерс AJ (2009). «Эмпирическое исследование обмена данными авторами, публикующими журналы PLoS». PLOS ONE. 4 (9): e7078. Bibcode:2009PLoSO ... 4.7078S. Дои:10.1371 / journal.pone.0007078. ЧВК  2739314. PMID  19763261.
  7. ^ "Публикация и открытость, "глава из" О том, чтобы быть ученым: ответственное поведение в исследованиях ", Национальная академия наук.
  8. ^ "Закон Америки КОНКУРЕНУЕТ
  9. ^ "Доступ к данным исследований и их хранение В архиве 2007-05-26 на Wayback Machine: Права и обязанности », стр. 5. Совет по связям с властями, март 2006 г.
  10. ^ "Политика обмена данными NIH."
  11. ^ WaveLab и воспроизводимые исследования Джонатан Б. Бакхейт и Дэвид Л. Донохо
  12. ^ Сайт WaveLab850
  13. ^ Риммер, Мэтью (01.09.2005). «Японский рис: интеллектуальная собственность, научные публикации и обмен данными». Прометей. 23 (3): 325–347. Дои:10.1080/08109020500235180. ISSN  0810-9028.
  14. ^ «Data Conservancy | Data Conservancy посвящен разработке институциональных решений для проблем сбора, сохранения и повторного использования данных».
  15. ^ Reichman O.J .; Jones M.B .; Шильдхауэр М.П. (2011). «Проблемы и возможности открытых данных в экологии». Наука. 331 (6018): 703–705. Bibcode:2011Научный ... 331..703R. Дои:10.1126 / science.1197962. PMID  21311007.
  16. ^ Статья NY Times о ценности общих данных для исследования болезни Альцгеймера
  17. ^ Веб-сайт Альянса налогоплательщиков
  18. ^ Глобальный импульс для общественного доступа к исследованиям, финансируемым государством
  19. ^ Шу, Юэлонг; Макколи, Джон (2017). «GISAID: Глобальная инициатива по обмену всеми данными о гриппе - от видения к реальности». Евронаблюдение. 22 (13). Дои:10.2807 / 1560-7917.es.2017.22.13.30494. ЧВК  5388101. PMID  28382917.
  20. ^ Yozwiak, Nathan L .; Шаффнер, Стивен Ф .; Сабети, Пардис К. (26 февраля 2015 г.). «Обмен данными: сделайте исследования о вспышках болезней открытым». Природа. 518 (7540): 477–479. Bibcode:2015Натура.518..477Y. Дои:10.1038 / 518477a. PMID  25719649.
  21. ^ «Когда исследования сходят с рельсов». Индуистский. Получено 2017-09-06.
  22. ^ «Преимущества обмена». Природа. 530 (7589): 129. 2016-02-11. Bibcode:2016 Натур.530Q.129.. Дои:10.1038 / 530129a. PMID  26863943.
  23. ^ Эльба, Стефан; Бакленд-Меррет, Джемма (01.01.2017). «Данные, болезни и дипломатия: инновационный вклад GISAID в глобальное здоровье». Глобальные вызовы. 1 (1): 33–46. Дои:10.1002 / гч2.1018. ISSN  2056-6646. ЧВК  6607375. PMID  31565258.
  24. ^ «Центр контроля заболеваний (CDC) стремится создать вакцину от новейшего штамма птичьего гриппа в Китае». Bloomberg.com. 2013-04-10. Получено 2017-09-06.
  25. ^ Кэмпбелл Э.Г., Кларридж Б.Р., Гохале М. и др. (2002). «Удержание данных в академической генетике: данные национального исследования». JAMA. 287 (4): 473–80. Дои:10.1001 / jama.287.4.473. PMID  11798369.
  26. ^ Wicherts, J.M .; Borsboom, D .; Kats, J .; Моленаар, Д. (2006). «Плохая доступность данных психологических исследований для повторного анализа». Американский психолог. 61 (7): 726–728. Дои:10.1037 / 0003-066X.61.7.726. PMID  17032082.
  27. ^ Vanpaemel, W .; Vermorgen, M .; Deriemaecker, L .; Штормы, Г. (2015). «Хороший кризис мы теряем? Доступность данных психологических исследований после урагана» (PDF). Collabra. 1 (1): 1–5. Дои:10.1525 / collabra.13.
  28. ^ Марвик, Бен; Берч, Сюзанна Э. Пилаар (5 апреля 2018 г.). «Стандарт научного цитирования археологических данных как стимул к обмену данными». Успехи в археологической практике. 6 (2): 125–143. Дои:10.1017 / апр.2018.3.
  29. ^ Vogeli C, Yucel R, Bendavid E, et al. (Февраль 2006 г.). «Удержание данных и новое поколение ученых: результаты национального исследования». Acad Med. 81 (2): 128–36. Дои:10.1097/00001888-200602000-00007. PMID  16436573.
  30. ^ Д Сабогал. 2015. Обмен данными при общинном мониторинге лесов: уроки Гайаны. Глобальная программа Canopy. http://forestcompass.org/how/resources/data-sharing-community-based-forest-monitoring-lessons-guyana

Литература

Комитет по вопросам трансграничного потока научных данных, Национальный исследовательский совет (1997). Биты силы: проблемы глобального доступа к научным данным. Вашингтон, округ Колумбия: National Academy Press. Дои:10.17226/5504. ISBN  978-0-309-05635-9. - обсуждает международный обмен данными в области естественных наук.

внешние ссылки