Публикация данных - Data publishing - Wikipedia

Публикация данных (также публикация данных) это акт освобождения данные исследования в опубликованная форма для использования другими. Это практика, состоящая в приготовлении определенных данные или же набор данных (s) для публичного использования, чтобы сделать их доступными для всех, чтобы они могли использовать их по своему желанию. Эта практика является неотъемлемой частью открытая наука движение. Существует широкий и многопрофильный консенсус в отношении преимуществ этой практики.[1][2][3]

Основная цель - сделать данные первоклассными результатами исследований.[4]Есть ряд инициатив, которые находятся в стадии реализации, а также точки консенсуса и вопросы, по-прежнему вызывающие разногласия.[5]

Есть несколько различных способов сделать доступными данные исследований, в том числе:

  • публикация данных в качестве дополнительных материалов, связанных с научная статья, как правило, с файлами данных, размещенными издателем статьи
  • размещение данных на общедоступном веб-сайте с файлами, доступными для загрузки
  • размещение данных в репозитории, который был разработан для поддержки публикации данных, например фигшер, Дриада, Dataverse, Зенодо. Существует большое количество репозиториев общих и специализированных (например, по темам исследования).[6] Например, Служба данных Великобритании позволяет пользователям размещать коллекции данных и повторно делиться ими в исследовательских целях.
  • публикация документа с данными о наборе данных, который может быть опубликован в виде препринта, в журнале или в журнале данных, предназначенном для поддержки документов с данными. Данные могут размещаться в журнале или отдельно в хранилище данных.

Публикация данных позволяет исследователям как сделать свои данные доступными для использования другими, так и дает возможность цитировать наборы данных аналогично другим типам исследовательских публикаций (например, статьям или книгам), тем самым позволяя производителям наборов данных получать академическое признание за свою работу.

Мотивы для публикации данных могут варьироваться в зависимости от желания сделать исследования более доступными, обеспечить цитируемость наборов данных или поручений спонсоров исследований или издателей, которые требуют публикации открытых данных. Служба данных Великобритании - одна из ключевых организаций, работающих с другими над повышением важности правильное цитирование данных и помощь исследователям в этом.

Предлагаемые решения для сохранения конфиденциальности при публикации данных, включая алгоритмы защиты конфиденциальности, методы «маскирования» данных и алгоритм расчета регионального уровня конфиденциальности.[7]

Способы публикации данных

Файлы данных как дополнительный материал

Большое количество журналов и издателей поддерживают добавление дополнительных материалов к исследовательским статьям, включая наборы данных. Хотя исторически такой материал мог распространяться только по запросу или по микроформа для библиотек сегодня журналы обычно размещают такие материалы в Интернете. Дополнительные материалы доступны подписчикам журнала или, если статья или журнал в открытом доступе, всем.

Хранилища данных

Существует большое количество репозиториев данных как по общим, так и по специализированным темам. Многие репозитории дисциплинарные репозитории, ориентированный на конкретную исследовательскую дисциплину, такую ​​как Служба данных Великобритании который является надежным цифровым хранилищем социальных, экономических и гуманитарных данных. Хранилища могут быть бесплатными для исследователей для загрузки своих данных или могут взиматься единовременная или постоянная плата за размещение данных. Эти репозитории предлагают общедоступный веб-интерфейс для поиска и просмотра размещенных наборов данных и могут включать дополнительные функции, такие как идентификатор цифрового объекта, для постоянного цитирования данных и ссылки на связанные опубликованные статьи и код.

Документы с данными

Документы с данными - это «научная публикация доступного для поиска документа с метаданными, описывающего определенный набор данных, доступный в режиме онлайн, или группу наборов данных, опубликованных в соответствии со стандартной академической практикой».[8]Их конечная цель - предоставить «информацию о том, что, где, почему, как и кто эти данные».[4]Цель информационного документа - предложить описательную информацию о связанном наборе (ах) данных с упором на сбор данных, отличительные особенности, доступ и возможное повторное использование, а не на обработку и анализ данных.[9] Поскольку документы с данными считаются академическими публикациями, ничем не отличаясь от других типов статей, они позволяют ученым, обменивающимся данными, получать кредит в валюте, распознаваемой в академической системе, таким образом «делая обмен данными в счет».[10] Это дает не только дополнительный стимул для обмена данными, но и за счет экспертная оценка процесс, повышает качество метаданных и, следовательно, возможность повторного использования общих данных.

Таким образом, информационные документы представляют научное общение подход к обмен данными.

Несмотря на свой потенциал, информационные бюллетени не являются окончательным и полным решением всех проблем обмена и повторного использования данных, а в некоторых случаях считается, что они вызывают ложные ожидания в исследовательском сообществе.[11]

Журналы данных

Документы с данными подкреплены богатым набором журналы, некоторые из которых являются «чистыми», т. е. предназначены только для публикации документов с данными, в то время как другие - большинство - являются «смешанными», т. е. они публикуют несколько типов статей, включая статьи с данными.

Доступен исчерпывающий обзор журналов данных [12]Неполный список журналов данных был составлен сотрудниками Эдинбургского университета.[13]

Примеры "чистых" журналов данных:Данные науки о Земле,Журнал открытых археологических данных,Открытые данные о здоровье,Журнал полярных данныхНаучные данные.

Примеры "смешанных" журналов, публикующих информационные статьи:Журнал данных о биоразнообразии,F1000 Исследования,GigaScience,ГигабайтPLOS ONESpringerPlus.

Цитирование данных

Цитирование данных - это предоставление точных, последовательных и стандартизированных ссылок на наборы данных так же библиографический цитаты предоставляются для других опубликованных источников, таких как исследовательские статьи или же монографии. Обычно хорошо зарекомендовавшие себя Идентификатор цифрового объекта (DOI) используется подход, когда DOI направляет пользователей к интернет сайт который содержит метаданные в наборе данных и в самом наборе данных.[14][15]

Смотрите также

Рекомендации

  1. ^ Костелло MJ (2009). «Мотивация публикации данных в Интернете». Бионаука. 59 (5): 418–427. Дои:10.1525 / bio.2009.59.5.9.
  2. ^ Смит VS (2009). «Публикация данных: к базе всего». BMC Research Notes. 2 (113): 113. Дои:10.1186/1756-0500-2-113. ЧВК  2702265. PMID  19552813.
  3. ^ Лоуренс, B; Jones, C .; Matthews, B .; Pepler, S .; Каллаган, С. (2011). «Цитирование и экспертная оценка данных: движение к официальной публикации данных». Международный журнал цифрового курирования. 6 (2): 4–37. Дои:10.2218 / ijdc.v6i2.205.
  4. ^ а б Каллаган, С., Донеган, С., Пеплер, С., Торли, М., Каннингем, Н., Кирш, П., Олт, Л., Белл, П., Боуи, Р., Ледбеттер, А., Лоури, Р., Монкойфе, Г., Харрисон, К., Смит-Хэддон, Б., Уэзерби, А., и Райт, Д. (2012). «Превращение данных в первоклассный научный продукт: цитирование и публикация данных центрами экологических данных NERC». Международный журнал цифрового курирования. 7 (1): 107–113. Дои:10.2218 / ijdc.v7i1.218.CS1 maint: несколько имен: список авторов (связь)
  5. ^ Кратц Дж, Штрассер С. (2014). «Консенсус и разногласия по поводу публикации данных». F1000 Исследования. 3 (94): 94. Дои:10.12688 / f1000research.4518. ЧВК  4097345. PMID  25075301.
  6. ^ Assante, M .; Candela, L .; Castelli, D .; Тани, А. (2016). "Справляются ли репозитории научных данных с публикацией исследовательских данных?". Журнал Data Science. 15. Дои:10.5334 / dsj-2016-006.
  7. ^ Чжан, Лунбинь; Ван, Юйсян; Сюй, Сяолян (август 2017 г.). «Гауссова дискретизация на основе логических разделов для онлайн-агрегирования». Пятая международная конференция по передовым облакам и большим данным (CBD), 2017 г.. IEEE. Дои:10.1109 / cbd.2017.39. ISBN  978-1-5386-1072-5.
  8. ^ Чаван В. и Пенев Л. (2011). «Документ с данными: механизм стимулирования публикации данных в области науки о биоразнообразии». BMC Bioinformatics. 12 (15): S2. Дои:10.1186 / 1471-2105-12-S15-S2. ЧВК  3287445. PMID  22373175.
  9. ^ Ньюман Пол; Корк Питер (2009). «Документы с данными - рецензируемая публикация наборов данных высокого качества». Международный журнал исследований робототехники. 28 (5): 587. Дои:10.1177/0278364909104283.
  10. ^ Горголевски К.Дж., Маргулис Д.С., Милхэм М.П. (2013). «Обеспечение важности совместного использования данных: решение на основе публикаций». Границы неврологии. 7: 9. Дои:10.3389 / fnins.2013.00009. ЧВК  3565154. PMID  23390412.
  11. ^ Parsons, M.A .; Фокс, П.А. (2013). «Является ли публикация данных правильной метафорой?». Журнал Data Science. 12: WDS31 – WDS46. Дои:10.2481 / dsj.WDS-042.
  12. ^ Кандела, Л., Кастелли, Д., Манги, П. и Тани, А. (2015). «Журналы данных: обзор». Журнал Ассоциации информационных наук и технологий. 66 (1): 1747–1762. Дои:10.1002 / asi.23358.CS1 maint: несколько имен: список авторов (связь)
  13. ^ https://www.wiki.ed.ac.uk/display/datashare/Sources+of+dataset+peer+review
  14. ^ Национальная служба данных Австралии: осведомленность о цитировании данных В архиве 2012-03-07 в Wayback Machine (Проверено 20 марта 2012 г.)
  15. ^ Болл, А., Дюк, М. (2011). «Цитирование и ссылки на данные». Информационные документы DCC. Эдинбург: Центр цифрового курирования. Доступно онлайн: http://www.dcc.ac.uk/resources/briefing-papers/