Викиданные - Wikidata

Викиданные
Викиданные-логотип-en.svg
Главная страница Викиданных (2019) .png
Главная страница Викиданных в ноябре 2019 года
Тип сайта
Доступно вНесколько языков
Основан29 октября 2012 г.; 8 лет назад (2012-10-29)[1]
редакторРедакторы Викиданных
URLwww.wikidata.org Отредактируйте это в Викиданных
КоммерческийНет
Постановка на учетНеобязательный

Викиданные это совместно отредактированный многоязычный граф знаний организовано Фонд Викимедиа. Это общий источник открытые данные что проекты Викимедиа, такие как Википедия,[2][3] и все остальные могут использовать под всеобщее достояние лицензия. Викиданные работают на программном обеспечении Викибаза.[4]

Концепция

На этой диаграмме показаны наиболее важные термины, используемые в Викиданных.

Викиданные - это документно-ориентированная база данных, ориентированный на элементы, которые представляют темы, концепции или объекты. Каждому предмету присваивается уникальный, постоянный идентификатор, положительное целое число с префиксом Q в верхнем регистре, известное как "QID ". Это позволяет переводить основную информацию, необходимую для определения темы, охватываемой элементом, без предпочтения какого-либо языка.

Примеры предметов включают Летние Олимпийские игры 1988 года (Q8470), люблю (Q316), Элвис Пресли (Q303), и Горилла (Q36611).

Ярлыки предметов не обязательно должны быть уникальными. Например, есть два предмета с именем «Элвис Пресли»: Элвис Пресли (Q303) представляет американский певец и актер, и Элвис Пресли (Q610926) представляет его одноименный альбом.

Но этикетка и текст описания должны быть уникальными вместе. Итак, Предмет связан с уникальным идентификатором (QID). Идентификатор связан с парой: метка и описание, чтобы устранить любую двусмысленность.

Типы элементов - общие и лексемы.

Главные части

Скриншот Викиданных


Макет четырех основных компонентов страницы Викиданных фазы 1: метка, описание, псевдонимы и межъязыковые ссылки.

По сути, предмет состоит из:

  • Обязательно идентификатор (QID), связанный с меткой и описанием.
  • Необязательно, несколько псевдонимов и некоторое количество операторов (а также их свойств и значений).

Мы их представим, от высших до низших.

Заявления

Скриншот Викиданных
Три заявления от Элемент Викиданных о планете Марс (Q111). Значения включают ссылки на другие элементы и Wikimedia Commons.

Заявления - это то, как любая информация, известная об элементе, записывается в Викиданные. Формально они состоят из пары ключ-значение, которые соответствуют свойство (например, "автор" или "дата публикации") с одним или несколькими объектами значения (Такие как "Сэр Артур Конан Дойл "или" 1902 "). Например, неофициальное английское утверждение" молоко белое "может быть закодировано утверждением, объединяющим свойство цвет (P462) со значением белый (Q23444) по пункту молоко (Q8495).

Операторы могут отображать свойство более чем на одно значение. Например, свойство "оккупация" для Мари Кюри можно связать со значениями «физик» и «химик», чтобы отразить тот факт, что она занималась обоими профессиями.[5]

Значения могут принимать разные типы, включая другие элементы Викиданных, строки, числа или мультимедийные файлы. Свойства определяют, с какими типами значений они могут быть связаны. Например, свойство Официальный веб-сайт (P856) может использоваться только в паре со значениями типа «URL».[6]

Собственность и стоимость

Пример простого оператора, состоящего из одной пары свойство-значение

Свойство описывает значение данных оператора и может рассматриваться как категория данных, например цвет (P462) для значения данных синий (Q1088) или образование для человека.

Как сказано, характеристики, в паре с значения, сформировать утверждение в Викиданных. Значения могут включать квалификаторы.

Наиболее часто используемым свойством является экземпляр (P31), который используется на более чем 95 000 000 страницах товаров.[7]

У свойств есть свои собственные страницы в Викиданных, и поскольку элемент может включать несколько свойств, это приводит к связанной структуре данных страниц в рамках одного и того же утверждения.

Свойства могут также определять более сложные правила их предполагаемого использования, называемые ограничения. Например, капитал (P36) свойство включает «ограничение единственного значения», отражающее реальность того, что (обычно) территории имеют только одну столицу. Ограничения рассматриваются как предупреждения и подсказки тестирования, а не как незыблемые правила.[8]

Необязательно, квалификаторы может использоваться для уточнения значения оператора, предоставляя дополнительную информацию, которая относится к области действия оператора в пределах значений. Например, свойство «совокупность» можно изменить с помощью квалификатора, такого как «по состоянию на 2011 год». Значения в заявлениях также могут быть помечены Рекомендации, указывая на источник, поддерживающий содержимое инструкции.[9]

Лексемы

В лингвистике лексема это единица лексический смысл. Аналогичным образом, Викиданные лексемы это предметы со структурой, которая делает их более подходящими для хранения лексикографический данные. Помимо хранения языка, к которому относится лексема, в них есть раздел для формы и раздел для чувства.[10]

Разработка

Празднование дня рождения Викиданных в Керале

Создание проекта финансировалось за счет пожертвований Институт искусственного интеллекта Аллена, то Фонд Гордона и Бетти Мур, и Google, Inc., всего 1,3 миллиона.[11][12] Развитие проекта в основном обусловлено Викимедиа Германия под управлением Лидия Пинчер, и изначально был разделен на три этапа:[13]

  1. Централизация межъязыковых ссылок - ссылки между статьями Википедии на одну и ту же тему на разных языках.
  2. Обеспечивает центральное место для данных инфобокса для всех Википедий.
  3. Создание и обновление статей списка на основе данных Викиданных и ссылки на другие родственные проекты Викимедиа, в том числе Мета-вики и собственные Викиданные (межвикилинки).

Первоначальное развертывание

Скриншот из Википедии


Список межъязыковых ссылок в статье Википедии, как они появляются в поле редактирования (слева) и на странице статьи (справа) прежний в Викиданные. Каждая ссылка в этих списках ведет на статью, для которой требуется собственный список межъязыковых ссылок на другие статьи; это информация, централизованная Викиданными.
Скриншот Викиданных
Ссылка "Изменить ссылки" Настоящее время переводит читателя в Викиданные для редактирования межъязыковых и межвикальных ссылок.

Викиданные были запущены 29 октября 2012 года и стали первым новым проектом Фонда Викимедиа с 2006 года.[2][14][15] В то время была доступна только централизация языковых ссылок. Это позволило создавать элементы и заполнять их основной информацией: метка - имя или заголовок, псевдонимы - альтернативные термины для метки, описание и ссылки на статьи по теме во всех различных языковых редакциях Википедии (ссылки на интервикипедии) .

Исторически статья в Википедии включала список межъязыковые ссылки, являющиеся ссылками на статьи по той же теме в других изданиях Википедии, если они существуют. Изначально Викиданные были автономным хранилищем межъязыковых ссылок. Языковые версии Википедии все еще не имели доступа к Викиданным, поэтому им нужно было продолжать поддерживать свои собственные списки межъязыковых ссылок, в основном в конце страниц статей.[нужна цитата ]

14 января 2013 г. Венгерская Википедия стал первым, кто позволил предоставлять межъязыковые ссылки через Викиданные.[16] Эта функциональность была расширена до иврит и Итальянский Википедии 30 января, Английская Википедия 13 февраля и во всех других Википедиях 6 марта.[17][18][19][20] После того как консенсус не был достигнут по предложению ограничить удаление языковых ссылок из английской Википедии,[21] право удалять их из английской Википедии было предоставлено автоматическим редакторам (боты ). 23 сентября 2013 г. межъязыковые ссылки были размещены на Wikimedia Commons.[22]

Заявления и доступ к данным

4 февраля 2013 г. в записи Викиданных были добавлены утверждения. Возможные значения свойств изначально были ограничены двумя типами данных (элементы и изображения на Wikimedia Commons), а позже появилось больше типов данных (например, координаты и даты). Первый новый тип - струна - был спущен на воду 6 марта.[23]

Возможность доступа к данным из Викиданных для различных языковых редакций Википедии постепенно расширялась с 27 марта по 25 апреля 2013 года.[24][25]

16 сентября 2015 г. Викиданные начали разрешать так называемые произвольный доступили доступ из данного элемента Викиданных к свойствам элементов, не связанных с ним напрямую. Например, из берлинской статьи стало возможным читать данные о Германии, что раньше было невозможно.[26] 27 апреля 2016 г. произвольный доступ был активирован на Wikimedia Commons.[27]

Служба запросов и другие улучшения

7 сентября 2015 г. Фонд Викимедиа объявила о выпуске службы запросов к Викиданным,[28] который позволяет пользователям выполнять запросы к данным, содержащимся в Викиданных.[29] Сервис использует SPARQL как язык запросов. По состоянию на ноябрь 2018 года существует как минимум 26 различных инструментов, позволяющих запрашивать данные разными способами.[30]

С другой стороны, в боковой панели Викисловаря инструменты теперь включают[когда? ] «Элемент Викиданных», помогающий создать новый элемент и ссылки на новые страницы.[нужна цитата ] Например, это полезно, когда элемент находится только в англоязычном Викисловаре и должен быть связан с другим проектом Викимедиа, а не с Викисловарями на других языках.

Службу запросов Викиданных можно использовать как альтернативу с открытым исходным кодом для IMDb Анализатор ключевых слов в фильмах (MoKA) для поиска фильмов или телесериалов по ключевым словам.[31] и найти фильмы или телесериалы, в которых 2 актера играли вместе[32].

Ниже приведен пример SPARQL для поиска экземпляра телесериала (P31) (Q5398426) с основной темой (P921) об острове (Q23442) и авиационной катастрофе (Q744913). Однако аналогичные результаты также можно найти непосредственно в Википедии, используя категории пересечения если соответствующие категории существуют и разрешены.

ВЫБРАТЬ ?элемент ? itemLabelКУДА {  ?элемент wdt:P31 wd:Q5398426.  ?элемент wdt:P921 wd:Q23442.  ?элемент wdt:P921 wd:Q744913.  СЛУЖБА викибаза:метка {bd:serviceParam викибаза:язык "[AUTO_LANGUAGE], en".}}

Ниже приведен еще один пример SPARQL, позволяющий найти экземпляр телесериала (P31) (Q5398426), в котором актерский состав (P161) включает Дэниела Дэ Кима (Q299700) и Хорхе Гарсиа (Q264914). Условие телесериала не позволяет отображать эпизод телесериала (Q21191270) ) / двухсерийный эпизод (Q21664088) и не показывает результатов, которые являются фильмом (Q11424).

ВЫБРАТЬ ?элемент ? itemLabelКУДА {  ?элемент wdt:P31 wd:Q5398426.  ?элемент wdt:P161 wd:Q299700.  ?элемент wdt:P161 wd:Q264914.  СЛУЖБА викибаза:метка {bd:serviceParam викибаза:язык "[AUTO_LANGUAGE], en".}}

Бары на логотип содержат слово "WIKI", закодированное в азбука Морзе.[33] Он был создан Аруном Ганешем и выбран по решению сообщества.[34]

Прием

В ноябре 2014 года Wikidata получила награду Open Data Publisher Award от Институт открытых данных «За чистый масштаб и встроенную открытость».[35]

По состоянию на ноябрь 2018 года информация Викиданных используется в 58,4% всех Английская Википедия статьи, в основном для внешних идентификаторов или координат местоположения. В совокупности данные из Викиданных отображаются в 64% всех Википедии 'страниц, 93% всех Wikivoyage статей, 34% всех Викицитаты ', 32% от всех Вики-источники 'и 27% Wikimedia Commons'. Использование в других Фонд Викимедиа проекты являются отзывами.[36]

По состоянию на ноябрь 2018 года данные Викиданных визуализируются как минимум 20 другими внешними инструментами.[37] о Викиданных опубликовано не менее 100 статей.[38] Его важность признана многими учреждениями культуры.[39]

Приложения

  • Расширение Mwnci может импортировать данные из Викиданных в электронные таблицы LibreOffice Calc.[40]
  • В октябре 2019 года ведутся дискуссии об использовании элементов QID по отношению к тому, что называется QID emoji.[41]
  • Wiki Explorer - приложение для Android, позволяющее узнавать о том, что вас окружает, и микромонтировать Викиданные[42]
  • KDE Itinerary - помощник по путешествиям с открытым исходным кодом, заботящийся о конфиденциальности, использующий данные из Викиданных[43]

Смотрите также

Рекомендации

  1. ^ https://blog.wikimedia.org/2013/04/25/the-wikidata-revolution/; получено: 14 ноября 2018 г .; цитата: Поскольку Wikidata.org был запущен 30 октября 2012 г. ,.
  2. ^ а б Викиданные (В архиве 30 октября 2012 г., в WebCite )
  3. ^ «Революция данных для Википедии». Wikimedia Deutschland. 30 марта 2012 г. В архиве из оригинала 11 сентября 2012 г.. Получено 11 сентября, 2012.
  4. ^ «Викибаза - Главная».
  5. ^ «Справка: Заявления».
  6. ^ «Справка: тип данных».
  7. ^ «Викиданные: отчеты базы данных / Список свойств / Top100».
  8. ^ «Справка: портал имущественных ограничений».
  9. ^ «Справка: источники».
  10. ^ «Викиданные - Документация лексикографических данных».
  11. ^ Дикинсон, Бунсри (30 марта 2012 г.). «Пол Аллен инвестирует в масштабный проект, чтобы сделать Википедию лучше». Business Insider. Получено 11 сентября, 2012.
  12. ^ Перес, Сара (30 марта 2012 г.). «Следующая большая вещь Википедии: Викиданные, машиночитаемая и редактируемая пользователем база данных, финансируемая Google, Полом Алленом и другими». TechCrunch. В архиве из оригинала 11 сентября 2012 г.. Получено 11 сентября, 2012.
  13. ^ «Викиданные - Мета».
  14. ^ Пинчер, Лидия (30 октября 2012 г.). "wikidata.org работает (с некоторыми оговорками)". wikidata-l (Список рассылки). Получено 3 ноября, 2012.
  15. ^ Рот, Мэтью (30 марта 2012 г.). «Революция данных в Википедии». Фонд Викимедиа. В архиве из оригинала 11 сентября 2012 г.. Получено 11 сентября, 2012.
  16. ^ Пинчер, Лидия (14 января 2013 г.). «Первые шаги Викиданных в венгерской Википедии». Викимедиа Германия. Получено 17 декабря 2015.
  17. ^ Пинчер, Лидия (30.01.2013). «Викиданные появятся в следующих двух Википедиях». Викимедиа Германия. Получено 31 января, 2013.
  18. ^ Пинчер, Лидия (13 февраля 2013 г.). «Викиданные размещены в английской Википедии». Викимедиа Германия. Получено 15 февраля 2013.
  19. ^ Пинцер, Лидия (6 марта 2013 г.). «Викиданные теперь доступны во всех Википедиях». Викимедиа Германия. Получено 8 марта 2013.
  20. ^ "Wikidata ist für all Wikipedien da" (на немецком). Golem.de. Получено 29 января 2014.
  21. ^ "Обсуждение в Википедии: Викиданные интервики RFC". 29 марта 2013 г.. Получено 30 марта, 2013.
  22. ^ Пинчер, Лидия (23 сентября 2013 г.). "Викиданные уже здесь!". Commons: деревенский насос.
  23. ^ Пинчер, Лидия. «Викиданные / Обновления статуса / 2013 03 01». Викимедиа Мета-Вики. Фонд Викимедиа. Получено 3 марта 2013.
  24. ^ Пинчер, Лидия (27 марта 2013 г.). "Вы можете получить все данные!". Викимедиа Германия. Получено 28 марта 2013.
  25. ^ «Викиданные становятся доступными по всему миру». The H. 2013-04-25. Архивировано из оригинал 1 января 2014 г.
  26. ^ Лидия, Пинцер (16 сентября 2015 г.). «Викиданные: здесь есть доступ к данным из произвольных элементов». Википедия: Деревенский насос (технический). Получено 30 августа 2016.
  27. ^ Лидия, Пинцер (27 апреля 2016 г.). «Поддержка Викиданных: произвольный доступ». Commons: деревенский насос. Получено 30 августа 2016.
  28. ^ https://query.wikidata.org/
  29. ^ «Объявление о выпуске службы запросов к Викиданным».
  30. ^ «Инструменты данных запросов к Викиданным».
  31. ^ "Самые популярные фильмы об островах, авиакатастрофах и телешоу". IMDb.
  32. ^ «Художественный фильм с Джонни Деппом, Леонардо Ди Каприо (сортировка по возрастанию популярности)». IMDb.
  33. ^ Commons: Обсуждение файлов: Wikidata-logo-en.svg # Hybrid. Проверено 6 октября 2016.
  34. ^ https://blog.wikimedia.de/2012/07/13/und-der-gewinner-ist/
  35. ^ «Первая награда ODI Open Data Awards, врученная сэрами Тимом Бернерс-Ли и Найджелом Шедболтом». Архивировано из оригинал на 24.03.2016.
  36. ^ «Процент статей, использующих данные из Викиданных».
  37. ^ «Инструменты Викиданных - Визуализируйте данные».
  38. ^ «Схолия - Викиданные».
  39. ^ «Международная конференция по семантической сети 2018».
  40. ^ Роб Барри / Mwnci - Глубокие таблицы · GitLab
  41. ^ «Вопросы общественного обзора».
  42. ^ Wiki Explorer в магазине Google Play
  43. ^ Краузе, Фолькер, KDE Itinerary - конфиденциальность от дизайнерского помощника путешественника, получено 2020-11-10

дальнейшее чтение

внешняя ссылка