OBO Foundry - OBO Foundry

OBO Foundry
ФокусУлучшение биомедицинских онтологий
Члены
27
Ключевые люди
Сюзанна Льюис, Барри Смит, Майкл Эшбёрнер
Интернет сайтфабрика.org

В Открытые биологические и биомедицинские онтологии (OBO) Литейный завод это группа людей, занимающихся созданием и обслуживанием онтологии связанный с Науки о жизни,.[1] OBO Foundry устанавливает набор принципов разработки онтологий для создания набора взаимодействующих справочные онтологии в биомедицинской сфере. На данный момент их более ста онтологии, соответствующие принципам OBO Foundry.

Усилия OBO Foundry упрощают интеграцию биомедицинских результатов. Он делает это, предлагая структурированную справочную информацию о различных областях исследований и их взаимосвязях (например, фенотип в модель мыши и связанный с ним фенотип в данио ).[2]

Вступление

Инициатива Foundry направлена ​​на улучшение интеграции данных в науки о жизни. Один из подходов к интеграции - аннотация данных из разных источников с использованием контролируемые словари. В идеале такие контролируемые словари имеют форму онтологии, которые поддерживают логическое обоснование данных, аннотированных с использованием терминов из словаря.

Формализация концепций в биомедицинской области особенно известна благодаря работе Генная онтология Консорциум, входящий в состав OBO Foundry. Это привело к разработке некоторых предложенных принципов надлежащей практики в разработке онтологий, которые в настоящее время претворяются в жизнь в рамках консорциума Open Biomedical Ontologies в рамках его инициативы OBO Foundry. Онтологии ОБО являются частью ресурсов Национальный центр биомедицинской онтологии, где они составляют центральный компонент биопортала NCBO.

Открытые биологические и биомедицинские онтологии

Открытые биологические и биомедицинские онтологии (ОБО; ранее - Открытые биомедицинские онтологии) - это попытка создать онтологии (контролируемые словари ) для использования в биологических и медицинских областях. Подмножество исходных онтологий OBO создало OBO Foundry, которое возглавляет усилия OBO с 2007 года.[1]

Создание ОБО в 2001 году во многом было вдохновлено усилиями Генная онтология проект.[3] ОБО является частью ресурсов НАС. Национальный центр биомедицинской онтологии (NCBIO) и центральный элемент биопортала NCBO. Это инициатива, возглавляемая OBO Foundry.

Правила участия

Компания OBO Foundry открыта для участия любых заинтересованных лиц. Онтологии, которые намерены официально стать частью OBO Foundry, должны придерживаться принципов OBO и проходить серию проверок, сделанных членами, когда «координаторы Foundry служат аналогами редакторов журналов».[1] Существуют онтологии, которые следуют принципам OBO, но официально не являются частью OBO, например орел-я Онтология применения реагентов.[4] и животные в контекстной онтологии.[5]

Интеграция в ОБО Теория жесткости OntoClean был предложен в качестве шага для стандартизации онтологий-кандидатов. Эта интеграция упростит разработку программного обеспечения для автоматической проверки кандидатов.[6]

Инструменты

Сообщество OBO Foundry также занимается разработкой инструментов, облегчающих создание и поддержку онтологий. Большинство разработчиков онтологий в ОБО используют Протеже редактор онтологий и Язык веб-онтологий (OWL) для построения онтологий. Чтобы облегчить командная строка Для управления онтологиями в формате, совместимом с Protégé и OWL, компания OBO Foundry разработала инструмент ROBOT (ROBOT - это инструмент OBO). ROBOT объединяет функции для рутинных задач в разработке онтологий, является Открытый исходный код, и может использоваться либо через командную строку, либо как библиотеку для любого языка на Виртуальная машина Java.[7]

Другой инструмент, связанный с усилиями OBO: OBO-Edit,[8] редактор онтологий и рассуждающий финансируется Консорциум генных онтологий. Существуют также плагины для OBO-Edit, которые облегчают разработку онтологий, такие как полуавтоматический генератор онтологий DOG4DAG.[9]

Формат файлов OBO

Формат файла OBO - это язык, ориентированный на биологию, для построения онтологий. Он основан на принципах Язык веб-онтологий (OWL).

В рамках усилий сообщества были созданы стандартные общие сопоставления для двусторонних преобразований без потерь между форматом открытых биомедицинских онтологий (OBO) и OWL.[10][11] Исследование содержит методическое изучение каждой из конструкций OBO и слоеный пирог для OBO, аналогичный стеку семантической паутины.[12]

Онтологии литейного производства OBO

Первоначальный набор онтологий OBO Foundry состоял из зрелых онтологий (таких как Генная онтология, GO и Базовая модель анатомии, FMAO), путем слияния ранее существовавших онтологий (например, Cell Ontology,[13] CL, сформированный из различных специализированных онтологий,[14][15] и связанных частей на GO и FMAO), а также путем разработки новых онтологий, основанных на его принципах.[16]

Первоначальный набор онтологий также включал анатомическую онтологию рыбок данио.[17] (часть Информационная сеть по рыбкам данио ), CheBI онтология, Онтология болезней, то Онтология растений, то Онтология последовательности, то Онтология для биомедицинских исследований и Онтология белка.[16]

Количество онтологий в ОБО выросло до нескольких сотен, и они собраны в список онтологий OBO Foundry.

OBO Foundry и Викиданные

Ряд различных онтологий OBO Foundry также интегрирован в Викиданные граф знаний.[18][19] Это привело к интеграции структурированных онтологий OBO с данными из других баз данных, не относящихся к OBO. Например, интеграция Онтология болезней человека [20] к Викиданным разрешил ссылку на описание Сотовые линии с ресурса Целлозавр.[21] Одна из целей интеграции OBO Foundry в Викиданные - снизить барьеры для не-онтологов, которые могут вносить свой вклад в онтологии и использовать их. Викиданные, вероятно, легче понять и использовать, чем традиционные модели онтологий (которые требуют высокой степени специальных знаний).[22]

Принципы.

Краткое изложение принципов работы литейного производства OBO[23] для развития OBO-совместимых наук о жизни онтология:

Открытость

Онтологии доступны в открытом доступе и должны выпускаться под лицензией. CC-BY 3.0 или в общественном достоянии (CC0 ).[24] Открытость онтологий позволила, например, импортировать термины из Генная онтология (одна из онтологий, соответствующих Принципам ОБО) в Викиданные проект.[25]

Общий формат

Онтологии должны быть доступны в общем формальный язык. На практике это означает, что онтологии, входящие в состав OBO, должны описывать элементы без форматов OWL /OWL2 или же OBO используя RDF / XML синтаксис для максимальной совместимости.[26]

Ортогональность

Отображение идентификаторов OBO в унифицированные идентификаторы ресурсов OBO (URI), уникальные для каждого элемента.[10]

Термины должны быть уникальными в пространстве OBO, что означает, что каждый элемент имеет уникальный префикс онтологии (например, ЧЕБИ, ИДТИ, PRO ) и локальный числовой идентификатор в онтологии.[27] Выбор числового идентификатора был сделан для улучшения обслуживания и развития ресурсов.[28] Чтобы участвовать в OBO Foundry, онтологии должны быть ортогональными, а концепции, которые они моделируют, должны быть уникальными в пределах OBO, поэтому каждая концепция имеет единую Универсальный идентификатор ресурса (URI). Таким образом, новые онтологии должны повторно использовать работу, проделанную в других целях.[28]

Несмотря на идеал уникальности терминов и взаимодействия, на практике это трудно обеспечить, что приводит к возникновению дублирования терминов. Более того, некоторые онтологии не используют повторно термины и даже не используют их ненадлежащим образом.[29]

Управление версиями

Онтологии развиваются во времени, уточняя концепции и описания в соответствии с прогрессом в знании их конкретных областей.[30] Чтобы гарантировать, что новые версии обновляются, но инструменты, которые используют старую версию онтологий, все еще функционируют, OBO применяет систему системы управления версиями, при этом каждая версия онтологии получает уникальный идентификатор в формате даты или системы нумерации, и метаданные даги.[31]

Объем

Онтологии должны иметь четко определенную область действия (область, которую они намереваются охватить).[32]

Есть текстовые определения

Онтологии должны иметь текстовые определения для каждого элемента в человек читаемый путь. Это означает, что, помимо буквенно-цифровой идентификации каждого элемента, они должны описываться на естественном языке с помощью логических утверждений, следующих за Аристотелевская логика способом, уникальным в рамках онтологии.[33]

Стандартизированные отношения и онтология отношений (RO)

Онтологии должны использовать отношения между элементами из Онтология отношений (RO). Это гарантирует бесшовную интеграцию различных онтологий, что особенно важно для логический вывод.[34]

Онтология отношений (RO) - это онтология предназначен для представления отношения между различными биомедицинскими концепциями.[35] Он строго описывает такие отношения, как «part_of», «location_in» и «previous_by», которые повторно используются многими онтологиями OBO Foundry.

Документация

Онтологии ОБО необходимо тщательно документировать. Часто это делается через GitHub репозитории для каждой конкретной онтологии (см. Список онтологий OBO Foundry ).[36]

Множественность пользователей

Онтологии должны быть полезны для множества разных людей, и разработчики онтологий должны документировать доказательства использования. Этот критерий важен для процесса проверки. Примеры использования включают ссылки на термины из других онтологий, использование в семантическая сеть проекты, использование в аннотации или другие исследовательские приложения.[37]

Открытость к сотрудничеству

Онтологии должны быть разработаны таким образом, чтобы позволять сотрудничество с другими членами OBO Foundry.[38]

Локус власти

В онтологиях должен быть один человек, ответственный за онтологию, который опосредует взаимодействие с сообществом.[39]

Соглашения об именах

Соглашения об именах для онтологий OBO нацелены на то, чтобы сделать первичные метки однозначными и уникальными внутри онтологии (и предпочтительно внутри OBO). Ярлыки и синонимы должны быть написаны на английском языке, избегая использования подчеркивает и верблюд.[40] В OBO отсутствует механизм многоязычной поддержки, в отличие от Викиданные, что позволяет использовать метки в разных системах. Система именования в OBO основана на серии исследований по каталогизации соглашений об именовании текущих онтологий, а также выявлению вопросов, связанных с этими соглашениями.[41]

Обслуживание

Онтологии следует обновлять с учетом изменений в научный консенсус. OBO Foundry определяет научный консенсус как «несколько публикаций независимых лабораторий в течение года приходят к одному и тому же выводу, и нет или нет или ограничено (<10%) особых мнений, опубликованных в один и тот же период времени». [42]

Смотрите также

Рекомендации

  1. ^ а б c Смит Б., Эшбернер М., Росс С., Бард Дж., Баг В., Цеустерс В. и др. (Ноябрь 2007 г.). «The OBO Foundry: скоординированная эволюция онтологий для поддержки интеграции биомедицинских данных». Природа Биотехнологии. 25 (11): 1251–5. Дои:10.1038 / nbt1346. ЧВК  2814061. PMID  17989687.
  2. ^ Мунгалл, Кристофер Дж; Гкоутос, Георгиос V; Смит, Синтия Л; Хендель, Мелисса А; Льюис, Сюзанна Э; Эшбернер, Майкл (2010). «Интеграция онтологий фенотипов нескольких видов». Геномная биология. 11 (1): R2. Дои:10.1186 / gb-2010-11-1-r2. ISSN  1465-6906. ЧВК  2847714. PMID  20064205.
  3. ^ Симояма, Мэри; Симояма, Мэри; Двинелл, Мелинда; Джейкоб, Ховард (2009-08-05). «Множественные онтологии для интеграции сложных наборов данных фенотипа». Природа предшествует. Дои:10.1038 / npre.2009.3554. ISSN  1756-0357.
  4. ^ Кисть MH, Василевский N, Torniai C, Johnson T, Shaffer C, Haendel M (2011). «Разработка онтологии приложения реагента в рамках OBO Foundry». Материалы семинара CEUR. 833: 234–236.
  5. ^ Сантамария SL (2012). Разработка животных в контекстной онтологии (PDF). Материалы Международной конференции по биомедицинской онтологии. Грац.
  6. ^ Сейед, Патрис и Стюарт С. Шапиро. (2011). Применение жесткости к стандартизации онтологий-кандидатов OBO Foundry (PDF). Труды Международной конференции по биомедицинской онтологии (CEUR 993).CS1 maint: несколько имен: список авторов (связь)
  7. ^ Джексон Р.С., Балхофф Дж. П., Дуглас Э., Харрис Н. Л., Мунгалл С. Джей, Овертон Дж. А. (июль 2019 г.). «РОБОТ: Инструмент для автоматизации рабочих процессов онтологий». BMC Bioinformatics. 20 (1): 407. Дои:10.1186 / s12859-019-3002-3. ЧВК  6664714. PMID  31357927.
  8. ^ Дэй-Рихтер Дж, Харрис М.А., Хендель М., Льюис С. (август 2007 г.). «ОБО-Edit - редактор онтологий для биологов». Биоинформатика. 23 (16): 2198–200. Дои:10.1093 / биоинформатика / btm112. PMID  17545183.
  9. ^ Вахтер Т., Шредер М. (июнь 2010 г.). «Полуавтоматическая генерация онтологий в OBO-Edit». Биоинформатика. 26 (12): i88-96. Дои:10.1093 / биоинформатика / btq188. ЧВК  2881373. PMID  20529942.
  10. ^ а б Тирмизи, Сайед; Эйткен, Стюарт; Морейра, Дилван А; Мунгалл, Крис; Секеда, Хуан; Шах, Нигам Х; Миранкер, Даниэль П. (2011). «Отображение языков онтологий OBO и OWL». Журнал биомедицинской семантики. 2 (Приложение 1): S3. Дои:10.1186 / 2041-1480-2-s1-s3. ISSN  2041-1480. ЧВК  3105495. PMID  21388572.
  11. ^ Голбрейх, Кристина; Хорридж, Мэтью; Хоррокс, Ян; Мотик, Борис; Ширер, Роб (2007), "OBO и OWL: Использование технологий семантической паутины для наук о жизни", Семантическая сеть, Springer Berlin Heidelberg, 4825, стр. 169–182, Bibcode:2007LNCS.4825..169G, Дои:10.1007/978-3-540-76298-0_13, ISBN  978-3-540-76297-3
  12. ^ Antezana, E .; Egana, M .; De Baets, B .; Kuiper, M .; Миронов, В. (2008). «ONTO-PERL: API для поддержки разработки и анализа био-онтологий». Биоинформатика. 24 (6): 885–887. Дои:10.1093 / биоинформатика / btn042. PMID  18245124.
  13. ^ Диль, Александр Д .; Михан, Терренс Ф .; Bradford, Yvonne M .; Brush, Matthew H .; Дахдул, Васила М .; Дугалл, Дэвид С .; Он, Юнцюнь; Осуми-Сазерленд, Дэвид; Руттенберг, Алан; Сарнтивиджай, Сирарат; Ван Слайк, Кери Э. (04.07.2016). «Cell Ontology 2016: улучшенное содержание, модуляризация и взаимодействие онтологий». Журнал биомедицинской семантики. 7 (1): 44. Дои:10.1186 / s13326-016-0088-7. ISSN  2041-1480. ЧВК  4932724. PMID  27377652.
  14. ^ Бард, Джонатан; Rhee, Seung Y .; Эшбёрнер, Майкл (2005-01-14). «Онтология типов клеток». Геномная биология. 6 (2): R21. Дои:10.1186 / gb-2005-6-2-r21. ISSN  1474-760X. ЧВК  551541. PMID  15693950.
  15. ^ Келсо, Дж. (12 мая 2003 г.). «eVOC: контролируемый словарь для унификации данных по экспрессии генов». Геномные исследования. 13 (6): 1222–1230. Дои:10.1101 / гр.985203. ISSN  1088-9051. ЧВК  403650. PMID  12799354.
  16. ^ а б Смит, Барри; Эшбернер, Майкл; Россе, Корнелиус; Бард, Джонатан; Баг, Уильям; Цеустерс, Вернер; Голдберг, Луи Дж; Эйлбек, Карен; Ирландия, Амелия; Мунгалл, Кристофер Дж; Леонтис, Неокл (ноябрь 2007 г.). «The OBO Foundry: скоординированная эволюция онтологий для поддержки интеграции биомедицинских данных». Природа Биотехнологии. 25 (11): 1251–1255. Дои:10.1038 / nbt1346. ISSN  1087-0156. ЧВК  2814061. PMID  17989687.
  17. ^ Ван Слайк, Кери Э .; Bradford, Yvonne M .; Вестерфилд, Монте; Хендель, Мелисса А. (25 февраля 2014 г.). «Анатомия рыбок данио и онтологии стадии: представление анатомии и развития Данио рерио». Журнал биомедицинской семантики. 5 (1): 12. Дои:10.1186/2041-1480-5-12. ISSN  2041-1480. ЧВК  3944782. PMID  24568621.
  18. ^ Ваагмеестер, Андра; Ступп, Грегори; Бургшталлер-Мюльбахер, Себастьян; Хорошо, Бенджамин М; Гриффит, Малахи; Гриффит, Оби Л.; Хансперс, Кристина; Hermjakob, Henning; Хадсон, Тоби С; Гибиске, Кевин; Китинг, Сара М (2020-03-17). Роджерс, Питер; Мунгалл, Крис (ред.). «Викиданные как граф знаний для наук о жизни». eLife. 9: e52614. Дои:10.7554 / eLife.52614. ISSN  2050-084X. ЧВК  7077981. PMID  32180547.
  19. ^ Турки, Хусемеддин; Шафи, Томас; Хадж Тайеб, Мохамед Али; Бен Ауича, Мохамед; Врандечич, Денни; Дас, Диптаншу; Хамди, Хельми (2019-11-01). «Викиданные: крупномасштабная совместная онтологическая медицинская база данных». Журнал биомедицинской информатики. 99: 103292. Дои:10.1016 / j.jbi.2019.103292. ISSN  1532-0464. PMID  31557529.
  20. ^ Schriml, Lynn M .; Митрака, Эльвира; Манро, Джеймс; Таубер, Бекки; Щор, Майк; Никль, Лэнс; Феликс, Виктор; Дженг, Линда; Предъявитель, Синтия; Лихенштейн, Ричард; Бисорди, Кэтрин (2019-01-08). «Обновление Human Disease Ontology 2018: классификация, содержание и расширение рабочего процесса». Исследования нуклеиновых кислот. 47 (D1): D955 – D962. Дои:10.1093 / нар / gky1032. ISSN  0305-1048. ЧВК  6323977. PMID  30407550.
  21. ^ "HeLa". www.wikidata.org. Получено 2020-05-04.
  22. ^ Якобсен, Анника; Ваагмеестер, Андра; Калияперумал, Раджарам; Ступп, Грегори С .; М. Шримл, Линн; Томпсон, Марк; И. Су, Андрей; Роос, Марко (2018-12-04). «Викиданные как интуитивно понятный ресурс для семантического моделирования данных в FAIRification». Фигшер. Дои:10.6084 / m9.figshare.7415282.v2.
  23. ^ "Обзор". obofoundry.org. Получено 2020-02-06.
  24. ^ «Открытый (принцип 1)». obofoundry.org. Получено 2020-02-06.
  25. ^ Burgstaller-Muehlbacher S, Waagmeester A, Mitraka E, Turner J, Putman T, Leong J, et al. (01.01.2016). «Викиданные как семантическая структура для инициативы Gene Wiki». База данных. 2016: baw015. Дои:10.1093 / база данных / baw015. ЧВК  4795929. PMID  26989148.
  26. ^ «Единый формат (принцип 2)». obofoundry.org. Получено 2020-02-06.
  27. ^ «URI / пространство идентификаторов (принцип 3)». obofoundry.org. Получено 2020-02-06.
  28. ^ а б Курто М., Мунгалл С., Бринкман Р.Р., Руттенберг А. (2010). Создание политики OBO Foundry - по одному. Материалы CEURS: Международная конференция по биомедицинским онтологиям.
  29. ^ Газвинян А., Ной Н.Ф., Мусен М.А. (май 2011 г.). «Насколько ортогональны онтологии OBO Foundry?». Журнал биомедицинской семантики. 2 Дополнение 2 (Дополнение 2): S2. Дои:10.1186 / 2041-1480-2-s2-s2. ЧВК  3102891. PMID  21624157.
  30. ^ Грос, Аника; Пруски, Седрик; Рам, Эрхард (2016). «Эволюция биомедицинских онтологий и отображений: Обзор последних подходов». Журнал вычислительной и структурной биотехнологии. 14: 333–340. Дои:10.1016 / j.csbj.2016.08.002. ISSN  2001-0370. ЧВК  5018063. PMID  27642503.
  31. ^ «Управление версиями (принцип 4)». obofoundry.org. Получено 2020-02-06.
  32. ^ «Объем (принцип 5)». obofoundry.org. Получено 2020-02-06.
  33. ^ «Текстовые определения (принцип 6)». obofoundry.org. Получено 2020-02-06.
  34. ^ «Отношения (принцип 7)». obofoundry.org. Получено 2020-02-06.
  35. ^ Смит, Барри; Цеустерс, Вернер; Клаггес, Берт; Келер, Якоб; Кумар, Ананд; Ломакс, Джейн; Мунгалл, Крис; Нейгауз, Фабиан; Ректор, Алан Л; Россе, Корнелиус (2005). «Отношения в биомедицинских онтологиях». Геномная биология. 6 (5): R46. Дои:10.1186 / gb-2005-6-5-r46. ЧВК  1175958. PMID  15892874.
  36. ^ «Документация (принцип 8)». obofoundry.org. Получено 2020-02-06.
  37. ^ «Документированное множество пользователей (принцип 9)». obofoundry.org. Получено 2020-02-06.
  38. ^ «Приверженность сотрудничеству (принцип 10)». obofoundry.org. Получено 2020-02-06.
  39. ^ «Локус власти (принцип 11)». obofoundry.org. Получено 2020-02-06.
  40. ^ «Соглашения об именах (принцип 12)». obofoundry.org. Получено 2020-02-06.
  41. ^ Шобер, Дэниел; Смит, Барри; Льюис, Сюзанна Э; Куснерчик, Вацлав; Ломакс, Джейн; Мунгалл, Крис; Тейлор, Крис Ф; Рокка-Серра, Филипп; Сансоне, Сусанна-Ассунта (2009). «Соглашения об именах на основе опросов для использования при разработке онтологии OBO Foundry». BMC Bioinformatics. 10 (1): 125. Дои:10.1186/1471-2105-10-125. ISSN  1471-2105. ЧВК  2684543. PMID  19397794.
  42. ^ «Техническое обслуживание (принцип 16)». obofoundry.org. Получено 2020-02-06.

внешняя ссылка