База данных универсальных модельных организмов - Generic Model Organism Database

Логотип проекта Базы данных универсальных модельных организмов

В База данных универсальных модельных организмов (GMOD) предоставляет биологическим исследовательским сообществам инструментарий программное обеспечение с открытым исходным кодом компоненты для визуализации, аннотирования, управления и хранения биологических данных. Проект GMOD финансируется США. Национальные институты здоровья, Национальный фонд науки и Служба сельскохозяйственных исследований Министерства сельского хозяйства США.

История

Проект GMOD был начат в начале 2000-х годов как сотрудничество нескольких базы данных моделей организмов (МОДЫ) кто разделял потребность создавать похожие программного обеспечения инструменты для обработки данных из проектов секвенирования. MOD, или специфичные для организма базы данных, описывать геном и другая информация о важных экспериментальные организмы в науках о жизни и охватить большие объемы данных и информации, генерируемые современными биология. Вместо того, чтобы каждая группа разрабатывала собственное программное обеспечение, четыре основных мода:FlyBase, База данных генома Saccharomyces, База данных генома мышей, и WormBase - работали вместе для создания приложений, которые обеспечивают функциональность, необходимую для всех модов, например, программное обеспечение, помогающее управлять данными в моде, а также помогать пользователям получать доступ к данным и запрашивать их.

Проект GMOD направлен на обеспечение взаимодействия программных компонентов. С этой целью многие инструменты используют общий формат файла ввода / вывода или запускаются из базы данных схемы Chado.

Схема базы данных Chado

Чадо[1] Схема направлена ​​на охват многих классов данных, часто используемых современными биологами, от генетических данных до филогенетических деревьев, публикаций и организмов, данных микрочипов, идентификаторов и экспрессии РНК / белков. Чадо широко использует контролируемые словари для ввода всех сущностей в базе данных; например: гены, транскрипты, экзоны, мобильные элементы и т. д. хранятся в таблице функций с типом, предоставленным Онтология последовательности. Когда новый тип добавляется в онтологию последовательности, таблица функций не требует модификации, только обновление данных в базе данных. То же самое можно сказать и о данных анализа, которые также можно хранить в Chado.

Существующие основные модули Чадо:

  • последовательность - для последовательностей / функций
  • cv - для контролируемых словарей / онтологий
  • общие - в настоящее время просто dbxrefs
  • организм - таксономические данные
  • pub - публикации и ссылки
  • companalysis - дополняет модуль последовательности данными вычислительного анализа
  • map - карты непоследовательности
  • генетико-генетические и фенотипические данные
  • выражение - экспрессия гена
  • естественное разнообразие - данные о населении

Программного обеспечения

Полный список компонентов программного обеспечения GMOD находится на странице компонентов GMOD. Эти компоненты включают:

  • GMOD Core (база данных и инструменты Chado)
    • Чадо: схема Чадо и инструменты для ее установки.
    • XORT: инструмент для загрузки и выгрузки chado-xml
    • GMODTools: извлекает данные из базы данных Chado в общие форматы групповых геномов (GFF, Fasta и т. Д.)
  • Сайт MOD
    • Tripal: веб-интерфейс на основе Drupal.
  • Редактирование и визуализация генома
    • Apollo: приложение Java для просмотра и редактирования аннотаций генома
    • GBrowse: CGI-приложение для отображения аннотаций генома[2]
    • JBrowse: приложение JavaScript для отображения аннотаций генома
    • Инструменты пути: браузер генома со сравнительным режимом
  • Сравнительная геномика
    • GBrowse_syn: программа просмотра synteny на основе GBrowse
    • CMap: приложение CGI для отображения сравнительных карт
  • Литературное руководство
    • Textpresso: система интеллектуального анализа текста для научной литературы
  • Инструменты запросов к базе данных
    • БиоМарт: система управления данными, ориентированная на запросы
    • InterMine: система хранилища данных с открытым исходным кодом
  • Биологические пути
    • Pathway Tools: инструменты для получения информации о метаболических путях и анализа данных функциональной геномики с высокой пропускной способностью.
  • Регулирующие сети
    • Инструменты пути: поддерживает определение регуляторных взаимодействий и просмотр регуляторных сетей.
  • Анализ

BioMartLogo.png

Участвующие базы данных

Следующие ниже базы данных организмов вносят свой вклад и / или принимают компоненты GMOD для баз данных модельных организмов.

АНИСИДАнтоноспораДБАрабидопсис
BeebaseBeetleBase[4]База данных генома крупного рогатого скота (BGD)
BioHealthBaseПросмотрщик QTL BovineБаза данных генов EST крупного рогатого скота
CGDCGLChromDB
Проект аннотации хромосомы 7CSHLmpdБаза данных геномных вариантов
DictyBase[5]ДРОСПЕГEcoCyc
FlyBaseСравнительная геномика грибовОбозреватель грибковых теломер
Браузер Gallus GenomeGeneDBGrainGenes
GrameneHapMapЧеловек 2q33
База данных сегментарного дублирования генома человекаIVDBМАГИ
Базы данных по морским биологическим лабораторным организмамИнформатика генома мышиБаза данных сегментарного дублирования, отличная от человека
OMAPOryGenesDBOryza Хромосома 8
Инструменты путиParameciumDB[6]АрахисКарта
РастенияDBPlasmoDBPomBase
PseudoCAPPossumBasePUMAdb
База данных генома крысыБаза данных генома SaccharomycesSGD Lite
SmedDBСеть Sol GenomicsSoybase
База данных Soybean GbrowseT1DBaseИнформационный ресурс по арабидопсису
TGDИнститут геномаИнститут геномных исследований
Браузер генома риса TIGRToxoDBTriAnnot BAC Viewer
VectorBasewFleaBase[7]WormBase
XanthusBaseXenbase

Связанные проекты

Смотрите также

Рекомендации

  1. ^ Кристофер Дж. Мунгалл; Дэвид Б. Эммерт; Консорциум FlyBase (2007). «Пример Чадо: основанная на онтологии модульная схема для представления связанной с геномом биологической информации». Биоинформатика. 23 (13): i337 – i346. Дои:10.1093 / биоинформатика / btm189. PMID  17646315.
  2. ^ Stein LD; Mungall C; Шу С; Caudy M; Mangone M; День А; Никерсон Э; Stajich JE; Харрис TW; Арва А; Льюис С. (2002). «Универсальный браузер генома: строительный блок для базы данных системы модельных организмов». Genome Res. 12 (10): 1599–610. Дои:10.1101 / гр. 403602. ЧВК  187535. PMID  12368253.
  3. ^ Afgan, E .; Baker, D .; ван ден Бик, М .; Бланкенберг, Д .; Bouvier, D .; Čech, M .; Чилтон, Дж .; Clements, D .; Coraor, N .; Эберхард, С .; Grüning, B .; Guerler, A .; Hillman-Jackson, J .; Von Kuster, G .; Rasche, E .; Soranzo, N .; Турага, Н .; Taylor, J .; Некрутенко, А .; Гокс, Дж. (8 июля 2016 г.). «Платформа Galaxy для доступных, воспроизводимых и совместных биомедицинских анализов: обновление 2016 г.». Исследования нуклеиновых кислот. 44 (W1): W3 – W10. Дои:10.1093 / нар / gkw343. ЧВК  4987906. PMID  27137889.
  4. ^ Ван Л; Ван С; Li Y; Paradesi MS; Браун SJ. (2007). «BeetleBase: база данных модельных организмов для Tribolium castaneum». Нуклеиновые кислоты Res. 35 (Выпуск базы данных): D476–9. Дои:10.1093 / нар / gkl776. ЧВК  1669707. PMID  17090595.
  5. ^ Чисхолм Р.Л .; Gaudet P; Просто ЭМ; Pilcher KE; Фей П; Торговец SN; Kibbe WA. (2006). "dictyBase, база данных модельных организмов Dictyostelium discoideum". Нуклеиновые кислоты Res. 34 (Выпуск базы данных): D423–7. Дои:10.1093 / nar / gkj090. ЧВК  1347453. PMID  16381903.
  6. ^ Arnaiz O; Каин С; Коэн Дж; Сперлинг Л. (2007). «ParameciumDB: ресурс сообщества, объединяющий последовательность генома Paramecium tetraurelia с генетическими данными». Нуклеиновые кислоты Res. 35 (Выпуск базы данных): D439–44. Дои:10.1093 / нар / gkl777. ЧВК  1669747. PMID  17142227.
  7. ^ Colbourne JK; Singan VR; Гилберт Д.Г. (2005). "wFleaBase: база данных генома дафний". BMC Bioinformatics. 6: 45. Дои:10.1186/1471-2105-6-45. ЧВК  555599. PMID  15752432.

внешняя ссылка