Справочная база данных белков человека - Human Protein Reference Database

В Справочная база данных белков человека (HPRD) это белок база данных доступный через Интернет.[1]

Обзор

HPRD - результат международного сотрудничества Института биоинформатики в Бангалоре, Индия, и лаборатории Pandey в Университет Джона Хопкинса в Балтиморе, США. HPRD содержит вручную подобранную научную информацию, относящуюся к биологии большинства белков человека. Информация о белках, участвующих в заболеваниях человека, аннотирована и связана с онлайн-базой данных по менделевскому наследованию в человеке (OMIM). Национальный центр биотехнологической информации обеспечивает связь с HPRD через свои базы данных белков человека (например, Entrez Gene, белок RefSeq, относящийся к генам и белкам.

Этот ресурс содержит информацию о функциях белков человека, включая белок-белковые взаимодействия, посттрансляционные модификации, фермент-субстратные отношения и ассоциации болезней. Каталогизированная информация о белках была получена путем ручного курирования с использованием опубликованной литературы опытными биологами и с помощью биоинформатического анализа белковой последовательности. Данные белок-белкового взаимодействия и субклеточной локализации из HPRD были использованы для разработки сети взаимодействия белков человека.[2]

Основные характеристики HPRD:

  • Из 10 000 белок-белковых взаимодействий (PPI), аннотированных для 3 000 белков в 2003 г., к концу 2007 г. HPRD вырос до более 36 500 уникальных PPI, аннотированных для 25 000 белков, включая 6 360 изоформ.[3]
  • Более 50% молекул, аннотированных в HPRD, имеют по крайней мере один PPI, а 10% имеют более 10 PPI.
  • Эксперименты с ИПП в широком смысле сгруппированы в три категории, а именно: in vitro, in vivo и дрожжи двугибридные (Y2H). Шестьдесят процентов ИЦП, аннотированных в HPRD, поддерживаются одним экспериментом, в то время как 26% ​​из них имеют аннотации к двум из трех экспериментальных методов.
  • HPRD содержит 18 000 вручную подобранных данных PTM, принадлежащих 26 различным типам. Фосфорилирование является ведущим типом модификации белка, на который приходится 63% данных PTM, аннотированных в HPRD. Гликозилирование, протеолитическое расщепление и дисульфидный мостик события являются следующими ведущими поставщиками данных PTM.
  • Данные HPRD доступны для загрузки в виде разделенных табуляцией и XML форматы файлов.[4]

HPRD также объединяет данные из Человеческая протеинпедия, портал сообщества для интеграции данных о человеческих белках. Данные из HPRD могут быть свободно доступны и использоваться академическими пользователями, в то время как коммерческие организации должны получить лицензию на использование. Человеческая протеинпедия[5] содержимое свободно доступно для загрузки и использования кем угодно.

PhosphoMotif Finder

PhosphoMotif Finder[6] содержит известный субстрат киназы / фосфатазы, а также связывающие мотивы, которые собраны из опубликованной литературы. Он сообщает ПРИСУТСТВИЕ любого литературного мотива в запросной последовательности. PhosphoMotif Finder НЕ ПРОГНОЗИРУЕТ какие-либо мотивы в последовательности запрашиваемого белка с использованием любого алгоритма или других вычислительных стратегий.

Сравнение данных по белку

Существуют и другие базы данных, которые имеют дело с протеомом человека (например, BioGRID, BIND, DIP, HPRD, IntAct, MINT, MIPS, PDZBase и Reactome). Каждая база данных имеет свой стиль представления данных. Большинству исследователей сложно сравнить объемные данные из этих баз данных, чтобы сделать выводы о сильных и слабых сторонах каждой базы данных. Мативанан и его коллеги [7] пытался решить эту проблему, анализируя данные о белках, задавая различные вопросы. Этот анализ поможет биологам сделать выбор среди этих баз данных в зависимости от их потребностей.

Рекомендации

  1. ^ Peri S, et al. (2003). «Разработка справочной базы данных белков человека в качестве начальной платформы для подхода к системной биологии человека». Геномные исследования. 13 (10): 2363–71. Дои:10.1101 / гр.1680803. ЧВК  403728. PMID  14525934.
  2. ^ Ганди Т.К.Б .; и другие. (Март 2006 г.). «Анализ взаимодействия белков человека и сравнение с наборами данных взаимодействия дрожжей, червей и мух». Природа Генетика. 38 (3): 285–293. Дои:10,1038 / ng1747. PMID  16501559. S2CID  1446423.
  3. ^ Mathivanan S .; и другие. (2006). «Оценка общедоступных данных белок-белкового взаимодействия человека». BMC Bioinformatics. 2006 (7): S19. Дои:10.1186 / 1471-2105-7-s5-s19. ЧВК  1764475. PMID  17254303.
  4. ^ Mishra G .; и другие. (2006). «Справочная база данных белков человека - обновление 2006 г.». Исследования нуклеиновых кислот. 34 (Выпуск базы данных): 411–414. Дои:10.1093 / nar / gkj141. ЧВК  1347503. PMID  16381900.
  5. ^ Mathivanan S .; и другие. (2008). «Human Proteinpedia позволяет обмениваться данными о человеческих белках» (PDF). Природа Биотехнологии. 26 (2): 164–167. Дои:10.1038 / nbt0208-164. HDL:10261/60528. PMID  18259167. S2CID  205265347.
  6. ^ Amanchy R .; и другие. (2007). «Сборник тщательно подобранных субстратов на основе фосфорилирования и связывающих мотивов». Природа Биотехнологии. 2007 (25): 285–286. Дои:10.1038 / nbt0307-285. PMID  17344875. S2CID  38824337.
  7. ^ Мативанан С., Периасвами Б., Ганди Т.К. и др. (2006). «Оценка общедоступных данных белок-белкового взаимодействия человека». BMC Bioinformatics. 7 Приложение 5: S19. Дои:10.1186 / 1471-2105-7-S5-S19. ЧВК  1764475. PMID  17254303.

внешняя ссылка