Справочная база данных белков человека - Human Protein Reference Database
Эта статья слишком полагается на Рекомендации к основные источники.Ноябрь 2008 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
В Справочная база данных белков человека (HPRD) это белок база данных доступный через Интернет.[1]
Обзор
HPRD - результат международного сотрудничества Института биоинформатики в Бангалоре, Индия, и лаборатории Pandey в Университет Джона Хопкинса в Балтиморе, США. HPRD содержит вручную подобранную научную информацию, относящуюся к биологии большинства белков человека. Информация о белках, участвующих в заболеваниях человека, аннотирована и связана с онлайн-базой данных по менделевскому наследованию в человеке (OMIM). Национальный центр биотехнологической информации обеспечивает связь с HPRD через свои базы данных белков человека (например, Entrez Gene, белок RefSeq, относящийся к генам и белкам.
Этот ресурс содержит информацию о функциях белков человека, включая белок-белковые взаимодействия, посттрансляционные модификации, фермент-субстратные отношения и ассоциации болезней. Каталогизированная информация о белках была получена путем ручного курирования с использованием опубликованной литературы опытными биологами и с помощью биоинформатического анализа белковой последовательности. Данные белок-белкового взаимодействия и субклеточной локализации из HPRD были использованы для разработки сети взаимодействия белков человека.[2]
Основные характеристики HPRD:
- Из 10 000 белок-белковых взаимодействий (PPI), аннотированных для 3 000 белков в 2003 г., к концу 2007 г. HPRD вырос до более 36 500 уникальных PPI, аннотированных для 25 000 белков, включая 6 360 изоформ.[3]
- Более 50% молекул, аннотированных в HPRD, имеют по крайней мере один PPI, а 10% имеют более 10 PPI.
- Эксперименты с ИПП в широком смысле сгруппированы в три категории, а именно: in vitro, in vivo и дрожжи двугибридные (Y2H). Шестьдесят процентов ИЦП, аннотированных в HPRD, поддерживаются одним экспериментом, в то время как 26% из них имеют аннотации к двум из трех экспериментальных методов.
- HPRD содержит 18 000 вручную подобранных данных PTM, принадлежащих 26 различным типам. Фосфорилирование является ведущим типом модификации белка, на который приходится 63% данных PTM, аннотированных в HPRD. Гликозилирование, протеолитическое расщепление и дисульфидный мостик события являются следующими ведущими поставщиками данных PTM.
- Данные HPRD доступны для загрузки в виде разделенных табуляцией и XML форматы файлов.[4]
HPRD также объединяет данные из Человеческая протеинпедия, портал сообщества для интеграции данных о человеческих белках. Данные из HPRD могут быть свободно доступны и использоваться академическими пользователями, в то время как коммерческие организации должны получить лицензию на использование. Человеческая протеинпедия[5] содержимое свободно доступно для загрузки и использования кем угодно.
PhosphoMotif Finder
PhosphoMotif Finder[6] содержит известный субстрат киназы / фосфатазы, а также связывающие мотивы, которые собраны из опубликованной литературы. Он сообщает ПРИСУТСТВИЕ любого литературного мотива в запросной последовательности. PhosphoMotif Finder НЕ ПРОГНОЗИРУЕТ какие-либо мотивы в последовательности запрашиваемого белка с использованием любого алгоритма или других вычислительных стратегий.
Сравнение данных по белку
Существуют и другие базы данных, которые имеют дело с протеомом человека (например, BioGRID, BIND, DIP, HPRD, IntAct, MINT, MIPS, PDZBase и Reactome). Каждая база данных имеет свой стиль представления данных. Большинству исследователей сложно сравнить объемные данные из этих баз данных, чтобы сделать выводы о сильных и слабых сторонах каждой базы данных. Мативанан и его коллеги [7] пытался решить эту проблему, анализируя данные о белках, задавая различные вопросы. Этот анализ поможет биологам сделать выбор среди этих баз данных в зависимости от их потребностей.
Рекомендации
- ^ Peri S, et al. (2003). «Разработка справочной базы данных белков человека в качестве начальной платформы для подхода к системной биологии человека». Геномные исследования. 13 (10): 2363–71. Дои:10.1101 / гр.1680803. ЧВК 403728. PMID 14525934.
- ^ Ганди Т.К.Б .; и другие. (Март 2006 г.). «Анализ взаимодействия белков человека и сравнение с наборами данных взаимодействия дрожжей, червей и мух». Природа Генетика. 38 (3): 285–293. Дои:10,1038 / ng1747. PMID 16501559. S2CID 1446423.
- ^ Mathivanan S .; и другие. (2006). «Оценка общедоступных данных белок-белкового взаимодействия человека». BMC Bioinformatics. 2006 (7): S19. Дои:10.1186 / 1471-2105-7-s5-s19. ЧВК 1764475. PMID 17254303.
- ^ Mishra G .; и другие. (2006). «Справочная база данных белков человека - обновление 2006 г.». Исследования нуклеиновых кислот. 34 (Выпуск базы данных): 411–414. Дои:10.1093 / nar / gkj141. ЧВК 1347503. PMID 16381900.
- ^ Mathivanan S .; и другие. (2008). «Human Proteinpedia позволяет обмениваться данными о человеческих белках» (PDF). Природа Биотехнологии. 26 (2): 164–167. Дои:10.1038 / nbt0208-164. HDL:10261/60528. PMID 18259167. S2CID 205265347.
- ^ Amanchy R .; и другие. (2007). «Сборник тщательно подобранных субстратов на основе фосфорилирования и связывающих мотивов». Природа Биотехнологии. 2007 (25): 285–286. Дои:10.1038 / nbt0307-285. PMID 17344875. S2CID 38824337.
- ^ Мативанан С., Периасвами Б., Ганди Т.К. и др. (2006). «Оценка общедоступных данных белок-белкового взаимодействия человека». BMC Bioinformatics. 7 Приложение 5: S19. Дои:10.1186 / 1471-2105-7-S5-S19. ЧВК 1764475. PMID 17254303.