Протеогеномика - Proteogenomics - Wikipedia

Протеогеномика использует комплексный подход, объединяя геномику, протеомику и транскриптомику.

Протеогеномика это область биологических исследований, в которой используется сочетание протеомика, геномика, и транскриптомика чтобы помочь в обнаружении и идентификации пептиды. Протеогеномика используется для идентификации новых пептидов путем сравнения МС / МС спектры против базы данных белков, которая была получена из геномной и транскриптомной информации. Протеогеномика часто относится к исследованиям, в которых используется протеомная информация, часто полученная из масс-спектрометрии, улучшить ген аннотации.^[1] Геномика занимается генетическим кодом целых организмов, а транскриптомика занимается изучением секвенирования РНК и транскриптов. Протеомика использует тандемная масс-спектрометрия и жидкостная хроматография для выявления и изучения функций белков. Протеомика используется для обнаружения всех белков, экспрессируемых в организме, известных как его протеом.^[2] Проблема с протеомикой заключается в том, что она основана на предположении, что текущие генные модели верны и что правильные последовательности белков можно найти с помощью базы данных эталонных последовательностей белков; однако это не всегда так, поскольку некоторые пептиды не могут быть найдены в базе данных. Кроме того, новые белковые последовательности могут возникать в результате мутаций. эти проблемы могут быть исправлены с использованием протеомных, геномных и транскриптомных данных. Использование протеомики и геномики привело к протеогеномике, которая стала отдельной областью в 2004 году.^[1]^[3]^[4].

Совсем недавно совместное профилирование поверхностных белков и транскриптов мРНК из отдельных клеток с помощью таких методов, как CITE-Seq был назван одноклеточной протеогеномикой^[5]^[6], хотя цели этих исследований не связаны с идентификацией пептидов.

Методология

Изображение клетки эукариота, иллюстрирующее, как образуются белки: ДНК в ядре считывается РНК-полимеразой, затем рибосомы в цитоплазме производят аминокислотную цепь, которая складывается в функциональный белок.

Основная идея протеогеномного подхода состоит в том, чтобы идентифицировать пептиды путем сравнения данных МС / МС с базами данных белков, которые содержат предсказанные последовательности белков. База данных белков создается различными способами за счет использования геномных и транскриптомных данных. Ниже приведены некоторые способы создания баз данных белков:

Шестикадровый перевод

Шестикадровые переводы может использоваться для создания базы данных, которая предсказывает последовательности белков. Ограничение этого метода заключается в том, что базы данных будут очень большими из-за количества генерируемых последовательностей, некоторые из которых не существуют в природе.^[1]

Прогнозирование гена ab initio

В этом методе основа белка создается алгоритмами прогнозирования генов, которые позволяют идентифицировать белок. кодирующие области. База данных похожа на базу данных, сгенерированную шестикадровым преобразованием, в том смысле, что базы данных могут быть очень большими.^[1]

Выраженные данные тега последовательности

Шестикадровый перевод может использовать выраженный тег последовательности (EST) для создания баз данных белков. Данные EST предоставляют информацию о транскрипции, которая может помочь в создании базы данных. База данных может быть очень большой, и ее недостатком является наличие нескольких копий данной последовательности; однако эту проблему можно обойти, сжав последовательность белка, сгенерированную с помощью вычислительных стратегий.^[1]

Другие методы

Базы данных белков также могут быть созданы с помощью РНК данные секвенирования, аннотированные транскрипты РНК и вариантные белковые последовательности. Также существуют другие более специализированные базы данных белков, которые могут быть созданы для надлежащей идентификации интересующего пептида.^[1]

Другой метод идентификации белков с помощью протеогеномики - сравнительная протеогеномика. Сравнительная протеогеномика сравнивает протеомные данные нескольких родственных видов одновременно и использует гомологию между их белками для улучшения аннотаций с более высокой статистической достоверностью.^[7]^[8]

Приложения

Протеогеномика может применяться по-разному. Одно из приложений - улучшение аннотаций генов у различных организмов. Аннотации генов включают в себя открытие генов и их функций.^[9] Протеогеномика стала особенно полезной в открытии и улучшении аннотаций генов у прокариотических организмов. Например, геномная аннотация различных микроорганизмов была изучена с помощью протеогеномного подхода, включая: кишечная палочка, Микобактерии, и несколько видов Shewanella бактерии.^[10]

Помимо улучшения аннотаций генов, протеогеномные исследования также могут предоставить ценную информацию о наличии запрограммированных кадровые сдвиги, N-концевой метионин иссечение сигнальные пептиды, протеолиз и другие посттрансляционные модификации.^[3]^[7] Протеогеномика имеет потенциальное применение в медицине, особенно в онкология исследование. Рак возникает через генетические мутации Такие как метилирование, перемещение, и соматический мутации. Исследования показали, что для понимания молекулярных вариаций, ведущих к раку, необходима как геномная, так и протеомная информация.^[2]^[11] Протеогеномика помогла в этом путем идентификации белковых последовательностей, которые могут играть функциональную роль при раке.^[12] Конкретный пример этого произошел в исследовании рака толстой кишки, в результате которого были обнаружены потенциальные мишени для лечения рака.^[2] Протеогеномика также привела к созданию индивидуализированных иммунотерапевтических средств для борьбы с раком, при которых эпитопы антител к раковым антигенам предсказываются с использованием протеогеномики для создания лекарств, действующих на специфическую опухоль пациента.^[13] Помимо лечения, протеогенономика может помочь в диагностике рака. В исследованиях рака прямой и толстой кишки протеогеномика использовалась для выявления соматических мутаций. Идентификация соматических мутаций у пациентов может быть использована для диагностики рака у пациентов. Помимо прямого применения в лечении и диагностике рака, протеогеномный подход можно использовать для изучения белков, которые приводят к устойчивости к химиотерапия.^[11]

Вызовы

Протеогеномика может предлагать методы идентификации пептидов без недостатка неполных или неточных баз данных белков, с которыми сталкивается протеомика; тем не менее, существуют проблемы с протеогеномным подходом.^[1] Одна из самых больших проблем протеогеномики - это огромный размер создаваемых баз данных белков. статистически большая база данных белков с большей вероятностью приведет к неправильному сопоставлению данных из базы данных белков с данными MS / MS, эта проблема может затруднить идентификацию новых пептидов. Ложноположительные результаты также являются проблемой при использовании протеогеномных подходов. ложные срабатывания могут возникать в результате очень больших баз данных по белкам, где несовпадающие данные приводят к неправильной идентификации. Другой проблемой является неправильное сопоставление спектров МС / МС с данными последовательности белков, которые соответствуют аналогичному пептиду, а не фактическому пептиду. Есть случаи получения данных о пептиде, расположенном на нескольких сайтах гена, это может привести к данным, которые можно интерпретировать по-разному. Несмотря на эти проблемы, есть способы уменьшить количество возникающих ошибок. Например, имея дело с очень большой базой данных белков, можно сравнить идентифицированные новые пептидные последовательности со всеми последовательностями в базе данных, а затем сравнить посттрансляционные модификации. Затем можно определить, представляют ли две последовательности один и тот же пептид или два разных пептида.^[1]

Рекомендации

^ ^а ^б ^c ^d ^е ^ж ^грамм ^час Несвижский, Алексей I (1 ноября 2014 г.). «Протеогеномика: концепции, приложения и вычислительные стратегии». Методы природы. 11 (11): 1114–1125. Дои:10.1038 / nmeth.3144. ЧВК 4392723. PMID 25357241.
^ ^а ^б ^c Саджад, Васим; Рафик, Мухаммад; Али, Баркат; Хаят, Мухаммад; Зада, сахиб; Саджад, Васим; Кумар, Танвир (июль 2016 г.). «Протеогеномика: новая развивающаяся технология». ХАЯТИ Журнал биологических наук. 23 (3): 97–100. Дои:10.1016 / j.hjb.2016.11.002.
^ ^а ^б Гупта Н., Таннер С., Джайтли Н., Адкинс Дж. Н., Липтон М., Эдвардс Р., Ромайн М., Остерман А., Бафна В., Смит Р. Д. и др. Полный протеомный анализ посттрансляционных модификаций: применение масс-спектрометрии для протеогеномной аннотации. Genome Res. 2007. 17: 1362–1377.
^ . Ансон К., Пурвин С. О., Адкинс Дж. Н., Липтон М. С., Смит Р. Д. (2008) Протеогеномика: потребности и роли протеомики в аннотации генома. Краткий. Функц. Геномика Протеомика 7, 50–62.
^ «Электронная книга TotalSeq». BioLegend. Получено 23 ноября, 2020.
^ «Proteona выпускает секвенирование РНК ESCAPE ™ для измерения белка и РНК в отдельных клетках с упором на клинические вопросы». Proteona. Получено 23 ноября, 2020.
^ ^а ^б Гупта Н., Бенхамида Дж., Бхаргава В., Гудман Д., Каин Э., Керман И., Нгуен Н., Олликайнен Н., Родригес Дж., Ван Дж. И др. Сравнительная протеогеномика: сочетание масс-спектрометрии и сравнительной геномики для анализа нескольких геномов. Genome Res. 2008; 18: 1133–1142.
^ Gallien S., Perrodou E., Carapito C., Deshayes C., Reyrat JM, Van Dorsselaer A., Poch O., Schaeffer C., Lecompte O. (2009) Орто-протеогеномика: исследование множественных протеомов с помощью ортологии и нового Протокол на базе MS. Genome Res 19, 128–135.
^ Ansong, C .; Purvine, S.O .; Adkins, J. N .; Lipton, M. S .; Смит, Р. Д. (7 марта 2008 г.). «Протеогеномика: потребности и роли протеомики в аннотации генома». Брифинги по функциональной геномике и протеомике. 7 (1): 50–62. Дои:10.1093 / bfgp / eln010. PMID 18334489.
^ Кучарова, Вероника; Викер, Харальд Г. (декабрь 2014 г.). «Протеогеномика в микробиологии: правильный поворот на стыке геномики и протеомики». Протеомика. 14 (23–24): 2360–2675. Дои:10.1002 / pmic.201400168. HDL:1956/9547. PMID 25263021.
^ ^а ^б Шукла, Подол Д .; Махмуд, Джавед; Вуяскович, Желько (декабрь 2015 г.). «Комплексный протеогеномный подход для ранней диагностики и прогноза рака». Письма о раке. 369 (1): 28–36. Дои:10.1016 / j.canlet.2015.08.003. PMID 26276717.
^ Чемберс, Мэтью С .; Jagtap, Pratik D .; Джонсон, Джеймс Э .; Макгоуэн, Томас; Кумар, Правин; Онсонго, Гетирия; Герреро, Кэндис Р .; Барснес, Харальд; Водель, Марк (2017-11-01). "Доступный ресурс по информатике протеогеномики для исследователей рака". Исследования рака. 77 (21): e43 – e46. Дои:10.1158 / 0008-5472.can-17-0331. ЧВК 5675041. PMID 29092937.
^ Крич, Аманда Л .; Тинг, Инь С .; Гулдинг, Скотт П .; Саулд, Джон Ф.К .; Бартельме, Доминик; Руни, Майкл С .; Аддона, Терри А .; Абелин, Дженнифер Г. (2018). «Роль масс-спектрометрии и протеогеномики в продвижении предсказания эпитопа HLA». Протеомика. 18 (12): н / д. Дои:10.1002 / pmic.201700259. ISSN 1615-9861. ЧВК 6033110. PMID 29314742.

[auto-1] а ^б ^c ^d ^е ^ж ^грамм ^час Несвижский, Алексей I (1 ноября 2014 г.). «Протеогеномика: концепции, приложения и вычислительные стратегии». Методы природы. 11 (11): 1114–1125. Дои:10.1038 / nmeth.3144. ЧВК 4392723. PMID 25357241.

[auto1-2] а ^б ^c Саджад, Васим; Рафик, Мухаммад; Али, Баркат; Хаят, Мухаммад; Зада, сахиб; Саджад, Васим; Кумар, Танвир (июль 2016 г.). «Протеогеномика: новая развивающаяся технология». ХАЯТИ Журнал биологических наук. 23 (3): 97–100. Дои:10.1016 / j.hjb.2016.11.002.

[Gupta07-3] а ^б Гупта Н., Таннер С., Джайтли Н., Адкинс Дж. Н., Липтон М., Эдвардс Р., Ромайн М., Остерман А., Бафна В., Смит Р. Д. и др. Полный протеомный анализ посттрансляционных модификаций: применение масс-спектрометрии для протеогеномной аннотации. Genome Res. 2007. 17: 1362–1377.

[Ansong-4] . Ансон К., Пурвин С. О., Адкинс Дж. Н., Липтон М. С., Смит Р. Д. (2008) Протеогеномика: потребности и роли протеомики в аннотации генома. Краткий. Функц. Геномика Протеомика 7, 50–62.

[5] «Электронная книга TotalSeq». BioLegend. Получено 23 ноября, 2020.

[6] «Proteona выпускает секвенирование РНК ESCAPE ™ для измерения белка и РНК в отдельных клетках с упором на клинические вопросы». Proteona. Получено 23 ноября, 2020.

[Gupta08-7] а ^б Гупта Н., Бенхамида Дж., Бхаргава В., Гудман Д., Каин Э., Керман И., Нгуен Н., Олликайнен Н., Родригес Дж., Ван Дж. И др. Сравнительная протеогеномика: сочетание масс-спектрометрии и сравнительной геномики для анализа нескольких геномов. Genome Res. 2008; 18: 1133–1142.

[Gallien-8] Gallien S., Perrodou E., Carapito C., Deshayes C., Reyrat JM, Van Dorsselaer A., Poch O., Schaeffer C., Lecompte O. (2009) Орто-протеогеномика: исследование множественных протеомов с помощью ортологии и нового Протокол на базе MS. Genome Res 19, 128–135.

[9] Ansong, C .; Purvine, S.O .; Adkins, J. N .; Lipton, M. S .; Смит, Р. Д. (7 марта 2008 г.). «Протеогеномика: потребности и роли протеомики в аннотации генома». Брифинги по функциональной геномике и протеомике. 7 (1): 50–62. Дои:10.1093 / bfgp / eln010. PMID 18334489.

[10] Кучарова, Вероника; Викер, Харальд Г. (декабрь 2014 г.). «Протеогеномика в микробиологии: правильный поворот на стыке геномики и протеомики». Протеомика. 14 (23–24): 2360–2675. Дои:10.1002 / pmic.201400168. HDL:1956/9547. PMID 25263021.

[auto2-11] а ^б Шукла, Подол Д .; Махмуд, Джавед; Вуяскович, Желько (декабрь 2015 г.). «Комплексный протеогеномный подход для ранней диагностики и прогноза рака». Письма о раке. 369 (1): 28–36. Дои:10.1016 / j.canlet.2015.08.003. PMID 26276717.

[12] Чемберс, Мэтью С .; Jagtap, Pratik D .; Джонсон, Джеймс Э .; Макгоуэн, Томас; Кумар, Правин; Онсонго, Гетирия; Герреро, Кэндис Р .; Барснес, Харальд; Водель, Марк (2017-11-01). "Доступный ресурс по информатике протеогеномики для исследователей рака". Исследования рака. 77 (21): e43 – e46. Дои:10.1158 / 0008-5472.can-17-0331. ЧВК 5675041. PMID 29092937.

[13] Крич, Аманда Л .; Тинг, Инь С .; Гулдинг, Скотт П .; Саулд, Джон Ф.К .; Бартельме, Доминик; Руни, Майкл С .; Аддона, Терри А .; Абелин, Дженнифер Г. (2018). «Роль масс-спектрометрии и протеогеномики в продвижении предсказания эпитопа HLA». Протеомика. 18 (12): н / д. Дои:10.1002 / pmic.201700259. ISSN 1615-9861. ЧВК 6033110. PMID 29314742.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

Омикс
Геномика	Когнитивная геномика Вычислительная геномика Сравнительная геномика Функциональная геномика Геномный проект Проект генома человека Метагеномика Пангеномика Персональная геномика Социальная геномика Структурная геномика
Биоинформатика	Биочип Хеминформатика Хемогеномика Коннектомика Проект Human Connectome Гликомикс Иммуномика Липидомика Метаболомика Микробиомика Нутригеномика Палеополиплоидия Фармакогенетика Фармакогеномика Системная биология Токсикогеномика Транскриптомика
Структурная биология	Протеомика Проект протеома человека Протеомика карты вызовов Дизайн лекарств на основе структуры Протеомика экспрессии
Инструменты исследования	2-D электрофорез Масс-спектрометр Электрораспылительная ионизация Матричная лазерная десорбционная ионизация Матричный лазерно-десорбционный ионизационно-времяпролетный масс-спектрометр Инструменты на основе микрофлюидов Теги сродства изотопов
Организации	Банк данных ДНК Японии (JP) Европейская лаборатория молекулярной биологии (ЕВРОПА) Национальные институты здоровья (СОЕДИНЕННЫЕ ШТАТЫ АМЕРИКИ) Институт Wellcome Sanger (ВЕЛИКОБРИТАНИЯ)
Список Категория