Секвенирование белков - Protein sequencing

Использование секвенатора белок-пептид Beckman-Spinco, 1970 г.

Секвенирование белков это практический процесс определения аминокислотная последовательность всего или части белок или же пептид. Это может служить для идентификации белка или характеристики его посттрансляционные модификации. Как правило, частичное секвенирование белка дает достаточно информации (один или несколько тегов последовательности) для его идентификации со ссылкой на базы данных последовательностей белков, полученных из концептуальных перевод из гены.

Двумя основными прямыми методами секвенирования белков являются: масс-спектрометрии и Эдман деградация используя секвенатор белков (секвенсор). Методы масс-спектрометрии в настоящее время наиболее широко используются для секвенирования и идентификации белков, но деградация по Эдману остается ценным инструментом для определения характеристик белков. N-терминал.

Определение аминокислотного состава

Часто желательно знать неупорядоченный аминокислотный состав белка до попытки найти упорядоченную последовательность, так как это знание может использоваться для облегчения обнаружения ошибок в процессе секвенирования или для различения неоднозначных результатов. Знание частоты встречаемости определенных аминокислот также может быть использовано для выбора протеаза использовать для переваривания белка. Также может быть определено неправильное включение низких уровней нестандартных аминокислот (например, норлейцина) в белки.[1] Обобщенный метод, часто называемый аминокислотный анализ[2] для определения аминокислотной частоты выглядит следующим образом:

  1. Гидролиз известного количества белка на составляющие его аминокислоты.
  2. Разделите и определите количество аминокислот каким-либо образом.

Гидролиз

Гидролиз осуществляется нагреванием образца белка в 6 M соляная кислота до 100–110 ° C в течение 24 часов или дольше. Белки с большим количеством объемных гидрофобный группам может потребоваться более длительный период обогрева. Однако эти условия настолько сильны, что некоторые аминокислоты (серин, треонин, тирозин, триптофан, глутамин, и цистеин ) деградированы. Чтобы обойти эту проблему, Biochemistry Online предлагает нагревать отдельные образцы в течение разного времени, анализировать каждый полученный раствор и экстраполировать обратно на нулевое время гидролиза. Расталл предлагает различные реагенты для предотвращения или уменьшения разложения, такие как тиол реагенты или же фенол для защиты триптофана и тирозина от воздействия хлора и предварительного окисления цистеина. Он также предлагает измерить количество аммиак эволюционировал, чтобы определить степень гидролиз амида.

Разделение и количественный анализ

Аминокислоты могут быть разделены ионообменная хроматография затем дериватизированы, чтобы облегчить их обнаружение. Чаще аминокислоты дериватизируются, а затем разделяются обращенно-фазовая ВЭЖХ.

Пример ионообменной хроматографии дан NTRC с использованием сульфированного полистирола в качестве матрицы, добавления аминокислот в кислотный раствор и пропускания буфера с постоянно увеличивающейся pH через колонку. Аминокислоты элюируются, когда pH достигает своего соответствующего значения. изоэлектрические точки. После разделения аминокислот определяют их соответствующие количества, добавляя реагент, который образует окрашенное производное. Если количество аминокислот превышает 10 нмоль, нингидрин можно использовать для этого; при реакции с пролином он дает желтый цвет, а с другими аминокислотами - ярко-фиолетовый. Концентрация аминокислоты пропорциональна поглощению полученного раствора. В очень малых количествах, вплоть до 10 пмоль, флуоресцентные производные могут быть образованы с использованием таких реагентов, как орто-фтальдегид (OPA) или же флуоресцин.

Для получения производных перед колонкой можно использовать реагент Эдмана для получения производного, которое определяется УФ-светом. Более высокая чувствительность достигается при использовании реагента, образующего флуоресцентное производное. Дериватизированные аминокислоты подвергают обращенно-фазовой хроматографии, обычно с использованием C8 или C18. колонка с диоксидом кремния и оптимизированный элюирование градиент. Элюирующие аминокислоты обнаруживают с помощью УФ-детектора или флуоресцентного детектора, а площади пиков сравнивают с площадями для производных стандартов, чтобы количественно определить каждую аминокислоту в образце.

N-концевой аминокислотный анализ

Метод Сенгера анализа концевых групп пептидов: А дериватизация N-терминальный конец с Реагент Сенгера (ДНФБ), B полный кислотный гидролиз динитрофенилпептида

Определение того, какая аминокислота образует N-терминал из пептид цепь полезна по двум причинам: чтобы помочь упорядочить последовательности отдельных пептидных фрагментов в целую цепь, и потому что первый раунд Эдман деградация часто загрязнен примесями и поэтому не дает точного определения N-концевая аминокислота. Обобщенный метод для N-концевой аминокислотный анализ:

  1. Взаимодействуйте с пептидом с реагентом, который избирательно метит концевую аминокислоту.
  2. Гидролизовать белок.
  3. Определите аминокислоту с помощью хроматографии и сравнения со стандартами.

Существует множество различных реагентов, которые можно использовать для мечения концевых аминокислот. Все они реагируют с аминогруппами и, следовательно, также будут связываться с аминогруппами в боковых цепях аминокислот, таких как лизин - по этой причине необходимо быть осторожным при интерпретации хроматограмм, чтобы убедиться, что выбрано правильное пятно. Два наиболее распространенных реагента: Реагент Сенгера (1-фтор-2,4-динитробензол ) и производные дансила, такие как дансил хлорид. Фенилизотиоцианат, реагент для разложения Эдмана, также может быть использован. Здесь применяются те же вопросы, что и при определении аминокислотного состава, за исключением того, что окрашивание не требуется, поскольку реагенты производят окрашенные производные, и требуется только качественный анализ. Таким образом, аминокислоту не нужно элюировать из хроматографической колонки, а просто сравнивать со стандартом. Еще одно соображение, которое следует принять во внимание, заключается в том, что, поскольку любые аминогруппы будут реагировать с реагентом для мечения, нельзя использовать ионообменную хроматографию и тонкослойная хроматография или же жидкостная хроматография высокого давления следует использовать вместо этого.

С-концевой аминокислотный анализ

Количество доступных методов для C-терминал аминокислотный анализ намного меньше, чем количество доступных методов N-концевого анализа. Самый распространенный метод - добавить карбоксипептидазы к раствору белка, через регулярные промежутки времени отбирайте образцы и определяйте концевую аминокислоту, анализируя график зависимости концентраций аминокислот от времени. Этот метод будет очень полезен в случае полипептидов и N-концов, блокированных белком. С-концевое секвенирование может значительно помочь в проверке первичных структур белков, предсказанных на основе последовательностей ДНК, и для обнаружения пострансляционного процессинга генных продуктов из известных последовательностей кодонов.

Эдман деградация

В Эдман деградация является очень важной реакцией для секвенирования белка, потому что она позволяет обнаружить упорядоченный аминокислотный состав белка. В настоящее время широко используются автоматические секвенаторы Эдмана, которые могут секвенировать пептиды длиной примерно до 50 аминокислот. Схема реакции для секвенирования белка деградацией Эдмана следует; некоторые из шагов будут подробно описаны позже.

  1. Сломать любой дисульфидные мостики в белке с Восстановитель подобно 2-меркаптоэтанол. А защитная группа Такие как йодуксусная кислота может быть необходимо для предотвращения повторного образования облигаций.
  2. Разделите и очистите отдельные цепи белкового комплекса, если их больше одной.
  3. Определите аминокислотный состав каждой цепи.
  4. Определите концевые аминокислоты каждой цепи.
  5. Разбейте каждую цепь на фрагменты длиной менее 50 аминокислот.
  6. Разделите и очистите фрагменты.
  7. Определите последовательность каждого фрагмента.
  8. Повторите то же самое с другим рисунком декольте.
  9. Постройте последовательность всего белка.

Расщепление на пептидные фрагменты

Пептиды длиной более 50-70 аминокислот не могут быть надежно секвенированы с помощью деградации Эдмана. Из-за этого длинные белковые цепи необходимо разбивать на небольшие фрагменты, которые затем можно секвенировать индивидуально. Пищеварение осуществляется либо эндопептидазы Такие как трипсин или же пепсин или химическими реагентами, такими как цианоген бромид. Различные ферменты дают разные модели расщепления, и перекрытие между фрагментами может использоваться для построения общей последовательности.

Реакция

Пептид, подлежащий секвенированию: адсорбированный на твердую поверхность. Один общий субстрат это стекловолокно, покрытое полибрен, а катионный полимер. Реагент Эдмана, фенилизотиоцианат (PITC), добавляется к адсорбированному пептиду вместе с умеренно основным буферный раствор 12% триметиламин. Он реагирует с аминогруппой N-концевой аминокислоты.

Конечная аминокислота затем может быть выборочно отделена путем добавления безводный кислота. Тогда производная изомерисы дать замененный фенилтиогидантоин, которые можно смыть и идентифицировать с помощью хроматографии, и цикл можно повторить. Эффективность каждого этапа составляет около 98%, что позволяет надежно определить около 50 аминокислот.

Аппарат для секвенирования белков Beckman-Coulter Porton LF3000G

Секвенатор белков

А секвенатор белков [3] - это машина, которая выполняет деградацию по Эдману в автоматическом режиме. Образец белка или пептида иммобилизуют в реакционном сосуде секвенатора белка и проводят деградацию по Эдману. Каждый цикл высвобождает и дериватизирует одну аминокислоту из белка или пептида. N-конце и высвободившееся производное аминокислоты затем идентифицируют с помощью ВЭЖХ. Процесс секвенирования повторяется в течение всего полипептид до тех пор, пока не будет установлена ​​вся измеримая последовательность или в течение заранее определенного количества циклов.

Идентификация масс-спектрометрией

Идентификация белка - это процесс присвоения имени интересующему белку (POI) на основе его аминокислотной последовательности. Обычно только часть последовательности белка необходимо определить экспериментально, чтобы идентифицировать белок со ссылкой на базы данных последовательностей белков, выведенных из последовательностей ДНК их генов. Дальнейшая характеристика белка может включать подтверждение фактических N- и C-концов POI, определение вариантов последовательности и идентификацию любых присутствующих посттрансляционных модификаций.

Протеолитические переваривания

Описана общая схема идентификации белков.[4][5]

  1. Точка интереса изолирована, обычно SDS-СТРАНИЦА или же хроматография.
  2. Выделенный POI может быть химически модифицирован для стабилизации остатков цистеина (например, S-амидометилирование или S-карбоксиметилирование).
  3. POI переваривается специфической протеазой с образованием пептидов. Трипсин, который селективно расщепляется на С-конце остатков лизина или аргинина, является наиболее часто используемой протеазой. Его преимущества включают i) частоту остатков Lys и Arg в белках, ii) высокую специфичность фермента, iii) стабильность фермента и iv) пригодность триптических пептидов для масс-спектрометрии.
  4. Пептиды можно обессолить для удаления ионизируемых примесей и подвергнуть МАЛДИ-ТОФ масс-спектрометрии. Прямое измерение масс пептидов может предоставить достаточно информации для идентификации белка (см. Снятие пептидных масс ), но дальнейшая фрагментация пептидов внутри масс-спектрометра часто используется для получения информации о последовательностях пептидов. В качестве альтернативы пептиды можно обессолить и разделить обращенно-фазовая ВЭЖХ и вводится в масс-спектрометр через ESI источник. LC-ESI-MS может предоставить больше информации, чем MALDI-MS для идентификации белков, но требует больше инструментального времени.
  5. В зависимости от типа масс-спектрометра, фрагментация пептидных ионов может происходить с помощью различных механизмов, таких как Диссоциация, вызванная столкновением (CID) или Пост-источник распада (PSD). В каждом случае структура фрагментных ионов пептида предоставляет информацию о его последовательности.
  6. Информация, включая измеренную массу предполагаемых пептидных ионов и их фрагментных ионов, затем сопоставляется с расчетными значениями массы из концептуального (in-silico) протеолиза и фрагментации баз данных белковых последовательностей. Успешное совпадение будет найдено, если его оценка превышает пороговое значение, определенное параметрами анализа. Даже если фактический белок не представлен в базе данных, устойчивое к ошибкам сопоставление позволяет предполагаемую идентификацию белка на основе сходства с гомологичный белки. Для выполнения этого анализа доступны различные программные пакеты.
  7. Пакеты программного обеспечения обычно создают отчет, показывающий идентичность (код доступа) каждого идентифицированного белка, его оценку соответствия и предоставляют меру относительной силы совпадения, когда идентифицировано несколько белков.
  8. Диаграмма сопоставленных пептидов в последовательности идентифицированного белка часто используется для демонстрации покрытия последовательности (% белка, обнаруженного как пептиды). Если предполагается, что POI значительно меньше, чем соответствующий белок, диаграмма может предложить, является ли POI N- или C-концевым фрагментом идентифицированного белка.

De novo секвенирование

Характер фрагментации пептида позволяет напрямую определять его последовательность с помощью de novo последовательность действий. Эта последовательность может использоваться для сопоставления баз данных последовательностей белков или для исследования посттрансляционный или химические модификации. Это может предоставить дополнительные доказательства для идентификации белков, выполненной, как указано выше.

N- и C-концы

Пептиды, сопоставленные во время идентификации белка, не обязательно включают N- или C-концы, предсказанные для сопоставленного белка. Это может быть результатом того, что N- или C-концевые пептиды трудно идентифицировать с помощью MS (например, они слишком короткие или слишком длинные), посттрансляционно модифицированы (например, N-концевое ацетилирование) или действительно отличаются от предсказанных. Посттрансляционные модификации или усеченные концы могут быть идентифицированы путем более тщательного изучения данных (т. Е. de novo последовательность действий). Также может быть полезно повторное расщепление с использованием протеазы различной специфичности.

Посттрансляционные модификации

Хотя подробное сравнение данных MS с прогнозами, основанными на известной последовательности белка, может использоваться для определения посттрансляционных модификаций, могут также использоваться целевые подходы к сбору данных. Например, специфическое обогащение фосфопептидами может помочь в идентификации фосфорилирование участков в протеине. Альтернативные методы фрагментации пептидов в масс-спектрометре, такие как ETD или же ECD, может давать дополнительную информацию о последовательности.

Определение всей массы

Полная масса белка - это сумма масс его аминокислотных остатков плюс масса молекулы воды с поправкой на любые посттрансляционные модификации. Хотя белки ионизируются хуже, чем пептиды, полученные из них, белок в растворе может быть подвергнут ESI-MS и его масса измерена с точностью до 1 части из 20 000 или лучше. Этого часто бывает достаточно, чтобы подтвердить концы (таким образом, что измеренная масса белка совпадает с предсказанной по его последовательности) и сделать вывод о наличии или отсутствии многих посттрансляционных модификаций.

Ограничения

Протеолиз не всегда дает набор легко анализируемых пептидов, покрывающих всю последовательность POI. Фрагментация пептидов в масс-спектрометре часто не дает ионов, соответствующих расщеплению каждой пептидной связи. Таким образом, выведенная последовательность для каждого пептида не обязательно является полной. Стандартные методы фрагментации не различают остатки лейцина и изолейцина, поскольку они изомерные.

Поскольку деградация по Эдману происходит от N-конца белка, она не будет работать, если N-конец был химически модифицирован (например, путем ацетилирования или образования пироглутаминовой кислоты). Деградация по Эдману обычно не используется для определения положения дисульфидных мостиков. Он также требует количества пептида 1 пикомоль или выше для заметных результатов, что делает его менее чувствительным, чем масс-спектрометрии.

Прогнозирование по последовательностям ДНК / РНК

В биологии белки производятся перевод информационной РНК (мРНК) с белковой последовательностью, полученной из последовательности кодонов в мРНК. Сама мРНК образована транскрипция генов и могут быть изменены. Эти процессы достаточно изучены, чтобы использовать компьютерные алгоритмы для автоматизации предсказаний белковых последовательностей на основе последовательностей ДНК, например, из проектов секвенирования ДНК всего генома, и привели к созданию больших баз данных белковых последовательностей, таких как UniProt. Предсказанные белковые последовательности являются важным ресурсом для идентификации белков с помощью масс-спектрометрии.

Исторически короткие последовательности белка (от 10 до 15 остатков), определенные деградацией по Эдману, были обратно транслированы в последовательности ДНК, которые можно было использовать в качестве зондов или праймеров для выделения молекулярные клоны соответствующего гена или комплементарной ДНК. Затем определяли последовательность клонированной ДНК и использовали ее для определения полной аминокислотной последовательности белка.

Инструменты биоинформатики

Биоинформатика существуют инструменты, помогающие интерпретировать масс-спектры (см. De novo пептидное секвенирование ), для сравнения или анализа белковых последовательностей (см. Анализ последовательности ) или поиск в базах данных с использованием пептидных или белковых последовательностей (см. ВЗРЫВ ).

Смотрите также

Рекомендации

  1. ^ Богосян Г., Виоланд Б.Н., Дорвард-Кинг Э.Д., Уоркман В.Е., Юнг П.Е., Кейн Д.Ф. (январь 1989 г.). «Биосинтез и включение в белок норлейцина Escherichia coli». Журнал биологической химии. 264 (1): 531–9. PMID  2642478.
  2. ^ Михаил А. Альтерман; Питер Ханзикер (2 декабря 2011 г.). Аминокислотный анализ: методы и протоколы. Humana Press. ISBN  978-1-61779-444-5.
  3. ^ Эдман П., Бегг Г. (март 1967 г.). «Секвенатор белка». Европейский журнал биохимии. 1 (1): 80–91. Дои:10.1111 / j.1432-1033.1967.tb00047.x. PMID  6059350.
  4. ^ Шевченко А, Томас Х, Хавлис Дж, Олсен ДжВ, Манн М (2006). «Расщепление в геле для масс-спектрометрической характеристики белков и протеомов». Протоколы природы. 1 (6): 2856–60. Дои:10.1038 / nprot.2006.468. PMID  17406544.
  5. ^ Гандри Р.Л., Уайт М.И., Мюррей К.И., Кейн Л.А., Фу Кью, Стэнли Б.А., Ван Эйк Д.Э. (октябрь 2009 г.). «Подготовка белков и пептидов для масс-спектрометрического анализа в восходящем потоке протеомики». Текущие протоколы в молекулярной биологии. Глава 10: Unit10.25. Дои:10.1002 / 0471142727.mb1025s88. ЧВК  2905857. PMID  19816929.

дальнейшее чтение

  • Стин Х, Манн М (сентябрь 2004 г.). «ABC (и XYZ) пептидного секвенирования». Обзоры природы Молекулярная клеточная биология. 5 (9): 699–711. Дои:10.1038 / nrm1468. PMID  15340378.