Библиотека белковых фрагментов - Protein fragment library - Wikipedia
Эта статья может быть слишком техническим для большинства читателей, чтобы понять. Пожалуйста помогите улучшить это к сделать понятным для неспециалистов, не снимая технических деталей. (Ноябрь 2016) (Узнайте, как и когда удалить этот шаблон сообщения) |
Библиотеки фрагментов основной цепи белка успешно использовались в различных структурная биология приложения, в том числе моделирование гомологии,[1] предсказание структуры de novo,[2][3][4] и определение структуры.[5] Уменьшая сложность области поиска, эти библиотеки фрагментов обеспечивают более быстрый поиск конформационное пространство, что приводит к созданию более эффективных и точных моделей.
Мотивация
Белки может принимать экспоненциальное количество состояний при дискретном моделировании. Как правило, конформации белка представлены в виде наборов двугранные углы, длина облигаций, и валентные углы между всеми связанными атомами. Наиболее распространенное упрощение - это предположение об идеальных длинах связей и валентных углах. Однако это все еще оставляет углы фи-пси позвоночника и до четырех двугранных углов для каждого боковая цепь, что приводит к наихудшей сложности k6*п возможные состояния белка, где п - количество остатков и k - количество дискретных состояний, смоделированных для каждого двугранного угла. Чтобы уменьшить конформационное пространство, можно использовать библиотеки фрагментов белка, а не явно моделировать каждый угол phi-psi.
Фрагменты - это короткие сегменты пептидного остова, обычно от 5 до 15. остатки длинные и не включают боковые цепи. Они могут указывать расположение только атомов C-альфа, если это сокращенное представление атома, или всех тяжелых атомов основной цепи (N, C-альфа, C карбонил, O). Обратите внимание, что боковые цепи обычно не моделируются с использованием подхода библиотеки фрагментов. Для моделирования дискретных состояний боковой цепи можно использовать ротамер библиотечный подход.[6]
Этот подход работает в предположении, что локальные взаимодействия играют большую роль в стабилизации общей конформации белка. В любой короткой последовательности молекулярные силы ограничивают структуру, приводя только к небольшому количеству возможных конформаций, которые можно моделировать с помощью фрагментов. Действительно, согласно Парадокс Левинталя, белок не может выбрать все возможные конформации за биологически разумный промежуток времени. Локально стабилизированные структуры уменьшили бы пространство поиска и позволили бы белкам сворачиваться за миллисекунды.
Строительство
Библиотеки этих фрагментов построены на основе анализа Банк данных белков (PDB). Сначала выбирается репрезентативное подмножество PDB, которое должно охватывать разнообразный массив структур, предпочтительно с хорошим разрешением. Затем для каждой структуры каждый набор п последовательные остатки взяты в качестве фрагмента образца. Затем образцы группируются в k группы в зависимости от того, насколько они похожи друг на друга в пространственной конфигурации, с использованием таких алгоритмов, как k-средства кластеризации. Параметры п и k выбираются в соответствии с заявкой (см. обсуждение сложности ниже). В центроиды кластеров затем принимают за фрагмент. Дальнейшая оптимизация может быть выполнена, чтобы гарантировать, что центроид обладает идеальной геометрией связи, поскольку она была получена путем усреднения других геометрий. [7]
Поскольку фрагменты происходят из структур, существующих в природе, сегмент основной цепи, который они представляют, будет иметь реалистичную геометрию соединения. Это помогает избежать исследования всего пространства углов конформации, большая часть которых может привести к нереалистичной геометрии.
Вышеупомянутая кластеризация может быть выполнена без учета идентичности остатков или может быть специфичной для остатков.[2] То есть для любой заданной входной последовательности аминокислот кластеризация может быть получена с использованием только образцов, найденных в PDB с такой же последовательностью в k-мерный фрагмент. Это требует больше вычислительной работы, чем создание библиотеки фрагментов, не зависящих от последовательности, но потенциально может создавать более точные модели. И наоборот, требуется больший набор выборок, и полного охвата может не быть.
Пример использования: моделирование цикла
В моделирование гомологии, обычное применение библиотек фрагментов - моделировать петли структуры. Обычно альфа спирали и бета-листы находятся резьбовой против шаблонной структуры, но циклы между ними не указаны и должны быть предсказаны. Поиск петли с оптимальной конфигурацией - это NP-жесткий. Чтобы уменьшить конформационное пространство, которое необходимо исследовать, можно смоделировать цикл как серию перекрывающихся фрагментов. Затем можно выполнить выборку пространства или, если пространство теперь достаточно мало, исчерпывающе пронумеровать.
Один из подходов к исчерпывающему перечислению состоит в следующем.[1] Конструирование петли начинается с выравнивания всех возможных фрагментов для перекрытия с тремя остатками на N-конце петли (точка привязки). Затем все возможные варианты выбора второго фрагмента выравниваются (все возможные варианты выбора) первого фрагмента, гарантируя, что последние три остатка первого фрагмента перекрываются с первыми тремя остатками второго фрагмента. Это гарантирует, что цепочка фрагментов образует реалистичные углы как внутри фрагмента, так и между фрагментами. Затем это повторяется до тех пор, пока не будет построен цикл с правильной длиной остатков.
Петля должна как начинаться у якоря на стороне N, так и заканчиваться у якоря на стороне C. Поэтому каждую петлю необходимо тестировать, чтобы увидеть, перекрываются ли ее последние несколько остатков с концевым якорем C. Очень немногие из этих экспоненциальных чисел циклов-кандидатов закроют цикл. После фильтрации петель, которые не замыкаются, необходимо определить, какая петля имеет оптимальную конфигурацию, определяемую наименьшей энергией с использованием некоторого силового поля молекулярной механики.
Сложность
Сложность пространства состояний по-прежнему экспоненциально зависит от количества остатков, даже после использования библиотек фрагментов. Однако степень экспоненты снижается. Для библиотеки F-мерные фрагменты, с L фрагментов в библиотеке, а также для моделирования цепочки N остатков, перекрывающих каждый фрагмент на 3, будет L[N/(F-3)]+1 возможные цепи. [7] Это намного меньше, чем KN возможности, если явное моделирование углов phi-psi как K возможных комбинаций, поскольку сложность возрастает на степень меньше, чем N.
Сложность возрастает в L, размер библиотеки фрагментов. Однако библиотеки с большим количеством фрагментов охватят большее разнообразие структур фрагментов, поэтому существует компромисс между точностью модели и скоростью исследования пространства поиска. Этот выбор определяет, что K используется при выполнении кластеризации.
Дополнительно для любых фиксированных Lразнообразие структур, которые можно моделировать, уменьшается с увеличением длины фрагментов. Более короткие фрагменты более способны покрывать разнообразный массив структур, обнаруженных в PDB, чем более длинные. Недавно было показано, что библиотеки длиной до 15 способны моделировать 91% фрагментов в PDB с точностью до 2,0 ангстрем. [8]
Смотрите также
- Прогноз структуры белка de novo
- Гомологическое моделирование
- Белковый дизайн
- Прогноз структуры белка
- Программное обеспечение для предсказания структуры белка
- Структурное выравнивание
Рекомендации
- ^ а б Колодный Р., Гибас Л., Левитт М. и Кёль П. (2005, март). Обратная кинематика в биологии: проблема замыкания белковой петли. Международный журнал исследований робототехники 24 (2-3), 151-163.
- ^ а б Саймонс К., Куперберг К., Хуанг Е. и Бейкер Д. (1997). Сборка третичных структур белка из фрагментов с подобными локальными последовательностями с использованием имитированных функций отжига и байесовской оценки. J Mol Biol 268, 209-225.
- ^ Bujnicki, J. (2006) Прогнозирование структуры белка путем рекомбинации фрагментов. ChemBioChem. 7, 19-27.
- ^ Ли, С. и др. (2008) Fragment-HMM: новый подход к прогнозированию структуры белка. Белковая наука. 17, 1925-1934 гг.
- ^ ДиМайо, Ф., Шавлик, Дж., Филлипс, Г. Вероятностный подход к отслеживанию белковой основы на картах электронной плотности (2006). Биоинформатика 22 (14), 81-89.
- ^ Канутеску А., Шеленков А. и Данбрак Р. (2003). Алгоритм теории графов для предсказания боковой цепи белка. Protein Sci. 12, 2001–2014.
- ^ а б Колодный, Р., Кёль, П., Гибас, Л., и Левитт, М. (2005). Небольшие библиотеки белковых фрагментов точно моделируют структуры нативных белков. Дж. Мол Биол 323, 297-307.
- ^ Ду П., Андрек М. и Леви Р. Все ли структуры, соответствующие коротким фрагментам белка, в банке данных белков? Обновление. Белковая инженерия. 2003, 16 (6) 407-414.