Самосогласованное среднее поле (биология) - Self-consistent mean field (biology)

В самосогласованное среднее поле (SCMF) метод является адаптацией теория среднего поля используется в предсказание структуры белка определить оптимальный аминокислота боковая цепь упаковка с учетом фиксированного белковый каркас[1]. Он быстрее, но менее точен, чем тупиковое устранение и обычно используется в ситуациях, когда интересующий белок слишком велик для решения проблемы с помощью DEE.[2].

Общие принципы

Подобно устранению тупика, метод SCMF исследует конформационное пространство путем дискретизации двугранные углы каждой боковой цепи в набор ротамеры для каждой позиции в последовательности белка. Этот метод итеративно разрабатывает вероятностное описание относительной совокупности каждого возможного ротамера в каждом положении, и вероятность данной структуры определяется как функция вероятностей отдельных компонентов ротамера.

Основные требования для эффективной реализации SCMF:

  1. Хорошо определенный конечный набор дискретных независимых переменных
  2. Предварительно вычисленное числовое значение (считающееся «энергией»), связанное с каждым элементом в наборе переменных и связанное с каждой парой двоичных элементов.
  3. Начальное распределение вероятностей, описывающее начальную популяцию каждого отдельного ротамера.
  4. Способ обновления энергий и вероятностей ротамеров в зависимости от энергии среднего поля

Процесс обычно инициализируется с равномерным распределением вероятностей по ротамерам - то есть, если есть ротамеры на положение в белке, тогда вероятность любого отдельного ротамера является . Преобразование между энергиями и вероятностями обычно осуществляется через Распределение Больцмана, который вводит температурный фактор (что делает метод пригодным для имитация отжига ). Более низкие температуры увеличивают вероятность схождения к единому раствору, а не к небольшой подгруппе решений.

Энергии среднего поля

Энергия отдельного ротамера зависит от энергии «среднего поля» других положений, то есть в любом другом положении вклад энергии каждого ротамера пропорционален его вероятности. Для белка длины с ротамеров на остаток, энергия на текущей итерации описывается следующим выражением. Отметим, что для наглядности энергия среднего поля на итерации обозначается , а предварительно вычисленные энергии обозначены , а вероятность данного ротамера обозначается .

Эти энергии среднего поля используются для обновления вероятностей с помощью закона Больцмана:

куда это Постоянная Больцмана и - температурный фактор.

Энергия системы

Хотя вычисление энергии системы не требуется при выполнении метода SCMF, полезно знать общие энергии сходимых результатов. Системная энергия состоит из двух сумм:

где слагаемые определены как:

Конвергенция

Идеальная сходимость для метода SCMF приведет к вероятности 1 ровно для одного ротамера в каждой позиции. в белке и с нулевой вероятностью для всех других ротамеров в каждом положении. Сходимость к уникальному решению требует вероятностей, близких к 1, для ровно одного ротамера в каждой позиции. На практике, особенно когда используются более высокие температуры, алгоритм вместо этого идентифицирует небольшое количество ротамеров с высокой вероятностью в каждом положении, позволяя затем перечислить относительные энергии результирующих конформаций (на основе предварительно вычисленных энергий, а не на основе полученных из приближение среднего поля). Одним из способов улучшения сходимости является повторный запуск при более низкой температуре с использованием вероятностей, рассчитанных на основе предыдущего запуска при более высокой температуре.

Точность

В отличие от исключения тупика, SCMF не гарантирует схождения к оптимальному решению. Однако он является детерминированным (например, он будет сходиться к одному и тому же решению каждый раз при одних и тех же начальных условиях), в отличие от альтернатив, основанных на анализе Монте-Карло. По сравнению с DEE, который гарантированно находит оптимальное решение, SCMF быстрее, но в целом менее точен; он значительно лучше определяет правильные конформации боковых цепей в ядре белка, чем правильные поверхностные конформации[3]. Геометрические ограничения упаковки менее строгие на поверхности и, таким образом, предоставляют меньше границ для конформационного поиска.

Рекомендации

  1. ^ Кёль П., Деларю М. (1994). Применение самосогласованной теории среднего поля для предсказания конформации боковых цепей белка и оценки их конформационной энтропии. Дж Мол Биол 239(2):249-75.
  2. ^ Voigt CA, Gordon DB, Mayo SL. (2000). Торговля точностью ради скорости: количественное сравнение алгоритмов поиска при разработке последовательности белков. Дж Мол Биол 299(3):789-803.