Probalign это инструмент для выравнивания последовательностей, который вычисляет максимальное ожидаемая точность выравнивание с использованием апостериорных вероятностей статистической суммы.[1] Вероятности пары оснований оцениваются с использованием оценки, аналогичной оценке Распределение Больцмана. Статистическая сумма вычисляется с использованием динамическое программирование подход.
Алгоритм
Ниже описан алгоритм, используемый probalign для определения вероятностей пары оснований.[2]
Оценка соответствия
Чтобы оценить выравнивание двух последовательностей, необходимы две вещи:
- функция подобия
(например. PAM, BLOSUM,...) - штраф за аффинный пробел:
![{ Displaystyle г (к) = альфа + бета к}](https://wikimedia.org/api/rest_v1/media/math/render/svg/28908bc6f7a06a7f851ced05be76f3a6ebc7b562)
Очки
трассы a определяется как:
![{ displaystyle S (a) = sum _ {x_ {i} -y_ {j} in a} sigma (x_ {i}, y_ {j}) + { text {стоимость разрыва}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7f7c3d5ae92bbcd72645724faba3a4f6d29cae5c)
Теперь взвешенный балл по Больцману для раскладки a равен:
![{ displaystyle e ^ { frac {S (a)} {T}} = e ^ { frac { sum _ {x_ {i} -y_ {j} in a} sigma (x_ {i}, y_ {j}) + { text {стоимость разрыва}}} {T}} = left ( prod _ {x_ {i} -y_ {i} in a} e ^ { frac { sigma (x_ {i}, y_ {j})} {T}} right) cdot e ^ { frac {gapcost} {T}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/107ea77a31d9c5d2ac35b22a4b2736872b7c320b)
Где
- коэффициент масштабирования.
Вероятность совмещения в предположении распределения Больцмана определяется выражением
![{ displaystyle Pr [a | x, y] = { frac {e ^ { frac {S (a)} {T}}} {Z}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bc95755b68056106788d9ba71ad9e9bc5be6fafb)
Где
- статистическая сумма, т.е. сумма весов Больцмана всех выравниваний.
Динамическое программирование
Позволять
обозначают статистическую сумму префиксов
и
. Рассмотрены три разных случая:
функция распределения всех выравниваний двух префиксов, заканчивающихся совпадением.
функция распределения всех выравниваний двух префиксов, заканчивающихся вставкой
.
функция распределения всех выравниваний двух префиксов, заканчивающихся удалением
.
Тогда у нас есть: ![{ displaystyle Z_ {i, j} = Z_ {i, j} ^ {M} + Z_ {i, j} ^ {D} + Z_ {i, j} ^ {I}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b6a81b68fd61c6fc86632317872b148c46dba367)
Инициализация
Матрицы инициализируются следующим образом:
![{ Displaystyle Z_ {0, j} ^ {M} = Z_ {i, 0} ^ {M} = 0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8f3c321550e83f42ba62ff136d6382326cd0f451)
![{ Displaystyle Z_ {0,0} ^ {M} = 1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2bfd47b443a0fc928f65cf05d8459b421044a08a)
![{ displaystyle Z_ {0, j} ^ {D} = 0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e4d5e861888485e6b74be711077001913b4dc664)
![{ Displaystyle Z_ {я, 0} ^ {I} = 0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/82b4c39591c2004933fdaf23aa271128a5b87e5b)
Рекурсия
Статистическая функция для выравнивания двух последовательностей
и
дан кем-то
, который можно вычислить рекурсивно:
![{ Displaystyle Z_ {я, j} ^ {M} = Z_ {i-1, j-1} cdot e ^ { frac { sigma (x_ {i}, y_ {j})} {T}} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/4c00bee912cca2657f2845969ca6d0a15fa4541a)
![{ Displaystyle Z_ {я, j} ^ {D} = Z_ {i-1, j} ^ {D} cdot e ^ { frac { beta} {T}} + Z_ {i-1, j} ^ {M} cdot e ^ { frac {g (1)} {T}} + Z_ {i-1, j} ^ {I} cdot e ^ { frac {g (1)} {T} }}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3c6ff46fdffded4a456940a76ae9bc47a9ea8f02)
аналогично
Вероятность пары оснований
Наконец, вероятность того, что позиции
и
образуют базовую пару:
![{ Displaystyle P (x_ {i} -y_ {j} | x, y) = { frac {Z_ {i-1, j-1} cdot e ^ { frac { sigma (x_ {i}, y_ {j})} {T}} cdot Z '_ {i', j '}} {Z_ {| x |, | y |}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ebc439377c464ea583ecf610abb0a7884affa469)
соответствующие значения для пересчитанного
с перевернутыми строками пары оснований.
Смотрите также
Рекомендации
внешняя ссылка