Тест глобального расстояния - Global distance test

В глобальный тест на расстояние (GDT), также записывается как GDT_TS для представления «общего балла» - это мера сходства между двумя белковые структуры с известными аминокислотными соответствиями (например, идентичные аминокислотные последовательности ) но разные третичные структуры. Чаще всего используется для сравнения результатов предсказание структуры белка к экспериментально определенной структуре, как измерено Рентгеновская кристаллография или же белок ЯМР. Метрика GDT, описанная ее автором Адамом Земла[1] предназначен для более точного измерения, чем более распространенный RMSD метрика, чувствительная к выброс регионов, созданных, например, из-за плохого моделирования отдельных петля области в структуре, которая в остальном достаточно точна. Измерения GDT_TS используются в качестве основных критериев оценки при получении результатов от Критическая оценка предсказания конструкции (CASP), крупномасштабный эксперимент в сообществе предсказателей структуры, посвященный оценке текущих методов моделирования и выявлению их основных недостатков.[1][2][3] В общем, чем выше GDT_TS, тем лучше данная модель по сравнению с эталонной структурой.

Оценка GDT рассчитывается как наибольший набор аминокислота остатки альфа-углерод атомы в модельной структуре попадают в пределы определенного расстояния, отсекающего их положение в экспериментальной структуре, после наложения двух структур. По оригинальному дизайну (№ патента: США 8 024 127 B2 ) алгоритм GDT вычисляет 20 оценок GDT, то есть для каждого из 20 последовательных отсечений расстояния (0,5 Å, 1,0 Å, 1,5 Å, ... 10,0 Å). Для оценки подобия структуры предполагается использовать баллы GDT из нескольких значений отсечки, и баллы обычно увеличиваются с увеличением отсечки. Плато в этом увеличении может указывать на крайнее расхождение между экспериментальной и предсказанной структурами, так что никакие дополнительные атомы не включаются ни в какое ограничение разумного расстояния (см. Графики GDT ). Обычный общий балл GDT_TS в CASP - средний результат отсечки на 1, 2, 4 и 8 Å.[1][4]

Исходный GDT_TS рассчитывается на основе наложений и оценок GDT, полученных программой Local Global Alignment (LGA).[1] Версия с высокой точностью, называемая GDT_HA, создается путем выбора меньших расстояний отсечки (половина размера GDT_TS) и, следовательно, является более строгой. Он использовался в категории высокой точности CASP7.[5] CASP8 определяет новую «оценку TR», которая представляет собой GDT_TS за вычетом штрафа за остатки, сгруппированные для закрытия, предназначенные для представления стерических конфликтов, изобретенных предсказателем, иногда для игры с мерой отсечения GDT.[6][7] Первичная оценка GDT использует только атомы Cα. Чтобы применить оценку на основе суперпозиции к функциональным концам боковых цепей белков, в 2008 году в рамках программы LGA была разработана и реализована оценка, подобная GDT, называемая вычислением глобального расстояния для боковых цепей (GDC_sc).[1][8] Вместо сравнения положений остатков на основе Cαs, GDC_sc использует характеристический атом около конца каждого типа боковой цепи для оценки отклонений расстояния между остатками. Вариант «все атомы» оценки GDC (GDC_all) рассчитывается с использованием информации о полной модели и является одним из стандартных показателей, используемых организаторами и экспертами CASP для оценки точности прогнозируемых структурных моделей.[8][9]

Смотрите также

Рекомендации

  1. ^ а б c d е Земля А (2003). «LGA: метод нахождения трехмерного сходства в белковых структурах». Исследования нуклеиновых кислот. 31 (13): 3370–3374. Дои:10.1093 / нар / gkg571. ЧВК  168977. PMID  12824330.
  2. ^ Земла А., Венцловас С., Молт Дж., Фиделис К. (1999). «Обработка и анализ предсказаний структуры белка CASP3». Белки. S3: 22–29. Дои:10.1002 / (SICI) 1097-0134 (1999) 37: 3+ <22 :: AID-PROT5> 3.0.CO; 2-W. PMID  10526349.
  3. ^ Земла А., Венцловас С., Молт Дж., Фиделис К. (2001). «Обработка и оценка прогнозов в CASP4». Белки. 45 (S5): 13–21. Дои:10.1002 / prot.10052. PMID  11835478.
  4. ^ Крыштафович А; Прлик, А; Дмитриев, З; Данилюк, П; Милостан, М; Эйрих, В; Хаббард, Т; Фиделис, К. (2007). «Новые инструменты и расширенные возможности анализа данных в Центре прогнозирования структуры белка». Белки. 69 Дополнение 8: 19–26. Дои:10.1002 / prot.21653. ЧВК  2656758. PMID  17705273.
  5. ^ Прочтите, Рэнди Дж .; Чавали, Гаятри (2007). «Оценка прогнозов CASP7 в категории высокоточного моделирования на основе шаблонов». Белки. 69 (S8): 27–37. Дои:10.1002 / prot.21662. PMID  17894351.
  6. ^ Ши, S; Пей, Дж; Садреев Р.И.; Кинч, LN; Маджумдар, я; Тонг, Дж; Cheng, H; Kim, BH; Гришин, Н.В. (2009). «Анализ целей CASP8, прогнозы и методы оценки». База данных: журнал биологических баз данных и курирования. 2009: bap003. Дои:10.1093 / база данных / bap003. ЧВК  2794793. PMID  20157476.. Связанная страница
  7. ^ Садреев Р.И.; Ши, S; Бейкер, Д; Гришин, Н.В. (15 мая 2009 г.). «Мера подобия структуры со штрафом за близкие неэквивалентные остатки». Биоинформатика. 25 (10): 1259–63. Дои:10.1093 / биоинформатика / btp148. ЧВК  2677741. PMID  19321733.
  8. ^ а б Keedy, D.A .; Уильямс, CJ; Headd, JJ; Арендалл, ВБ; Чен, В.Б .; Капрал, ГДж; Гиллеспи, РА; Блок, JN; Земля, А; Ричардсон, округ Колумбия; Ричардсон, Дж. С. (2009). «Остальные 90% белка: оценка за пределами α-углерода для высокоточных моделей на основе шаблона CASP8». Белки. 77 (Дополнение 9): 29–49. Дои:10.1002 / prot.22551. ЧВК  2877634. PMID  19731372.
  9. ^ Моди В., Сюй К.Ф., Адхикари С., Данбрак Р.Л. (2016). «Оценка основанного на шаблонах моделирования структуры белка в CASP11». Белки. 84: 200–220. Дои:10.1002 / prot.25049. ЧВК  5030193. PMID  27081927.

внешняя ссылка

  • Графики GDT пример графиков из GDT-анализа структурных моделей, оцененных в эксперименте CASP5
  • Описание GDC, GDT, LCS и LGA услуги и документация по сравнению структур и мерам сходства