Вменение (генетика) - Imputation (genetics)

Вменение в генетика относится к статистические выводы ненаблюдаемых генотипы.[1] Это достигается за счет использования известных гаплотипы в популяции, например из HapMap или Проект 1000 геномов у людей, что позволяет проверить связь между представляющим интерес признаком (например, болезнью) и экспериментально нетипизированными генетическими вариантами, но чьи генотипы были определены статистически («вменены»).[2] Вменение генотипа обычно выполняется на SNP, наиболее распространенный вид генетической изменчивости.

Таким образом, вменение генотипа в огромной степени помогает сузить местонахождение возможных причинных вариантов в полногеномные ассоциации исследований, поскольку он увеличивает плотность SNP (размер генома остается постоянным, но увеличивается количество генетических вариантов), тем самым сокращает расстояние между двумя соседними SNP.

Контекст

В генетическая эпидемиология и количественная генетика, исследователи стремятся определить геномные местоположения где различия между людьми связаны с вариациями в черты интереса между людьми. Следовательно, такие исследования требуют доступа к генетическому строению группы людей. Последовательность действий целый геном каждого человека в исследовании часто слишком дорого обходится, поэтому можно измерить только часть генома. Это часто означает, во-первых, только рассмотрение однонуклеотидные полиморфизмы (SNP) и пренебрежение копировать варианты номера и, во-вторых, измерение только тех SNP, которые, как известно, достаточно изменчивы в популяции, так что они, вероятно, также будут изменчивы в рассматриваемой группе индивидуумов. Наиболее информативное подмножество SNP выбирается на основе распределения общих генетическая вариация вдоль генома, например, произведенные HapMap или Проект 1000 геномов в людях. Эти SNP затем используются для построения микромассив, тем самым позволяя каждому человеку в исследовании быть генотипированным по всем этим SNP одновременно.

Мотивация

Массивы генотипов, используемые для полногеномных ассоциативных исследований (GWAS), основаны на маркировке SNP и поэтому не позволяют напрямую генотипировать все вариации в геноме. Внесение генотипов в контрольную панель, которая была генотипирована для большего числа вариантов, увеличивает охват геномных вариаций по сравнению с исходными генотипами. Как следствие, можно оценить влияние большего количества SNP, чем на исходный микромассив. Важно отметить, что вменение облегчило метаанализ наборов данных, которые были генотипированы на разных массивах, за счет увеличения перекрытия вариантов, доступных для анализа между массивами.

Инструменты

Существует несколько пакетов программного обеспечения для вменения генотипов из массива генотипов в контрольные панели, например, гаплотипов «1000 Genomes Project». Эти инструменты включают MaCH[3] Minimac, IMPUTE2[4] и Бигль.[5] У каждого инструмента есть свои плюсы и минусы с точки зрения скорости и точности.[6] Дополнительные инструменты фазирования, такие как SHAPEIT2[7] позволяют выполнять предварительную фазировку входных гаплотипов для повышения точности вменения и производительности вычислений.

В начале использования вменения гаплотипы из популяций HapMap использовались в качестве контрольной панели, однако на смену этому пришли гаплотипы из проекта 1000 Genomes Project.[8] в качестве контрольных панелей, с большим количеством образцов, среди более разнообразных групп населения и с большим количеством генетический маркер плотность. По состоянию на середину 2014 г. данные о последовательности всего генома общедоступны на веб-сайте проекта «1000 геномов».[9] для 2535 человек из 26 различных популяций по всему миру.

Статистические модели

Разработка точных статистических моделей для вменения генотипа во многом связана с проблемой оценка гаплотипа («поэтапное») и является активной областью исследований.[10]

Смотрите также

Рекомендации

  1. ^ Шит, Пол; Стивенс, Мэтью (2006). «Быстрая и гибкая статистическая модель для крупномасштабных данных о популяционном генотипе: приложения для определения отсутствующих генотипов и гаплотипической фазы». Американский журнал генетики человека. 78 (4): 629–644. Дои:10.1086/502802. ЧВК  1424677. PMID  16532393.
  2. ^ Marchini, J .; Хауи, Б. (2010). «Вменение генотипа для полногеномных ассоциативных исследований». Природа Обзоры Генетика. 11 (7): 499–511. Дои:10.1038 / nrg2796. PMID  20517342.
  3. ^ Ли, У; Виллер, CJ; Дин, Дж; Scheet, P; Abecasis, GR (декабрь 2010 г.). «MaCH: использование данных о последовательности и генотипе для оценки гаплотипов и ненаблюдаемых генотипов». Генетическая эпидемиология. 34 (8): 816–34. Дои:10.1002 / gepi.20533. ЧВК  3175618. PMID  21058334.
  4. ^ Хауи, B; Fuchsberger, C; Стивенс, М; Марчини, Дж; Abecasis, GR (22 июля 2012 г.). «Быстрое и точное вменение генотипа в полногеномных ассоциативных исследованиях за счет предварительной фазы». Природа Генетика. 44 (8): 955–9. Дои:10.1038 / ng.2354. ЧВК  3696580. PMID  22820512.
  5. ^ Браунинг, Брайан Л .; Браунинг, Шэрон Р. (2009). «Единый подход к вменению генотипа и выводу фазы гаплотипа для больших наборов данных о троих и неродственных лицах». Американский журнал генетики человека. 84 (2): 210–223. Дои:10.1016 / j.ajhg.2009.01.005. ЧВК  2668004. PMID  19200528.
  6. ^ Хауи, Брайан; Фуксбергер, Кристиан; Стивенс, Мэтью; Маркини, Джонатан; Абекасис, Гонсало Р. (22 июля 2012 г.). «Быстрое и точное вменение генотипа в полногеномных ассоциативных исследованиях за счет предварительной фазы». Природа Генетика. 44 (8): 955–959. Дои:10.1038 / ng.2354. ЧВК  3696580. PMID  22820512.
  7. ^ Делано, Оливье; Маркини, Джонатан; Загури, Жан-Франсуа (4 декабря 2011 г.). «Метод фазирования линейной сложности для тысяч геномов». Методы природы. 9 (2): 179–181. Дои:10.1038 / nmeth.1785. PMID  22138821.
  8. ^ Дурбин, Ричард М .; Альтшулер, Дэвид Л .; Дурбин, Ричард М .; Abecasis, Gonçalo R .; Бентли, Дэвид Р .; Чакраварти, Аравинда; Кларк, Эндрю Дж .; Коллинз, Фрэнсис С. (28 октября 2010 г.). «Карта вариаций генома человека по результатам популяционного секвенирования». Природа. 467 (7319): 1061–1073. Дои:10.1038 / природа09534. ЧВК  3042601. PMID  20981092.
  9. ^ «1000 геномов - глубокий каталог генетических вариаций человека». Получено 17 июля 2014.
  10. ^ Хауи, Брайан; Доннелли, Питер; Маркини, Джонатан (2009). «Гибкий и точный метод вменения генотипа для следующего поколения исследований общегеномной ассоциации». PLoS Genetics. 5 (6): e1000529. Дои:10.1371 / journal.pgen.1000529. ЧВК  2689936. PMID  19543373.