Справочная база данных гаплотипов Y-хромосомы - Y Chromosome Haplotype Reference Database

Логотип Справочной базы данных гаплотипов Y-хромосомы (YHRD) версии 4.0

В Справочная база данных гаплотипов Y-хромосомы (YHRD) представляет собой аннотированный набор популяционных выборок с открытым доступом, типизированных для вариантов последовательности Y-хромосомы. Преследуются две важные цели: (1) получение надежных оценок частоты для Y-STR гаплотипы и Y-SNP гаплотипы для использования при количественной оценке совпадений в судебных делах и делах о родстве и (2) при характеристике мужских родословных, чтобы сделать выводы о происхождении и истории человеческих популяций. База данных одобрена Международное общество судебной генетики (ISFG) По состоянию на декабрь 2019 г. 307169 Гаплотипы локуса 9-STR, из них 246 821 Гаплотипы локуса 17-STR, 73,006 Гаплотипы 23-STR локуса, 73,810 Гаплотипы локуса 27-STR и 25 672 Y SNP профили образцы, собранные в 136 странах, были непосредственно представлены судебно-медицинскими учреждениями и университетами 73 стран. В географическом отношении 47% образцов YHRD происходят из Азии, 23% из Европы, 14% из Северной Америки, 11% из Латинской Америки, 3% из Африки, 1% из Океании / Австралии и 0,3% из Арктики (выпуск 62 от 31 декабря 2019 г.). 1348 индивидуальных выборочных проектов описаны в более чем 600 рецензируемых публикациях. [1]

Подача и регистрация

YHRD строится на основе прямого представления данных о населении из отдельных лабораторий. После получения заявки персонал МПСД проверяет оригинальность данных и присваивает порядковый номер выборке населения и выполняет проверки обеспечения качества. Затем представленные материалы регистрируются в общедоступной базе данных, где записи могут быть получены Поиск для гаплотипов, популяций, участников или инвентарных номеров. Все данные о населении публикуются в судебно-медицинских журналах как FSI: Генетика или Международный журнал судебной медицины должны быть подтверждены хранителями YHRD и впоследствии включены в YHRD.[2]

Структура базы данных

База данных поддерживает наиболее часто используемые форматы гаплотипов (например, Minimal (minHt), Powerplex Y12,[3] YFiler,[4] Powerplex Y23 [5] , YfilerPlus и Maximal (maxHt), для которых существуют базы данных разного размера.

Поскольку существуют сильные корреляции между географическими областями и вариантами Y-хромосомы, база данных населения YHRD была структурирована таким образом, чтобы отображать географические, лингвистические и филогенетические отношения исследуемых профилей гаплотипов. В настоящее время база данных YHRD распознает четыре отдельные структуры «метапопуляции»: национальная, континентальная, языковая / этническая и филогенетическая принадлежность с несколькими категориями внутри. В популяционной генетике термин метапопуляция описывает дискретные пространственно распределенные группы населения, которые связаны между собой потоком генов и миграцией.[6] По аналогии, термин «метапопуляция» используется в судебной генетике для описания набора географически рассредоточенных популяций с общим происхождением и продолжающимся потоком генов. Таким образом, группы населения более похожи внутри метапопуляции, чем группы вне метапопуляции.[7]

Национальный

Концепция объединения данных для создания «национальных баз данных» имеет очень простое объяснение: правоохранительные органы и судебно-медицинские службы полагаются на население своей страны для создания справочные базы данных. В большинстве случаев правонарушители и жертвы принадлежат к национальному населению, и их генетические профили должны быть представлены в базе данных. В таких странах, как США, Бразилия, Великобритания или Китай, которые характеризуются сильной подструктурой населения, национальные справочные базы данных часто строятся на основе исторической концепции этнической принадлежности, например Население США подразделяется на кавказское, африканское, испаноязычное, азиатское и индейское население, или Великобритания различает английский, афро-карибский, индо-пакистанский и китайский. Таким образом, национальные базы данных в силу их важности для национального законодательства доступны для поиска в YHRD. Каждая национальная метапопуляция в YHRD включает всех людей, отобранных в конкретной стране, независимо от происхождения людей.

Континентальный

Континентальные метапопуляции в YHRD включают всех людей, отобранных на определенном континенте, независимо от их происхождения. YHRD определяет семь континентальных метапопуляций в соответствии с классификацией географических регионов Организации Объединенных Наций: Африка, Арктика, Азия, Европа, Латинская Америка, Северная Америка, Океания / Австралия.

Лингвистический / этнический

Структура метапопуляции, построенная на основе «этнической / языковой принадлежности», в большей степени учитывает происхождение выбранных индивидов. «Родословная» - это термин, объединяющий исторические, культурные, географические и лингвистические категории. Конечно, концепция метапопуляции на основе «этнической принадлежности» никоим образом не является идеальной, полностью рациональной или полностью переводимой, а просто принимает во внимание тот факт, что на глобальном уровне категории, отличные от «нации» или «географии», гораздо лучше описывают наблюдали генетическую кластеризацию и неоднородность паттернов Y-хромосомы.

Для глобальной справочной базы данных критерий «основная языковая группа» кажется наиболее подходящим для группировки данных с учетом предков и создания суббаз с учетом генетического сходства. Причина этого двоякая: во-первых, язык - это унаследованная культурная черта, и поэтому языковые типы часто коррелируют с генетическими чертами, не в последнюю очередь с полиморфизмом Y-хромосомы. Во-вторых, поскольку языки хорошо изучаются наукой и в основном понимаются публикой из-за давних традиций языковых исследований, лингвистическая терминология в принципе более понятна и применима на практике, чем их генетическая подвеска. Помимо чисто лингвистической категоризации (например, Алтайский языковая семья, состоящая из людей, говорящих Турок и Монгольские языки ) взяты также объединяющие географические критерии (К югу от Сахары состоящий из спикеров разных Африканский языковые группы, проживающие к югу от Сахара ).

Важно отметить, что текущая структура метапопуляции - это априорная категоризация, которая требует постоянной оценки и проверки с помощью статистических методов для количественной оценки генетического сходства / несходства между образцами. В то время как текущая категоризация восьми крупных метапопуляций получает некоторую поддержку из анализа генетических расстояний, выполненного на основе ~ 41000 гаплотипов. [7] Дальнейшее деление «евразийско-европейской метапопуляции» было осуществлено исключительно на основе Y-STR гаплотипы. Анализ ~ 12 000 европейских гаплотипов, проведенный AMOVA, показывает, что существуют три больших пула европейских гаплотипов: западная, восточная и юго-восточная метапопуляции.[8]

В настоящее время YHRD имеет семь непересекающихся широко определенных метапопуляций: африканские, афро-азиатские, коренные американцы, австралийские аборигены, восточноазиатские, эскимо-алеутские и евразийские. Некоторые из этих метапопуляций далее подразделяются, например Евразийцы на шесть подкатегорий, из которых европейская подгруппа делится на три группы западных, восточных и юго-восточных европейцев.

Филогенетический

ДНК-профилирование Y-хромосом, представленное в YHRD, теперь постоянно расширяется для бинарных полиморфизмов Y-SNP. Филогения Y-хромосомы, определяемая бинарными полиморфизмами, хорошо установлена ​​и стабильна (Андерхилл и др. (2000), Хаммер и др. (2001), Джоблинг и Тайлер-Смит (2003) и Карафет и др. (2008)). Все Y-хромосомы, разделяющие мутацию, связаны по происхождению, пока следующая мутация не разделит ветвь. Гаплотипы внутри гаплогруппы могут быть очень похожими или даже «идентичными по происхождению» (IBD). Таким образом, гаплогруппа может использоваться в качестве критерия для субструктурирования базы данных в соответствии с филогенетическим происхождением образцов. Несмотря на то, что хронология мутаций SNP гораздо менее определена, чем структура дерева, многие гаплогруппы можно приравнять к событиям в предыстории человека. Мировое распространение паттернов разнообразия Y-хромосомы человека выявило четкие географически связанные гаплогруппы (Underhill et al. (2000)).

Инструменты базы данных

AMOVA

Анализ молекулярной дисперсии (AMOVA) представляет собой метод анализа изменчивости популяции с использованием молекулярных данных, например Y-STR гаплотипы.[9] С помощью AMOVA можно оценить и количественно оценить степень дифференциации между двумя или более выборками населения. AMOVA реализована как онлайн-инструмент в YHRD и обеспечивает способ оценки ΦST и FST ценности. Онлайн-инструмент принимает файлы Excel и создает из них файлы ввода. В анализ AMOVA можно добавить до 9 эталонных популяций, выбранных из YHRD, а также наборы популяций. Онлайн-расчет возвращает в результате таблицу * .csv с попарными FST или ΦST(рST) значений плюс p-значения в качестве теста на значимость (10 000 перестановок). Кроме того, Участок МДС генерируется для графической иллюстрации генетической дистанции между анализируемыми популяциями. Программа показывает ссылки для выбранных популяционных исследований, что облегчает правильное цитирование.

Смесь

Инструмент может применяться в судебно-медицинских случаях, когда необходимо проанализировать смешанный след (2 или более участников-мужчин). Результатом будет соотношение правдоподобия донорства и недонорства предполагаемого участника трассировки.

Родство

Этот инструмент может быть применен в случаях родства, когда необходимо проанализировать отношения между родственниками, расположенными выше и ниже по течению (например, отец-сын или дед-внук). Результатом будет отношение правдоподобия (или индекс родства) патрилинейных отношений к отцовским не-отношениям анализируемых лиц.

Статистика матчей

Поиск YHRD приведет к совпадению или несовпадению между искомым гаплотипом и эталонными образцами на основе данных. Относительное количество совпадений описывается как частота профиля. В судебно-медицинской экспертизе вероятность совпадения, основанная на частоте профиля, оценивается с использованием различных методов. Некоторые из них рекомендованы национальными директивами, например расширенный метод подсчета с доверительными интервалами и / или коррекцией тета-субпопуляции (SWGDAM Interpretation Guidelines for Y-Chromosome STR typing by Forensic Laboratories in USA, 2014) или дискретный метод Лапласа (Andersen et al.2013), рекомендованный в Германии (Willuweit и др., 2018). И расширенный счет, и значения DL предоставляются YHRD для разных метапопуляций.

Релизы

ДатаВыпускГаплотипыВеха
1 августа 1999 г.12,517YHRD 1.0
16 июня 2000 г.3,589
1 января 2003 г.218,050
18 августа 2003 г.319,482
30 октября 2003 г.420,152
11 июля 2003 г.520,320
12 октября 2003 г.620,865
29 декабря 2003 г.8,921,446
24 февраля 2004 г.1021,546
26 февраля 2004 г.1122,872
13 апреля 2004 г.1224,524YHRD 2.0
24 мая 2004 г.1325,066
1 июля 2004 г.1426,325
18 сентября 2004 г.1528,649
17 декабря 2004 г.1632,196
31 мая 2005 г.1734,558
14 октября 2005 г.1838,761
31 января 2006 г.1941,965
1 августа 2006 г.2046,831
28 декабря 2006 г.2151,253
13 апреля 2007 г.2252,655
10 августа 2007 г.2354,833
23 июля 2008 г.2459,004YHRD 3.0
1 октября 2008 г.2565,165
29 января 2009 г.2668,108
13 февраля 2009 г.2772,082
23 марта 2009 г.2872,055
12 июня 2009 г.2974,742
21 августа 2009 г.3079,147
16 ноября 2009 г.3181,099
18 декабря 2009 г.3284,047
3 марта 2010 г.3386,568
16 июля 2010 г.3489,237
30 декабря 2010 г.3591,601
15 мая 2011 г.3693,290
21 июня 2011 г.3797,575
30 декабря 2011 г.3899,881
17 февраля 2012 г.39101,055
29 августа 2012 г.40104,174
1 октября 2012 г.41105,498
11 января 2013 г.42108,949
18 января 2013 г.43112,005
12 июля 2013 г.44114,256
31 октября 2013 г.45124,343
20 декабря 2013 г.46126,931
15 августа 2014 г.47132,553YHRD 4.0
10 ноября 2014 г.48136,184
17 февраля 2015 г.49143,044
18 июля 2015 г.50154,329
6 января 2016 г.51160,693
27 октября 2016 г.52178,171
1 марта 2017 г.53183,655
6 июня 2017 г.54188,209
20 октября 2017 г.55197,102
9 апреля 2018 г.56207,467
15 июня 2018 г.57216,562
9 сентября 2018 г.58255,811
1 ноября 2018 г.59265,324
14 января 2019 г.,60269,383
24 июня 2019 г.,61285,406
31 декабря 2019 г.,62307,169

Смотрите также

использованная литература

  1. ^ "Домашняя страница МПД". Получено 2 января, 2020.
  2. ^ «Правила публикации ФСИГЕН» (PDF). Получено 25 сентября 2013.
  3. ^ «Promega PowerPlex Y». Получено 25 сентября 2013.
  4. ^ «Прикладная биосистема Yfiler». Получено 25 сентября 2013.
  5. ^ «Promega PowerPlex Y23». Получено 25 сентября 2013.
  6. ^ Гански И. и Гилпин М. (1997). Биология метапопуляции: экология, генетика и эволюция., Academic Press, Сан-Диего.
  7. ^ а б Виллувейт, С., Ровер, Л. и Международная судебная группа пользователей Y-хромосомы (2007). Справочная база данных гаплотипов Y-хромосомы (YHRD): Обновление., Forensic Sci Int Genet 1 (2): 83–87.
  8. ^ Ровер, Л., Краучер, П.Дж.П., Виллувейт, С., Лу, Т.Т., Кайзер, М., Лессиг, Р., де Книж, П., Джоблинг, М.А., Тайлер-Смит, К. и Кравчак, М. ( 2005). Подпись недавних исторических событий в европейском распределении STR-гаплотипов y-хромосомы., Hum Genet 116 (4): 279-291.
  9. ^ Роуер, Л., Кайзер, М., Дильтьес, П., Надь, М., Баккер, Э., Кравчак, М. и де Книж, П. (1996). Анализ молекулярной дисперсии (AMOVA) микросателлитов, специфичных для y-хромосомы, в двух близкородственных популяциях человека. Hum Mol Genet 5 (7): 1029–1033.

внешние ссылки