Янив Эрлих - Yaniv Erlich
Янив Эрлих | |
---|---|
יניב ארליך | |
Альма-матер | Школа биологических наук Уотсона |
Научная карьера | |
Поля | Геномика, Биоинформатика, Генетическая конфиденциальность, Краудсорсинг, |
Учреждения | Колумбийский университет |
Докторант | Грег Хэннон |
Интернет сайт | https://teamerlich.org/ |
Янив Эрлих является Израильско-американский ученый. Он доцент кафедры Информатика в Колумбийский университет и главный научный сотрудник MyHeritage.[1] Работы Эрлиха объединяют Информатика и геномика.
биография
Эрлих родился в Израиль. Он получил степень бакалавра наук о мозге в 2006 г. Тель-авивский университет и докторскую степень по биоинформатике в 2010 г. Школа биологических наук Уотсона в Лаборатория Колд-Спринг-Харбор. С 2010 по 2015 год Эрлих был научным сотрудником Институт Уайтхеда, Массачусетский технологический институт. С 2015 г. руководит лабораторией в Колумбийский университет в вычислительной геномике [2]
Научная работа
Краудсорсинг геномной информации
Команда Эрлиха опубликовала исследование в журнале Наука который сообщил о краудсорсинге десятков миллионов генеалогических записей с веб-сайта Geni.com.[3] Команде удалось создать единое генеалогическое древо из 13 миллионов человек, которые связаны между собой и охватывают десятки поколений и более 600 лет истории.[4] В исследовании использовались данные для анализа генетики долголетия и семейной дисперсии.[5]
В другом направлении исследований Эрлих и Джо Пикрелл создали веб-сайт под названием DNA.Land, чтобы собирать наборы геномных данных участников потребительской геномики.[6] К ноябрю 2018 года на сайте было собрано более 130000 наборов данных.
Генетическая конфиденциальность
Группа Эрлиха опубликовала несколько исследований по теме генетическая конфиденциальность. В 2013 году они сообщили о возможности восстановления фамилия мужчины из его якобы анонимного набора геномных данных, что может привести к установлению его полной личности.[7] Этот метод использует совместное наследование фамилий и Y-хромосом в большинстве обществ. Таким образом, сравнивая Y-хромосома человека, интересующегося в базах данных генетической генеалогии Y-хромосом, в некоторых случаях можно вывести фамилию. Команда подсчитала, что 12% мужчин в США подлежат успешному восстановлению фамилии. Команда также продемонстрировала, что после восстановления фамилии основные демографические идентификаторы, такие как возраст и место проживания, могут позволить проследить личность человека. Чтобы продемонстрировать силу техники, они восстанавливают идентичность нескольких 1000 геномов по фамилии.
В 2014 году Эрлих и Арвинд Нараянан опубликовал обзор методов взлома наборов геномных данных.[8] Они предсказали, что поиски аутосом в GEDmatch может использоваться для отслеживания личности анонимных людей, когда база пользователей GEDmatch достигнет определенного размера, что действительно произошло в 2018 году, когда веб-сайт использовался для захвата Голден Стэйт Киллер.
В 2018 году команда Эрлиха опубликовала в Science исследование, в котором сообщается, что около 60% людей европейского происхождения в США имеют как минимум троюродный брат в GEDmatch, что теоретически может позволить их идентификацию.[9] Через два-три года практически любого человека из этой этнической группы можно будет теоретически отследить с помощью этой техники, если нынешние темпы роста GEDmatch сохранятся.[10] Команда предложила метод криптографической подписи, чтобы уменьшить вероятность неправомерного использования веб-сайтов потребителей при обыске.
Рекомендации
- ^ «Сайт лаборатории Эрлиха».
- ^ "Спикеры TEDxDanubia".
- ^ «Количественный анализ генеалогических деревьев с миллионами родственников».
- ^ «Краудсорсинг 600 лет истории человечества».
- ^ "WSJ".
- ^ «DNA.Land - это платформа для сбора геномов и феноменов в эпоху обилия генетической информации».
- ^ «Идентификация личных геномов по фамилии».
- ^ «Пути нарушения и защиты генетической конфиденциальности».
- ^ «Идентификационный вывод геномных данных с помощью семейных поисков на дальние расстояния».
- ^ «ДНК большинства белых американцев может быть идентифицирована с помощью генеалогических баз данных».