Янив Эрлих - Yaniv Erlich

Янив Эрлих
יניב ארליך
Альма-матерШкола биологических наук Уотсона
Научная карьера
ПоляГеномика, Биоинформатика, Генетическая конфиденциальность, Краудсорсинг,
УчрежденияКолумбийский университет
ДокторантГрег Хэннон
Интернет сайтhttps://teamerlich.org/

Янив Эрлих является Израильско-американский ученый. Он доцент кафедры Информатика в Колумбийский университет и главный научный сотрудник MyHeritage.[1] Работы Эрлиха объединяют Информатика и геномика.

биография

Эрлих родился в Израиль. Он получил степень бакалавра наук о мозге в 2006 г. Тель-авивский университет и докторскую степень по биоинформатике в 2010 г. Школа биологических наук Уотсона в Лаборатория Колд-Спринг-Харбор. С 2010 по 2015 год Эрлих был научным сотрудником Институт Уайтхеда, Массачусетский технологический институт. С 2015 г. руководит лабораторией в Колумбийский университет в вычислительной геномике [2]

Научная работа

Краудсорсинг геномной информации

Команда Эрлиха опубликовала исследование в журнале Наука который сообщил о краудсорсинге десятков миллионов генеалогических записей с веб-сайта Geni.com.[3] Команде удалось создать единое генеалогическое древо из 13 миллионов человек, которые связаны между собой и охватывают десятки поколений и более 600 лет истории.[4] В исследовании использовались данные для анализа генетики долголетия и семейной дисперсии.[5]

В другом направлении исследований Эрлих и Джо Пикрелл создали веб-сайт под названием DNA.Land, чтобы собирать наборы геномных данных участников потребительской геномики.[6] К ноябрю 2018 года на сайте было собрано более 130000 наборов данных.

Генетическая конфиденциальность

Группа Эрлиха опубликовала несколько исследований по теме генетическая конфиденциальность. В 2013 году они сообщили о возможности восстановления фамилия мужчины из его якобы анонимного набора геномных данных, что может привести к установлению его полной личности.[7] Этот метод использует совместное наследование фамилий и Y-хромосом в большинстве обществ. Таким образом, сравнивая Y-хромосома человека, интересующегося в базах данных генетической генеалогии Y-хромосом, в некоторых случаях можно вывести фамилию. Команда подсчитала, что 12% мужчин в США подлежат успешному восстановлению фамилии. Команда также продемонстрировала, что после восстановления фамилии основные демографические идентификаторы, такие как возраст и место проживания, могут позволить проследить личность человека. Чтобы продемонстрировать силу техники, они восстанавливают идентичность нескольких 1000 геномов по фамилии.

В 2014 году Эрлих и Арвинд Нараянан опубликовал обзор методов взлома наборов геномных данных.[8] Они предсказали, что поиски аутосом в GEDmatch может использоваться для отслеживания личности анонимных людей, когда база пользователей GEDmatch достигнет определенного размера, что действительно произошло в 2018 году, когда веб-сайт использовался для захвата Голден Стэйт Киллер.

В 2018 году команда Эрлиха опубликовала в Science исследование, в котором сообщается, что около 60% людей европейского происхождения в США имеют как минимум троюродный брат в GEDmatch, что теоретически может позволить их идентификацию.[9] Через два-три года практически любого человека из этой этнической группы можно будет теоретически отследить с помощью этой техники, если нынешние темпы роста GEDmatch сохранятся.[10] Команда предложила метод криптографической подписи, чтобы уменьшить вероятность неправомерного использования веб-сайтов потребителей при обыске.

Рекомендации

  1. ^ «Сайт лаборатории Эрлиха».
  2. ^ "Спикеры TEDxDanubia".
  3. ^ «Количественный анализ генеалогических деревьев с миллионами родственников».
  4. ^ «Краудсорсинг 600 лет истории человечества».
  5. ^ "WSJ".
  6. ^ «DNA.Land - это платформа для сбора геномов и феноменов в эпоху обилия генетической информации».
  7. ^ «Идентификация личных геномов по фамилии».
  8. ^ «Пути нарушения и защиты генетической конфиденциальности».
  9. ^ «Идентификационный вывод геномных данных с помощью семейных поисков на дальние расстояния».
  10. ^ «ДНК большинства белых американцев может быть идентифицирована с помощью генеалогических баз данных».