Пакетный эффект - Batch effect

В молекулярная биология, а пакетный эффект возникает, когда небиологические факторы в эксперименте вызывают изменения в данных, полученных в ходе эксперимента. Такие эффекты могут привести к неточным выводам, если их причины коррелируют с одним или несколькими интересующими результатами эксперимента. Они распространены во многих типах высокопроизводительное секвенирование эксперименты, в том числе с использованием микрочипы, масс-спектрометры,[1] и одноклеточное РНК-секвенирование данные.[2] Чаще всего они обсуждаются в контексте геномика и исследования в области высокопроизводительного секвенирования, но они существуют и в других областях науки.[1]

Определения

В литературе было предложено несколько определений термина «эффект партии». Lazar et al. (2013) отметили: «Дать полное и недвусмысленное определение так называемого пакетного эффекта - сложная задача, особенно потому, что его происхождение и то, как он проявляется в данных, полностью не известны или не зарегистрированы». Сосредоточившись на экспериментах с микрочипами, они предлагают новое определение, основанное на нескольких предыдущих: «[T] эффект партии представляет собой систематические технические различия, когда образцы обрабатываются и измеряются в разных партиях и которые не связаны с какими-либо биологическими вариациями, зарегистрированными во время MAGE [ экспрессия генов микроматрицы] эксперимент ".[3]

Причины

Многие потенциально изменяющиеся факторы были идентифицированы как потенциальные причины эффектов партии, включая следующие:

  • Лабораторные условия[1]
  • Выбор партии реагента или партии[1][4]
  • Кадровые различия[1]
  • Время суток, когда проводился эксперимент[4]
  • Атмосферный озон уровни[4]
  • Инструменты, используемые для проведения эксперимента

Исправление

Были разработаны различные статистические методы, чтобы попытаться исправить эффекты партии в экспериментах с высокой производительностью. Эти методы предназначены для использования на этапах планирования экспериментов и анализа данных. Исторически они в основном сосредоточились на экспериментах по геномике и только недавно начали расширяться в другие научные области, такие как протеомика.[5] Одна из проблем, связанных с такими методами, заключается в том, что они могут непреднамеренно устранить фактические биологические вариации.[6] Некоторые методы, которые использовались для обнаружения и / или корректировки пакетных эффектов, включают следующее:

  • Для данных микрочипа линейные смешанные модели были использованы с смешивающими факторами, включенными в качестве случайных перехватов.[7]
  • В 2007 году Johnson et al. предложил эмпирический байесовский техника коррекции пакетных эффектов. Этот подход представляет собой улучшение по сравнению с предыдущими методами, поскольку он может эффективно использоваться с небольшими размерами партий.[4]
  • В 2012 г. пакет программного обеспечения был представлен. Он включает в себя несколько функций для настройки пакетных эффектов, включая использование суррогатная переменная оценка, которая, как ранее было показано, улучшает воспроизводимость и снижает зависимость в высокопроизводительных экспериментах.
  • Ахверди и другие. (2018) предложили метод, разработанный для данных секвенирования РНК одной клетки, основанный на обнаружении общие ближайшие соседи в данных.[2]
  • Papiez et al. (2019) предложили динамическое программирование алгоритм для выявления пакетных эффектов неизвестного значения в данных с высокой пропускной способностью.[8]

использованная литература

  1. ^ а б c d е Лик, Джеффри Т.; Шарпф, Роберт Б .; Браво, Эктор Коррада; Симха, Дэвид; Лэнгмид, Бенджамин; Джонсон, У. Эван; Джеман, Дональд; Баггерли, Кейт; Иризарри, Рафаэль А. (Октябрь 2010 г.). «Устранение широко распространенного и критического воздействия пакетных эффектов на данные с высокой пропускной способностью». Природа Обзоры Генетика. 11 (10): 733–739. Дои:10,1038 / nrg2825. ISSN  1471-0056. ЧВК  3880143. PMID  20838408.
  2. ^ а б Хагверди, Лале; Лун, Аарон Т. Л.; Морган, Майкл Д; Мариони, Джон К. (май 2018 г.). «Пакетные эффекты в данных секвенирования РНК одной клетки корректируются путем сопоставления ближайших соседей». Природа Биотехнологии. 36 (5): 421–427. Дои:10.1038 / nbt.4091. ISSN  1087-0156. ЧВК  6152897. PMID  29608177.
  3. ^ Лик, Джеффри Т .; Джонсон, У. Эван; Паркер, Хилари С .; Jaffe, Andrew E .; Стори, Джон Д. (2012-03-15). «Пакет sva для удаления пакетных эффектов и других нежелательных отклонений в высокопроизводительных экспериментах». Биоинформатика. 28 (6): 882–883. Дои:10.1093 / биоинформатика / bts034. ISSN  1460-2059. ЧВК  3307112. PMID  22257669.
  4. ^ а б c d Джонсон, У. Эван; Ли, Ченг; Рабинович, Ариэль (01.01.2007). «Регулировка пакетных эффектов в данных экспрессии микроматрицы с использованием эмпирических байесовских методов». Биостатистика. 8 (1): 118–127. Дои:10.1093 / биостатистика / kxj037. ISSN  1468-4357. PMID  16632515.
  5. ^ Чуклина, Елена; Педриоли, Патрик Г. А .; Эберсольд, Руеди (2020). Обзор подходов к предотвращению, диагностике и коррекции пакетных эффектов. Методы молекулярной биологии. 2051. С. 373–387. Дои:10.1007/978-1-4939-9744-2_16. ISBN  978-1-4939-9743-5. ISSN  1940-6029. PMID  31552638.
  6. ^ Го, Уилсон Вен Бин; Ван, Вэй; Вонг, Лимсун (июнь 2017 г.). «Почему пакетные эффекты имеют значение в данных Omics и как их избежать». Тенденции в биотехнологии. 35 (6): 498–507. Дои:10.1016 / j.tibtech.2017.02.012. PMID  28351613.
  7. ^ Эспин-Перес, Альмудена; Портье, Крис; Chadeau-Hyam, Marc; ван Вельдховен, Карин; Kleinjans, Jos C.S .; де Кок, Тео М. С. М. (30 августа 2018 г.). Кришнан, Вишванатан В. (ред.). «Сравнение статистических методов и использование образцов контроля качества для коррекции эффекта партии в данных транскриптома человека». PLOS ONE. 13 (8): e0202947. Bibcode:2018PLoSO..1302947E. Дои:10.1371 / journal.pone.0202947. ISSN  1932-6203. ЧВК  6117018. PMID  30161168.
  8. ^ Папье, Анна; Марчик, Михал; Полянска, Иоанна; Полански, Анджей (2019-06-01). Бергер, Бонни (ред.). «BatchI: Пакетный эффект. Идентификация в данных высокопроизводительного скрининга с использованием алгоритма динамического программирования». Биоинформатика. 35 (11): 1885–1892. Дои:10.1093 / биоинформатика / bty900. ISSN  1367-4803. ЧВК  6546123. PMID  30357412.