Пакетный эффект - Batch effect
В молекулярная биология, а пакетный эффект возникает, когда небиологические факторы в эксперименте вызывают изменения в данных, полученных в ходе эксперимента. Такие эффекты могут привести к неточным выводам, если их причины коррелируют с одним или несколькими интересующими результатами эксперимента. Они распространены во многих типах высокопроизводительное секвенирование эксперименты, в том числе с использованием микрочипы, масс-спектрометры,[1] и одноклеточное РНК-секвенирование данные.[2] Чаще всего они обсуждаются в контексте геномика и исследования в области высокопроизводительного секвенирования, но они существуют и в других областях науки.[1]
Определения
В литературе было предложено несколько определений термина «эффект партии». Lazar et al. (2013) отметили: «Дать полное и недвусмысленное определение так называемого пакетного эффекта - сложная задача, особенно потому, что его происхождение и то, как он проявляется в данных, полностью не известны или не зарегистрированы». Сосредоточившись на экспериментах с микрочипами, они предлагают новое определение, основанное на нескольких предыдущих: «[T] эффект партии представляет собой систематические технические различия, когда образцы обрабатываются и измеряются в разных партиях и которые не связаны с какими-либо биологическими вариациями, зарегистрированными во время MAGE [ экспрессия генов микроматрицы] эксперимент ".[3]
Причины
Многие потенциально изменяющиеся факторы были идентифицированы как потенциальные причины эффектов партии, включая следующие:
- Лабораторные условия[1]
- Выбор партии реагента или партии[1][4]
- Кадровые различия[1]
- Время суток, когда проводился эксперимент[4]
- Атмосферный озон уровни[4]
- Инструменты, используемые для проведения эксперимента
Исправление
Были разработаны различные статистические методы, чтобы попытаться исправить эффекты партии в экспериментах с высокой производительностью. Эти методы предназначены для использования на этапах планирования экспериментов и анализа данных. Исторически они в основном сосредоточились на экспериментах по геномике и только недавно начали расширяться в другие научные области, такие как протеомика.[5] Одна из проблем, связанных с такими методами, заключается в том, что они могут непреднамеренно устранить фактические биологические вариации.[6] Некоторые методы, которые использовались для обнаружения и / или корректировки пакетных эффектов, включают следующее:
- Для данных микрочипа линейные смешанные модели были использованы с смешивающими факторами, включенными в качестве случайных перехватов.[7]
- В 2007 году Johnson et al. предложил эмпирический байесовский техника коррекции пакетных эффектов. Этот подход представляет собой улучшение по сравнению с предыдущими методами, поскольку он может эффективно использоваться с небольшими размерами партий.[4]
- В 2012 г. пакет программного обеспечения был представлен. Он включает в себя несколько функций для настройки пакетных эффектов, включая использование суррогатная переменная оценка, которая, как ранее было показано, улучшает воспроизводимость и снижает зависимость в высокопроизводительных экспериментах.
- Ахверди и другие. (2018) предложили метод, разработанный для данных секвенирования РНК одной клетки, основанный на обнаружении общие ближайшие соседи в данных.[2]
- Papiez et al. (2019) предложили динамическое программирование алгоритм для выявления пакетных эффектов неизвестного значения в данных с высокой пропускной способностью.[8]
использованная литература
- ^ а б c d е Лик, Джеффри Т.; Шарпф, Роберт Б .; Браво, Эктор Коррада; Симха, Дэвид; Лэнгмид, Бенджамин; Джонсон, У. Эван; Джеман, Дональд; Баггерли, Кейт; Иризарри, Рафаэль А. (Октябрь 2010 г.). «Устранение широко распространенного и критического воздействия пакетных эффектов на данные с высокой пропускной способностью». Природа Обзоры Генетика. 11 (10): 733–739. Дои:10,1038 / nrg2825. ISSN 1471-0056. ЧВК 3880143. PMID 20838408.
- ^ а б Хагверди, Лале; Лун, Аарон Т. Л.; Морган, Майкл Д; Мариони, Джон К. (май 2018 г.). «Пакетные эффекты в данных секвенирования РНК одной клетки корректируются путем сопоставления ближайших соседей». Природа Биотехнологии. 36 (5): 421–427. Дои:10.1038 / nbt.4091. ISSN 1087-0156. ЧВК 6152897. PMID 29608177.
- ^ Лик, Джеффри Т .; Джонсон, У. Эван; Паркер, Хилари С .; Jaffe, Andrew E .; Стори, Джон Д. (2012-03-15). «Пакет sva для удаления пакетных эффектов и других нежелательных отклонений в высокопроизводительных экспериментах». Биоинформатика. 28 (6): 882–883. Дои:10.1093 / биоинформатика / bts034. ISSN 1460-2059. ЧВК 3307112. PMID 22257669.
- ^ а б c d Джонсон, У. Эван; Ли, Ченг; Рабинович, Ариэль (01.01.2007). «Регулировка пакетных эффектов в данных экспрессии микроматрицы с использованием эмпирических байесовских методов». Биостатистика. 8 (1): 118–127. Дои:10.1093 / биостатистика / kxj037. ISSN 1468-4357. PMID 16632515.
- ^ Чуклина, Елена; Педриоли, Патрик Г. А .; Эберсольд, Руеди (2020). Обзор подходов к предотвращению, диагностике и коррекции пакетных эффектов. Методы молекулярной биологии. 2051. С. 373–387. Дои:10.1007/978-1-4939-9744-2_16. ISBN 978-1-4939-9743-5. ISSN 1940-6029. PMID 31552638.
- ^ Го, Уилсон Вен Бин; Ван, Вэй; Вонг, Лимсун (июнь 2017 г.). «Почему пакетные эффекты имеют значение в данных Omics и как их избежать». Тенденции в биотехнологии. 35 (6): 498–507. Дои:10.1016 / j.tibtech.2017.02.012. PMID 28351613.
- ^ Эспин-Перес, Альмудена; Портье, Крис; Chadeau-Hyam, Marc; ван Вельдховен, Карин; Kleinjans, Jos C.S .; де Кок, Тео М. С. М. (30 августа 2018 г.). Кришнан, Вишванатан В. (ред.). «Сравнение статистических методов и использование образцов контроля качества для коррекции эффекта партии в данных транскриптома человека». PLOS ONE. 13 (8): e0202947. Bibcode:2018PLoSO..1302947E. Дои:10.1371 / journal.pone.0202947. ISSN 1932-6203. ЧВК 6117018. PMID 30161168.
- ^ Папье, Анна; Марчик, Михал; Полянска, Иоанна; Полански, Анджей (2019-06-01). Бергер, Бонни (ред.). «BatchI: Пакетный эффект. Идентификация в данных высокопроизводительного скрининга с использованием алгоритма динамического программирования». Биоинформатика. 35 (11): 1885–1892. Дои:10.1093 / биоинформатика / bty900. ISSN 1367-4803. ЧВК 6546123. PMID 30357412.