Секвенирование красителей Illumina - Illumina dye sequencing

Секвенирование красителей Illumina это метод, используемый для определения серии пар оснований в ДНК, также известный как Секвенирование ДНК. Концепция химии с обратимым терминированием была изобретена Бруно Канардом и Саймоном Сарфати в Институте Пастера в Париже.^[1]^[2] Он был разработан Шанкар Баласубраманян и Дэвид Кленерман Кембриджского университета,^[3] который впоследствии основал Solexa, компанию, позже приобретенную Иллюмина. Этот метод секвенирования основан на обратимых терминаторах красителя, которые позволяют идентифицировать отдельные нуклеотиды, когда они промываются по цепям ДНК. Его также можно использовать для всегогеном и секвенирование области, транскриптом анализ, метагеномика, маленький РНК открытие метилирование профилирование и геном белок -нуклеиновая кислота анализ взаимодействия.^[4]^[5]

ДНК прикрепляется к проточной ячейке через комплементарные последовательности. Нить наклоняется и прикрепляется ко второму олиго, образуя мостик. Полимераза синтезирует обратную цепь. Две пряди отпустите и распрямите. Каждый образует новый мост (усиление моста). Результатом является кластер клонов прямой и обратной цепей ДНК.

Обзор

Технология секвенирования Illumina состоит из трех основных этапов: амплификации, секвенирования и анализа. Процесс начинается с очищенной ДНК. ДНК фрагментируется, и добавляются адаптеры, содержащие сегменты, которые действуют как контрольные точки во время амплификации, секвенирования и анализа. Модифицированная ДНК загружается в проточную ячейку, где происходит амплификация и секвенирование. Проточная ячейка содержит нанокарманы, которые разделяют фрагменты и помогают справиться с переполненностью.^[6] Каждая нанолунка содержит олигонуклеотиды, которые обеспечивают точку прикрепления адаптеров. После присоединения фрагментов начинается фаза, называемая генерацией кластера. На этом этапе создается около тысячи копий каждого фрагмента ДНК и выполняется с помощью мостиковой ПЦР-амплификации. Затем на чип промывают праймеры и модифицированные нуклеотиды. Эти нуклеотиды имеют обратимый блокатор 3'-флуоресценции, поэтому ДНК-полимераза может добавлять только один нуклеотид за раз к фрагменту ДНК.^[6] После каждого цикла синтеза камера делает снимок чипа. Компьютер определяет, какая база была добавлена по длине волны флуоресцентной метки, и записывает ее для каждой точки на чипе. После каждого цикла невключенные молекулы смываются. Затем используется стадия химического деблокирования для удаления 3’-флуоресцентной концевой блокирующей группы. Процесс продолжается до тех пор, пока не будет секвенирована полная молекула ДНК.^[5] С помощью этой технологии тысячи мест по всему геному секвенируются одновременно с помощью массивное параллельное секвенирование.

Процедура

Геномная библиотека

После очистки ДНК необходимо создать библиотеку ДНК, геномную библиотеку. Есть два способа создания геномной библиотеки: ультразвуковая обработка и тегирование. С пометкой, транспозиции случайным образом разрезает ДНК на фрагменты размером от 50 до 500 п.н. и одновременно добавляет адаптеры.^[6] Генетическая библиотека также может быть создана с использованием ультразвуковой обработки для фрагментации геномной ДНК. Ультразвуковая обработка фрагментирует ДНК до одинаковых размеров с помощью ультразвуковых звуковых волн. Правый и левый адаптеры должны быть присоединены ДНК-полимеразой Т7 и ДНК-лигазой Т4 после обработки ультразвуком. Нити, к которым не удалось связать адаптеры, смываются.^[7]

Двухцепочечная ДНК расщепляется транспосомами. Обрезанные концы восстанавливаются, и к каждой цепи ДНК добавляются адаптеры, индексы, сайты связывания праймеров и концевые сайты. Изображение частично основано на видео с секвенсором компании Illumina.^[7]

Адаптеры

Адаптеры содержат три разных сегмента: последовательность, комплементарную твердой подложке (олигонуклеотиды на проточной кювете), последовательность штрих-кода (индексы) и сайт связывания для праймера для секвенирования.^[6] Индексы обычно состоят из шести пар оснований и используются при анализе последовательности ДНК для идентификации образцов. Индексы позволяют обрабатывать до 96 различных выборок вместе, это также известно как мультиплексирование. Во время анализа компьютер группирует все чтения с одним индексом вместе.^[8]^[9] Illumina использует подход «последовательность за синтезом».^[9] Этот процесс происходит внутри проточной стеклянной ячейки с акриламидным покрытием.^[10] Проточная ячейка имеет олигонуклеотиды (короткие нуклеотидные последовательности), покрывающие дно ячейки, и они служат твердой опорой для удержания цепей ДНК на месте во время секвенирования. Когда фрагментированная ДНК промывается над проточной ячейкой, соответствующий адаптер прикрепляется к дополнительной твердой подложке.

Миллионы олигонуклеотидов выстилают дно каждой дорожки проточной кюветы.

Мостовое усиление

После подключения можно начинать создание кластера. Цель состоит в том, чтобы создать сотни идентичных цепочек ДНК. Некоторые будут передней прядью; в остальном наоборот. Вот почему используются правый и левый переходники. Кластеры генерируются посредством мостовой амплификации. ДНК-полимераза движется по цепи ДНК, создавая ее дополнительную цепь. Исходная прядь смывается, остается только обратная прядь. Вверху обратной нити находится последовательность адаптеров. Нить ДНК изгибается и прикрепляется к олиго, которое комплементарно верхней последовательности адаптера. Полимеразы прикрепляются к обратной нити, и создается ее дополнительная нить (которая идентична исходной). Теперь двухцепочечная ДНК денатурируется, так что каждая цепь может отдельно присоединяться к олигонуклеотидной последовательности, прикрепленной к проточной ячейке. Одна будет обратной прядью; другой, нападающий. Этот процесс называется усилением мостика, и он происходит сразу для тысяч кластеров по всей проточной ячейке.^[11]

Клональная амплификация

Снова и снова нити ДНК будут изгибаться и прикрепляться к твердой опоре. ДНК-полимераза будет синтезировать новую цепь для создания двухцепочечного сегмента, который будет денатурирован, так что все цепи ДНК в одной области будут из одного источника (клональная амплификация). Клональная амплификация важна для контроля качества. Если обнаруживается, что нить имеет нечетную последовательность, ученые могут проверить обратную цепочку, чтобы убедиться, что она имеет комплемент такой же странности. Прямые и обратные нити действуют как проверки для защиты от артефактов. Поскольку при секвенировании Illumina используется ДНК-полимераза, наблюдались ошибки замены оснований,^[12] особенно на 3-м конце.^[13] Парные конечные чтения в сочетании с генерацией кластера могут подтвердить, что произошла ошибка. Обратная и прямая цепочки должны дополнять друг друга, все обратные чтения должны соответствовать друг другу, а все прямые чтения должны соответствовать друг другу. Если чтение недостаточно похоже на его копии (с которыми он должен быть клоном), возможно, произошла ошибка. Минимальный порог сходства 97% использовался в анализах некоторых лабораторий.^[13]

Последовательность путем синтеза

В конце клональной амплификации все обратные цепи смываются с проточной кюветы, оставляя только прямые цепи. Праймер прикрепляется к сайту связывания праймера адаптера прямых цепей, а полимераза добавляет флуоресцентно меченый дНТФ к цепи ДНК. Только одно основание может быть добавлено за раунд из-за того, что флуорофор действует как блокирующая группа; однако группа блокировки обратима.^[6] Используя четырехцветную химию, каждая из четырех оснований имеет уникальное излучение, и после каждого раунда машина записывает, какая база была добавлена. После регистрации цвета флуорофор смывается, а другой dNTP промывается над проточной ячейкой, и процесс повторяется. dATP, dTTP, dGTP и dCTP промывают клетку отдельно, так что каждый нуклеотид может быть идентифицирован.

Начиная с запуска NextSeq, а затем MiniSeq, Illumina представила новую химию двухцветного секвенирования. Нуклеотиды различаются по одному из двух цветов (красный или зеленый), без цвета («черный») или по сочетанию обоих цветов (оранжевый цвет представляет собой смесь красного и зеленого).

Помеченные нуклеотиды добавляются к цепи ДНК. Каждый из четырех нуклеотидов имеет идентифицирующую метку, которая может быть возбуждена для излучения характерной длины волны. Компьютер записывает все выбросы, и на основе этих данных выполняются базовые вызовы.

После считывания цепи ДНК только что добавленная цепь смывается. Затем присоединяется праймер с индексом 1, полимеризуется последовательность с индексом 1 и смывается. Нить снова образует мостик, и 3'-конец цепи ДНК прикрепляется к олиго на проточной кювете. Праймер индекса 2 прикрепляется, полимеризует последовательность и смывается.

Полимераза размещает комплементарную цепь поверх дугообразной цепи. Они разделяются, и 3 'конец каждой пряди блокируется. Прямая цепь смывается, и процесс последовательности путем синтеза повторяется для обратной цепи.

Анализ данных

Секвенирование происходит сразу для миллионов кластеров, и каждый кластер имеет ~ 1000 идентичных копий вставки ДНК.^[12] Данные последовательности анализируются путем нахождения фрагментов с перекрывающимися областями, называемыми контиги, и выстраивая их в ряд. Если эталонная последовательность известна, контиги затем сравниваются с ней для идентификации варианта.

Этот поэтапный процесс позволяет ученым видеть полную последовательность, даже если нефрагментированная последовательность никогда не запускалась; однако, поскольку длина чтения Illumina не очень велика^[13] (Секвенирование HiSeq может обеспечить длину чтения около 90 п.н.^[8]), может возникнуть проблема с устранением участков с короткими тандемными повторами.^[8]^[12] Кроме того, если последовательность является de novo и ссылки не существует, повторяющиеся области могут вызвать большие трудности при сборке последовательности.^[12] Дополнительные трудности включают замену оснований (особенно в 3 'конце чтения^[13]) из-за неточных полимераз, химерных последовательностей и смещения ПЦР, все из которых может способствовать созданию неправильной последовательности.^[13]

Сравнение с другими методами секвенирования

Этот метод предлагает несколько преимуществ по сравнению с традиционными методами секвенирования, такими как Секвенирование по Сэнгеру. Секвенирование по Сэнгеру требует двух реакций, одну для прямого праймера, а другую для обратного праймера. В отличие от Illumina, при секвенировании по Сэнгеру используются флуоресцентно меченные дидезоксинуклеозидтрифосфаты (ddNTP) для определения последовательности фрагмента ДНК. В ddNTP отсутствует 3 'ОН-группа, что приводит к окончательному прекращению синтеза ДНК.^[6] В каждую реакционную пробирку добавляются dNTP и ddNTP, а также ДНК-полимераза и праймеры. Отношение ddNTP к dNTP имеет значение, поскольку матричная ДНК должна быть полностью синтезирована, а избыток ddNTP создает множество фрагментов того же размера и положения, что и матрица ДНК. Когда ДНК-полимераза добавляет ddNTP, фрагмент обрывается и синтезируется новый фрагмент. Каждый синтезированный фрагмент на один нуклеотид длиннее предыдущего. Как только матрица ДНК будет полностью синтезирована, фрагменты разделяют капиллярным электрофорезом. Внизу капиллярной трубки лазер возбуждает флуоресцентно меченые ддНТФ, и камера фиксирует излучаемый цвет.

Благодаря автоматическому характеру секвенирования красителей Illumina можно секвенировать сразу несколько нитей и быстро получить фактические данные секвенирования. При секвенировании по Сэнгеру единовременно можно секвенировать только одну цепь, и это относительно медленно. Illumina использует только ДНК-полимераза в отличие от множества дорогих ферменты требуется другими методами секвенирования (т. е. пиросеквенирование ).^[14]

Примеры использования

Секвенирование Illumina использовалось для исследования транскриптомы из сладкий картофель^[15] и голосеменное растение род Taxus.^[16]