Открытая рамка чтения - Open reading frame

Примерная последовательность, показывающая три различных возможных рамки чтения. Стартовые кодоны выделены фиолетовым, а стоп-кодоны выделены красным.

В молекулярная генетика, открытая рамка чтения (ORF) является частью рамка чтения у которого есть способность быть переведено. ORF - это непрерывный участок кодоны что начинается с стартовый кодон (обычно AUG) и заканчивается на стоп-кодон (обычно UAA, UAG или UGA).[1] Кодон ATG (AUG с точки зрения РНК ) в ORF (не обязательно первый) может указывать, где начинается перевод. В прекращение транскрипции сайт расположен после ORF, за пределами перевод стоп-кодон. Если бы транскрипция прекратилась до появления стоп-кодона, во время трансляции образовался бы неполный белок.[2] В эукариотический гены с несколькими экзоны, интроны удаляются, а экзоны затем соединяются вместе после транскрипции, чтобы получить окончательный мРНК для трансляции белков. В контексте поиск генов, старт-стоп определение ORF, следовательно, применяется только к сплайсированным мРНК, а не к геномной ДНК, поскольку интроны могут содержать стоп-кодоны и / или вызывать сдвиги между рамками считывания. Альтернативное определение гласит, что ORF - это последовательность, длина которой делится на три и ограничена стоп-кодонами.[3][4]. Это более общее определение также может быть полезно в контексте транскриптомика и / или метагеномика, где стартовый и / или стоп-кодон может отсутствовать в полученных последовательностях. Такая ORF соответствует частям гена, а не всему гену.

Биологическое значение

Открытые рамки считывания (ORF) часто используются как одно свидетельство, помогающее в предсказание генов. Длинные ORF часто используются вместе с другими доказательствами для первоначальной идентификации кандидата. кодирование белков регионы или функциональная РНК -кодирование регионов в ДНК последовательность.[5] Наличие ORF не обязательно означает, что область всегда переведено. Например, в случайно сгенерированной последовательности ДНК с равным процентом каждого нуклеотид, а стоп-кодон ожидается раз в 21 кодоны.[5] Простой предсказание генов алгоритм для прокариоты может искать стартовый кодон за которой следует открытая рамка считывания, достаточно длинная для кодирования типичного белка, где использование кодонов этой области соответствует частотной характеристике для кодирующих областей данного организма.[5] Поэтому некоторые авторы говорят, что ORF должна иметь минимальную длину, например 100 кодонов[6] или 150 кодонов.[5] Сама по себе даже длинная открытая рамка считывания не является убедительным доказательством наличия ген.[5] С другой стороны, было доказано, что некоторые короткие ОРС (кОРС), в которых отсутствуют классические признаки кодирующих белки генов (как из нкРНК, так и мРНК), могут продуцировать функциональные пептиды.[7] Известно, что 5’NTR примерно 50% мРНК млекопитающих содержат одну или несколько кОРС.[8] 64–75% экспериментально обнаруженных сайтов инициации трансляции кОРС консервативны в геномах человека и мыши и могут указывать на то, что эти элементы выполняют функцию.[9] Однако кОРС часто можно найти только в минорных формах мРНК и избежать отбора; высокая консервативность сайтов инициации может быть связана с их расположением внутри промоторов соответствующих генов. Такая ситуация характерна для SLAMF1 ген, например.[10]

Шестикадровый перевод

Поскольку ДНК интерпретируется группами из трех нуклеотидов (кодонов), цепь ДНК имеет три различных рамки считывания.[11] Двойная спираль молекулы ДНК имеет две антипараллельные нити; с двумя цепями, каждая из которых имеет по три рамки считывания, существует шесть возможных трансляций рамки.[11]

Пример шестикадрового перевода. Нуклеотидная последовательность показана посередине с прямой трансляцией вверху и обратной трансляцией внизу. Выделены две возможные открытые рамки считывания с последовательностями.

Инструменты поиска ORF

ORF Finder

ORF Finder (поиск открытых рамок чтения)[12] представляет собой инструмент графического анализа, который находит все открытые рамки считывания заданного минимального размера в пользовательской последовательности или в последовательности, уже содержащейся в базе данных. Этот инструмент идентифицирует все открытые рамки считывания с использованием стандартных или альтернативных генетических кодов. Выведенная аминокислотная последовательность может быть сохранена в различных форматах и ​​найдена в базе данных последовательностей с помощью ВЗРЫВ сервер. ORF Finder должен быть полезен при подготовке полных и точных представлений последовательности. Он также поставляется с программным обеспечением для отправки последовательностей Sequin (анализатор последовательностей).

Исследователь ORF

Исследователь ORF[13] представляет собой программу, которая не только дает информацию о кодирующих и некодирующих последовательностях, но также может выполнять попарное глобальное выравнивание последовательностей различных участков гена / ДНК. Инструмент эффективно находит ORF для соответствующих аминокислотных последовательностей и преобразует их в их однобуквенные аминокислотные коды, а также предоставляет их положения в последовательности. Попарное глобальное выравнивание между последовательностями позволяет удобно обнаруживать различные мутации, в том числе однонуклеотидный полиморфизм. Алгоритмы Нидлмана – Вунша используются для выравнивания генов. ORF Investigator написан на портативном Perl язык программирования, и поэтому доступен для пользователей всех распространенных операционных систем.

ORF Predictor

OrfPredictor[14] представляет собой веб-сервер, разработанный для идентификации областей, кодирующих белок, в последовательностях, производных от метки экспрессируемой последовательности (EST). Для запрашиваемых последовательностей с попаданием в BLASTX программа предсказывает кодирующие области на основе рамок считывания трансляции, идентифицированных при выравнивании BLASTX, в противном случае она предсказывает наиболее вероятную кодирующую область на основе внутренних сигналов запрашиваемых последовательностей. Результатом являются предсказанные пептидные последовательности в формате FASTA и строка определения, которая включает идентификатор запроса, рамку считывания трансляции и положения нуклеотидов, в которых начинается и заканчивается кодирующая область. OrfPredictor упрощает аннотацию последовательностей, производных от EST, в частности, для крупномасштабных проектов EST.

ORF Predictor использует комбинацию двух разных определений ORF, упомянутых выше. Он ищет участки, начиная с стартового кодона и заканчивая стоп-кодоном. В качестве дополнительного критерия он ищет стоп-кодон в 5 ' непереведенный регион (UTR).

ORFik

ORFik - это R-пакет в Bioconductor для поиска открытых рамок считывания и использования технологий секвенирования нового поколения для обоснования ORF.[15]

Смотрите также

Рекомендации

  1. ^ «Открытая рамка чтения». Национальная медицинская библиотека США. 2015-10-19. Получено 2015-10-22.
  2. ^ Слончевский, Жанна; Джон Уоткинс Фостер (2009). Микробиология: развивающаяся наука. Нью-Йорк: W.W. Norton & Co. ISBN  978-0-393-97857-5. OCLC  185042615.
  3. ^ Claverie, J.-M. (1997) Вычислительные методы идентификации генов в геномных последовательностях позвоночных. Гм. Мол. Genet. 6, 1735–1744.
  4. ^ П. Зибер, М. Платцер, С. Шустер (2018). Повторное рассмотрение определения открытой рамки считывания. Тенденции Genet. 34, 167-170.
  5. ^ а б c d е Деонье, Ричард; Симон Таваре; Майкл Уотерман (2005). Вычислительный анализ генома: введение. Springer-Verlag. п. 25. ISBN  978-0-387-98785-9.
  6. ^ Клавери, Ж.-М., Пуаро, О., Лопес, Ф. (1997) Сложность идентификации генов в анонимных последовательностях позвоночных. Comput. Chem. 21 203-214
  7. ^ Zanet, J .; Benrabah, E .; Li, T .; Пелисье-Монье, А .; Chanut-Delalande, H .; Ронсин, Б .; Bellen, H.J .; Payre, F .; Плаза, С. (2015). «Пептиды Pri sORF индуцируют селективный протеасомный процессинг белка». Наука. 349 (6254): 1356–1358. Дои:10.1126 / science.aac5677. ISSN  0036-8075. PMID  26383956. S2CID  206639549.
  8. ^ Ветмар, Клаус; Барбоса-Сильва, Адриано; Андраде-Наварро, Мигель А .; Леутц, Ахим (01.01.2014). «uORFdb - обширная база данных литературы по биологии эукариотических НКО». Исследования нуклеиновых кислот. 42 (D1): D60 – D67. Дои:10.1093 / нар / gkt952. ISSN  0305-1048. ЧВК  3964959. PMID  24163100.
  9. ^ Ли, Сунчол; Лю, Ботао; Ли, Сухён; Хуанг, Шэн-Сюн; Шен, Бен; Цянь, Шу-Бин (11.09.2012). «Глобальное картирование сайтов инициации трансляции в клетках млекопитающих при разрешении одного нуклеотида». Труды Национальной академии наук. 109 (37): E2424 – E2432. Дои:10.1073 / pnas.1207846109. ISSN  0027-8424. ЧВК  3443142. PMID  22927429.
  10. ^ Шварц, Антон М .; Путляева, Лидия В .; Кович, Милица; Клепикова, Анна В .; Акулич, Ксения А .; Воронцов, Илья Е .; Корнеев, Кирилл В .; Дмитриев, Сергей Е .; Полановский, Олег Л. (2016-10-01). «Ранний B-клеточный фактор 1 (EBF1) имеет решающее значение для транскрипционного контроля гена SLAMF1 в человеческих B-клетках». Biochimica et Biophysica Acta (BBA) - механизмы регуляции генов. 1859 (10): 1259–1268. Дои:10.1016 / j.bbagrm.2016.07.004. PMID  27424222.
  11. ^ а б Пирсон, Уильям Р .; Вуд, Тодд; Чжан, Чжэн; Миллер, Уэбб (1997-11-15). «Сравнение последовательностей ДНК с последовательностями белков». Геномика. 46 (1): 24–36. Дои:10.1006 / geno.1997.4995. ISSN  0888-7543. PMID  9403055. S2CID  6413018.
  12. ^ "ORFfinder". www.ncbi.nlm.nih.gov.
  13. ^ Двиведи, Вивек Дхар; Мишра, Сарад Кумар (2012). «Исследователь ORF: новый инструмент поиска ORF, объединяющий попарное глобальное выравнивание генов». Исследовательский журнал последних наук. 1 (11): 32–35.
  14. ^ "OrfPredictor". bioinformatics.ysu.edu.
  15. ^ «ОРФик - Открытые рамки считывания в геномике». bioconductor.org.

внешняя ссылка

  • Перевод и открытые рамки для чтения
  • hORFeome V5.1 - Интерактивный веб-инструмент для CCSB Human ORFeome Collection
  • Маркер ORF - Бесплатный, быстрый и многоплатформенный настольный графический интерфейс для прогнозирования и анализа ORF.
  • StarORF - Мультиплатформенный инструмент с графическим интерфейсом на основе Java для прогнозирования и анализа ORF и получения последовательности обратного комплемента
  • ORFPredictor - Веб-сервер, предназначенный для предсказания ORF и трансляции пакета последовательностей EST или кДНК