Области низкой сложности в белках - Low complexity regions in proteins

Области низкой сложности в белковых последовательностях (LCR), также определяемые в некоторых контекстах как композиционно предвзятые регионы (CBR) - это участки в белковых последовательностях, которые отличаются по составу и сложности от большинства белков, которые обычно связаны с глобулярной структурой.[1][2] LCR имеют отличные от нормальных регионов свойства в отношении структура, функция и эволюция.

Структура

Первоначально считалось, что LCR представляют собой неструктурированные и гибкие линкеры, служащие для разделения структурированных (и функциональных) доменов сложных белков,[3] но они также способны образовывать вторичные структуры, такие как спирали (чаще) и даже листы.[4] Они могут играть структурную роль в таких белках, как коллагены, миозин, кератины, шелк, белки клеточной стенки.[5] Тандемные повторы коротких олигопептидов, богатых глицином, пролином, серином или треонином, способны образовывать гибкие структуры, которые связывают лиганды при определенных условиях pH и температуры.[6] Пролин является хорошо известным разрушителем альфа-спирали, однако аминокислотные повторы, состоящие из пролина, могут образовывать полипролиновые спирали.[7]

Функции

Изначально LCR считались `` мусорными '' областями или нейтральными линкерами между доменами, однако экспериментальные и вычислительные данные все чаще указывают на то, что они могут играть важные адаптивные и консервативные роли, имеющие отношение к биотехнологии, экспрессии гетерологичных белков, медицине, а также нашему пониманию эволюции белка.[8]

LCR эукариотических белков участвуют в заболеваниях человека,[9][10] особенно нейродегенеративные, где они имеют тенденцию образовывать амилоиды у людей и других эукариот.[11]

Сообщается, что у них есть клейкие роли,[12] функция выделяемых липких белков, используемых для поимки добычи,[13] или играют роль передатчиков молекулярного движения, например в прокариотических системах TonB / TolA.[14]

LCR могут образовывать поверхности для взаимодействия с фосфолипидными бислоями,[15] или как кластеры положительного заряда для связывания ДНК,[8][16][17] или как кластеры с отрицательным или даже гистидиновым зарядом для координации ионов кальция, магния или цинка.[8][16]

Они также могут играть важную роль в трансляции белка в качестве «губок» тРНК, замедляя трансляцию, чтобы дать время для правильного сворачивания растущей полипептидной цепи.[18] Они могут даже функционировать как контрольные точки сдвига рамки, сдвигаясь к необычному содержанию аминокислот, которое делает белок очень нестабильным или нерастворимым, что, в свою очередь, запускает быструю переработку до дальнейшего повреждения клеток.[19][20]

Анализы на модельных и немодельных эукариотических протеомах показали, что LCR часто обнаруживаются в белках, участвующих в связывании нуклеиновых кислот (ДНК или РНК), в транскрипции, активности рецепторов, развитии, репродукции и иммунитете, тогда как метаболические белки лишены LCR.[3][21][22][23] Биоинформатическое исследование аннотации Uniprot для белков, содержащих LCR, показало, что 44% (9751/22259) бактериальных и 44% (662/1521) архейных LCR обнаруживаются в белках с неизвестной функцией, однако значительное количество белков известных функция (от многих различных видов), особенно те, которые участвуют в трансляции и рибосоме, связывании нуклеиновых кислот, связывании ионов металла и сворачивании белка также содержат LCR.[8]

Свойства

LCR более распространены у эукариот, но они также значительно присутствуют у многих прокариот.[8] В среднем 0,05 и 0,07% протеомов бактерий и архей (общее количество аминокислот LCR в данном протеоме / общее количество аминокислот этого протеома) образуют LCR, тогда как для пяти модельных протеомов эукариот (человек, плодовая муха, дрожжи, делящиеся дрожжи, Арабидопсис) этот охват был значительно выше (в среднем 0,4%; от 2 до 23 раз выше, чем у прокариот).[8]

LCR эукариот обычно длиннее, чем LCR прокариот.[8] Средний размер LCR эукариот составляет 42 аминокислоты, тогда как LCR бактерий, архей и фагов имеют длину 38, 36 и 33 аминокислоты соответственно.[8]

В архее галобактерии Натриальба магадии имеет наибольшее количество LCR и наибольшее обогащение LCR.[8] У бактерий, Enhygromyxa salina, дельта-протеобактерии, принадлежащие к миксобактериям, имеют наибольшее количество LCR и наибольшее обогащение LCR.[8] Интересно, что четыре из пяти бактерий с наибольшим обогащением LCR также являются миксобактериями.[8]

Три наиболее обогащенных аминокислоты в LCR бактерий - это пролин, глицин и аланин, тогда как у архей это треонин, аспартат и пролин.[8] В фагах это аланин, глицин и пролин.[8] Глицин и пролин появляются как очень обогащенные аминокислоты во всех трех эволюционных линиях, тогда как аланин сильно обогащен бактериями и фагами, но не архей. С другой стороны, гидрофобные (M, I, L, V) и ароматические аминокислоты (F, Y, W), а также цистеин, аргинин и аспарагин в значительной степени недопредставлены в LCR.[8] Очень похожие тенденции для аминокислот с высоким (G, A, P, S, Q) и низким (M, V, L, I, W, F, R, C) присутствием в LCR также наблюдались у эукариот.[24][21] Этот наблюдаемый образец чрезмерного представительства (обогащения) или недостаточного представительства некоторых аминокислот в LCR можно частично объяснить затратами энергии на синтез или метаболизм каждой из аминокислот.[8] Другим возможным объяснением, которое не исключает предыдущее объяснение стоимости энергии, может быть реакционная способность определенных аминокислот.[8] Например, цистеин - это очень реактивная аминокислота, которую нельзя переносить в больших количествах в небольшом участке белка.[25] Точно так же чрезвычайно гидрофобные области могут образовывать неспецифические белок-белковые взаимодействия между собой и с другими умеренно гидрофобными областями.[26][27] в клетках млекопитающих. Таким образом, их присутствие может нарушить баланс сетей белок-белкового взаимодействия в клетке, особенно если белки-носители высоко экспрессируются.[8] Третье объяснение может быть основано на микроэволюционных силах и, более конкретно, на предвзятости проскальзывания ДНК-полимеразы для определенных ди-три- или тетра-нуклеотидов.[8]

Обогащение аминокислот для определенных функциональных категорий LCR

Биоинформатический анализ LCR прокариот выявил 5 типов обогащения аминокислотами для определенных функциональных категорий LCR.[8]:

  • Белки с GO-терминами, относящимися к связыванию и процессингу полисахаридов, были обогащены серином и треонином в их LCR.
  • Белки с GO-терминами, относящимися к связыванию и процессингу РНК, были обогащены аргинином в их LCR.
  • Белки с терминами GO, относящимися к связыванию и процессингу ДНК, были особенно обогащены лизином, но также и глицином, тирозином, фенилаланином и глутамином в их LCR.
  • Белки с GO-терминами, относящимися к связыванию металлов и, более конкретно, к связыванию с кобальтом или никелем, были обогащены в основном гистидином, но также и аспартатом в их LCR.
  • Белки с GO-терминами, относящимися к сворачиванию белков, были обогащены глицином, метионином и фенилаланином в их LCR.

На основе приведенных выше наблюдений и анализа был разработан веб-сервер нейронной сети под названием LCR-hound для прогнозирования LCR и их функции.[8]

Эволюция

LCR очень интересны с точки зрения микро- и макроэволюции.[8] Они могут возникать в результате проскальзывания, рекомбинации и ремонта ДНК.[28] Таким образом, они связаны с горячими точками рекомбинации и, возможно, даже могут способствовать кроссинговеру.[29][30] Происходя из генетической нестабильности, они могут на уровне ДНК вызывать расширение или сжатие определенной области белка и даже вызывать сдвиги рамки считывания (фазовые варианты), которые влияют на патогенность микробов или обеспечивают исходный материал для эволюции.[31] Что самое интересное, они могут открыть окно в самую раннюю эволюцию жизни.[8][32] Во время ранней эволюции, когда было доступно только несколько аминокислот, а первичный генетический код все еще расширял свой репертуар, первые белки считались короткими, повторяющимися и, следовательно, невысокой сложностью.[33][34] Таким образом, современные LCR могут представлять первичные аспекты эволюции в направлении белкового мира и могут давать подсказки о функциях ранних протопептидов.[8]

Большинство исследований было сосредоточено на эволюции, функциональной и структурной роли эукариотических LCR.[8] Однако всестороннее изучение прокариотических LCR из множества различных прокариотических линий дает уникальную возможность понять происхождение, эволюцию и природу этих регионов. Благодаря высокой эффективной численности популяции и короткому времени генерации прокариот, de novo появление умеренно или умеренно вредного аминокислотного повтора или LCR следует быстро отфильтровать с помощью сильных селективных сил.[8] Это должно быть особенно характерно для LCR, обнаруженных в высокоэкспрессируемых белках, поскольку они также должны иметь большое влияние на энергетическую нагрузку трансляции белков.[35][36] Таким образом, любые прокариотические LCR, которые представляют собой эволюционные случайности, не имеющие функционального значения, не должны фиксироваться генетическим дрейфом и, следовательно, не должны демонстрировать какие-либо уровни сохранения среди умеренно далеких эволюционных родственников.[8] Напротив, любой LCR, обнаруженный среди гомологов нескольких умеренно удаленных видов прокариот, весьма вероятно, должен сохранять функциональную роль.[8]

LCR и протопептиды раннего генетического кода

Аминокислоты с самой высокой частотой в LCR - это глицин и аланин, причем их соответствующие кодоны GGC и GCC являются наиболее частыми, а также комплементарными.[8] У эукариот и, более конкретно, у хордовых (таких как человек, мышь, курица, рыбка данио и морской брызг) LCR, богатые аланином и глицином, чрезмерно представлены в недавно сформированных LCR и, вероятно, лучше переносятся клеткой.[37] Интересно, что также было высказано предположение, что они представляют собой самые первые две аминокислоты.[38] и кодоны[34][39][40] раннего генетического кода. Таким образом, эти два кодона и соответствующие им аминокислоты должны были входить в состав самых ранних олигопептидов длиной от 10 до 55 аминокислот.[41] и очень низкая сложность. Основываясь на нескольких различных критериях и источниках данных, Хиггс и Пудриц[38] предлагают G, A, D, E, V, S, P, I, L, T как ранние аминокислоты генетического кода. Работа Трифонова в значительной степени согласуется с этой категоризацией и предполагает, что ранними аминокислотами в хронологическом порядке являются G, A, D, V, S, P, E, L, T, R. Эволюционный анализ показал, что многие из аминокислот Предполагаемые очень ранние генетические коды (за исключением гидрофобных) значительно обогащены бактериальными LCR.[8] Большинство более поздних дополнений к генетическому коду значительно недостаточно представлены в бактериальных LCR.[8] Таким образом, они выдвигают гипотезу и предполагают, что в бесклеточной среде ранний генетический код мог также производить олигопептиды низкой сложности из валина и лейцина.[8] Однако позже, в более сложной клеточной среде, эти высокогидрофобные LCR стали неуместными или даже токсичными с точки зрения взаимодействия с белками, и с тех пор их отбирали.[8] Кроме того, они также предполагают, что очень ранние протопептиды не имели связывающей роли нуклеиновых кислот,[8] поскольку ДНК и РНК-связывающие LCR сильно обогащены глюцином, аргинином и лизином, однако аргинин и лизин не входят в число аминокислот предложенного раннего генетического кода.

Методы обнаружения

Области низкой сложности в белках могут быть обнаружены с помощью вычислений из последовательности с использованием различных методов и определений, как описано в.[2] Среди самых популярных методологий определения LCR - измерение их энтропии Шеннона.[1] Чем ниже значение рассчитанной энтропии, тем более однородной является область с точки зрения содержания аминокислот. Кроме того, веб-сервер нейронной сети, LCR-hound, был разработан для прогнозирования функции LCR на основе его аминокислотного или диаминокислотного содержания.[8]

использованная литература

  1. ^ а б Вуттон, Джон С. (сентябрь 1994 г.). «Неглобулярные домены в белковых последовательностях: автоматическая сегментация с использованием мер сложности». Компьютеры и химия. 18 (3): 269–285. Дои:10.1016/0097-8485(94)85023-2. PMID  7952898.
  2. ^ а б Миер П., Паладин Л., Тамана С., Петросян С., Хайду-Солтес Б., Урбанек А., Груца А., Плевчински Д., Гринберг М., Бернадо П., Гаспари З, Узунис Ц.А., Промпонас В. Дж., Каява А. В., Хэнкок Д. М., Тосатто, СК, Dosztanyi Z, Andrade-Navarro MA (30 января 2019 г.). «Распутывая сложность белков низкой сложности». Краткий биоинформ. 21 (2): 458–472. Дои:10.1093 / bib / bbz007. ЧВК  7299295. PMID  30698641.
  3. ^ а б Хантли, Мелани А .; Голдинг, Дж. Брайан (01.07.2002). «Простые последовательности редко встречаются в банке данных по белкам». Белки: структура, функции и генетика. 48 (1): 134–140. Дои:10.1002 / prot.10150. ISSN  0887-3585. PMID  12012345. S2CID  42193081.
  4. ^ Кумари, Бандана; Кумар, Равиндра; Кумар, Маниш (2015). «Низкая сложность и неупорядоченные области белков имеют разные структурные и аминокислотные предпочтения». Молекулярные биосистемы. 11 (2): 585–594. Дои:10.1039 / C4MB00425F. ISSN  1742-206X. PMID  25468592.
  5. ^ Luo, H .; Нейвин, Х. (01.07.2014). «Понимание и идентификация аминокислотных повторов». Брифинги по биоинформатике. 15 (4): 582–591. Дои:10.1093 / bib / bbt003. ISSN  1467-5463. ЧВК  4103538. PMID  23418055.
  6. ^ Мацусима, Норио; Ёсида, Хитоши; Кумаки, Ясухиро; Камия, Масакацу; Танака, Таканори; Крецингер, Ёсинобу Идзуми и Роберт Х. (30 ноября 2008 г.). «Гибкие структуры и лигандные взаимодействия тандемных повторов, состоящих из пролина, глицина, аспарагина, серина и / или олигопептидов, богатых треонином в белках». Современная наука о белках и пептидах. 9 (6): 591–610. Дои:10.2174/138920308786733886. PMID  19075749. Получено 2020-11-03.
  7. ^ Аджубей, Алексей А .; Sternberg, Michael J.E .; Макаров, Александр Александрович (июнь 2013 г.). «Спираль полипролина-II в белках: структура и функции». Журнал молекулярной биологии. 425 (12): 2100–2132. Дои:10.1016 / j.jmb.2013.03.018. PMID  23507311.
  8. ^ а б c d е ж г час я j k л м п о п q р s т ты v ш Икс у z аа ab ac объявление ае аф аг ах Нтунтуми, Криса; Властаридис, Панайотис; Моссиалос, Димитрис; Статопулос, Константинос; Илиопулос, Иоаннис; Промпонас, Василиос; Оливер, Стивен Дж. Амуциас, Григорис Д. (04.11.2019). «Области низкой сложности в белках прокариот выполняют важные функциональные роли и являются высококонсервативными». Исследования нуклеиновых кислот. 47 (19): 9998–10009. Дои:10.1093 / нар / gkz730. ISSN  0305-1048. ЧВК  6821194. PMID  31504783. CC-BY icon.svg Текст был скопирован из этого источника, который доступен под Международная лицензия Creative Commons Attribution 4.0.
  9. ^ Карлин, С .; Brocchieri, L .; Бергман, А .; Mrazek, J .; Джентлз, А. Дж. (8 января 2002 г.). «Аминокислоты работают в протеомах эукариот и ассоциациях болезней». Труды Национальной академии наук. 99 (1): 333–338. Bibcode:2002PNAS ... 99..333K. Дои:10.1073 / pnas.012608599. ISSN  0027-8424. ЧВК  117561. PMID  11782551.
  10. ^ Миркин, Сергей М. (21.06.2007). «Расширяемые повторы ДНК и болезнь человека». Природа. 447 (7147): 932–940. Bibcode:2007Натура.447..932М. Дои:10.1038 / природа05977. ISSN  0028-0836. PMID  17581576. S2CID  4397592.
  11. ^ Кумари, Бандана; Кумар, Равиндра; Чаухан, Випин; Кумар, Маниш (30.10.2018). «Сравнительный функциональный анализ белков, содержащих предсказанные амилоидные области низкой сложности». PeerJ. 6: e5823. Дои:10.7717 / peerj.5823. ISSN  2167-8359. ЧВК  6214233. PMID  30397544.
  12. ^ Итак, Christopher R .; Страхи, Kenan P .; Лири, Дагмар Х .; Scancella, Jenifer M .; Ван, Чжэн; Лю, Джинни Л .; Ориуэла, Беатрис; Ритчоф, Дэн; Spillmann, Christopher M .; Уол, Кэтрин Дж. (8 ноября 2016 г.). «Последовательность в основе наноструктуры Barnacle Cement Nanostructure определяется белками с гомологией шелка». Научные отчеты. 6 (1): 36219. Bibcode:2016НатСР ... 636219С. Дои:10.1038 / srep36219. ISSN  2045-2322. ЧВК  5099703. PMID  27824121.
  13. ^ Haritos, Victoria S .; Ниранджане, Аджай; Вайсман, Сара; Trueman, Holly E .; Шрисканта, Алагакон; Сазерленд, Тара Д. (07.11.2010). «Нарушение использования: онихофораны для поимки добычи используют белки с высокой степенью неструктурированности, а не шелк». Труды Королевского общества B: биологические науки. 277 (1698): 3255–3263. Дои:10.1098 / rspb.2010.0604. ISSN  0962-8452. ЧВК  2981920. PMID  20519222.
  14. ^ Брюэр, С .; Толлей, М .; Trayer, I.P .; Barr, G.C .; Dorman, C.J .; Hannavy, K .; Higgins, C.F .; Evans, J.S .; Levine, B.A .; Wormald, M.R. (1990-12-20). «Структура и функция дипептидных повторов X-Pro в белках TonB Salmonella typhimurium и Escherichia coli». Журнал молекулярной биологии. 216 (4): 883–895. Дои:10.1016 / S0022-2836 (99) 80008-4. PMID  2266560.
  15. ^ Робисон, Аарон Д .; Солнце, Симоу; Пойтон, Мэтью Ф .; Джонсон, Грегори А .; Пеллуа, Жан-Филипп; Юнгвирт, Павел; Ваздар, Марио; Кремер, Пол С. (2016-09-08). «Полиаргинин более сильно и кооперативно, чем полилизин, взаимодействует с бислоями фосфолипидов». Журнал физической химии B. 120 (35): 9287–9296. Дои:10.1021 / acs.jpcb.6b05604. ISSN  1520-6106. ЧВК  5912336. PMID  27571288.
  16. ^ а б Zhu, Z. Y .; Карлин, С. (1996-08-06). «Кластеры заряженных остатков в трехмерных структурах белков». Труды Национальной академии наук. 93 (16): 8350–8355. Bibcode:1996PNAS ... 93.8350Z. Дои:10.1073 / пнас.93.16.8350. ISSN  0027-8424. ЧВК  38674. PMID  8710874.
  17. ^ Kushwaha, Ambuj K .; Гроув, Энн (01.02.2013). «С-концевые повторы последовательности низкой сложности Mycobacterium smegmatis Ku модулируют связывание ДНК». Отчеты по бионауке. 33 (1): 175–84. Дои:10.1042 / BSR20120105. ISSN  0144-8463. ЧВК  3553676. PMID  23167261.
  18. ^ Фругье, Магали; Бур, Таня; Аяч, Майя; Santos, Manuel A.S .; Рудингер-Тирион, Жоэль; Теобальд-Дитрих, Анна; Пицци, Элизабетта (21 января 2010 г.). «Области низкой сложности ведут себя как губки тРНК, помогая ко-трансляционному сворачиванию плазмодийных белков». Письма FEBS. 584 (2): 448–454. Дои:10.1016 / j.febslet.2009.11.004. PMID  19900443. S2CID  24172658.
  19. ^ Тайдмерс, Йенс; Могк, Аксель; Букау, Бернд (ноябрь 2010 г.). «Клеточные стратегии для контроля агрегации белков». Обзоры природы Молекулярная клеточная биология. 11 (11): 777–788. Дои:10.1038 / nrm2993. ISSN  1471-0072. PMID  20944667. S2CID  22449895.
  20. ^ Лин, Цзицян; Чо, Крис; Го, Ли-Тао; Aerni, Hans R .; Райнхарт, Джесси; Зёлль, Дитер (14 декабря 2012 г.). «Агрегация белков, вызванная действием аминогликозидов, предотвращается поглотителем перекиси водорода». Молекулярная клетка. 48 (5): 713–722. Дои:10.1016 / j.molcel.2012.10.001. ЧВК  3525788. PMID  23122414.
  21. ^ а б Хэрти, Вильфрид; Голдинг, Дж. Брайан (октябрь 2010 г.). Бонен, Линда (ред.). «Последовательности низкой сложности и одиночные аминокислотные повторы: не просто« мусорные »пептидные последовательности». Геном. 53 (10): 753–762. Дои:10.1139 / G10-063. ISSN  0831-2796. PMID  20962881.
  22. ^ Фокс, Н. Г. (21 марта 2005 г.). «Функциональное понимание распределения и роли белков, содержащих гомопептидные повторы». Геномные исследования. 15 (4): 537–551. Дои:10.1101 / гр.3096505. ISSN  1088-9051. ЧВК  1074368. PMID  15805494.
  23. ^ Albà, M.M .; Tompa, P .; Вейтия, Р.А. (2007), Вольф, Ж.-Н. (ред.), «Аминокислотные повторы, структура и эволюция белков», Геномная динамика, Базель: KARGER, стр. 119–130, Дои:10.1159/000107607, ISBN  978-3-8055-8340-4, получено 2020-11-03
  24. ^ Marcotte, Эдвард М .; Пеллегрини, Маттео; Йейтс, Тодд О .; Эйзенберг, Дэвид (1999-10-15). «Перепись белковых повторов». Журнал молекулярной биологии. 293 (1): 151–160. Дои:10.1006 / jmbi.1999.3136. PMID  10512723.
  25. ^ Марино, Стефано М .; Гладышев, Вадим Н. (2012-02-10). «Анализ и функциональное прогнозирование реактивных остатков цистеина». Журнал биологической химии. 287 (7): 4419–4425. Дои:10.1074 / jbc.R111.275578. ISSN  0021-9258. ЧВК  3281665. PMID  22157013.
  26. ^ Дорсман, Дж. К. (15.06.2002). «Сильная агрегация и повышенная токсичность полилейцина по сравнению с полиглутаминовыми участками в клетках млекопитающих». Молекулярная генетика человека. 11 (13): 1487–1496. Дои:10.1093 / hmg / 11.13.1487. PMID  12045202.
  27. ^ Ома, Йоко; Кино, Йошихиро; Сасагава, Нобору; Ишиура, Шоичи (2004-05-14). «Внутриклеточная локализация гомополимерных аминокислот, содержащих протеины, экспрессируемые в клетках млекопитающих». Журнал биологической химии. 279 (20): 21217–21222. Дои:10.1074 / jbc.M309887200. ISSN  0021-9258. S2CID  23798438.
  28. ^ Эллегрен, Ханс (01.06.2004). «Микроспутники: простые последовательности со сложной эволюцией». Природа Обзоры Генетика. 5 (6): 435–445. Дои:10.1038 / nrg1348. ISSN  1471-0056. PMID  15153996. S2CID  11975343.
  29. ^ Верстрепен, Кевин Дж; Jansen, An; Льюиттер, Фрэн; Финк, Джеральд Р. (2005-09-01). «Внутригенные тандемные повторы создают функциональную изменчивость». Природа Генетика. 37 (9): 986–990. Дои:10,1038 / ng1618. ISSN  1061-4036. ЧВК  1462868. PMID  16086015.
  30. ^ Сивах, Пратибха; Попхали, Саураб Дилип; Ганеш, Субраманиам (01.07.2006). «Геномные и эволюционные исследования генов, кодирующих белки с одиночными аминокислотными повторами». Молекулярная биология и эволюция. 23 (7): 1357–1369. Дои:10.1093 / molbev / msk022. ISSN  1537-1719. PMID  16618963.
  31. ^ Моксон, Ричард; Бейлисс, Крис; Худ, Дерек (01.12.2006). «Бактериальные непредвиденные локусы: роль простых последовательностей ДНК-повторов в бактериальной адаптации». Ежегодный обзор генетики. 40 (1): 307–333. Дои:10.1146 / annurev.genet.40.110405.090442. ISSN  0066-4197. PMID  17094739.
  32. ^ Толл-Риера, М .; Rado-Trilla, N .; Мартис, Ф .; Альба, М. М. (2012-03-01). «Роль последовательностей низкой сложности в формировании новых белковых кодирующих последовательностей». Молекулярная биология и эволюция. 29 (3): 883–886. Дои:10.1093 / molbev / msr263. ISSN  0737-4038. PMID  22045997.
  33. ^ Оно, С .; Эпплен, Дж. Т. (1 июня 1983 г.). «Примитивный код и повторы основных олигомеров как первичная последовательность, кодирующая белок». Труды Национальной академии наук. 80 (11): 3391–3395. Bibcode:1983PNAS ... 80.3391O. Дои:10.1073 / pnas.80.11.3391. ISSN  0027-8424. ЧВК  394049. PMID  6574491.
  34. ^ а б Трифонов, Эдвард Н. (сентябрь 2009 г.). «Происхождение генетического кода и самых ранних олигопептидов». Исследования в области микробиологии. 160 (7): 481–486. Дои:10.1016 / j.resmic.2009.05.004. PMID  19524038.
  35. ^ Акаши, Хироши; Годзобори, Такаши (19 марта 2002 г.). «Метаболическая эффективность и аминокислотный состав в протеомах Escherichia coli и Bacillus subtilis». Труды Национальной академии наук. 99 (6): 3695–3700. Bibcode:2002PNAS ... 99.3695A. Дои:10.1073 / pnas.062526999. ISSN  0027-8424. ЧВК  122586. PMID  11904428.
  36. ^ Бартон, Майкл Д .; Дельнери, Даниэла; Оливер, Стивен Дж .; Рэттрей, Магнус; Бергман, Кейси М. (17 августа 2010 г.). Bähler, Jürg (ред.). "Эволюционная системная биология стоимости биосинтеза аминокислот в дрожжах". PLOS ONE. 5 (8): e11935. Bibcode:2010PLoSO ... 511935B. Дои:10.1371 / journal.pone.0011935. ISSN  1932-6203. ЧВК  2923148. PMID  20808905.
  37. ^ Радо-Трилла, Нурия; Альба, MMar (2012). «Анализ роли регионов низкой сложности в эволюции белков позвоночных». BMC Эволюционная биология. 12 (1): 155. Дои:10.1186/1471-2148-12-155. ISSN  1471-2148. ЧВК  3523016. PMID  22920595.
  38. ^ а б Хиггс, Пол Дж .; Пудриц, Ральф Э. (июнь 2009 г.). "Термодинамические основы синтеза пребиотических аминокислот и природа первого генетического кода". Астробиология. 9 (5): 483–490. arXiv:0904.0402. Bibcode:2009AsBio ... 9..483H. Дои:10.1089 / аст.2008.0280. ISSN  1531-1074. PMID  19566427. S2CID  9039622.
  39. ^ Трифонов, Э.Н. (2000-12-30). «Согласованный временной порядок аминокислот и эволюция триплетного кода». Ген. 261 (1): 139–151. Дои:10.1016 / S0378-1119 (00) 00476-5. PMID  11164045.
  40. ^ Трифонов, Эдуард Н. (2004-08-01). «Тройной код из первых принципов». Журнал биомолекулярной структуры и динамики. 22 (1): 1–11. Дои:10.1080/07391102.2004.10506975. ISSN  0739-1102. PMID  15214800. S2CID  28509952.
  41. ^ Феррис, Джеймс П .; Hill, Aubrey R .; Лю, Рихэ; Оргел, Лесли Э. (1996-05-02). «Синтез длинных пребиотических олигомеров на минеральных поверхностях». Природа. 381 (6577): 59–61. Bibcode:1996Натура 381 ... 59F. Дои:10.1038 / 381059a0. ISSN  0028-0836. PMID  8609988. S2CID  4351826.