FAM98A - FAM98A
Семейство со сходством последовательностей 98, член A, или же FAM98A, это ген, который в человеческий геном кодирует белок FAM98A. FAM98A имеет два паралоги у человека - FAM98B и FAM98C. Все три характеризуются DUF2465, консервативным доменом, который, как показано, связывается с РНК.[5] FAM98A также характеризуется высоким содержанием глицина. С-концевой домен.[6] FAM98A также имеет гомологи у позвоночных и беспозвоночных и имеет отдаленных гомологов в хоанофлагелляты и зеленые водоросли.
Ген
Locus
Ген FAM98A расположен на 2p22.3 у человека на «-» (минусовой) цепи. Включая 5 'и 3' UTR, ген охватывает 15 634 основания и содержит 8 экзонов.[7]
мРНК
Размер мРНК составляет 2745 п.н., включающий 8 экзонов. Кодирующая последовательность начинается с основания 75 и продолжается до основания 1631. Сигнальная последовательность полиА-хвоста представляет собой шестинуклеотидную последовательность из 20 оснований от 3'-конца транскрипта на основании 2725-2730, а сайт полиА находится на основании 2745.[8]
Протеин
Первичная последовательность
FAM98A имеет длину 518 аминокислот с молекулярной массой 55,3 кДа без модификаций. Остатки 10-329 составляют DUF2465, а остаток белка представляет собой обогащенный диглицином С-конец. Глицин составляет примерно 20% белка, большая часть которого находится в последних 200 остатках.[9]
Посттрансляционные модификации
FAM98A имеет шесть строго предсказанных сайтов фосфорилирования в DUF2465. Предполагается, что эти сайты фосфорилируют S169, T178, S236, T243, S276 и S285 протеинкиназой C.[10] GPS также предсказывает фосфорилирование протеинкиназой C по S285 и T178.[11]FAM98A, вероятно, сумоилирован по K183 и K195.[12] Сумоилирование может позволить клетке повторно локализовать FAM98A между ядром и цитоплазмой.[13] Богатый глицином С-конец имеет повторяющиеся последовательности GRG, которые, как было показано, чувствительны к метилированию аргинина, симметрично или асимметрично.[14] В другой статье объясняется влияние метилирования аргинина на биохимические функции, такие как активация и репрессия транскрипции, сплайсинг мРНК, ядерно-цитозольное перемещение и восстановление ДНК.[15]
Вторичная структура
Предполагается, что N-конец имеет несколько альфа-спиралей, хотя C-конец, вероятно, только свернут.[16] Альфа-спирали не образуют никаких каналов, и FAM98A не является трансмембранным белком.
Третичная и четвертичная структура
Структура FAM98A была предсказана с помощью программы Phyre2. N-концевой участок содержит несколько альфа-спиралей и С-концевой скрученный участок, соответствующий богатому глицином С-концу. Эти две области белка соединены альфа-спиралью длиной примерно 50 остатков от остатков 200-256. Phyre2 обнаружил, что наиболее похожим белком является компонент кинетохорного комплекса человеческого белка NDC80, ядерный белок, который связывается с микротрубочками.[17]
Домены и мотивы
FAM98A имеет домен с неизвестной функцией 2465 (DUF2465) из аминокислот 10-329. Внутри DUF2465 есть гептид (VPDRGGR) рядом с С-концом, который является консервативным у всех протестированных видов. С-конец представляет собой богатый глицином домен (глицин составляет около 40% С-конца) с повторами GGRGGR.[9] На остатках 149-155 имеется предсказанный сигнал ядерного экспорта с последовательностью ICIALGM (обычно [LIVFM] -X- [LIVFM] -X- [LIVFM] -X- [LIVFM]).[18] Предполагается, что остатки 173-176 являются сигналом ядерной локализации KKLK (K- [K / R] -X- [K / R]).[19]
Гомология
Паралоги
FAM98A имеет два паралога: FAM98B и FAM98C. FAM98A является самым длинным из трех паралоговых белковых продуктов с 518 аминокислотами. Он больше похож на FAM98B, у которого богатый глицином С-конец намного короче, чем у FAM98A. FAM98C менее похож, чем FAM98B, на FAM98A, почти не имеет С-конца после DUF2465, а также содержит больше различий в аминокислотной последовательности внутри DUF2465. Экспериментально было показано, что все три белковых продукта неспецифично связываются с РНК: FAM98A связывается с мРНК, а FAM98B включается в комплекс для сплайсинга тРНК.[5]
Ортологи
Ортологи FAM98A были обнаружены у позвоночных. У насекомых и моллюсков предсказаны белки для гена FAM98A. Поскольку у человека есть три паралога FAM98, у этих генов есть общий предок. Строгий ортолог, ген, который является ортологом FAM98A, а не всему семейству FAM98, менее ясен. FAM98A еще не был тщательно изучен, что усугубляется тем фактом, что многие геномы еще не зарегистрированы, что затрудняет определение того, является ли предсказанный ген FAM98A у комаров строгим ортологом (произошло разделение FAM98 на FAM98A, B, C). до разделения видов) или если он является гомологом («FAM98A» у комаров является наследственным геном FAM98).
Последовательность Число | Род виды (Gsp) | Распространенное имя | Дата расхождения (MYA) (из Дерево времени ) | Номер доступа (из NCBI ) | Последовательность Длина (AA) | Личность | Сходство |
1 | Homo sapiens (Hsa) - человек разумный | Человек | 0 | 518 | 100 | 100 | |
2 | Mus musculus (Mmu) | Мышь | 92.3 | 515 | 95 | 96 | |
3 | Камелус ферус (Cfe) | Двугорбый верблюд | 94.2 | 517 | 97 | 98 | |
4 | Pantholops hodgsonii (Pho) | Тибетская антилопа | 94.2 | 521 | 96 | 97 | |
5 | Elephantulus edwardii (Eed) | Слоновая землеройка в клетке | 98.7 | 517 | 94 | 96 | |
6 | Geospiza fortis (Gfo) | Средний наземный зяблик | 296 | 648 | 84 | 88 | |
7 | Pseudopodoces humilis (Phu) | Земляная синица | 296 | 545 | 84 | 88 | |
8 | Аллигатор миссисипиенсис (Ami) | Американский аллигатор | 296 | 556 | 81 | 86 | |
9 | Pelodiscus sinensis (пси) | Китайская черепаха с мягким панцирем | 296 | 549 | 85 | 88 | |
10 | Chrysemys picta bellii (Cpi) | Западная расписная черепаха | 296 | 549 | 85 | 88 | |
11 | Ксенопус тропический (Xtr) | Западная когтистая лягушка | 371.2 | 520 | 79 | 86 | |
12 | Фимбрия аноплопомы (Афи) | Соболь | 400.1 | 353 | 31 | 48 | |
13 | Ictalurus punctatus (Ипу) | Канальный сом | 400.1 | 543 | 67 | 75 | |
14 | Camponotus floridanus (Cfl). | Флорида Карпентер Муравей | 782.7 | 516 | 41 | 53 | |
15 | Culex quinquefasciatus (Cqu) | Комар | 782.7 | 498 | 38 | 52 | |
16 | Головной цератит (Cca) | Средиземноморская муха | 782.7 | 454 | 35 | 51 | |
17 | Lepeophtheirus salmonis (Lsa). | Лососевая вошь | 782.7 | 467 | 29 | 45 | |
18 | Crassotrea gigas (Cgi) | Тихоокеанская устрица | 782.7 | 422 | 45 | 59 | |
19 | Clonorchis sinensis (Csi) | Китайская печеночная двуустка | 792.4 | 378 | 35 | 47 | |
20 | Echinococcus granulosus (Egr) | Собачий солитер | 792.4 | 1177 | 39 | 56 |
Далекие гомологи
Гены, гомологичные FAM98A, предположительно встречаются во многих таксонах в пределах Animalia, но есть и другие таксоны за пределами Animalia, которые могут иметь гомологичные гены FAM98 в своих геномах. Эукариоты, такие как опистоконты Monosiga brevicollis (XP_00174505.1 ) и Capraspora owczarzaki (XP_004346371.1 ), и даже протист Chlorella variabilis (XP_005845167.1 ), зеленая водоросль, может содержать в своем геноме FAM98.[20]
Гомологические домены
Гомологичный домен в FAM98A представляет собой домен DUF2465 (домен с неизвестной функцией 2465). Функция этого домена, как и самого гена, в значительной степени неизвестна, хотя сообщалось, что он преимущественно связывается с РНК, нацеливаясь на мРНК в FAM98A и тРНК в FAM98B.[5]
Выражение
Промоутер
Промотор (GXP_90934), присвоенный транскрипту человеческого FAM98A (GXT_24436545)[21] имеет длину 915 п.н., и он перекрывается с транскриптом, включая 243 п.н. транскрипта мРНК. Ядерный респираторный фактор 1 (NRF1) представляет собой фактор транскрипции, у которого было предсказано семь сайтов для связывания с промотором, четыре из которых имели матричное сходство - оптимальная оценка больше или равная 0,085, и два самых высоких предсказанных фактора транскрипции были NRF1 с оценка 0,204 и 0,199.[22]
Выражение
В крупномасштабном человеческом транскриптоме GEO FAM98A экспрессировался повсеместно, но не равномерно. Наиболее выраженными типами клеток были многие части головного мозга (кора, миндалина, таламус, мозолистое тело и гипофиз), яички, матка и гладкие мышцы.[23] Согласно Aceview, FAM98A экспрессируется в 3,9 раза по сравнению с экспрессией среднего гена. AceView идентифицировал одиннадцать транскриптов, пять из которых были «хорошими», полными (как N-, так и C-концы полностью транслировались) белками. Судя по транскриптам, очевидно, что есть две основные части FAM98A: первые четыре экзона и вторые четыре экзона, и эти части примерно соответствуют третичной структуре белка - N-концевые альфа-спирали экзонам 1-4, и длинное альфа-спиральное плечо и С-конец скручиваются с экзонами 5-8.[24]
Функция и биохимия
Функция FAM98A не была экспериментально определена, хотя было показано, что он связывает свой DUF2465 с мРНК.[5] Кирага и др. отметили, что основные белки связываются с нуклеиновыми кислотами.[25] Фактически, FAM98A (и его ортологи) имеют немодифицированную изоэлектрическую точку примерно 9.[26]
Известные взаимодействия
Экспериментально показано, что FAM98A взаимодействует с UBC, DDX1, C14orf166 и SUMO3 и коэкспрессируется с DDX1, C14orf166 и RBM25.[27] Эти последние три белка взаимодействуют с мРНК, как это предсказано и для FAM98A. DDX1 представляет собой предполагаемую АТФ-зависимую РНК-геликазу в сплайсосоме, вероятно, высвобождая РНК из комплекса сплайсинга.[28] C14orf166 - фактор связывания полимеразы II,[29] а RBM25 регулирует альтернативное сращивание.[30] Все эти взаимодействия предполагают, что FAM98A является ядерным белком. FAM98A также взаимодействует с SUMO3, который сумоилирует лизины в белке, чтобы облегчить транспорт через ядерную мембрану между ядром и цитозолем.[13] FAM98A также связывает неспецифическую мРНК, что указывает на потенциальный челнок мРНК из ядра к рибосомам.[5]
Клиническое значение
В исследовании, в котором изучались различия в уровнях экспрессии определенных генов (включая FAM98A) как у молодых, так и у пожилых мужчин с диетами с высоким или низким содержанием белка, уровни экспрессии измерялись как соотношение диет с низким / высоким содержанием белка в каждой группе мужчин ( молодой и старый). FAM98A имел повышенную экспрессию при низкобелковой диете как у молодых, так и у пожилых мужчин, 1,01 и 1,20, соответственно. Только один другой ген, участвовавший в исследовании, имел такую же тенденцию к увеличению экспрессии в рационах с низким содержанием белка в обеих группах: THOC4.[31] THOC4, THO Complex 4 или фактор экспорта Aly / REF димеризуется, образуя более крупный комплекс, и шапероны сплайсируют мРНК, помогая процессингу и экспорту мРНК.[32] В документе упоминается, что повышающая регуляция мРНК у пожилых людей связана со связыванием / сплайсингом РНК, сигнальными белками и деградацией белков; Фактически, у старшей группы выше экспрессия FAM98A при низкобелковой диете, чем у молодых мужчин.[31]
Ассоциация болезней
Исследование популяции в Тайване выявило связь между гипертонией, начинающейся у молодых, и двумя SNP, расположенными выше четырех генов в локусе 2p22.3. Одним из этих четырех генов был FAM98A, хотя необходимо провести дополнительные исследования, чтобы подтвердить, что именно FAM98A был геном, ответственным за гипертонию.[33] В самом деле, FAM98A экспрессируется на умеренно высоком уровне (примерно 75-й процентиль) в гладких мышцах и сердечных миоцитах.[23]
Рекомендации
- ^ а б c ГРЧ38: Ансамбль выпуск 89: ENSG00000119812 - Ансамбль, Май 2017
- ^ а б c GRCm38: выпуск ансамбля 89: ENSMUSG00000002017 - Ансамбль, Май 2017
- ^ "Справочник человека по PubMed:". Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
- ^ «Ссылка на Mouse PubMed:». Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
- ^ а б c d е Dürnberger G, Bürckstümmer T, Huber K, Giambruno R, Doerks T, Karayel E, Burkard TR, Kaupe I, Müller AC, Schönegger A, Ecker GF, Lohninger H, Bork P, Bennett KL, Superti-Furga G, Colinge J ( Июль 2013). «Экспериментальная характеристика взаимодействия нуклеиновой кислоты человека, не специфичной для последовательности». Геномная биология. 14 (7): R81. Дои:10.1186 / gb-2013-14-7-r81. ЧВК 4053969. PMID 23902751.
- ^ "Pfam: Семейство: DUF2465 (PF10239)". Pfam. EMBL-EBI. Получено 5 мая 2014.
- ^ "Ген человека FAM98A (uc002rpa.1)". Геном. NCBI. Получено 5 мая 2014.
- ^ NCBI (Национальный центр биотехнологической информации) последовательность мРНК FAM98A NM_015475.3 https://www.ncbi.nlm.nih.gov/nuccore/NM_015475.3
- ^ а б Brendel, V .; Bucher, P .; Nourbakhsh, I.R .; Blaisdell, B.E .; Карлин, С. (1992). «Методы и алгоритмы статистического анализа белковых последовательностей». Proc. Natl. Акад. Sci. СОЕДИНЕННЫЕ ШТАТЫ АМЕРИКИ. 89 (6): 2002–2006. Дои:10.1073 / пнас.89.6.2002. ЧВК 48584. PMID 1549558.
- ^ Блом Н., Зихериц-Понтен Т., Гупта Р., Гаммельтофт С., Брунак С. (июнь 2004 г.). «Прогнозирование посттрансляционного гликозилирования и фосфорилирования белков по аминокислотной последовательности». Протеомика. 4 (6): 1633–49. Дои:10.1002 / pmic.200300771. PMID 15174133. S2CID 18810164.
- ^ Сюэ И, Жэнь Дж, Гао Х, Цзинь Ц, Вэнь Л., Яо Х (сентябрь 2008 г.). «GPS 2.0, инструмент для предсказания сайтов фосфорилирования, специфичных для киназ, в иерархии». Молекулярная и клеточная протеомика. 7 (9): 1598–608. Дои:10.1074 / mcp.m700574-mcp200. ЧВК 2528073. PMID 18463090.
- ^ Abgent, компания WuXi App Tec. Программа анализа SUMOplotTM. 2013. http://www.abgent.com/tools
- ^ а б Матунис MJ, Coutavas E, Blobel G (декабрь 1996 г.). «Новая убиквитиноподобная модификация модулирует разделение Ran-GTPase-активирующего белка RanGAP1 между цитозолем и комплексом ядерных пор». Журнал клеточной биологии. 135 (6, п. 1): 1457–70. Дои:10.1083 / jcb.135.6.1457. ЧВК 2133973. PMID 8978815.
- ^ Хён Ю.Л., Лью Д.Б., Пак С.Х., Ким С.В., Пайк В.К., Ким С. «Ферментативное метилирование аргинильных остатков в -gly-arg-глипептидах». Биохимический журнал. 348 (3): 573–8. Дои:10.1042/0264-6021:3480573. ЧВК 1221099. PMID 10839988.
- ^ Бедфорд М. Т., Кларк С. Г. (январь 2009 г.). «Метилирование протеина аргинина у млекопитающих: кто, что и почему» (PDF). Молекулярная клетка. 33 (1): 1–13. Дои:10.1016 / j.molcel.2008.12.013. ЧВК 3372459. PMID 19150423.
- ^ PELE (BPS, D_R, DSC, GGR, GOR, G_G, H_K, K_S, L_G, Q_S, JOI). Инструментальные средства SDSC. Совет попечителей Иллинойского университета, 1999.
- ^ Келли Л.А., Штернберг MJ (2009). «Прогнозирование структуры белка в Интернете: пример использования сервера Phyre» (PDF). Протоколы природы. 4 (3): 363–71. Дои:10.1038 / nprot.2009.2. HDL:10044/1/18157. PMID 19247286. S2CID 12497300.
- ^ Fu SC, Imai K, Horton P (сентябрь 2011 г.). «Прогнозирование богатых лейцином сигналов ядерного экспорта, содержащих белки с NESsential». Исследования нуклеиновых кислот. 39 (16): e111. Дои:10.1093 / nar / gkr493. ЧВК 3167595. PMID 21705415.
- ^ Timmers AC, Stuger R, Schaap PJ, van 't Riet J, Raué HA (июнь 1999 г.). «Ядерная и ядрышковая локализация рибосомных белков Saccharomyces cerevisiae S22 и S25». Письма FEBS. 452 (3): 335–40. Дои:10.1016 / s0014-5793 (99) 00669-9. PMID 10386617. S2CID 1933493.
- ^ Альтшул С.Ф., Мэдден Т.Л., Шеффер А.А., Чжан Дж., Чжан З., Миллер В., Липман Д.Д. (сентябрь 1997 г.). «Gapped BLAST и PSI-BLAST: новое поколение программ поиска по базе данных белков». Исследования нуклеиновых кислот. 25 (17): 3389–402. Дои:10.1093 / nar / 25.17.3389. ЧВК 146917. PMID 9254694.
- ^ Выписка GXT_2827489. Программное обеспечение Genomatix. 2014 г. http://www.genomatix.de/cgi-bin/[постоянная мертвая ссылка ]/eldorado/eldorado.pl?s=2ab9d4751cbd873358acdd746c629f61;TRANS=1;TRANSCRIPTID=2827489;ELDORADO_VERSION=E28R1306
- ^ GXP_90934. Программное обеспечение Genomatix. 2014 г. http://www.genomatix.de/cgi-bin/[постоянная мертвая ссылка ]/eldorado/eldorado.pl?s=99a7e4da5d3118fa8a93fb9a283d710f;PROM_ID=GXP_90934;GROUP=vertebrates;GROUP=others;ELDORADO_VERSION=E28R1306
- ^ а б Национальный центр биотехнологической информации, Национальная медицинская библиотека США. Профили Омнибуса экспрессии генов (GEO). «Масштабный анализ человеческого транскриптома (HG-U133A)». https://www.ncbi.nlm.nih.gov/geo/tools/profileGraph.cgi?ID=GDS596:212333_at
- ^ «Комплексный локус FAM98A человека Homo sapiens, кодирующее семейство со сходством последовательностей 98, член А.» AceView. NCBI.
- ^ Кирага Дж., Мацкевич П., Мацкевич Д., Ковальчук М., Биецек П., Полак Н., Смоларчик К., Дудек М. Р., Цебрат С. (июнь 2007 г.). «Взаимосвязь между изоэлектрической точкой и длиной белков, таксономией и экологией организмов». BMC Genomics. 8: 163. Дои:10.1186/1471-2164-8-163. ЧВК 1905920. PMID 17565672.
- ^ Программа доктора Луки Толдо, разработанная в http://www.embl-heidelberg.de. Изменено Бьорном Киндлером для печати минимального найденного чистого заряда. Доступно на WWW-шлюзе EMBL в службу Isoelectric Point «Архивная копия». Архивировано из оригинал на 2008-10-26. Получено 2014-05-10.CS1 maint: заархивированная копия как заголовок (связь)
- ^ СТРОКА 9.1. FAM98A. http://string-db.org/newstring_cgi/show_network_section.pl
- ^ "DEAD (Asp-Glu-Ala-Asp) Box Helicase 1". Генные Карты.
- ^ «Открытая рамка чтения 166 хромосомы 14». Генные Карты.
- ^ «Белок связывающего РНК-мотива 25». Генные Карты.
- ^ а б Thalacker-Mercer AE, Fleet JC, Craig BA, Campbell WW (ноябрь 2010 г.). «Профиль транскрипции скелетных мышц отражает аккомодационные реакции на недостаточное потребление белка у молодых и пожилых мужчин». Журнал пищевой биохимии. 21 (11): 1076–82. Дои:10.1016 / j.jnutbio.2009.09.004. ЧВК 2891367. PMID 20149619.
- ^ «Экспортный фактор Али / РЭФ». Генные Карты.
- ^ Yang HC, Liang YJ, Wu YL, Chung CM, Chiang KM, Ho HY, Ting CT, Lin TH, Sheu SH, Tsai WC, Chen JH, Leu HB, Yin WH, Chiu TY, Chen CI, Fann CS, Wu JY , Лин Т. Н., Лин С. Дж., Чен Ю. Т., Чен Дж. В., Пан WH (2009). «Полногеномное ассоциативное исследование гипертонии с ранним началом у ханьского китайского населения Тайваня». PLOS ONE. 4 (5): e5459. Дои:10.1371 / journal.pone.0005459. ЧВК 2674219. PMID 19421330.