FAM98A - FAM98A

FAM98A
Идентификаторы
ПсевдонимыFAM98A, семейство с подобием последовательностей 98 член A
Внешние идентификаторыMGI: 1919972 ГомолоГен: 41042 Генные карты: FAM98A
Расположение гена (человек)
Хромосома 2 (человек)
Chr.Хромосома 2 (человек)[1]
Хромосома 2 (человек)
Геномное расположение FAM98A
Геномное расположение FAM98A
Группа2п22.3Начинать33,583,660 бп[1]
Конец33,599,382 бп[1]
Ортологи
РазновидностьЧеловекМышь
Entrez
Ансамбль
UniProt
RefSeq (мРНК)

NM_015475
NM_001304538

NM_133747
NM_001357860

RefSeq (белок)

NP_001291467
NP_056290
NP_001291467.1
NP_056290.3

NP_598508
NP_001344789

Расположение (UCSC)Chr 2: 33,58 - 33,6 МбChr 17: 75,54 - 75,55 Мб
PubMed поиск[3][4]
Викиданные
Просмотр / редактирование человекаПросмотр / редактирование мыши

Семейство со сходством последовательностей 98, член A, или же FAM98A, это ген, который в человеческий геном кодирует белок FAM98A. FAM98A имеет два паралоги у человека - FAM98B и FAM98C. Все три характеризуются DUF2465, консервативным доменом, который, как показано, связывается с РНК.[5] FAM98A также характеризуется высоким содержанием глицина. С-концевой домен.[6] FAM98A также имеет гомологи у позвоночных и беспозвоночных и имеет отдаленных гомологов в хоанофлагелляты и зеленые водоросли.

Ген

Locus

Ген FAM98A расположен на 2p22.3 у человека на «-» (минусовой) цепи. Включая 5 'и 3' UTR, ген охватывает 15 634 основания и содержит 8 экзонов.[7]

мРНК

Размер мРНК составляет 2745 п.н., включающий 8 экзонов. Кодирующая последовательность начинается с основания 75 и продолжается до основания 1631. Сигнальная последовательность полиА-хвоста представляет собой шестинуклеотидную последовательность из 20 оснований от 3'-конца транскрипта на основании 2725-2730, а сайт полиА находится на основании 2745.[8]

Протеин

Первичная последовательность

FAM98A имеет длину 518 аминокислот с молекулярной массой 55,3 кДа без модификаций. Остатки 10-329 составляют DUF2465, а остаток белка представляет собой обогащенный диглицином С-конец. Глицин составляет примерно 20% белка, большая часть которого находится в последних 200 остатках.[9]

Посттрансляционные модификации

FAM98A имеет шесть строго предсказанных сайтов фосфорилирования в DUF2465. Предполагается, что эти сайты фосфорилируют S169, T178, S236, T243, S276 и S285 протеинкиназой C.[10] GPS также предсказывает фосфорилирование протеинкиназой C по S285 и T178.[11]FAM98A, вероятно, сумоилирован по K183 и K195.[12] Сумоилирование может позволить клетке повторно локализовать FAM98A между ядром и цитоплазмой.[13] Богатый глицином С-конец имеет повторяющиеся последовательности GRG, которые, как было показано, чувствительны к метилированию аргинина, симметрично или асимметрично.[14] В другой статье объясняется влияние метилирования аргинина на биохимические функции, такие как активация и репрессия транскрипции, сплайсинг мРНК, ядерно-цитозольное перемещение и восстановление ДНК.[15]

Вторичная структура

Предполагается, что N-конец имеет несколько альфа-спиралей, хотя C-конец, вероятно, только свернут.[16] Альфа-спирали не образуют никаких каналов, и FAM98A не является трансмембранным белком.

Третичная и четвертичная структура

Структура FAM98A была предсказана с помощью программы Phyre2. N-концевой участок содержит несколько альфа-спиралей и С-концевой скрученный участок, соответствующий богатому глицином С-концу. Эти две области белка соединены альфа-спиралью длиной примерно 50 остатков от остатков 200-256. Phyre2 обнаружил, что наиболее похожим белком является компонент кинетохорного комплекса человеческого белка NDC80, ядерный белок, который связывается с микротрубочками.[17]

Домены и мотивы

FAM98A имеет домен с неизвестной функцией 2465 (DUF2465) из аминокислот 10-329. Внутри DUF2465 есть гептид (VPDRGGR) рядом с С-концом, который является консервативным у всех протестированных видов. С-конец представляет собой богатый глицином домен (глицин составляет около 40% С-конца) с повторами GGRGGR.[9] На остатках 149-155 имеется предсказанный сигнал ядерного экспорта с последовательностью ICIALGM (обычно [LIVFM] -X- [LIVFM] -X- [LIVFM] -X- [LIVFM]).[18] Предполагается, что остатки 173-176 являются сигналом ядерной локализации KKLK (K- [K / R] -X- [K / R]).[19]

Гомология

Паралоги

FAM98A имеет два паралога: FAM98B и FAM98C. FAM98A является самым длинным из трех паралоговых белковых продуктов с 518 аминокислотами. Он больше похож на FAM98B, у которого богатый глицином С-конец намного короче, чем у FAM98A. FAM98C менее похож, чем FAM98B, на FAM98A, почти не имеет С-конца после DUF2465, а также содержит больше различий в аминокислотной последовательности внутри DUF2465. Экспериментально было показано, что все три белковых продукта неспецифично связываются с РНК: FAM98A связывается с мРНК, а FAM98B включается в комплекс для сплайсинга тРНК.[5]

Ортологи

Ортологи FAM98A были обнаружены у позвоночных. У насекомых и моллюсков предсказаны белки для гена FAM98A. Поскольку у человека есть три паралога FAM98, у этих генов есть общий предок. Строгий ортолог, ген, который является ортологом FAM98A, а не всему семейству FAM98, менее ясен. FAM98A еще не был тщательно изучен, что усугубляется тем фактом, что многие геномы еще не зарегистрированы, что затрудняет определение того, является ли предсказанный ген FAM98A у комаров строгим ортологом (произошло разделение FAM98 на FAM98A, B, C). до разделения видов) или если он является гомологом («FAM98A» у комаров является наследственным геном FAM98).

График данных слева, относящийся к процентной идентичности белковой последовательности между животными и людьми.
Последовательность

Число

Род виды (Gsp)Распространенное имяДата расхождения (MYA)

(из Дерево времени )

Номер доступа

(из NCBI )

Последовательность

Длина (AA)

ЛичностьСходство
1Homo sapiens (Hsa) - человек разумныйЧеловек0

NM_015475.3

518100100
2Mus musculus (Mmu)Мышь92.3

NP_598508.2

5159596
3Камелус ферус (Cfe)Двугорбый верблюд94.2

XP_006192455.1

5179798
4Pantholops hodgsonii (Pho)Тибетская антилопа94.2

XP_005963883.1

5219697
5Elephantulus edwardii (Eed)Слоновая землеройка в клетке98.7

XP_006882420.1

5179496
6Geospiza fortis (Gfo)Средний наземный зяблик296

XP_005416400.1

6488488
7Pseudopodoces humilis (Phu)Земляная синица296

XP_005526966.1

5458488
8Аллигатор миссисипиенсис (Ami)Американский аллигатор296

XP_006273242.1

5568186
9Pelodiscus sinensis (пси)Китайская черепаха с мягким панцирем296

XP_006131385.1

5498588
10Chrysemys picta bellii (Cpi)Западная расписная черепаха296

XP_005296336.1

5498588
11Ксенопус тропический (Xtr)Западная когтистая лягушка371.2

XP_002934502.2

5207986
12Фимбрия аноплопомы (Афи)Соболь400.1

BT082651.1

3533148
13Ictalurus punctatus (Ипу)Канальный сом400.1

AHH38396.1

5436775
14Camponotus floridanus (Cfl).Флорида Карпентер Муравей782.7

EFN74857.1

5164153
15Culex quinquefasciatus (Cqu)Комар782.7

XM_001846602.1

4983852
16Головной цератит (Cca)Средиземноморская муха782.7

JAC03102.1

4543551
17Lepeophtheirus salmonis (Lsa).Лососевая вошь782.7

BT078155.1

4672945
18Crassotrea gigas (Cgi)Тихоокеанская устрица782.7

EKC33026.1

4224559
19Clonorchis sinensis (Csi)Китайская печеночная двуустка792.4

GAA34581.2

3783547
20Echinococcus granulosus (Egr)Собачий солитер792.4

CDJ19758.1

11773956

Далекие гомологи

Гены, гомологичные FAM98A, предположительно встречаются во многих таксонах в пределах Animalia, но есть и другие таксоны за пределами Animalia, которые могут иметь гомологичные гены FAM98 в своих геномах. Эукариоты, такие как опистоконты Monosiga brevicollis (XP_00174505.1 ) и Capraspora owczarzaki (XP_004346371.1 ), и даже протист Chlorella variabilis (XP_005845167.1 ), зеленая водоросль, может содержать в своем геноме FAM98.[20]

Гомологические домены

Гомологичный домен в FAM98A представляет собой домен DUF2465 (домен с неизвестной функцией 2465). Функция этого домена, как и самого гена, в значительной степени неизвестна, хотя сообщалось, что он преимущественно связывается с РНК, нацеливаясь на мРНК в FAM98A и тРНК в FAM98B.[5]

Выражение

Промоутер

Промотор (GXP_90934), присвоенный транскрипту человеческого FAM98A (GXT_24436545)[21] имеет длину 915 п.н., и он перекрывается с транскриптом, включая 243 п.н. транскрипта мРНК. Ядерный респираторный фактор 1 (NRF1) представляет собой фактор транскрипции, у которого было предсказано семь сайтов для связывания с промотором, четыре из которых имели матричное сходство - оптимальная оценка больше или равная 0,085, и два самых высоких предсказанных фактора транскрипции были NRF1 с оценка 0,204 и 0,199.[22]

Выражение

В крупномасштабном человеческом транскриптоме GEO FAM98A экспрессировался повсеместно, но не равномерно. Наиболее выраженными типами клеток были многие части головного мозга (кора, миндалина, таламус, мозолистое тело и гипофиз), яички, матка и гладкие мышцы.[23] Согласно Aceview, FAM98A экспрессируется в 3,9 раза по сравнению с экспрессией среднего гена. AceView идентифицировал одиннадцать транскриптов, пять из которых были «хорошими», полными (как N-, так и C-концы полностью транслировались) белками. Судя по транскриптам, очевидно, что есть две основные части FAM98A: первые четыре экзона и вторые четыре экзона, и эти части примерно соответствуют третичной структуре белка - N-концевые альфа-спирали экзонам 1-4, и длинное альфа-спиральное плечо и С-конец скручиваются с экзонами 5-8.[24]

Функция и биохимия

Функция FAM98A не была экспериментально определена, хотя было показано, что он связывает свой DUF2465 с мРНК.[5] Кирага и др. отметили, что основные белки связываются с нуклеиновыми кислотами.[25] Фактически, FAM98A (и его ортологи) имеют немодифицированную изоэлектрическую точку примерно 9.[26]

Известные взаимодействия

Экспериментально показано, что FAM98A взаимодействует с UBC, DDX1, C14orf166 и SUMO3 и коэкспрессируется с DDX1, C14orf166 и RBM25.[27] Эти последние три белка взаимодействуют с мРНК, как это предсказано и для FAM98A. DDX1 представляет собой предполагаемую АТФ-зависимую РНК-геликазу в сплайсосоме, вероятно, высвобождая РНК из комплекса сплайсинга.[28] C14orf166 - фактор связывания полимеразы II,[29] а RBM25 регулирует альтернативное сращивание.[30] Все эти взаимодействия предполагают, что FAM98A является ядерным белком. FAM98A также взаимодействует с SUMO3, который сумоилирует лизины в белке, чтобы облегчить транспорт через ядерную мембрану между ядром и цитозолем.[13] FAM98A также связывает неспецифическую мРНК, что указывает на потенциальный челнок мРНК из ядра к рибосомам.[5]

Клиническое значение

В исследовании, в котором изучались различия в уровнях экспрессии определенных генов (включая FAM98A) как у молодых, так и у пожилых мужчин с диетами с высоким или низким содержанием белка, уровни экспрессии измерялись как соотношение диет с низким / высоким содержанием белка в каждой группе мужчин ( молодой и старый). FAM98A имел повышенную экспрессию при низкобелковой диете как у молодых, так и у пожилых мужчин, 1,01 и 1,20, соответственно. Только один другой ген, участвовавший в исследовании, имел такую ​​же тенденцию к увеличению экспрессии в рационах с низким содержанием белка в обеих группах: THOC4.[31] THOC4, THO Complex 4 или фактор экспорта Aly / REF димеризуется, образуя более крупный комплекс, и шапероны сплайсируют мРНК, помогая процессингу и экспорту мРНК.[32] В документе упоминается, что повышающая регуляция мРНК у пожилых людей связана со связыванием / сплайсингом РНК, сигнальными белками и деградацией белков; Фактически, у старшей группы выше экспрессия FAM98A при низкобелковой диете, чем у молодых мужчин.[31]

Ассоциация болезней

Исследование популяции в Тайване выявило связь между гипертонией, начинающейся у молодых, и двумя SNP, расположенными выше четырех генов в локусе 2p22.3. Одним из этих четырех генов был FAM98A, хотя необходимо провести дополнительные исследования, чтобы подтвердить, что именно FAM98A был геном, ответственным за гипертонию.[33] В самом деле, FAM98A экспрессируется на умеренно высоком уровне (примерно 75-й процентиль) в гладких мышцах и сердечных миоцитах.[23]

Рекомендации

  1. ^ а б c ГРЧ38: Ансамбль выпуск 89: ENSG00000119812 - Ансамбль, Май 2017
  2. ^ а б c GRCm38: выпуск ансамбля 89: ENSMUSG00000002017 - Ансамбль, Май 2017
  3. ^ "Справочник человека по PubMed:". Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
  4. ^ «Ссылка на Mouse PubMed:». Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
  5. ^ а б c d е Dürnberger G, Bürckstümmer T, Huber K, Giambruno R, Doerks T, Karayel E, Burkard TR, Kaupe I, Müller AC, Schönegger A, Ecker GF, Lohninger H, Bork P, Bennett KL, Superti-Furga G, Colinge J ( Июль 2013). «Экспериментальная характеристика взаимодействия нуклеиновой кислоты человека, не специфичной для последовательности». Геномная биология. 14 (7): R81. Дои:10.1186 / gb-2013-14-7-r81. ЧВК  4053969. PMID  23902751.
  6. ^ "Pfam: Семейство: DUF2465 (PF10239)". Pfam. EMBL-EBI. Получено 5 мая 2014.
  7. ^ "Ген человека FAM98A (uc002rpa.1)". Геном. NCBI. Получено 5 мая 2014.
  8. ^ NCBI (Национальный центр биотехнологической информации) последовательность мРНК FAM98A NM_015475.3 https://www.ncbi.nlm.nih.gov/nuccore/NM_015475.3
  9. ^ а б Brendel, V .; Bucher, P .; Nourbakhsh, I.R .; Blaisdell, B.E .; Карлин, С. (1992). «Методы и алгоритмы статистического анализа белковых последовательностей». Proc. Natl. Акад. Sci. СОЕДИНЕННЫЕ ШТАТЫ АМЕРИКИ. 89 (6): 2002–2006. Дои:10.1073 / пнас.89.6.2002. ЧВК  48584. PMID  1549558.
  10. ^ Блом Н., Зихериц-Понтен Т., Гупта Р., Гаммельтофт С., Брунак С. (июнь 2004 г.). «Прогнозирование посттрансляционного гликозилирования и фосфорилирования белков по аминокислотной последовательности». Протеомика. 4 (6): 1633–49. Дои:10.1002 / pmic.200300771. PMID  15174133. S2CID  18810164.
  11. ^ Сюэ И, Жэнь Дж, Гао Х, Цзинь Ц, Вэнь Л., Яо Х (сентябрь 2008 г.). «GPS 2.0, инструмент для предсказания сайтов фосфорилирования, специфичных для киназ, в иерархии». Молекулярная и клеточная протеомика. 7 (9): 1598–608. Дои:10.1074 / mcp.m700574-mcp200. ЧВК  2528073. PMID  18463090.
  12. ^ Abgent, компания WuXi App Tec. Программа анализа SUMOplotTM. 2013. http://www.abgent.com/tools
  13. ^ а б Матунис MJ, Coutavas E, Blobel G (декабрь 1996 г.). «Новая убиквитиноподобная модификация модулирует разделение Ran-GTPase-активирующего белка RanGAP1 между цитозолем и комплексом ядерных пор». Журнал клеточной биологии. 135 (6, п. 1): 1457–70. Дои:10.1083 / jcb.135.6.1457. ЧВК  2133973. PMID  8978815.
  14. ^ Хён Ю.Л., Лью Д.Б., Пак С.Х., Ким С.В., Пайк В.К., Ким С. «Ферментативное метилирование аргинильных остатков в -gly-arg-глипептидах». Биохимический журнал. 348 (3): 573–8. Дои:10.1042/0264-6021:3480573. ЧВК  1221099. PMID  10839988.
  15. ^ Бедфорд М. Т., Кларк С. Г. (январь 2009 г.). «Метилирование протеина аргинина у млекопитающих: кто, что и почему» (PDF). Молекулярная клетка. 33 (1): 1–13. Дои:10.1016 / j.molcel.2008.12.013. ЧВК  3372459. PMID  19150423.
  16. ^ PELE (BPS, D_R, DSC, GGR, GOR, G_G, H_K, K_S, L_G, Q_S, JOI). Инструментальные средства SDSC. Совет попечителей Иллинойского университета, 1999.
  17. ^ Келли Л.А., Штернберг MJ (2009). «Прогнозирование структуры белка в Интернете: пример использования сервера Phyre» (PDF). Протоколы природы. 4 (3): 363–71. Дои:10.1038 / nprot.2009.2. HDL:10044/1/18157. PMID  19247286. S2CID  12497300.
  18. ^ Fu SC, Imai K, Horton P (сентябрь 2011 г.). «Прогнозирование богатых лейцином сигналов ядерного экспорта, содержащих белки с NESsential». Исследования нуклеиновых кислот. 39 (16): e111. Дои:10.1093 / nar / gkr493. ЧВК  3167595. PMID  21705415.
  19. ^ Timmers AC, Stuger R, Schaap PJ, van 't Riet J, Raué HA (июнь 1999 г.). «Ядерная и ядрышковая локализация рибосомных белков Saccharomyces cerevisiae S22 и S25». Письма FEBS. 452 (3): 335–40. Дои:10.1016 / s0014-5793 (99) 00669-9. PMID  10386617. S2CID  1933493.
  20. ^ Альтшул С.Ф., Мэдден Т.Л., Шеффер А.А., Чжан Дж., Чжан З., Миллер В., Липман Д.Д. (сентябрь 1997 г.). «Gapped BLAST и PSI-BLAST: новое поколение программ поиска по базе данных белков». Исследования нуклеиновых кислот. 25 (17): 3389–402. Дои:10.1093 / nar / 25.17.3389. ЧВК  146917. PMID  9254694.
  21. ^ Выписка GXT_2827489. Программное обеспечение Genomatix. 2014 г. http://www.genomatix.de/cgi-bin/[постоянная мертвая ссылка ]/eldorado/eldorado.pl?s=2ab9d4751cbd873358acdd746c629f61;TRANS=1;TRANSCRIPTID=2827489;ELDORADO_VERSION=E28R1306
  22. ^ GXP_90934. Программное обеспечение Genomatix. 2014 г. http://www.genomatix.de/cgi-bin/[постоянная мертвая ссылка ]/eldorado/eldorado.pl?s=99a7e4da5d3118fa8a93fb9a283d710f;PROM_ID=GXP_90934;GROUP=vertebrates;GROUP=others;ELDORADO_VERSION=E28R1306
  23. ^ а б Национальный центр биотехнологической информации, Национальная медицинская библиотека США. Профили Омнибуса экспрессии генов (GEO). «Масштабный анализ человеческого транскриптома (HG-U133A)». https://www.ncbi.nlm.nih.gov/geo/tools/profileGraph.cgi?ID=GDS596:212333_at
  24. ^ «Комплексный локус FAM98A человека Homo sapiens, кодирующее семейство со сходством последовательностей 98, член А.» AceView. NCBI.
  25. ^ Кирага Дж., Мацкевич П., Мацкевич Д., Ковальчук М., Биецек П., Полак Н., Смоларчик К., Дудек М. Р., Цебрат С. (июнь 2007 г.). «Взаимосвязь между изоэлектрической точкой и длиной белков, таксономией и экологией организмов». BMC Genomics. 8: 163. Дои:10.1186/1471-2164-8-163. ЧВК  1905920. PMID  17565672.
  26. ^ Программа доктора Луки Толдо, разработанная в http://www.embl-heidelberg.de. Изменено Бьорном Киндлером для печати минимального найденного чистого заряда. Доступно на WWW-шлюзе EMBL в службу Isoelectric Point «Архивная копия». Архивировано из оригинал на 2008-10-26. Получено 2014-05-10.CS1 maint: заархивированная копия как заголовок (связь)
  27. ^ СТРОКА 9.1. FAM98A. http://string-db.org/newstring_cgi/show_network_section.pl
  28. ^ "DEAD (Asp-Glu-Ala-Asp) Box Helicase 1". Генные Карты.
  29. ^ «Открытая рамка чтения 166 хромосомы 14». Генные Карты.
  30. ^ «Белок связывающего РНК-мотива 25». Генные Карты.
  31. ^ а б Thalacker-Mercer AE, Fleet JC, Craig BA, Campbell WW (ноябрь 2010 г.). «Профиль транскрипции скелетных мышц отражает аккомодационные реакции на недостаточное потребление белка у молодых и пожилых мужчин». Журнал пищевой биохимии. 21 (11): 1076–82. Дои:10.1016 / j.jnutbio.2009.09.004. ЧВК  2891367. PMID  20149619.
  32. ^ «Экспортный фактор Али / РЭФ». Генные Карты.
  33. ^ Yang HC, Liang YJ, Wu YL, Chung CM, Chiang KM, Ho HY, Ting CT, Lin TH, Sheu SH, Tsai WC, Chen JH, Leu HB, Yin WH, Chiu TY, Chen CI, Fann CS, Wu JY , Лин Т. Н., Лин С. Дж., Чен Ю. Т., Чен Дж. В., Пан WH (2009). «Полногеномное ассоциативное исследование гипертонии с ранним началом у ханьского китайского населения Тайваня». PLOS ONE. 4 (5): e5459. Дои:10.1371 / journal.pone.0005459. ЧВК  2674219. PMID  19421330.