CCDC130 - CCDC130
CCDC130 | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Идентификаторы | |||||||||||||||||||||||||
Псевдонимы | CCDC130, спиральный домен, содержащий 130 | ||||||||||||||||||||||||
Внешние идентификаторы | MGI: 1914986 ГомолоГен: 12183 Генные карты: CCDC130 | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ортологи | |||||||||||||||||||||||||
Разновидность | Человек | Мышь | |||||||||||||||||||||||
Entrez | |||||||||||||||||||||||||
Ансамбль | |||||||||||||||||||||||||
UniProt | |||||||||||||||||||||||||
RefSeq (мРНК) |
| ||||||||||||||||||||||||
RefSeq (белок) |
| ||||||||||||||||||||||||
Расположение (UCSC) | Chr 19: 13.73 - 13.76 Мб | Chr 8: 84.26 - 84.27 Мб | |||||||||||||||||||||||
PubMed поиск | [3] | [4] | |||||||||||||||||||||||
Викиданные | |||||||||||||||||||||||||
|
Спиральный домен, содержащий 130 это белок что у людей кодируется CCDC130 ген. Он является частью три-snRNP U4 / U5 / U6 в части U5. Это три-snRNP соединяется с другими белками с образованием комплекса B зрелого сплайсосома. Зрелый белок составляет примерно 45 килодальтон (кДа) и чрезвычайно гидрофильный из-за аномально большого количества заряженных и полярных аминокислоты.[5] CCDC130 является высококонсервативным белком, он имеет ортологичные гены в некоторых дрожжах и растениях, которые были обнаружены с помощью нуклеотидных и белковых версий основного инструмента поиска локального выравнивания (ВЗРЫВ ) от Национальный центр биотехнологической информации.[6] Профили GEO для CCDC130 показали, что этот белок экспрессируется повсеместно, но самые высокие уровни экспрессии обнаруживаются в Т-лимфоциты.[6]
Функция
Хотя конкретная функция CCDC130 все еще неизвестна, было проведено несколько исследований и исследовательских работ, в которых он идентифицирован как компонент U5-части три-snRNP U4 / U5 / U6, которая помогает формировать Комплекс B сплайсосомы человека после объединения с Комплекс А. Комплекс B затем претерпевает дополнительные модификации и конформационные изменения, прежде чем стать зрелой сплайсосомой. В одном исследовании сохранение сплайсосомных компонентов обсуждается путем сравнения сплайсосом человека и дрожжей. В этом исследовании CCDC130 классифицируется как известный фактор сплайсинга, а его гомолог у дрожжей - Yju2.[7] Этот дрожжевой белок является фактором сплайсинга, который помогает сформировать полную активную сплайсосому и способствует первому этапу сплайсинга, который включает расщепление в 5'-сайте сплайсинга первого экзона.[7] Основываясь на этой информации, вполне вероятно, что CCDC130 играет аналогичную роль в сплайсосоме человека, но из-за более высокой сложности сплайсосомы человека этот белок может выполнять другие функции или совершенно другую функцию. Из-за большого числа сайтов фосфорилирования этот белок, вероятно, активируется и рекрутируется в сплайсосомный комплекс посредством фосфорилирования или дефосфорилирования (см. Посттрансляционные модификации). Поскольку этот ген экспрессируется повсеместно и экспрессируется в 2,9 раза выше, чем средний ген, ясно, что этот белок играет неотъемлемую роль в правильном функционировании сплайсосомы.[6]
Ген
Псевдонимы
Домен Coiled-coil, содержащий 130, имеет несколько псевдонимов, включая CCDC130, SB115, LOC81576 и MGC10471.
Locus
CCDC130 расположен на коротком плече 19 хромосомы у человека. Точный локус - 19p13.2. Весь ген простирается от 13858753-13874106 на + цепи хромосомы 19.[6] CCDC130 граничит с CACNA1A на - нити, глатобу, smagly и socho на + нити, а ниже по течению MGC3207, C19orf53, ZSWIM4 на + цепи и Joypaw, смейглы, флойтобу, smawgly и wycho на - пряди.[6] Glatobu, smagly, socho, joypaw, smeygly, floytobu, smawgly и wycho были проверены только кДНК последовательности в GenBank и не имеют информации об их функциях. Есть также несколько небольших генов, обнаруженных в последовательности CCDC130, при этом snugly, glytobu, stygly и glartobu встречаются на + цепи, а chacho, zoycho, spogly, glotobu, glutobu и sneygly встречаются на - цепи.[6] Все эти небольшие гены имеют чрезвычайно низкие уровни экспрессии (менее 3% от экспрессии среднего гена), причем стигли имеет наивысший уровень экспрессии - 2,8% от среднего.[6]
Промоутер
Было обнаружено несколько предсказанных промоторов для CCDC130 с использованием ElDorado от Genomatix, но промоутер которая соответствует наиболее близкой к последовательности белка, составляет 760 оснований и охватывает 13858094-13858853 на хромосоме 19.[8]
Гомология и эволюция
Паралоги
Для CCDC130 идентифицирован только один паралог, которым является CCDC94, единственный другой известный человеческий член семейства белков CWC16. У них около 27% идентичности, большая часть которой расположена в домене COG5134 и в C-конец. CCDC94 имеет три предсказанных серина фосфорилирование сайты в положениях 213, 220 и 306, которые совпадают с серинами в CCDC130 при множественном выравнивании последовательностей, и сайт фосфорилирования треонина, который выравнивается с фосфорилированным серином в CCDC130.[5][9]
Ортологи и гомологи
CCDC130 - это высококонсервативный белок с истинным ортологи присутствует у приматов, других млекопитающих, амфибий, рептилий, рыб и даже у беспозвоночных, таких как насекомые и морские беспозвоночные. Ортологи птиц не были обнаружены в BLAST-нуклеотидах или белках. [6] Были зарегистрированы гомологичные гены у дрожжей и других грибов, а также растений. Неясно, когда возник самый далекий гомолог CCDC130, но это было задолго до расхождения автотрофы и гетеротрофы
Последовательность | Род | Разновидность | Распространенное имя | Дата расхождения (млн лет назад) | Номер доступа | Длина последовательности (аа) | % Личность |
---|---|---|---|---|---|---|---|
1 | Гомо | sapiens | Человек | Нет данных | NP_110445 | 396 | 100 |
2 | Саймири | боливиенс | Белка обезьяна | 42.6 | XP_003941759 | 396 | 94 |
3 | Айлуропода | меланолеука | Гигантская панда | 94.2 | XP_002921062 | 392 | 88 |
4 | Canis | семейная волчанка | Собака | 94.2 | XP_542031 | 397 | 87 |
5 | Bos | Телец | Корова | 94.2 | NP_001069812 | 400 | 86 |
6 | Sus | Scrofa | Дикий кабан | 94.2 | XP_003123393 | 398 | 86 |
7 | Cricetulus | гризей | Китайский хомяк | 92.3 | XP_003501975 | 383 | 79 |
8 | Mus | Musculus | Мышь | 92.3 | NP_080626 | 385 | 78 |
9 | Саркофил | Harrisii | Тасманский дьявол | 162.6 | XP_003760711 | 367 | 77 |
10 | Анолис | carolinensis | Ящерица анол | 296 | XP_003216443 | 373 | 62 |
11 | Ксенопус | Laevis | Африканская когтистая лягушка | 371.2 | NP_001086365 | 384 | 61 |
12 | Данио | Rerio | Данио | 400.1 | NP_991158 | 390 | 56 |
13 | Такифугу | рубцы | Рыба фугу | 400.1 | XP_003972319 | 379 | 65 |
14 | Амфимедон | Queenslandica | Губка | 716.5 | XP_003388671 | 299 | 46 |
15 | Culex | quinquefasciatus | Комар | 782.7 | XP_001846118 | 329 | 53 |
16 | Бомбус | нетерпеливый | Шмель | 782.7 | XP_003485202 | 314 | 55 |
17 | Caenorhabditis | Реманей | Нематода | 937.5 | XP_003094402 | 365 | 44 |
18 | Шизосахаромицеты | помба | Дрожжи | 1215.8 | NP_595734.2 | 294 | 27 |
19 | Cucumis | сативус | Огурец | 1369 | XP_004135117 | 313 | 47 |
Консервированные регионы
CCDC130 имеет два консервативных домена и область спиральной спирали. Первый - это домен COG5134, который, как обнаружено, является консервативным в огурцах и, вероятно, играет роль в функции белка, поскольку он всегда является наиболее высококонсервативным участком в любом множественное выравнивание последовательностей.[5] Он охватывает примерно первые 170 аминокислот белка. Другой домен - это домен DUF572, который является эукариотическим область неизвестной функции это разделяется всеми ортологами и большинством более далеких гомологов. Этот домен не имеет определенного диапазона, поскольку разные источники сообщают о разной длине, некоторые говорят, что это весь белок. Область спиральной спирали находится в пределах 182-214 в человеческом белке и богата заряженными аминокислотами. Модифицированные остатки также очень хорошо сохраняются.
Протеин
Самый распространенный вариант CCDC130 кодируется вторым по длине открытая рамка чтения (ORF), что соответствует белку из 396 аминокислот с молекулярной массой 44,8 кДа и изоэлектрической точкой 8,252.[5] Белок CCDC130 богат заряженными аминокислотами и не имеет незаряженных неполярных аминокислот.[5] Mobyle @ Pasteur предсказал, что CCDC130 будет чрезвычайно гидрофильным из-за большого количества заряженных и полярных аминокислот, при этом ни один сайт не имеет баллов выше нуля на графике гидрофобности, а некоторые сайты достигают даже -6 (F180). Есть регион в спиральная катушка домен (182-214), в котором 14 из 18 аминокислот заряжены. Анализ SAPS предсказал, что этот белок будет нестабильным.[5] Из-за своей высокой гидрофильности этот белок определенно не содержит трансмембранных сегментов.
Вариация
Существует 17 различных мРНК, полученных из гена CCDC130. 13 из этих мРНК происходят в результате альтернативного сплайсинга, а остальные четыре не сплайсированы.[6] Было четыре альтернативных промоутера, пять альтернативных полиаденилирование сайтов и четыре альтернативных последних экзоны описано.[6] Два экземпляра интрон удержание были описаны. Из гена CCDC130 было идентифицировано 14 различных белков, все из которых содержат домен DUF572, но только пять, по-видимому, обнаруживают растяжение спиральной спирали. Остальные три мРНК были очень низкого качества и не транслировались. Также было отмечено, что этот ген может кодировать несколько неперекрывающихся белков. 45 SNP были задокументированы для CCDC130 в NCBI: 29 миссенс-мутации и 16 синонимичных мутаций, не изменяющих аминокислоту.[6]
Посттрансляционные модификации
CCDC130 представляет собой сильно фосфорилированный белок, с 31 различным сайтом фосфорилирования, предсказанным NetPhos, и 26 из этих 31 расположены в С-концевой половине белка.[9] 17 из 22 предсказанных серинов, 4 из 6 предсказанных треонинов и 2 из 3 тирозинов имели оценку вероятности более 0,800, что указывает на высокую вероятность того, что они являются сайтами истинного фосфорилирования.[9] Было шесть сумоилирование сайты были предсказаны, но только один из этих сайтов (K177) имел оценку вероятности выше, чем 0,500, на 0,640.[10] Физиологическая функция сумоилирования все еще относительно загадочна, но эта модификация может добавить значительную молекулярную массу к белку (11 кДа). 13 гликирование были предсказаны сайты с вероятностью более 0,500, и 10 из 13 гликированных лизинов находятся в N-концевой половине белка.[11] NetOGlyc предсказал 11 возможных О-гликозилинониты с вероятностью более 0,500, причем все 11 встречаются в промежутке из 64 аминокислот, от T313 до T376.[12] Некоторые из этих сайтов были предсказаны как сайты фосфорилирования и сайты O-гликозилирования. CCDC130 не прогнозировался сульфатированный,[13] ацетилированный,[14] миристоилированный,[15] N-гликозилированный,[16] C-маннозилированный,[17] или пройти любой GPI модификация.[18]
Вторичная структура
Есть длинный альфа спираль последовательность, предсказанная в CCDC130, которая простирается от R121-A211, которая была предсказана YASPIN. Другие программы для вторичная структура Анализ, такой как PELE, CHOFAS и SABLE, также предсказал альфа-спирали различной длины в этой области.[5][19] Нет последовательных прогнозов для бета-листы в CCDC130.
Информация о взаимодействии
Перечислены несколько белков, которые взаимодействуют с CCDC130, в том числе EEF1A1, NINL, TRAF2, ZBTB16, ZNF165, и ZNF24. EEF1A1 - фактор элонгации эукариот, который участвует в связывании аминоацил-тРНК к Сайт из рибосомы во время перевода.[20] NINL - это белок, подобный девятину, который участвует в микротрубочка организация и обладает активностью связывания ионов кальция.[20] TRAF2, опухоль некроз фактор (TNF), связанный с рецептором фактора 2, является частью некоторых E3 убиквитинлигаза комплексов и участвует в убиквитинизации белков, поэтому они могут разлагаться протеасома.[20] ZBTB16, цинковый палец и белок 16, содержащий домен BTB, также является частью комплекса убиквитин-лигазы E3 и, скорее всего, участвует в распознавании субстрата. Существует также альтернативная форма CCDC130, в которой транскрибируется только 803 основания вместо 1433, но дополнительная информация не предоставляется.[21] ZNF165 и ZNF24 являются белками с цинковыми пальцами, которые связывают ДНК и другие белки для регулирования транскрипции. Ниже представлена таблица взаимодействующих белков для CCDC130, собранных GeneCards.[21] Взаимодействие CCDC130 с NINL, ZNF24, TRAF2, ЮП, GATA5 были проверены двухгибридным экраном согласно STRING, поэтому эти взаимодействия действительно происходят. JUP представляет собой белок зубного налета. GATA5 - это фактор транскрипции, который помогает активировать промотор лактазы-флоризингидролазы.[21] Взаимодействие с CDA, DERA, CDC40, NAA25, DGCR14, NAA20, и PRPF19 не были подтверждены экспериментально, но взаимодействия между гомологами генов были зарегистрированы у других видов в соответствии с STRING, так что эти взаимодействия потенциально могут иметь место. ZBTB16, EEF1A1 и ZNF165 все были проверены, по крайней мере, одним двухгибридным экраном согласно MINT. NAT9 был описан как известный взаимодействующий агент на I2D. В исследовании, проведенном в Университете округа Колумбия для характеристики CCDC130, они обнаружили, что он индуцируется посредством передачи сигналов инсулина и нацелен на три разных киназы (GSK3, CK1, и CK2 ), и является митохондриальным белком.5 Исследование также показывает, что CCDC130 потенциально может использоваться в качестве биомаркер для некоторых типов рака из-за его дифференциальной экспрессии в раковых клетках. В исследовании конкретно упоминается, что CCDC130 подавляется при некоторых типах рака толстой кишки, что позволило большему количеству раковых клеток не нацеливаться на апоптоз путь.
Выражение
CCDC130 - это повсеместно экспрессируемый белок, демонстрирующий определенный уровень экспрессии во всех проанализированных образцах тканей и клеток. Профиль AceView для CCDC130 показывает уровни экспрессии в 2,9 раза выше, чем средний белок.[6] Уровень экспрессии сильно различается между тканями, но в каждом образце присутствует хотя бы некоторый уровень экспрессии. Согласно профилям NCBI GEO и данным BioGPS, плод щитовидная железа, кора надпочечников, матка, предстательная железа, яички, семенной канальец, сердце, PB-CD4 + Т-клетки, PB-CD8 + Т-клетки, лимфатический узел, легкое, вилочковая железа, щитовидная железа, лейкемия Образцы хронического миелогенного K562 и лимфобластного molt4 лейкемии все имели уровни экспрессии выше 75-го процентиля для экспрессии генов по крайней мере в одном из двух образцов. Экспрессия генов была ниже 25-го процентиля по крайней мере в одном из двух образцов для ножек мозжечка, затылочной доли, моста и др. тройничный узел, субталамическое ядро, верхний шейный ганглий (кардинально разные уровни экспрессии), ганглий дорзального корня, плод печень, тело матки, атриовентрикулярный узел, приложение, скелетная мышца, сердечная миоциты, язык и слюнных желез. PB-CD8 + Т-клетки имели самую высокую относительную экспрессию CCDC130, а язык имел самую низкую относительную экспрессию. Для получения дополнительной информации о выражении CCDC130 см. данные по экспрессии мозга мыши или же данные микрочипа человеческого мозга из Атлас мозга Аллена или дифференциальное выражение в GEO профили из NCBI.[6]
Медицинская информация
Было показано, что CCDC130 по-разному экспрессируется при нескольких формах рака, включая рак груди, толстой кишки и поджелудочной железы. микрочип исследования раковых клеток.[22] Было показано, что он подавляется при раке толстой кишки, что позволяет предположить, что он может быть биомаркером рака. По этой теме все еще проводятся исследования, чтобы подтвердить его функцию в качестве идентификатора рака. Многие веб-сайты также говорят, что он участвует в реакции клетки на вирусную инфекцию, но нет конкретной информации по этому поводу или каких-либо разработок.
Рекомендации
- ^ а б c ГРЧ38: Ансамбль выпуск 89: ENSG00000104957 - Ансамбль, Май 2017
- ^ а б c GRCm38: выпуск Ensembl 89: ENSMUSG00000004994 - Ансамбль, Май 2017
- ^ "Справочник человека по PubMed:". Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
- ^ "Ссылка на Mouse PubMed:". Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
- ^ а б c d е ж грамм «Анализ CCDC130». Верстак биологии. Суперкомпьютерный центр Сан-Диего - Калифорнийский университет в Сан-Диего. Получено 7 мая 2013.[постоянная мертвая ссылка ]
- ^ а б c d е ж грамм час я j k л м «NCBI». Национальная медицинская библиотека. Получено 2 апреля 2013.
- ^ а б Фабрицио П., Данненберг Дж., Дубе П., Кастнер Б., Старк Х., Урлауб Х., Люрманн Р. (ноябрь 2009 г.). «Эволюционно консервативный дизайн ядра стадии каталитической активации сплайсосомы дрожжей». Молекулярная клетка. 36 (4): 593–608. Дои:10.1016 / j.molcel.2009.09.040. PMID 19941820.
- ^ "Эльдорадо". Genomatix Software GmbH. Получено 11 апреля 2013.
- ^ а б c Блом Н., Гаммельтофт С., Брунак С. (1999). «Последовательность и предсказание на основе структуры сайтов фосфорилирования эукариотических белков». Журнал молекулярной биологии. 294 (5): 1351–62. Дои:10.1006 / jmbi.1999.3310. PMID 10600390.
- ^ «Программа анализа SUMOplot». Abgent- компания WuXi AppTec. Получено 14 мая 2013.
- ^ Йохансен МБ, Кимер Л., Брунак С. (2006). «Анализ и прогноз гликирования белков млекопитающих». Гликобиология. 16 (9): 844–53. CiteSeerX 10.1.1.128.831. Дои:10.1093 / glycob / cwl009. PMID 16762979.
- ^ Юлениус К., Мёльгаард А., Гупта Р., Брунак С. (2005). «Прогнозирование, анализ сохранения и структурная характеристика сайтов O-гликозилирования муцинового типа млекопитающих». Гликобиология. 15 (2): 153–64. Дои:10.1093 / glycob / cwh151. PMID 15385431.
- ^ Монигатти Ф, Гастайгер Э, Байроч А, Юнг Э (2002). «Сульфинатор: прогнозирование сайтов сульфатирования тирозина в белковых последовательностях». Биоинформатика. 18 (5): 769–70. Дои:10.1093 / биоинформатика / 18.5.769. PMID 12050077.
- ^ Кимер Л., Бендцен Дж. Д., Блом Н. (2005). «NetAcet: предсказание сайтов N-концевого ацетилирования». Биоинформатика. 21 (7): 1269–70. Дои:10.1093 / биоинформатика / bti130. PMID 15539450.
- ^ Болонья G, Ивон C, Duvaud S, Veuthey AL (2004). «Предсказания N-терминального миристоилирования ансамблями нейронных сетей». Протеомика. 4 (6): 1626–32. Дои:10.1002 / pmic.200300783. PMID 15174132.
- ^ Р. Гупта; Э. Юнг; С. Брунак (2004). «Прогнозирование сайтов N-гликозилирования в человеческих белках». NetNGlyc1.0. Центр анализа биологической последовательности - Датский университет. Получено 13 мая 2013.
- ^ Юлениус К (2007). "NetCGlyc 1.0: предсказание сайтов C-маннозилирования у млекопитающих". Гликобиология. 17 (8): 868–76. Дои:10.1093 / гликоб / cwm050. PMID 17494086.
- ^ "большой PI Predictor". Проект GPI Lipid Anchor - I.M.P. Биоинформатика. Получено 14 мая 2013.
- ^ "Прогнозирование вторичной структуры SABLE". Медицинский центр детской больницы Цинциннати. Получено 14 мая 2013.
- ^ а б c «NextProt». CCDC130 взаимодействующие белки. Швейцарский институт биоинформатики. Получено 14 мая 2013.
- ^ а б c «Генные карты». Институт науки Вейцмана. Получено 14 мая 2013.
- ^ Ван И, Сун Дж, Цзи З, Син Ц, Лян И (20 января 2012 г.). «Метод взвешенных точек изменения для обнаружения дифференциальной экспрессии генов в данных микрочипа рака груди». PLOS ONE. 7 (1): e29860. Дои:10.1371 / journal.pone.0029860. ЧВК 3262809. PMID 22276133.
дальнейшее чтение
внешняя ссылка
- СМИ, связанные с CCDC130 в Wikimedia Commons
- Человек CCDC130 расположение генома и CCDC130 страница сведений о гене в Браузер генома UCSC.