CCDC130 - CCDC130

CCDC130
Идентификаторы
ПсевдонимыCCDC130, спиральный домен, содержащий 130
Внешние идентификаторыMGI: 1914986 ГомолоГен: 12183 Генные карты: CCDC130
Расположение гена (человек)
Хромосома 19 (человек)
Chr.Хромосома 19 (человек)[1]
Хромосома 19 (человек)
Геномное расположение CCDC130
Геномное расположение CCDC130
Группа19п13.13Начинать13,731,760 бп[1]
Конец13,763,296 бп[1]
Ортологи
РазновидностьЧеловекМышь
Entrez
Ансамбль
UniProt
RefSeq (мРНК)

NM_001294281
NM_026350

RefSeq (белок)

NP_001281210
NP_080626

Расположение (UCSC)Chr 19: 13.73 - 13.76 МбChr 8: 84.26 - 84.27 Мб
PubMed поиск[3][4]
Викиданные
Просмотр / редактирование человекаПросмотр / редактирование мыши

Спиральный домен, содержащий 130 это белок что у людей кодируется CCDC130 ген. Он является частью три-snRNP U4 / U5 / U6 в части U5. Это три-snRNP соединяется с другими белками с образованием комплекса B зрелого сплайсосома. Зрелый белок составляет примерно 45 килодальтон (кДа) и чрезвычайно гидрофильный из-за аномально большого количества заряженных и полярных аминокислоты.[5] CCDC130 является высококонсервативным белком, он имеет ортологичные гены в некоторых дрожжах и растениях, которые были обнаружены с помощью нуклеотидных и белковых версий основного инструмента поиска локального выравнивания (ВЗРЫВ ) от Национальный центр биотехнологической информации.[6] Профили GEO для CCDC130 показали, что этот белок экспрессируется повсеместно, но самые высокие уровни экспрессии обнаруживаются в Т-лимфоциты.[6]

Функция

Хотя конкретная функция CCDC130 все еще неизвестна, было проведено несколько исследований и исследовательских работ, в которых он идентифицирован как компонент U5-части три-snRNP U4 / U5 / U6, которая помогает формировать Комплекс B сплайсосомы человека после объединения с Комплекс А. Комплекс B затем претерпевает дополнительные модификации и конформационные изменения, прежде чем стать зрелой сплайсосомой. В одном исследовании сохранение сплайсосомных компонентов обсуждается путем сравнения сплайсосом человека и дрожжей. В этом исследовании CCDC130 классифицируется как известный фактор сплайсинга, а его гомолог у дрожжей - Yju2.[7] Этот дрожжевой белок является фактором сплайсинга, который помогает сформировать полную активную сплайсосому и способствует первому этапу сплайсинга, который включает расщепление в 5'-сайте сплайсинга первого экзона.[7] Основываясь на этой информации, вполне вероятно, что CCDC130 играет аналогичную роль в сплайсосоме человека, но из-за более высокой сложности сплайсосомы человека этот белок может выполнять другие функции или совершенно другую функцию. Из-за большого числа сайтов фосфорилирования этот белок, вероятно, активируется и рекрутируется в сплайсосомный комплекс посредством фосфорилирования или дефосфорилирования (см. Посттрансляционные модификации). Поскольку этот ген экспрессируется повсеместно и экспрессируется в 2,9 раза выше, чем средний ген, ясно, что этот белок играет неотъемлемую роль в правильном функционировании сплайсосомы.[6]

Ген

Псевдонимы

Домен Coiled-coil, содержащий 130, имеет несколько псевдонимов, включая CCDC130, SB115, LOC81576 и MGC10471.

CCDC130 локус и соседи

Locus

CCDC130 расположен на коротком плече 19 хромосомы у человека. Точный локус - 19p13.2. Весь ген простирается от 13858753-13874106 на + цепи хромосомы 19.[6] CCDC130 граничит с CACNA1A на - нити, глатобу, smagly и socho на + нити, а ниже по течению MGC3207, C19orf53, ZSWIM4 на + цепи и Joypaw, смейглы, флойтобу, smawgly и wycho на - пряди.[6] Glatobu, smagly, socho, joypaw, smeygly, floytobu, smawgly и wycho были проверены только кДНК последовательности в GenBank и не имеют информации об их функциях. Есть также несколько небольших генов, обнаруженных в последовательности CCDC130, при этом snugly, glytobu, stygly и glartobu встречаются на + цепи, а chacho, zoycho, spogly, glotobu, glutobu и sneygly встречаются на - цепи.[6] Все эти небольшие гены имеют чрезвычайно низкие уровни экспрессии (менее 3% от экспрессии среднего гена), причем стигли имеет наивысший уровень экспрессии - 2,8% от среднего.[6]

Промоутер

Было обнаружено несколько предсказанных промоторов для CCDC130 с использованием ElDorado от Genomatix, но промоутер которая соответствует наиболее близкой к последовательности белка, составляет 760 оснований и охватывает 13858094-13858853 на хромосоме 19.[8]

Гомология и эволюция

Паралоги

Для CCDC130 идентифицирован только один паралог, которым является CCDC94, единственный другой известный человеческий член семейства белков CWC16. У них около 27% идентичности, большая часть которой расположена в домене COG5134 и в C-конец. CCDC94 имеет три предсказанных серина фосфорилирование сайты в положениях 213, 220 и 306, которые совпадают с серинами в CCDC130 при множественном выравнивании последовательностей, и сайт фосфорилирования треонина, который выравнивается с фосфорилированным серином в CCDC130.[5][9]

Некорневое филогенетическое древо человеческого CCDC130, близкие ортологи и несколько отдаленных гомологов.

Ортологи и гомологи

CCDC130 - это высококонсервативный белок с истинным ортологи присутствует у приматов, других млекопитающих, амфибий, рептилий, рыб и даже у беспозвоночных, таких как насекомые и морские беспозвоночные. Ортологи птиц не были обнаружены в BLAST-нуклеотидах или белках. [6] Были зарегистрированы гомологичные гены у дрожжей и других грибов, а также растений. Неясно, когда возник самый далекий гомолог CCDC130, но это было задолго до расхождения автотрофы и гетеротрофы

ПоследовательностьРодРазновидностьРаспространенное имяДата расхождения (млн лет назад)Номер доступаДлина последовательности (аа)% Личность
1ГомоsapiensЧеловекНет данныхNP_110445396100
2СаймириболивиенсБелка обезьяна42.6XP_00394175939694
3АйлуроподамеланолеукаГигантская панда94.2XP_00292106239288
4Canisсемейная волчанкаСобака94.2XP_54203139787
5BosТелецКорова94.2NP_00106981240086
6SusScrofaДикий кабан94.2XP_00312339339886
7CricetulusгризейКитайский хомяк92.3XP_00350197538379
8MusMusculusМышь92.3NP_08062638578
9СаркофилHarrisiiТасманский дьявол162.6XP_00376071136777
10АнолисcarolinensisЯщерица анол296XP_00321644337362
11КсенопусLaevisАфриканская когтистая лягушка371.2NP_00108636538461
12ДаниоRerioДанио400.1NP_99115839056
13ТакифугурубцыРыба фугу400.1XP_00397231937965
14АмфимедонQueenslandicaГубка716.5XP_00338867129946
15CulexquinquefasciatusКомар782.7XP_00184611832953
16БомбуснетерпеливыйШмель782.7XP_00348520231455
17CaenorhabditisРеманейНематода937.5XP_00309440236544
18ШизосахаромицетыпомбаДрожжи1215.8NP_595734.229427
19CucumisсативусОгурец1369XP_00413511731347

Консервированные регионы

CCDC130 имеет два консервативных домена и область спиральной спирали. Первый - это домен COG5134, который, как обнаружено, является консервативным в огурцах и, вероятно, играет роль в функции белка, поскольку он всегда является наиболее высококонсервативным участком в любом множественное выравнивание последовательностей.[5] Он охватывает примерно первые 170 аминокислот белка. Другой домен - это домен DUF572, который является эукариотическим область неизвестной функции это разделяется всеми ортологами и большинством более далеких гомологов. Этот домен не имеет определенного диапазона, поскольку разные источники сообщают о разной длине, некоторые говорят, что это весь белок. Область спиральной спирали находится в пределах 182-214 в человеческом белке и богата заряженными аминокислотами. Модифицированные остатки также очень хорошо сохраняются.

Протеин

Самый распространенный вариант CCDC130 кодируется вторым по длине открытая рамка чтения (ORF), что соответствует белку из 396 аминокислот с молекулярной массой 44,8 кДа и изоэлектрической точкой 8,252.[5] Белок CCDC130 богат заряженными аминокислотами и не имеет незаряженных неполярных аминокислот.[5] Mobyle @ Pasteur предсказал, что CCDC130 будет чрезвычайно гидрофильным из-за большого количества заряженных и полярных аминокислот, при этом ни один сайт не имеет баллов выше нуля на графике гидрофобности, а некоторые сайты достигают даже -6 (F180). Есть регион в спиральная катушка домен (182-214), в котором 14 из 18 аминокислот заряжены. Анализ SAPS предсказал, что этот белок будет нестабильным.[5] Из-за своей высокой гидрофильности этот белок определенно не содержит трансмембранных сегментов.

Последовательность белка основной формы CCDC130. Этот пептид имеет длину 396 аминокислот, содержит область спиральной спирали из 182-214, домен неизвестной функции (DUF572) и домен COG5134 в N-концевой половине.
Альтернативные варианты сплайсинга белка CCDC130, как показано на AceView от NCBI.

Вариация

Существует 17 различных мРНК, полученных из гена CCDC130. 13 из этих мРНК происходят в результате альтернативного сплайсинга, а остальные четыре не сплайсированы.[6] Было четыре альтернативных промоутера, пять альтернативных полиаденилирование сайтов и четыре альтернативных последних экзоны описано.[6] Два экземпляра интрон удержание были описаны. Из гена CCDC130 было идентифицировано 14 различных белков, все из которых содержат домен DUF572, но только пять, по-видимому, обнаруживают растяжение спиральной спирали. Остальные три мРНК были очень низкого качества и не транслировались. Также было отмечено, что этот ген может кодировать несколько неперекрывающихся белков. 45 SNP были задокументированы для CCDC130 в NCBI: 29 миссенс-мутации и 16 синонимичных мутаций, не изменяющих аминокислоту.[6]

Концептуальная трансляция аминокислот 269-396 и 3 'UTR CCDC130. Синие отметки указывают на сайты фосфорилирования, а розовые буквы указывают на заряженные аминокислоты.

Посттрансляционные модификации

CCDC130 представляет собой сильно фосфорилированный белок, с 31 различным сайтом фосфорилирования, предсказанным NetPhos, и 26 из этих 31 расположены в С-концевой половине белка.[9] 17 из 22 предсказанных серинов, 4 из 6 предсказанных треонинов и 2 из 3 тирозинов имели оценку вероятности более 0,800, что указывает на высокую вероятность того, что они являются сайтами истинного фосфорилирования.[9] Было шесть сумоилирование сайты были предсказаны, но только один из этих сайтов (K177) имел оценку вероятности выше, чем 0,500, на 0,640.[10] Физиологическая функция сумоилирования все еще относительно загадочна, но эта модификация может добавить значительную молекулярную массу к белку (11 кДа). 13 гликирование были предсказаны сайты с вероятностью более 0,500, и 10 из 13 гликированных лизинов находятся в N-концевой половине белка.[11] NetOGlyc предсказал 11 возможных О-гликозилинониты с вероятностью более 0,500, причем все 11 встречаются в промежутке из 64 аминокислот, от T313 до T376.[12] Некоторые из этих сайтов были предсказаны как сайты фосфорилирования и сайты O-гликозилирования. CCDC130 не прогнозировался сульфатированный,[13] ацетилированный,[14] миристоилированный,[15] N-гликозилированный,[16] C-маннозилированный,[17] или пройти любой GPI модификация.[18]

Вторичная структура

Есть длинный альфа спираль последовательность, предсказанная в CCDC130, которая простирается от R121-A211, которая была предсказана YASPIN. Другие программы для вторичная структура Анализ, такой как PELE, CHOFAS и SABLE, также предсказал альфа-спирали различной длины в этой области.[5][19] Нет последовательных прогнозов для бета-листы в CCDC130.

Информация о взаимодействии

Перечислены несколько белков, которые взаимодействуют с CCDC130, в том числе EEF1A1, NINL, TRAF2, ZBTB16, ZNF165, и ZNF24. EEF1A1 - фактор элонгации эукариот, который участвует в связывании аминоацил-тРНК к Сайт из рибосомы во время перевода.[20] NINL - это белок, подобный девятину, который участвует в микротрубочка организация и обладает активностью связывания ионов кальция.[20] TRAF2, опухоль некроз фактор (TNF), связанный с рецептором фактора 2, является частью некоторых E3 убиквитинлигаза комплексов и участвует в убиквитинизации белков, поэтому они могут разлагаться протеасома.[20] ZBTB16, цинковый палец и белок 16, содержащий домен BTB, также является частью комплекса убиквитин-лигазы E3 и, скорее всего, участвует в распознавании субстрата. Существует также альтернативная форма CCDC130, в которой транскрибируется только 803 основания вместо 1433, но дополнительная информация не предоставляется.[21] ZNF165 и ZNF24 являются белками с цинковыми пальцами, которые связывают ДНК и другие белки для регулирования транскрипции. Ниже представлена ​​таблица взаимодействующих белков для CCDC130, собранных GeneCards.[21] Взаимодействие CCDC130 с NINL, ZNF24, TRAF2, ЮП, GATA5 были проверены двухгибридным экраном согласно STRING, поэтому эти взаимодействия действительно происходят. JUP представляет собой белок зубного налета. GATA5 - это фактор транскрипции, который помогает активировать промотор лактазы-флоризингидролазы.[21] Взаимодействие с CDA, DERA, CDC40, NAA25, DGCR14, NAA20, и PRPF19 не были подтверждены экспериментально, но взаимодействия между гомологами генов были зарегистрированы у других видов в соответствии с STRING, так что эти взаимодействия потенциально могут иметь место. ZBTB16, EEF1A1 и ZNF165 все были проверены, по крайней мере, одним двухгибридным экраном согласно MINT. NAT9 был описан как известный взаимодействующий агент на I2D. В исследовании, проведенном в Университете округа Колумбия для характеристики CCDC130, они обнаружили, что он индуцируется посредством передачи сигналов инсулина и нацелен на три разных киназы (GSK3, CK1, и CK2 ), и является митохондриальным белком.5 Исследование также показывает, что CCDC130 потенциально может использоваться в качестве биомаркер для некоторых типов рака из-за его дифференциальной экспрессии в раковых клетках. В исследовании конкретно упоминается, что CCDC130 подавляется при некоторых типах рака толстой кишки, что позволило большему количеству раковых клеток не нацеливаться на апоптоз путь.

CCDC130 GEOprofile expressiondata1.png
CCDC130 выражение summary2.png

Выражение

CCDC130 - это повсеместно экспрессируемый белок, демонстрирующий определенный уровень экспрессии во всех проанализированных образцах тканей и клеток. Профиль AceView для CCDC130 показывает уровни экспрессии в 2,9 раза выше, чем средний белок.[6] Уровень экспрессии сильно различается между тканями, но в каждом образце присутствует хотя бы некоторый уровень экспрессии. Согласно профилям NCBI GEO и данным BioGPS, плод щитовидная железа, кора надпочечников, матка, предстательная железа, яички, семенной канальец, сердце, PB-CD4 + Т-клетки, PB-CD8 + Т-клетки, лимфатический узел, легкое, вилочковая железа, щитовидная железа, лейкемия Образцы хронического миелогенного K562 и лимфобластного molt4 лейкемии все имели уровни экспрессии выше 75-го процентиля для экспрессии генов по крайней мере в одном из двух образцов. Экспрессия генов была ниже 25-го процентиля по крайней мере в одном из двух образцов для ножек мозжечка, затылочной доли, моста и др. тройничный узел, субталамическое ядро, верхний шейный ганглий (кардинально разные уровни экспрессии), ганглий дорзального корня, плод печень, тело матки, атриовентрикулярный узел, приложение, скелетная мышца, сердечная миоциты, язык и слюнных желез. PB-CD8 + Т-клетки имели самую высокую относительную экспрессию CCDC130, а язык имел самую низкую относительную экспрессию. Для получения дополнительной информации о выражении CCDC130 см. данные по экспрессии мозга мыши или же данные микрочипа человеческого мозга из Атлас мозга Аллена или дифференциальное выражение в GEO профили из NCBI.[6]

Медицинская информация

Было показано, что CCDC130 по-разному экспрессируется при нескольких формах рака, включая рак груди, толстой кишки и поджелудочной железы. микрочип исследования раковых клеток.[22] Было показано, что он подавляется при раке толстой кишки, что позволяет предположить, что он может быть биомаркером рака. По этой теме все еще проводятся исследования, чтобы подтвердить его функцию в качестве идентификатора рака. Многие веб-сайты также говорят, что он участвует в реакции клетки на вирусную инфекцию, но нет конкретной информации по этому поводу или каких-либо разработок.

Рекомендации

  1. ^ а б c ГРЧ38: Ансамбль выпуск 89: ENSG00000104957 - Ансамбль, Май 2017
  2. ^ а б c GRCm38: выпуск Ensembl 89: ENSMUSG00000004994 - Ансамбль, Май 2017
  3. ^ "Справочник человека по PubMed:". Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
  4. ^ "Ссылка на Mouse PubMed:". Национальный центр биотехнологической информации, Национальная медицинская библиотека США.
  5. ^ а б c d е ж грамм «Анализ CCDC130». Верстак биологии. Суперкомпьютерный центр Сан-Диего - Калифорнийский университет в Сан-Диего. Получено 7 мая 2013.[постоянная мертвая ссылка ]
  6. ^ а б c d е ж грамм час я j k л м «NCBI». Национальная медицинская библиотека. Получено 2 апреля 2013.
  7. ^ а б Фабрицио П., Данненберг Дж., Дубе П., Кастнер Б., Старк Х., Урлауб Х., Люрманн Р. (ноябрь 2009 г.). «Эволюционно консервативный дизайн ядра стадии каталитической активации сплайсосомы дрожжей». Молекулярная клетка. 36 (4): 593–608. Дои:10.1016 / j.molcel.2009.09.040. PMID  19941820.
  8. ^ "Эльдорадо". Genomatix Software GmbH. Получено 11 апреля 2013.
  9. ^ а б c Блом Н., Гаммельтофт С., Брунак С. (1999). «Последовательность и предсказание на основе структуры сайтов фосфорилирования эукариотических белков». Журнал молекулярной биологии. 294 (5): 1351–62. Дои:10.1006 / jmbi.1999.3310. PMID  10600390.
  10. ^ «Программа анализа SUMOplot». Abgent- компания WuXi AppTec. Получено 14 мая 2013.
  11. ^ Йохансен МБ, Кимер Л., Брунак С. (2006). «Анализ и прогноз гликирования белков млекопитающих». Гликобиология. 16 (9): 844–53. CiteSeerX  10.1.1.128.831. Дои:10.1093 / glycob / cwl009. PMID  16762979.
  12. ^ Юлениус К., Мёльгаард А., Гупта Р., Брунак С. (2005). «Прогнозирование, анализ сохранения и структурная характеристика сайтов O-гликозилирования муцинового типа млекопитающих». Гликобиология. 15 (2): 153–64. Дои:10.1093 / glycob / cwh151. PMID  15385431.
  13. ^ Монигатти Ф, Гастайгер Э, Байроч А, Юнг Э (2002). «Сульфинатор: прогнозирование сайтов сульфатирования тирозина в белковых последовательностях». Биоинформатика. 18 (5): 769–70. Дои:10.1093 / биоинформатика / 18.5.769. PMID  12050077.
  14. ^ Кимер Л., Бендцен Дж. Д., Блом Н. (2005). «NetAcet: предсказание сайтов N-концевого ацетилирования». Биоинформатика. 21 (7): 1269–70. Дои:10.1093 / биоинформатика / bti130. PMID  15539450.
  15. ^ Болонья G, Ивон C, Duvaud S, Veuthey AL (2004). «Предсказания N-терминального миристоилирования ансамблями нейронных сетей». Протеомика. 4 (6): 1626–32. Дои:10.1002 / pmic.200300783. PMID  15174132.
  16. ^ Р. Гупта; Э. Юнг; С. Брунак (2004). «Прогнозирование сайтов N-гликозилирования в человеческих белках». NetNGlyc1.0. Центр анализа биологической последовательности - Датский университет. Получено 13 мая 2013.
  17. ^ Юлениус К (2007). "NetCGlyc 1.0: предсказание сайтов C-маннозилирования у млекопитающих". Гликобиология. 17 (8): 868–76. Дои:10.1093 / гликоб / cwm050. PMID  17494086.
  18. ^ "большой PI Predictor". Проект GPI Lipid Anchor - I.M.P. Биоинформатика. Получено 14 мая 2013.
  19. ^ "Прогнозирование вторичной структуры SABLE". Медицинский центр детской больницы Цинциннати. Получено 14 мая 2013.
  20. ^ а б c «NextProt». CCDC130 взаимодействующие белки. Швейцарский институт биоинформатики. Получено 14 мая 2013.
  21. ^ а б c «Генные карты». Институт науки Вейцмана. Получено 14 мая 2013.
  22. ^ Ван И, Сун Дж, Цзи З, Син Ц, Лян И (20 января 2012 г.). «Метод взвешенных точек изменения для обнаружения дифференциальной экспрессии генов в данных микрочипа рака груди». PLOS ONE. 7 (1): e29860. Дои:10.1371 / journal.pone.0029860. ЧВК  3262809. PMID  22276133.

дальнейшее чтение

внешняя ссылка