CCDC47

CCDC47
Identifiers
, MSTP041, GK001, coiled-coil-domän som innehåller 47, THNS
externa ID :n
Ortologer
Arter Mänsklig Mus
Entrez
Ensembl
UniProt
RefSeq (mRNA)

RefSeq (protein)

Plats (UCSC)
PubMed -sökning
Wikidata
Visa/redigera människa Visa/redigera mus

Coiled-coil-domän 47 (CCDC47) är en gen belägen på human kromosom 17 , specifikt lokus 17q23.3 som kodar för proteinet CCDC47. Genen har flera alias inklusive GK001 och MSTP041. Proteinet i sig innehåller lindade spoldomäner, SEEEED-superfamiljen, en domän med okänd funktion (DUF1682) och en transmembrandomän. Funktionen av proteinet är okänd, men det har föreslagits att CCDC47 är involverat i kalciumjonhomeostas och det endoplasmatiska retikulumöverbelastningssvaret.

Gen

Själva CCDC47-genen är lokaliserad på minussträngen av human kromosom 17 och innehåller 13 exonsplitsningsställen och 14 distinkta introner . Efter avlägsnande av exoner är genen 3445 baspar lång. Inga bevis för mikro-RNA eller pseudogener har hittats. Genen har inte olika isoformer , endast transkriptvariant 1X existerar.

Genomiskt läge för CCDC47 vid 17q23.3

Protein

Strukturera

Proteinet som kodas av CCDC47 är 483 aminosyror långt och innehåller både en signalpeptid- och en transmembrandomän . Den är rik på negativt laddade aminosyror som asparaginsyra och glutaminsyra vilket ger den en sur isoelektrisk punkt på 4,56. Proteinet är också rikt på metionin . Totalt väger den 55,9 kDal som konserveras genom olika ortologer. CCDC47 innehåller också SEEEED-superfamiljen och domänen för okänd funktion 1682 (DUF1682). SEEEED-superfamiljen är en kort region med låg komplexitet som huvudsakligen består av serin. Familjen ligger rutinmässigt på klatrinadapterkomplexet 3 beta-1 subenhetsproteiner. Den exakta funktionen av DUF 1682 är oklar men en medlem av familjen har beskrivits som ett adipocytspecifikt protein.

PHYRE kunde med 76,1 % konfidens förutsäga C-terminalstrukturen för CCDC47 från aminosyrorna 396-473. Denna alfaspiralstruktur avbildas ovan.

Det finns två förutsagda disulfidbindningar i strukturen av CCDC47 vid cysteinerna 209 till 214 respektive cysteinerna 215 till 283. Den C-terminala delen av proteinet är mycket laddad och dess sekundära struktur förutsägs vara den för en alfahelixregion . Denna region innehåller också lindade spoldomäner som är strukturella motiv i vilka 2-7 alfa-helixar lindas ihop och är därefter involverade i biologiskt uttryck. Dessa domäner följer vanligtvis mönstret HxxHCxC där H är en hydrofob aminosyra, C är en laddad aminosyra och x är vilken aminosyra som helst. Många aminosyrasekvenser som följer detta mönster ses i den C-terminala regionen av CCDC47 där den högsta konserveringen genom ortologer är representerad.

CCDC47-proteinkonstruktionen, inklusive signalpeptiden, SEEEED-superfamiljen, transmembrandomänen och DUF1682.

Reglering och översättning

CCDC47 regleras av promotorn GXP43413. Promotorn är 819 baspar lång och är mycket konserverad i däggdjur. Konserverade bindningsställen hos däggdjur som är belägna på denna promotor inkluderar Nuclear Respiratory Factor 1 (NFR1), cAMP-responsivt elementbindande protein (CREB), PAR b ZIP-familjen och Sp4 Transcription Factor. NRF1 kodar för ett protein som homodimeriserar och aktiverar uttryck av viktiga metaboliska gener. CREB binder till cAMP-svarselement och därigenom ökar eller minskar transkriptionen av nedströms gener medan PAR b ZIP-familjen är involverad i regleringen av dygnsrytmer . När det gäller mRNA , börjar translation vid baspar 337 och slutar vid 1728. Det finns en stark stamslinga belägen i 5' UTR-regionen från baserna 289-318 som sannolikt är involverad i regleringen av mRNA:t på grund av dess närhet till startkodonet . _

Cellfördelning

Det slutliga proteinet tros översättas från det endoplasmatiska retikulumet till cellens cytoplasma. Proteinet är förankrat i membranet av ER vid transmembrandomänen belägen från aminosyra 137 till 165. Den del av proteinet som sträcker sig in i cytosolen förutsägs vara högt fosforylerad eftersom proteinets fosforyleringsställen bevaras i benfiskortologerna . Forskning har visat att CCDC47 uttrycks i svaret på en ER-överbelastning vilket gör denna närhet till ER viktig.

Post translationell modifiering

Utöver de höga nivåerna av fosforylering som ses i CCDC47, förutsägs och bevaras tre sulfineringsställen hos däggdjur, reptiler och fåglar men inte hos fiskar, amfibier eller ryggradslösa djur. Fem potentiella sumoyleringsställen ses också och bevaras tillbaka till benfisken. Det finns ingen glykosylering av proteinet eftersom det inte förutsägs sträcka sig in i den extracellulära delen av cellen.

Uttryck

Microarray vävnadsuttrycksmönster från GEO analyserades och visade att CCDC47 verkar vara ett allmänt uttryckt på måttliga nivåer i många olika mänskliga vävnader. Även om proteinet uttrycks allestädes närvarande, ses de högsta nivåerna av uttryck i neuronala vävnader såsom det överlägsna cervikala gangliet , hjärnans amygdala och ciliärgangliet . Förhöjt uttryck ses också i sköldkörtel- och CD34+-cellerna.

Homologi

CCDC47 har inga kända paraloger genom textbaserade frågor, BLAST och BLAT. Genen har många ortologer som sträcker sig tillbaka till ryggradslösa djur som C. elegans och är mycket konserverad hos däggdjur med en procentuell identitet som är större än 95 %. CCDC47 har sekvenserats i en bred taxonomi av organismer inklusive däggdjur, fåglar, reptiler, amfibier, benfiskar och ryggradslösa djur. Procentuell identitet för mänsklig CCDC47 med en specifik ortolog minskar med ökande år av divergens, som förväntat. Homologa gener av CCDC47 finns också i myggor, svampar, arabidopsis och asiatiskt ris. Dessa homologer innehåller samma DUF1682 som finns i CCDC47.

Ortologer av CCDC47
Släkte

Arter

Vanligt organismnamn Avvikelse från

Människor (MYA)

NCBI-protein

Tillträdesnummer

Sekvensidentitet

till människor

Sekvenslängd

(AA)

Mus musculus Mus 92,3 NP_080285.2 97,90 % 483
Myotis davidii Fladdermus med öron 94,2 XP_006776781.1 97,50 % 483
Elephantulus edwardii Elephant Shrew 98,7 XP_006886355.1 95,00 % 483
Alligator mississippiensis Amerikansk Alligator 296 XP_006271625.1 91,00 % 482
Falco körsbär Saker Falcon 296 XP_005439470.1 90,10 % 482
Ophiophagus hannah kung Kobra 296 ETE73955 78,90 % 516
Xenopus laevis Afrikansk klogroda 371,2 NP_001087058.1 78,70 % 489
Danio rerio Zebra fisk 400,1 NP_001004551.1 76,20 % 486
Latimeria chalumnae Coelacanth 414,9 XP_00599466.3 83,50 % 478
Saccoglossus kowalevskii Acorn Worm 661,2 XP_006822108 50,50 % 496
Pediculus humanus corporis Människokroppslöss 782,7 XP_002424359 46,10 % 447
Acyrthosiphon kolv Bladlus 782,7 NP_001162147 43,50 % 449
Caenorhabditis elegans Spolmask 937,5 NP_497788.1 35,10 % 442

externa länkar