CCDC47
CCDC47 | |||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Identifiers | |||||||||||||||||||||||||||||||||||||||||||||||
, MSTP041, GK001, coiled-coil-domän som innehåller 47, THNS | |||||||||||||||||||||||||||||||||||||||||||||||
externa ID :n | |||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||
Wikidata | |||||||||||||||||||||||||||||||||||||||||||||||
|
Coiled-coil-domän 47 (CCDC47) är en gen belägen på human kromosom 17 , specifikt lokus 17q23.3 som kodar för proteinet CCDC47. Genen har flera alias inklusive GK001 och MSTP041. Proteinet i sig innehåller lindade spoldomäner, SEEEED-superfamiljen, en domän med okänd funktion (DUF1682) och en transmembrandomän. Funktionen av proteinet är okänd, men det har föreslagits att CCDC47 är involverat i kalciumjonhomeostas och det endoplasmatiska retikulumöverbelastningssvaret.
Gen
Själva CCDC47-genen är lokaliserad på minussträngen av human kromosom 17 och innehåller 13 exonsplitsningsställen och 14 distinkta introner . Efter avlägsnande av exoner är genen 3445 baspar lång. Inga bevis för mikro-RNA eller pseudogener har hittats. Genen har inte olika isoformer , endast transkriptvariant 1X existerar.
Protein
Strukturera
Proteinet som kodas av CCDC47 är 483 aminosyror långt och innehåller både en signalpeptid- och en transmembrandomän . Den är rik på negativt laddade aminosyror som asparaginsyra och glutaminsyra vilket ger den en sur isoelektrisk punkt på 4,56. Proteinet är också rikt på metionin . Totalt väger den 55,9 kDal som konserveras genom olika ortologer. CCDC47 innehåller också SEEEED-superfamiljen och domänen för okänd funktion 1682 (DUF1682). SEEEED-superfamiljen är en kort region med låg komplexitet som huvudsakligen består av serin. Familjen ligger rutinmässigt på klatrinadapterkomplexet 3 beta-1 subenhetsproteiner. Den exakta funktionen av DUF 1682 är oklar men en medlem av familjen har beskrivits som ett adipocytspecifikt protein.
Det finns två förutsagda disulfidbindningar i strukturen av CCDC47 vid cysteinerna 209 till 214 respektive cysteinerna 215 till 283. Den C-terminala delen av proteinet är mycket laddad och dess sekundära struktur förutsägs vara den för en alfahelixregion . Denna region innehåller också lindade spoldomäner som är strukturella motiv i vilka 2-7 alfa-helixar lindas ihop och är därefter involverade i biologiskt uttryck. Dessa domäner följer vanligtvis mönstret HxxHCxC där H är en hydrofob aminosyra, C är en laddad aminosyra och x är vilken aminosyra som helst. Många aminosyrasekvenser som följer detta mönster ses i den C-terminala regionen av CCDC47 där den högsta konserveringen genom ortologer är representerad.
Reglering och översättning
CCDC47 regleras av promotorn GXP43413. Promotorn är 819 baspar lång och är mycket konserverad i däggdjur. Konserverade bindningsställen hos däggdjur som är belägna på denna promotor inkluderar Nuclear Respiratory Factor 1 (NFR1), cAMP-responsivt elementbindande protein (CREB), PAR b ZIP-familjen och Sp4 Transcription Factor. NRF1 kodar för ett protein som homodimeriserar och aktiverar uttryck av viktiga metaboliska gener. CREB binder till cAMP-svarselement och därigenom ökar eller minskar transkriptionen av nedströms gener medan PAR b ZIP-familjen är involverad i regleringen av dygnsrytmer . När det gäller mRNA , börjar translation vid baspar 337 och slutar vid 1728. Det finns en stark stamslinga belägen i 5' UTR-regionen från baserna 289-318 som sannolikt är involverad i regleringen av mRNA:t på grund av dess närhet till startkodonet . _
Cellfördelning
Det slutliga proteinet tros översättas från det endoplasmatiska retikulumet till cellens cytoplasma. Proteinet är förankrat i membranet av ER vid transmembrandomänen belägen från aminosyra 137 till 165. Den del av proteinet som sträcker sig in i cytosolen förutsägs vara högt fosforylerad eftersom proteinets fosforyleringsställen bevaras i benfiskortologerna . Forskning har visat att CCDC47 uttrycks i svaret på en ER-överbelastning vilket gör denna närhet till ER viktig.
Post translationell modifiering
Utöver de höga nivåerna av fosforylering som ses i CCDC47, förutsägs och bevaras tre sulfineringsställen hos däggdjur, reptiler och fåglar men inte hos fiskar, amfibier eller ryggradslösa djur. Fem potentiella sumoyleringsställen ses också och bevaras tillbaka till benfisken. Det finns ingen glykosylering av proteinet eftersom det inte förutsägs sträcka sig in i den extracellulära delen av cellen.
Uttryck
Microarray vävnadsuttrycksmönster från GEO analyserades och visade att CCDC47 verkar vara ett allmänt uttryckt på måttliga nivåer i många olika mänskliga vävnader. Även om proteinet uttrycks allestädes närvarande, ses de högsta nivåerna av uttryck i neuronala vävnader såsom det överlägsna cervikala gangliet , hjärnans amygdala och ciliärgangliet . Förhöjt uttryck ses också i sköldkörtel- och CD34+-cellerna.
Homologi
CCDC47 har inga kända paraloger genom textbaserade frågor, BLAST och BLAT. Genen har många ortologer som sträcker sig tillbaka till ryggradslösa djur som C. elegans och är mycket konserverad hos däggdjur med en procentuell identitet som är större än 95 %. CCDC47 har sekvenserats i en bred taxonomi av organismer inklusive däggdjur, fåglar, reptiler, amfibier, benfiskar och ryggradslösa djur. Procentuell identitet för mänsklig CCDC47 med en specifik ortolog minskar med ökande år av divergens, som förväntat. Homologa gener av CCDC47 finns också i myggor, svampar, arabidopsis och asiatiskt ris. Dessa homologer innehåller samma DUF1682 som finns i CCDC47.
Släkte Arter |
Vanligt organismnamn | Avvikelse från Människor (MYA) |
NCBI-protein Tillträdesnummer |
Sekvensidentitet till människor |
Sekvenslängd (AA) |
---|---|---|---|---|---|
Mus musculus | Mus | 92,3 | NP_080285.2 | 97,90 % | 483 |
Myotis davidii | Fladdermus med öron | 94,2 | XP_006776781.1 | 97,50 % | 483 |
Elephantulus edwardii | Elephant Shrew | 98,7 | XP_006886355.1 | 95,00 % | 483 |
Alligator mississippiensis | Amerikansk Alligator | 296 | XP_006271625.1 | 91,00 % | 482 |
Falco körsbär | Saker Falcon | 296 | XP_005439470.1 | 90,10 % | 482 |
Ophiophagus hannah | kung Kobra | 296 | ETE73955 | 78,90 % | 516 |
Xenopus laevis | Afrikansk klogroda | 371,2 | NP_001087058.1 | 78,70 % | 489 |
Danio rerio | Zebra fisk | 400,1 | NP_001004551.1 | 76,20 % | 486 |
Latimeria chalumnae | Coelacanth | 414,9 | XP_00599466.3 | 83,50 % | 478 |
Saccoglossus kowalevskii | Acorn Worm | 661,2 | XP_006822108 | 50,50 % | 496 |
Pediculus humanus corporis | Människokroppslöss | 782,7 | XP_002424359 | 46,10 % | 447 |
Acyrthosiphon kolv | Bladlus | 782,7 | NP_001162147 | 43,50 % | 449 |
Caenorhabditis elegans | Spolmask | 937,5 | NP_497788.1 | 35,10 % | 442 |
externa länkar
- Human CCDC47- genomplacering och CCDC47- geninformationssida i UCSC Genome Browser .