C1orf131
C1orf131 | |||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Identifierare | |||||||||||||||||||||||||||||||||||||||||||||||
, kromosom 1 öppen läsram 131 | |||||||||||||||||||||||||||||||||||||||||||||||
Externa ID | |||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||
Wikidata | |||||||||||||||||||||||||||||||||||||||||||||||
|
Okarakteriserat protein C1orf131 är ett protein som hos människor kodas av genen C1orf131 . Den första ortologen av detta protein upptäcktes hos människor. Därefter, genom användning av algoritmer och bioinformatik, har homologer av C1orf131 upptäckts i många arter, och som ett resultat är namnet på majoriteten av proteinerna i denna proteinfamilj Okarakteriserat protein C1orf131-homolog.
Gen
Hos människor finns C1orf131 på minussträngen av kromosom 1 och på det cytogenetiska bandet 1q42.2 tillsammans med 193 andra gener. Noterbart är genen uppströms om C1orf131 GNPAT , och genen nedströms om C1orf131 är TRIM67 . När denna gen transkriberas hos människor C1orf131 oftast ett mRNA på 1458 baspar långt som är sammansatt av sju exoner. Det finns åtminstone nio andra alternativa splitsningsformer hos människor som producerar proteiner. De varierar i storlek från 129 baspar (2 exoner) till 1458 baspar (7 exoner).
Protein
I proteinfamiljen C1orf131 är proteinerna mellan 93 och 450 aminosyror långa; dock tenderar majoriteten att vara mellan 160-295 aminosyror långa. De har en molekylvikt mellan 10,6 och 49,0 kDa med majoriteten mellan 18,6 och 32,7 kDa. De har en isoelektrisk punkt mellan 9,6 och 11,2. Över 30 ortologer från däggdjur, fåglar och ödlor har identifierats ha ett poly(A) RNA-bindningsställe. Alla ortologer i denna proteinfamilj har en domän med okänd funktion DUF4602. Det mänskliga proteinet har visat sig vara både fosforylerat och acetylerat. Dessa proteiner är lysinrika , laddade aminosyror ( DEH K R ) och basiska laddade aminosyror ( H K R ) . Den sekundära strukturen hos dessa proteiner består främst av alfaspiraler och spolar med en liten andel betasträngar. C1orf131 har visats interagera med ubiquitin genom affinitetsinfångning följt av masspektrometri och APP (amyloid beta (A4) prekursorprotein) genom rekonstituerat komplex.
DUF4602
DUF4602 (PF15375) är i allmänhet 120+ aminosyror lång. Det finns vanligtvis bara en gen som innehåller denna DUF-domän, men DUF-domänen har identifierats i två olika proteiner i flera arter. I Trichuris suis finns DUF4602 i både hypotetiskt protein M5114_09117 och tRNA pseudouridinsyntas D, och i Echinocuccus granulosus har DUF4602 hittats i hypotetiskt protein EGR 05135 och uttryckt konserverat protein. DUF4602 har hittats främst i eukaryoter; emellertid har DUF4602 identifierats i viruset DRHN1 , Bacillus sp. UNC41MFS5 , Enterococcus faecalis och Enterococcus faecalis 13-SD-W-01 . I C1orf131-ortologerna är DUF-domänerna vanligtvis belägna i mitten av genen mot C-terminalsidan i större proteiner (250+ rester) och i mindre ortologer (160-250 rester) är DUF-domänen belägen nära N-terminalen . Även i större ortologer finns regioner med låg komplexitet som kan tyda på att dessa proteiner är i sig störda proteiner .
Evolutionshistoria
Denna genfamilj existerar endast i eukaryoter. Det finns inga paraloger av denna gen; dock finns det några pseudogener av C1orf131 . Hittills har de bara hittats i orangutanger, muslemurer och sengångare. När denna genfamilj jämförs med cytokrom C, en gen som utvecklas långsamt, och fibrinogen gammakedja , en gen som utvecklas snabbt, har den visat sig utvecklas i en snabbare takt än fibrinogen.