C16orf90
C16orf90 eller kromosom 16 öppen läsram 90 producerar okarakteriserat protein C16orf90 i homo sapiens. C16orf90s protein har fyra förutsagda alfa-helix-domäner och uttrycks milt i testiklarna och uttrycks lågt i hela kroppen. Även om funktionen av C16orf90 ännu inte är väl förstådd av det vetenskapliga samfundet, har den misstänkt inblandning i det biologiska stresssvaret och apoptos baserat på uttrycksdata från mikroarrayer och post-translationella modifieringsdata.
Gen
C16orf90 eller kromosom 16 öppen läsram 90 har inga alias och spänner över 3 169 nukleotider från 3 493 484 - 3 496 652 på den korta armen av kromosom 16. Den är belägen i position 16p13.3 på den omvända strängen. Det finns 3 exoner och mRNA-strängen innehåller 972 baspar. C16orf90-proteinet är 182 aminosyror långt.
Exoner
C16orf90 innehåller 3 exonregioner och 2 intronregioner. Exongränserna förekommer mellan aminosyrorna 30 & 31 och 147 & 148. Den första exonen är dåligt konserverad, men exonerna 2 & 3 är mycket konserverade.
Protein
C16orf90 har en molekylvikt på 21 kDa och en alkalisk isoelektrisk punkt på 9,2. Det är ett lösligt protein.
Avskrifter
Det finns 3 isoformer av C16orf90. De är okarakteriserat protein C16orf90 isoform a (197aa) som producerar alla 3 exonerna, okarakteriserat protein C16orf90 isoform b (175aa) som producerar 2:a och 3:e exonerna, och okarakteriserat protein C16orf90 isoform c (som producerar de sista aminosyrorna C16orf909)
Uttryck
C16orf90 har relativt högt vävnadsuttryck i testiklarna och mycket lågt (0,213) uttryck i alla andra vävnader hos friska människor. Under stressiga förhållanden verkar C16orf90 uppreglerad i grafer som finns på NCBI Geo.
Subcellulär plats
Kärnan är det mest troliga hemmet för C16orf90s producerade protein och är inte ett transmembranprotein. Dessa resultat verifierades genom att jämföra resultaten av de homologa mus- och delfin-C16orf90-proteinerna.
Strukturera
Sekundär struktur
mRNA
Den sekundära mRNA-strukturen som hittas av RNAfold verkade visa medelhög till hög affinitet för strukturen producerad med stam-ögla och hårnålsvarv. Endast två områden indikerade en låg sannolikhet för den producerade sekundära strukturen.
Protein
C16orf90:s protein innehåller 4 alfa-helixar och inga beta-ark med coiled-coils som sannolikt förbinder helixarna. Dessa spiraler är ungefär lika fördelade över proteinet. En nukleär lokaliseringssignal identifierades såväl som fyra alfa-helixdomäner som hjälper till att bestämma C16orf90s sekundära struktur.
Tertiär struktur
C16orf90:s tertiära struktur inkluderar linjära alfa-helixar separerade av en oordnad eller spiralformad region.
förordning
Promotor
Med hjälp av Genomatix-verktyget Gene2Promoter visade sig C16orf90 ha 4 möjliga promotorsekvenser. Promotoruppsättningen 3, GXP_644807, är promotorn för den omvända strängen eftersom den innehöll flest CAGE-taggar, inriktade på 5'-änden av genen och innehöll korrekt GeneID.
Proteinnivåreglering
En nukleär lokaliseringssignal (NLS) vid proteinets C-terminal från 173-197 stödjer den subcellulära lokaliseringsförutsägelsen.
Post translationella ändringar
Fosforylering sker vid många aminosyror på C16orf90. De röda markörerna på proteinschemat indikerar troliga fosforyleringsställen. NetPhos, en prediktor för fosforyleringsställen, returnerade många ställen inklusive aminosyrorna 16, 34, 56, 63, 67, 86, 130, 144, 147, 148, 150, 151, 152, 153, 165, 165, 176, 176, 165, 165, 165, 176 och 191.
Ett CTCF-bindningsställe (CCCTC-bindande faktor) är en 11-zinkfingertranskriptionsfaktor som i allmänhet undertrycker transkription. Det finns en indikerad plats för detta bindningsställe på C16orf90-proteinet och dess effekter kan bidra till C16orf90:s låga uttrycksnivåer.
O-GlcNAc -ställen hämmar fosforylering. C16orf90 har två serinaminosyror som är hem för potentiella O-GlcNAc-ställen vid 34 & 144. O-GlcNAc-ställen tävlar med fosforylering om kontroll av proteinets aktiveringsställe så i C16orf90 kan denna egenskap inaktivera proteinet tills en allvarlig omständighet när proteinet behövs och kan sedan aktiveras.
NetGlycate (ett verktyg för förutsägelse av glykation ) hittade 2 lysinrester vid aminosyrorna 70 (.709) och 158 (.595) som förutsäger glykationsställen . Glykationsställen tillför sockerarter till lysiner post-translationellt och kan vara nödvändiga för proteinveckning eller stabilitet
Det finns ett klyvningsställe beläget mellan 172R och 173K på C16orf90s protein. Denna plats är också där den nukleära lokaliseringssignalen börjar, vilket indikerar att NLS kan klyvas för att eventuellt ta bort proteinet från kärnan eller när proteinet kräver nedbrytning.
Homologi och evolution
C16orf90 ortologer har en relativt hög mutationshastighet som ses i grafen till höger som jämför C16orf90 med fibrinopeptider , hemoglobin och cytokrom C.
Ortologerna sorteras efter ökande datum för divergens och sekvenslikhet . C16orf90 är begränsad till däggdjur men finns i monotremes och pungdjur, vilket indikerar att genen kom in i genomet för cirka 180 miljoner år sedan.
Släkte | Arter | Vanligt namn | Taxonomisk grupp | Datum för avvikelse (MYA) | Tillträdesnummer | Sekvenslängd (AA) | Sekvens identitet till människa | Sekvenslikhet med människa |
---|---|---|---|---|---|---|---|---|
Homo | sapiens | Människor | primater | 0,00 | XP_024306160.1 | 197 | 100,00 % | 100,00 % |
Gorilla | gorilla | Gorilla | primater | 8.6 | XP_004057139 | 185 | 82,00 % | 82,50 % |
Mus | musculus | Mus | Rodentia | 89 | NP_082760.2 | 171 | 63,50 % | 66,50 % |
Bison | bison | Bison | Hovdjur med jämn tå | 94 | XP_010838682 | 186 | 65,50 % | 69,00 % |
Zalophus | californianus | Sjölejon | Carnivora | 94 | XP_027973424.1 | 185 | 65,20 | 69,10 % |
Canis lupus |
familiaris | Hund | Carnivora | 94 | XP_003434913.2 | 214 | 64,50 % | 69,60 % |
Equus | caballus | Häst | Udda hovdjur | 94 | XP_001502184.1 | 183 | 63,70 % | 67,60 % |
Sorex | araneus | Vanlig näbbmuska | Soricomorphas | 94 | XP_004600963.1 | 320 | 63,87 % | 70,00 % |
Acinonyx |
jubatus | Gepard | Carnivora | 94 | XP_026899211 | 225 | 61,90 % | 67,30 % |
Pteropus |
vampyrus | Stor flygande räv | Chiroptera | 94 | XP_023376984.1 | 224 | 61,80 % | 64,50 % |
Lagenorhynchus | obliquidens | Stillahavsvitsidig delfin | Artiodactyla | 94 | XP_026974160 | 192 | 54,30 % | 58,00 % |
Dasypus | novemcinctus | Niobandad bältdjur | Cingulata | 102 | XP_004474400.1 | 185 | 61,30 % | 67,20 % |
Orycteropus | efter | Aardvark | Tubulidentata | 102.00 | XP_007937762.1 | 185 | 59,80 % | 65,70 % |
Monodelphis | domestica | Grå kortstjärtad opossum | Pungdjur | 160,00 | XP_001363889.1 | 187 | 53,80 % | 60,50 % |
Phascolarctos | cinereus | Koala | Pungdjur | 160,00 | XP_020851162.1 | 187 | 53,10 % | 60,20 % |
Ornithorhynchus | anatinus | Platypus | Monotrem | 180.00 | XP_016082126.2 | 216 | 33,90 % | 40,40 % |
Klinisk signifikans
I forskning har sekvensen identifierats innehålla en möjlig patogen recessiv variant (K53N) för olika intellektuella funktionsnedsättningar bland 31 andra. Proteinet misstänks vara en adapter/kofaktor som binder till andra molekyler. I det här fallet kan en icke-homolog substitution förändra bindningen till andra molekyler och potentiellt orsaka intellektuell funktionsnedsättning, ljumskbråck, frontal uppsvep av hår, makrotia, hög gom, hypertoni, hyperreflexi, abnormitet i storhjärnan eller D-vitaminbrist