C16orf90

C16orf90 eller kromosom 16 öppen läsram 90 producerar okarakteriserat protein C16orf90 i homo sapiens. C16orf90s protein har fyra förutsagda alfa-helix-domäner och uttrycks milt i testiklarna och uttrycks lågt i hela kroppen. Även om funktionen av C16orf90 ännu inte är väl förstådd av det vetenskapliga samfundet, har den misstänkt inblandning i det biologiska stresssvaret och apoptos baserat på uttrycksdata från mikroarrayer och post-translationella modifieringsdata.

Kromosom 16

Gen

C16orf90 eller kromosom 16 öppen läsram 90 har inga alias och spänner över 3 169 nukleotider från 3 493 484 - 3 496 652 på den korta armen av kromosom 16. Den är belägen i position 16p13.3 på den omvända strängen. Det finns 3 exoner och mRNA-strängen innehåller 972 baspar. C16orf90-proteinet är 182 aminosyror långt.

Exoner

C16orf90 innehåller 3 exonregioner och 2 intronregioner. Exongränserna förekommer mellan aminosyrorna 30 & 31 och 147 & 148. Den första exonen är dåligt konserverad, men exonerna 2 & 3 är mycket konserverade.

C16orf90 markerad på kromosom 16 vid 16p13.3

Protein

C16orf90 har en molekylvikt på 21 kDa och en alkalisk isoelektrisk punkt på 9,2. Det är ett lösligt protein.

Avskrifter

Det finns 3 isoformer av C16orf90. De är okarakteriserat protein C16orf90 isoform a (197aa) som producerar alla 3 exonerna, okarakteriserat protein C16orf90 isoform b (175aa) som producerar 2:a och 3:e exonerna, och okarakteriserat protein C16orf90 isoform c (som producerar de sista aminosyrorna C16orf909)

Uttryck

C16orf90 har relativt högt vävnadsuttryck i testiklarna och mycket lågt (0,213) uttryck i alla andra vävnader hos friska människor. Under stressiga förhållanden verkar C16orf90 uppreglerad i grafer som finns på NCBI Geo.

Subcellulär plats

Kärnan är det mest troliga hemmet för C16orf90s producerade protein och är inte ett transmembranprotein. Dessa resultat verifierades genom att jämföra resultaten av de homologa mus- och delfin-C16orf90-proteinerna.

Strukturera

Sekundär struktur

mRNA

Den sekundära mRNA-strukturen som hittas av RNAfold verkade visa medelhög till hög affinitet för strukturen producerad med stam-ögla och hårnålsvarv. Endast två områden indikerade en låg sannolikhet för den producerade sekundära strukturen.

Protein

C16orf90:s protein innehåller 4 alfa-helixar och inga beta-ark med coiled-coils som sannolikt förbinder helixarna. Dessa spiraler är ungefär lika fördelade över proteinet. En nukleär lokaliseringssignal identifierades såväl som fyra alfa-helixdomäner som hjälper till att bestämma C16orf90s sekundära struktur.

Schematisk gen för C16orf90

Tertiär struktur

C16orf90:s tertiära struktur inkluderar linjära alfa-helixar separerade av en oordnad eller spiralformad region.

förordning

Promotor

Med hjälp av Genomatix-verktyget Gene2Promoter visade sig C16orf90 ha 4 möjliga promotorsekvenser. Promotoruppsättningen 3, GXP_644807, är promotorn för den omvända strängen eftersom den innehöll flest CAGE-taggar, inriktade på 5'-änden av genen och innehöll korrekt GeneID.

Proteinnivåreglering

En nukleär lokaliseringssignal (NLS) vid proteinets C-terminal från 173-197 stödjer den subcellulära lokaliseringsförutsägelsen.

Post translationella ändringar

Fosforylering sker vid många aminosyror på C16orf90. De röda markörerna på proteinschemat indikerar troliga fosforyleringsställen. NetPhos, en prediktor för fosforyleringsställen, returnerade många ställen inklusive aminosyrorna 16, 34, 56, 63, 67, 86, 130, 144, 147, 148, 150, 151, 152, 153, 165, 165, 176, 176, 165, 165, 165, 176 och 191.

Ett CTCF-bindningsställe (CCCTC-bindande faktor) är en 11-zinkfingertranskriptionsfaktor som i allmänhet undertrycker transkription. Det finns en indikerad plats för detta bindningsställe på C16orf90-proteinet och dess effekter kan bidra till C16orf90:s låga uttrycksnivåer.

O-GlcNAc -ställen hämmar fosforylering. C16orf90 har två serinaminosyror som är hem för potentiella O-GlcNAc-ställen vid 34 & 144. O-GlcNAc-ställen tävlar med fosforylering om kontroll av proteinets aktiveringsställe så i C16orf90 kan denna egenskap inaktivera proteinet tills en allvarlig omständighet när proteinet behövs och kan sedan aktiveras.

NetGlycate (ett verktyg för förutsägelse av glykation ) hittade 2 lysinrester vid aminosyrorna 70 (.709) och 158 (.595) som förutsäger glykationsställen . Glykationsställen tillför sockerarter till lysiner post-translationellt och kan vara nödvändiga för proteinveckning eller stabilitet

Det finns ett klyvningsställe beläget mellan 172R och 173K på C16orf90s protein. Denna plats är också där den nukleära lokaliseringssignalen börjar, vilket indikerar att NLS kan klyvas för att eventuellt ta bort proteinet från kärnan eller när proteinet kräver nedbrytning.

Homologi och evolution

C16orf90 ortologer har en relativt hög mutationshastighet som ses i grafen till höger som jämför C16orf90 med fibrinopeptider , hemoglobin och cytokrom C.

Mutationshastigheten för C16orf90 jämfört med fibrinopeptider , hemoglobin och cytokrom c.

Ortologerna sorteras efter ökande datum för divergens och sekvenslikhet . C16orf90 är begränsad till däggdjur men finns i monotremes och pungdjur, vilket indikerar att genen kom in i genomet för cirka 180 miljoner år sedan.

Släkte Arter Vanligt namn Taxonomisk grupp Datum för avvikelse (MYA) Tillträdesnummer Sekvenslängd (AA) Sekvens identitet till människa Sekvenslikhet med människa
Homo sapiens Människor primater 0,00 XP_024306160.1 197 100,00 % 100,00 %
Gorilla gorilla Gorilla primater 8.6 XP_004057139 185 82,00 % 82,50 %
Mus musculus Mus Rodentia 89 NP_082760.2 171 63,50 % 66,50 %
Bison bison Bison Hovdjur med jämn tå 94 XP_010838682 186 65,50 % 69,00 %
Zalophus californianus Sjölejon Carnivora 94 XP_027973424.1 185 65,20 69,10 %
Canis lupus
familiaris Hund Carnivora 94 XP_003434913.2 214 64,50 % 69,60 %
Equus caballus Häst Udda hovdjur 94 XP_001502184.1 183 63,70 % 67,60 %
Sorex araneus Vanlig näbbmuska Soricomorphas 94 XP_004600963.1 320 63,87 % 70,00 %
Acinonyx
jubatus Gepard Carnivora 94 XP_026899211 225 61,90 % 67,30 %
Pteropus
vampyrus Stor flygande räv Chiroptera 94 XP_023376984.1 224 61,80 % 64,50 %
Lagenorhynchus obliquidens Stillahavsvitsidig delfin Artiodactyla 94 XP_026974160 192 54,30 % 58,00 %
Dasypus novemcinctus Niobandad bältdjur Cingulata 102 XP_004474400.1 185 61,30 % 67,20 %
Orycteropus efter Aardvark Tubulidentata 102.00 XP_007937762.1 185 59,80 % 65,70 %
Monodelphis domestica Grå kortstjärtad opossum Pungdjur 160,00 XP_001363889.1 187 53,80 % 60,50 %
Phascolarctos cinereus Koala Pungdjur 160,00 XP_020851162.1 187 53,10 % 60,20 %
Ornithorhynchus anatinus Platypus Monotrem 180.00 XP_016082126.2 216 33,90 % 40,40 %

Klinisk signifikans

I forskning har sekvensen identifierats innehålla en möjlig patogen recessiv variant (K53N) för olika intellektuella funktionsnedsättningar bland 31 andra. Proteinet misstänks vara en adapter/kofaktor som binder till andra molekyler. I det här fallet kan en icke-homolog substitution förändra bindningen till andra molekyler och potentiellt orsaka intellektuell funktionsnedsättning, ljumskbråck, frontal uppsvep av hår, makrotia, hög gom, hypertoni, hyperreflexi, abnormitet i storhjärnan eller D-vitaminbrist