MGC50722

MGC50722
Identifierare
Externa ID:n
Ortologer
Arter Mänsklig Mus
Entrez
Ensembl
UniProt
RefSeq (mRNA)

RefSeq (protein)

Plats (UCSC)
PubMed -sökning
Wikidata
Visa/redigera människa

MGC50722 , även känt som okarakteriserat protein LOC399693 , är ett protein som hos människor kodas av MGC50722 -genen (Dammalian Gene Collection Project Gene 50722). Detta humana protein med 965 aminosyror har en molekylvikt på 104,495 kDa och en domän med okänd funktion (DUF390). Generellt bevarad över däggdjur visar denna snabbt utvecklande gen relativt lågt uttryck i de flesta mänskliga vävnader utom i testiklarna .

Gen

Hela den mänskliga genen är 40 364 baspar lång, medan det obearbetade mRNA:t är 25 960 baspar långt. Efter splitsning av introner har 10 exon -genen en slutlig mRNA-längd på 3 596 baspar som kodar för 965 aminosyror.

Ställe

Human MGC50722 är belägen på minussträngen av kromosom 9 i regionen q34 i det humana genomet (NCBI Gene ID: 399693). Den mest karakteriserade genen i denna region av det mänskliga genomet är GPSM1 , som kodar för G-protein-signaleringsmodulator 1-proteinet.

Homologi och evolution

Divergens av den humana MGC50722-genen grafisk mot fibrinogen- och cytokrom C- divergens. Varje datapunkt på grafen representerar en annan art och den artens homologa gen som identifierats genom BLAST . BLAST-sökningar utfördes med användning av den humana MGC50722-, Fibrinogen- och Cytokrom C-genen och procentandelen identiteter plottades mot den faktiska avvikelsen från människor för den artens homologa genen.

Paraloger

Det visade sig att det centrosomassocierade proteinet 350 ( CEP350 ) var den enda möjliga paralogen till proteinet MGC50722 hos människor. CEP350 är ett 3117 aminosyror långt protein och ligger i linje med proteinet MGC50722 vid dess N-terminal. Detta indikerar att paralogavståndet är mycket långt när MGC50722 delas från CEP350 .

Ortologer

Konkurrerande ortologer för protein MGC50722 finns endast i däggdjur , där mest bevarande finns inom N-terminalen och DUF390.

Avlägsna homologer

Den mest avlägsna homolog som kan påvisas är i broskfisk (462,5 MYA).

Homologa domäner

Domänen med okänd funktion 390 (pfam04094: DUF390) är en del av en familj av proteiner som endast har identifierats inom risgenomet. Även om denna domäns funktion är okänd, kan den vara något slags transponerbart element.

Protein

Primär sekvens och isoformer

Humant protein MGC50722 är 104,495 kDa, med en isoelektrisk punkt på 10,24. Ett blandat laddat kluster av aminosyror är närvarande mellan positionerna 146 och 182, vilket verkar vara konserverat i primater, men inte närvarande i andra däggdjur. Det finns också 6 förutspådda isoformer som finns hos människor.

Subcellulära lokaliseringssignaler

PSORTII-servrar Arkiverade 2021-09-06 på Wayback Machine förutsäger 5 nukleära lokaliseringssignaler i det mänskliga proteinet MGC50722. När ortologsekvenser till det humana proteinet kördes genom PSORT II, ​​var den förutsagda nukleära subcellulära lokaliseringen en konsensusförutsägelse.

Förutspådda nukleära lokaliseringssignaler i humant protein MGC50722
Signaltyp Restintervall Aminosyrasekvens
pat4 46-49 RPRK
pat4 148-151 KPKR
pat7 43-49 PQQRPRK
pat7 149-155 PKRVKSS
pat7 302-308 PSKRRLQ

Post-translationella modifieringar

Humant protein MGC50722 ortolog i möss, 4932418E24Rik protein, har experimentellt bestämt fosforyleringsställen vid S588, S591 och S670 i testiklarna ( pTestis ID: PT-MM-02686) . Prediktionsservrar på ExPASy förutsäger också fler fosforyleringsställen ( NetPhos 2.0 Server ), en N-termnial acetyleringsplats ( NetAcet 1.0 Server ), glykeringsplatser ( NetGlycate 1.0 Server ) och en GalNAc O-glykosyleringsplats ( NetOGlyc 4.0 Serverrester ) i det humana MGC50722-proteinet.

Sekundär struktur

Förutsägelsemodeller karakteriserade proteinet MGC50722 som mestadels oordnat, men två regioner med lindade spolar.

Proteins inre struktur och egenskaper

Funktion Restintervall
Region med låg komplexitet 11-26
DUF390 405-690
Region med låg komplexitet 410-423
Region med låg komplexitet 546-556
Coiled-Coil 546-566
Region med låg komplexitet 606-621
Coiled-Coil 720-753
Region med låg komplexitet 771-791
Region med låg komplexitet 871-884
Protein MGC50722 primära aminosyrasekvens och dess interna egenskaper/strukturer.

Potentiell funktion

Funktionen av protein MGC50722 är okänd. Med tanke på att det företrädesvis uttrycks i testiklarna och verkar vara subcellulärt lokaliserat i kärnan, kan det spela en viktig roll i gametceller.

Interagerande proteiner

På grund av den senaste identifieringen av denna gen och dess protein har interaktionsdatabaser ( MINT , STRING , IntAct och BioGRID ) inte identifierat några interaktioner. Mer data skulle utöka karakteriseringen av MGC50722 .

Uttryck

Uttrycksnivåer av humant MGC50722 verkar vara låga/frånvarande i de flesta celltyper, med det högsta och mest rikliga uttrycket visat sig vara i testiklarna (GEO-profil-ID: 48997768 och 49895282 ). En lungcancerstudie visade också att MGC50722 uttrycktes i CD4+ T-celler från normala mänskliga vävnadsprover.

Promotor

Transkriptionsstartstället för MGC50722 är bäst i linje med SPZ1 , SORY , SP1F och FAST transkriptionsfaktorbindningsställen.

Klinisk signifikans

En betydande GEO-profil relaterad till MGC50722 var en studie gjord på manlig fertilitet hos människor som tittade på sjukdomen teratozoospermi (GEO Profile ID: 38113951 ). Teratozoospermi är ett tillstånd där morfologin under utvecklingen av mogna spermier förändras, vilket leder till, i vissa fall, manlig infertilitet. Genuttryck visar att MGC50722 uttrycks hos normala människor, medan uttrycksnivåerna hos patienter med teratozoospermi sjunker avsevärt eller stängs av.

Föreslagen läsning