SOGA2
MTCL1- | |||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
identifierare | |||||||||||||||||||||||||||||||||||||||||||||||
, CCDC165, KIAA0802, SOGA2, mikrotubuli tvärbindningsfaktor 1 | |||||||||||||||||||||||||||||||||||||||||||||||
Externa ID:n | |||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||
Wikidata | |||||||||||||||||||||||||||||||||||||||||||||||
|
SOGA2 , även känd som suppressor of glucose autophagy association 2 eller CCDC165 , är ett protein som hos människor kodas av SOGA2 -genen . SOGA2 har två mänskliga paraloger , SOGA1 och SOGA3 . Hos människor är den genkodande sekvensen 151 349 baspar lång, med ett mRNA på 6092 baspar och en proteinsekvens på 1586 aminosyror. SOGA2-genen är bevarad i gorilla, babian, galago, råtta, mus, katt och mer. Det finns avlägsen bevarande ses i organismer som zebrafinkar och anoler. SOGA2 uttrycks överallt hos människor, med särskilt högt uttryck i hjärnan (särskilt lillhjärnan och hippocampus), tjocktarmen, hypofysen, tunntarmen, ryggmärgen, testiklarna och fostrets hjärna.
Gen
Ställe
SOGA2 - genen är lokaliserad från 8717369 - 8832775 på den korta armen av kromosom 18 (18p11.22).
Homologi och evolution
Paraloger
Det finns två huvudparaloger till SOGA2: humant protein SOGA1 och humant protein SOGA3 . SOGA1 har visat sig vara involverad i suppression av glukos genom autofagi. Hastigheten med vilken ortologer avviker från SOGA2 människa (mätt med % identitet) placerar den ungefärliga dupliceringshändelsen för SOGA1 från SOGA2 till ~254,1 MYA och dupliceringshändelsen för SOGA3 från SOGA2 ~329,1 MYA.
proteinnamn | anslutningsnummer | sekvenslängd (aa) | sekvensidentitet med humant protein | anteckningar |
SOGA3 | NP_001012279.1 | 947 | 58 % | konserverad i ~500 N-terminala aa |
SOGA1 isoform 2 | NP_954650.2 | 1016 aa | 65 % | konserverad i första ~900 aa |
SOGA1 isoform 1 | NP_542194.2 | 1661 | 41 % | konserverad över sekvensens längd utom ~950-1150 |
Ortologer
Många ortologer har identifierats i eukaryoter.
vanligt namn | proteinnamn | avvikelse från mänsklig härstamning (MYA) | anslutningsnummer | sekvenslängd (aa) | sekvensidentitet med humant protein | skillnader i proteindomäner |
---|---|---|---|---|---|---|
gorilla | protein SOGA2 | 8.8 | XP_004059220.1 | 1586 | 99 % | |
babian | protein SOGA2 | 29 | XP_003914218 | 1587 | 98 % | |
galago | protein SOGA3 | 74 | XP_003801047.1 | 1583 | 88 % | DUF4201 inte närvarande |
råtta | CCDC165 | 92,3 | XP_237548.6 | 2060 | 81 % | DUF4201 inte närvarande |
mus | SOGA2 | 92,3 | NP_001107570.1 | 1893 | 80 % | |
hus katt | protein SOGA2 | 94,2 | XP_003995077.1 | 1700 | 84 % | DUF4201 inte närvarande |
ko | CCDC166 | 94,2 | XP_581047.5 | 1525 | 74 % | DUF4201 inte närvarande |
Afrikansk elefant | CCDC167-liknande | 98,7 | XP_003406836.1 | 1544 | 73 % | |
Zebra Finch | protein SOGA2 | 296 | XP_002193121.1 | 1598 | 69 % | DUF4201 inte närvarande |
Röd JungleFowl | CCDC165 | 296 | XP_423729.3 | 1600 | 70 % | DUF4201 inte närvarande |
Carolina anole | okarakteriserat protein KIAA0802-liknande | 296 | XP_003225723.1 | 1839 | 67 % | DUF4201 inte närvarande |
Avlägsna homologer
vanligt namn | proteinnamn | avvikelse från mänsklig härstamning (MYA) | anslutningsnummer | sekvenslängd (aa) | sekvensidentitet med humant protein | skillnader i proteindomäner |
---|---|---|---|---|---|---|
Tropisk klogroda | okarakteriserat protein C20orf117-liknande | 371,2 | XP_002942331.1 | 1584 | 39 % | |
lila sjöborre | okarakteriserat protein LOC578090 | 742,9 | XP_783370.2 | 1587 | 47 % | DUF4201 inte närvarande |
kroppslus | Centromeriskt protein E, förmodat | 782,7 | XP_002429877.1 | 2086 | 30 % | inga delade domäner |
södra husmyggan | konserverat hypotetiskt protein | 782,7 | XP_001843754.1 | 1878 | 32 % | inga delade domäner |
fläskmask | ytantigen repeterande familj protein | 937,5 | XP_003380263.1 | 2030 | 36 % | inga delade domäner |
Homologa domäner
SOGA2 är bevarad längst bak i sin N-terminala region, där den innehåller sina tre domäner med okänd funktion.
Protein
Proteins inre sammansättning
SOGA2 är rikt på glycin (förhållandet mellan SOGA2-sammansättningen och det genomsnittliga humana proteinet är 1,723), glutamat (r = 1,647) och arginin (r = 1,357). Den har också en lägre än vanligt sammansättning av tyrosin (r = 0,3406), isoleucin (r = 0,4430), fenylalanin (r = 0,5808) och valin (r = 0,6161).
Primär struktur och isoformer
SOGA2 har 4 isoformer: Q9Y4B5-1, Q9Y4B5-2, Q9Y4B5-3, Q9Y4B5-4.
Domäner och motiv
SOGA2 innehåller Domain of Unknown Function 4201 (DUF4201) från aa 16-235. Denna domän är specifik för Coiled Coil Domain Containing av proteiner i eukaryoter. Den innehåller också två kopior av Domain of Unknown Function 3166 (DUF3166): en från aa 140-235 och en från aa 269-364.
Post-translationella modifieringar
SOGA2 förväntas genomgå ett antal post-translationella modifieringar. Modifieringar av mänsklig SOGA2 som delas av ortologer inkluderar:
- Sumoylering vid aminosyrorna 87, 152, 235, 392 och 1379.
- Sulfinering vid tyrosiner 14 och 1249.
- Fosforylering på ett antal platser, markerat i följande grafik:
Sekundär struktur
Konsensus för förutsägelseprogramvaran PELE, GOR4 och SOSUICoil är att den sekundära strukturen hos SOGA2 domineras av alfaspiraler med insprängda regioner av slumpmässig spole. GOR4 indikerade att SOGA2 domineras av alfa-helixer; den förutspådde bara 5,61 % av resterna i en förlängd sträng (parallell eller antiparallell Beta-sheet) konformation, i motsats till 47,79 % alfahelix och 46,6 % slumpmässiga spolar.
Tertiär struktur
SOGA2 delar sekvensegenskaper i sin mycket konserverade N-terminala region. Denna homologi tillåter förutsägelse av dess tertiära struktur på basis av homologi till publicerade 3d-strukturer via Phyre2 och NCBI-struktur.
Genexpression
Promotor
Promotorn för humant SOGA2 är nedan.
Genuttrycksdata
EST-profilen visar att SOGA2 hos människor uttrycks i hög grad på många platser i kroppen, inklusive ben, hjärna, öra, ögon och många andra. Det finns ett stort antal avskrifter i levercancerprover. Mänskliga mikroarraydata visar att SOGA2 uttrycks måttligt, med särskilt högt uttryck i hjärnan (särskilt lillhjärnan och hippocampus), tjocktarmen, hypofysen, tunntarmen, ryggmärgen, testiklarna och fostrets hjärna. Hjärnvävnadsspecifika mikroarraydata visar att SOGA2 har högt uttryck i hela den bakre loben av de cerebellära hemisfärerna och den bakre loben av vermis i mushjärnan . Det är lågt uttryck i de flesta andra delar av hjärnan.
Avskriftsvarianter
Hos människor producerar SOGA2-genen 17 olika transkript, varav 8 bildar en proteinprodukt (en genomgår nonsensmedierad sönderfall). Huvudtranskriptet hos människor är transkript ID ENST00000359865, eller SOGA2-001.
Fungera
Möjliga transkriptionsfaktorer
Möjliga transkriptionsfaktorer för human SOGA2 inkluderar:
- Modulatorigenkänningsfaktor 2
- cAMP-responsivt elementbindande protein 1
- alternativ skarvningsvariant av FOXP1
- MDS1/EVI1-liknande gen 1
- Ikaros 2, möjlig regulator av lymfocytdifferentiering
Interaktioner
Proteinkomplex co-immunoprecipitation ( Co-IP ) experiment avslöjade interagerande proteiner såsom celldödsregulatorer , ATP-bindande kassett (ABC) transportörer och proteinkinas A bindande proteiner.
De 540 interagerande proteinerna inkluderar ABCF1 , ACTB , ACTL6A , BCLAF1 , BCLAF1 , CHEK1 och MAGEE2.
Analys av K-närmaste granne av varg pSort indikerar att hos människor är SOGA2 främst fokuserat på kärnan, cytoplasman och det cytonukleära utrymmet. Det finns en liten chans att det är lokaliserat till golgi.
Ett antal proteininteraktanter identifierades också via STRING-databasen, inklusive MARK2 , MARK4 och PPP2R2B .
Klinisk signifikans
SOGA2 har för närvarande inga kända sjukdomsassociationer eller mutationer.
Vidare läsning
- Strausberg RL, Feingold EA, Grouse LH, et al. (2003). "Generering och initial analys av mer än 15 000 fullängds human- och mus-cDNA-sekvenser" . Proc. Natl. Acad. Sci. USA . 99 (26): 16899–903. Bibcode : 2002PNAS...9916899M . doi : 10.1073/pnas.242603899 . PMC 139241 . PMID 12477932 .
- Brajenovic M, Joberty G, Küster B, et al. (2004). "Omfattande proteomisk analys av humana Par-proteinkomplex avslöjar ett sammankopplat proteinnätverk" . J. Biol. Chem . 279 (13): 12804–11. doi : 10.1074/jbc.M312171200 . PMID 14676191 .
- Ota T, Suzuki Y, Nishikawa T, et al. (2004). "Fullständig sekvensering och karakterisering av 21 243 humana cDNAs i full längd" . Nat. Genet . 36 (1): 40–5. doi : 10.1038/ng1285 . PMID 14702039 .
- Gerhard DS, Wagner L, Feingold EA, et al. (2004). "Status, kvalitet och expansion av NIH fullängds cDNA-projektet: Däggdjursgensamlingen (MGC)" . Genome Res . 14 (10B): 2121–7. doi : 10.1101/gr.2596504 . PMC 528928 . PMID 15489334 .
- Nusbaum C, Zody MC, Borowsky ML, et al. (2005). "DNA-sekvens och analys av human kromosom 18" . Naturen . 437 (7058): 551–5. Bibcode : 2005Natur.437..551N . doi : 10.1038/nature03983 . PMID 16177791 .
- Nousiainen M, Silljé HH, Sauer G, et al. (2006). "Fosfoproteomanalys av den mänskliga mitotiska spindeln" . Proc. Natl. Acad. Sci. USA . 103 (14): 5391–6. Bibcode : 2006PNAS..103.5391N . doi : 10.1073/pnas.0507066103 . PMC 1459365 . PMID 16565220 .
- Beausoleil SA, Villén J, Gerber SA, et al. (2006). "Ett sannolikhetsbaserat tillvägagångssätt för högkapacitetsproteinfosforyleringsanalys och platslokalisering". Nat. Biotechnol . 24 (10): 1285–92. doi : 10.1038/nbt1240 . PMID 16964243 . S2CID 14294292 .
- Olsen JV, Blagoev B, Gnad F, et al. (2006). "Global, in vivo och platsspecifik fosforyleringsdynamik i signalnätverk" . Cell . 127 (3): 635–48. doi : 10.1016/j.cell.2006.09.026 . PMID 17081983 . S2CID 7827573 .