SOGA2

MTCL1-
identifierare
, CCDC165, KIAA0802, SOGA2, mikrotubuli tvärbindningsfaktor 1
Externa ID:n
Ortologer
Arter Mänsklig Mus
Entrez
Ensembl
UniProt
RefSeq (mRNA)

RefSeq (protein)

Plats (UCSC)
PubMed -sökning
Wikidata
Visa/redigera människa Visa/redigera mus

SOGA2 , även känd som suppressor of glucose autophagy association 2 eller CCDC165 , är ett protein som hos människor kodas av SOGA2 -genen . SOGA2 har två mänskliga paraloger , SOGA1 och SOGA3 . Hos människor är den genkodande sekvensen 151 349 baspar lång, med ett mRNA på 6092 baspar och en proteinsekvens på 1586 aminosyror. SOGA2-genen är bevarad i gorilla, babian, galago, råtta, mus, katt och mer. Det finns avlägsen bevarande ses i organismer som zebrafinkar och anoler. SOGA2 uttrycks överallt hos människor, med särskilt högt uttryck i hjärnan (särskilt lillhjärnan och hippocampus), tjocktarmen, hypofysen, tunntarmen, ryggmärgen, testiklarna och fostrets hjärna.

Gen

Ställe

SOGA2 - genen är lokaliserad från 8717369 - 8832775 på den korta armen av kromosom 18 (18p11.22).

Homologi och evolution

Paraloger

Det finns två huvudparaloger till SOGA2: humant protein SOGA1 och humant protein SOGA3 . SOGA1 har visat sig vara involverad i suppression av glukos genom autofagi. Hastigheten med vilken ortologer avviker från SOGA2 människa (mätt med % identitet) placerar den ungefärliga dupliceringshändelsen för SOGA1 från SOGA2 till ~254,1 MYA och dupliceringshändelsen för SOGA3 från SOGA2 ~329,1 MYA.

proteinnamn anslutningsnummer sekvenslängd (aa) sekvensidentitet med humant protein anteckningar
SOGA3 NP_001012279.1 947 58 % konserverad i ~500 N-terminala aa
SOGA1 isoform 2 NP_954650.2 1016 aa 65 % konserverad i första ~900 aa
SOGA1 isoform 1 NP_542194.2 1661 41 % konserverad över sekvensens längd utom ~950-1150

Ortologer

Många ortologer har identifierats i eukaryoter.

vanligt namn proteinnamn avvikelse från mänsklig härstamning (MYA) anslutningsnummer sekvenslängd (aa) sekvensidentitet med humant protein skillnader i proteindomäner
gorilla protein SOGA2 8.8 XP_004059220.1 1586 99 %
babian protein SOGA2 29 XP_003914218 1587 98 %
galago protein SOGA3 74 XP_003801047.1 1583 88 % DUF4201 inte närvarande
råtta CCDC165 92,3 XP_237548.6 2060 81 % DUF4201 inte närvarande
mus SOGA2 92,3 NP_001107570.1 1893 80 %
hus katt protein SOGA2 94,2 XP_003995077.1 1700 84 % DUF4201 inte närvarande
ko CCDC166 94,2 XP_581047.5 1525 74 % DUF4201 inte närvarande
Afrikansk elefant CCDC167-liknande 98,7 XP_003406836.1 1544 73 %
Zebra Finch protein SOGA2 296 XP_002193121.1 1598 69 % DUF4201 inte närvarande
Röd JungleFowl CCDC165 296 XP_423729.3 1600 70 % DUF4201 inte närvarande
Carolina anole okarakteriserat protein KIAA0802-liknande 296 XP_003225723.1 1839 67 % DUF4201 inte närvarande
En graf över sekvensidentitet med human SOGA2 som en funktion av divergenstiden för humana SOGA2 ortologer.

Avlägsna homologer

vanligt namn proteinnamn avvikelse från mänsklig härstamning (MYA) anslutningsnummer sekvenslängd (aa) sekvensidentitet med humant protein skillnader i proteindomäner
Tropisk klogroda okarakteriserat protein C20orf117-liknande 371,2 XP_002942331.1 1584 39 %
lila sjöborre okarakteriserat protein LOC578090 742,9 XP_783370.2 1587 47 % DUF4201 inte närvarande
kroppslus Centromeriskt protein E, förmodat 782,7 XP_002429877.1 2086 30 % inga delade domäner
södra husmyggan konserverat hypotetiskt protein 782,7 XP_001843754.1 1878 32 % inga delade domäner
fläskmask ytantigen repeterande familj protein 937,5 XP_003380263.1 2030 36 % inga delade domäner

Homologa domäner

SOGA2 är bevarad längst bak i sin N-terminala region, där den innehåller sina tre domäner med okänd funktion.

En jämförelse av multipelsekvensinriktning av de N-terminala regionerna vs. C-terminala regioner av avlägset besläktade SOGA2-ortologer. Här visas att den N-terminala regionen är väl bevarad i organismer som klogrodan (FROG_SOGA2) men den C-terminala regionen är det inte. Plats 19 är ett exempel på en av de 7 leucinresterna som är bevarade i alla ortologer.

Protein

Proteins inre sammansättning

SOGA2 är rikt på glycin (förhållandet mellan SOGA2-sammansättningen och det genomsnittliga humana proteinet är 1,723), glutamat (r = 1,647) och arginin (r = 1,357). Den har också en lägre än vanligt sammansättning av tyrosin (r = 0,3406), isoleucin (r = 0,4430), fenylalanin (r = 0,5808) och valin (r = 0,6161).

Primär struktur och isoformer

SOGA2 har 4 isoformer: Q9Y4B5-1, Q9Y4B5-2, Q9Y4B5-3, Q9Y4B5-4.

En grafik som visar de fyra olika isoformerna av SOGA2. Isoform 1 är kanonisk. Ändringsnyckel: * E → ELRGPPVLPEQSVSIEELQGQLVQAARLHQEETETFTNKIHK **Q → QNCCGYPRINIEEETLGFTRLPAGSTVKTLKSLGLQRLE *** NQTVLLTAPWGL → ELPCSALAPS...LHGLSQYNSL

Domäner och motiv

SOGA2 innehåller Domain of Unknown Function 4201 (DUF4201) från aa 16-235. Denna domän är specifik för Coiled Coil Domain Containing av proteiner i eukaryoter. Den innehåller också två kopior av Domain of Unknown Function 3166 (DUF3166): en från aa 140-235 och en från aa 269-364.

Post-translationella modifieringar

SOGA2 förväntas genomgå ett antal post-translationella modifieringar. Modifieringar av mänsklig SOGA2 som delas av ortologer inkluderar:

  • Sumoylering vid aminosyrorna 87, 152, 235, 392 och 1379.
  • Sulfinering vid tyrosiner 14 och 1249.
  • Fosforylering på ett antal platser, markerat i följande grafik:
Fosforyleringsställen i SOGA2 förutspådde av netPhos. Markerade platser är bevarade så långt tillbaka som afrikanska grodor.

Sekundär struktur

Konsensus för förutsägelseprogramvaran PELE, GOR4 och SOSUICoil är att den sekundära strukturen hos SOGA2 domineras av alfaspiraler med insprängda regioner av slumpmässig spole. GOR4 indikerade att SOGA2 domineras av alfa-helixer; den förutspådde bara 5,61 % av resterna i en förlängd sträng (parallell eller antiparallell Beta-sheet) konformation, i motsats till 47,79 % alfahelix och 46,6 % slumpmässiga spolar.

Sekundär struktur av mänsklig SOGA2 förutspådd av GOR4-verktyget. h motsvarar alfaspiraler, c motsvarar slumpmässiga spolar och e motsvarar förlängd sträng

Tertiär struktur

SOGA2 delar sekvensegenskaper i sin mycket konserverade N-terminala region. Denna homologi tillåter förutsägelse av dess tertiära struktur på basis av homologi till publicerade 3d-strukturer via Phyre2 och NCBI-struktur.

SOGA2:s 3d-struktur förutspådd av Phyre2. Strukturen är baserad på kristallstrukturen av tropomyosin vid 7 Ångströms upplösning, med 12% identitet. 283 rester matchar, i den N-terminala regionen som innehåller CCDC.
1I84 S, Tungt Meromyosin-subfragment av kycklingmage Slät muskelmyosin med regulatorisk lätt kedja i 3d-strukturen av defosforylerat tillstånd. Markerad region är bevarad i SOGA2.

Genexpression

Promotor

Promotorn för humant SOGA2 är nedan.

Promotorn för den humana SOGA2-genen.

Genuttrycksdata

EST-profilen visar att SOGA2 hos människor uttrycks i hög grad på många platser i kroppen, inklusive ben, hjärna, öra, ögon och många andra. Det finns ett stort antal avskrifter i levercancerprover. Mänskliga mikroarraydata visar att SOGA2 uttrycks måttligt, med särskilt högt uttryck i hjärnan (särskilt lillhjärnan och hippocampus), tjocktarmen, hypofysen, tunntarmen, ryggmärgen, testiklarna och fostrets hjärna. Hjärnvävnadsspecifika mikroarraydata visar att SOGA2 har högt uttryck i hela den bakre loben av de cerebellära hemisfärerna och den bakre loben av vermis i mushjärnan . Det är lågt uttryck i de flesta andra delar av hjärnan.

Avskriftsvarianter

Hos människor producerar SOGA2-genen 17 olika transkript, varav 8 bildar en proteinprodukt (en genomgår nonsensmedierad sönderfall). Huvudtranskriptet hos människor är transkript ID ENST00000359865, eller SOGA2-001.

Fungera

Möjliga transkriptionsfaktorer

Möjliga transkriptionsfaktorer för human SOGA2 inkluderar:

  • Modulatorigenkänningsfaktor 2
  • cAMP-responsivt elementbindande protein 1
  • alternativ skarvningsvariant av FOXP1
  • MDS1/EVI1-liknande gen 1
  • Ikaros 2, möjlig regulator av lymfocytdifferentiering

Interaktioner

Proteinkomplex co-immunoprecipitation ( Co-IP ) experiment avslöjade interagerande proteiner såsom celldödsregulatorer , ATP-bindande kassett (ABC) transportörer och proteinkinas A bindande proteiner.

De 540 interagerande proteinerna inkluderar ABCF1 , ACTB , ACTL6A , BCLAF1 , BCLAF1 , CHEK1 och MAGEE2.

Analys av K-närmaste granne av varg pSort indikerar att hos människor är SOGA2 främst fokuserat på kärnan, cytoplasman och det cytonukleära utrymmet. Det finns en liten chans att det är lokaliserat till golgi.

Ett antal proteininteraktanter identifierades också via STRING-databasen, inklusive MARK2 , MARK4 och PPP2R2B .

Klinisk signifikans

SOGA2 har för närvarande inga kända sjukdomsassociationer eller mutationer.

Vidare läsning