INAVA

INAVA-
identifierare
, kromosom 1 öppen läsram 106, C1orf106, medfödd immunitetsaktivator
Externa ID:n
Ortologer
Arter Mänsklig Mus
Entrez
Ensembl
UniProt
RefSeq (mRNA)

RefSeq (protein)

Plats (UCSC)
PubMed -sökning
Wikidata
Visa/redigera människa Visa/redigera mus

INAVA , ibland kallat hypotetiskt protein LOC55765 , är ett protein med okänd funktion som hos människor kodas av INAVA -genen . Mindre vanliga genalias inkluderar FLJ10901 och MGC125608.

Gen

Plats

C1orf106-plats på kromosom 1

Hos människor är INAVA beläget på den långa armen av kromosom 1 vid lokus 1q32.1. Den sträcker sig från 200 891 499 till 200 915 736 (24,238 kb) på plussträngen.

Gene grannskap

Gene grannskap

INAVA flankeras av G-proteinkopplad receptor 25 (uppströms) och maestro värmeliknande familjemedlem 3 (MROH3P), en förutspådd nedströms pseudogen. Ribosomalt protein L34 pseudogen 6 (RPL34P6) är längre uppströms och kinesin familjemedlem 21B är längre nedströms.

Promotor

Förutspådd C1orf106-promotorregion med förmodade transkriptionsfaktorbindningsställen

Det finns sju förutsagda promotorer för INAVA, och experimentella bevis tyder på att isoform 1 och 2, de vanligaste isoformerna, transkriberas med olika promotorer. MatInspector, ett verktyg tillgängligt genom Genomatix, användes för att förutsäga transkriptionsfaktorbindningsställen inom potentiella promotorregioner. Transkriptionsfaktorerna som förutsägs rikta in sig på den förväntade promotorn för isoform 1 uttrycks i en rad vävnader. De vanligaste uttrycksvävnaderna är det urogenitala systemet, nervsystemet och benmärgen. Detta sammanfaller med uttrycksdata för INAVA-proteinet, som är starkt uttryckt i njure och benmärg. Ett diagram över den förutsagda promotorregionen, med markerade transkriptionsfaktorbindningsställen, visas till höger. Faktorerna som förutsägs binda till promotorregionen av isoform 2 skiljer sig åt, och tolv av de tjugo främsta förutspådda faktorerna uttrycks i blodceller och/eller vävnader i det kardiovaskulära systemet.

Uttryck

C1orf106 uttrycks i ett brett spektrum av vävnader. Uttrycksdata från GEO-profiler visas nedan. Platserna med högsta uttryck listas i tabellen. Uttrycket är måttligt i moderkakan, prostata, testiklarna, lungorna, spottkörtlarna och dendritiska cellerna. Det är lågt i hjärnan, de flesta immunceller, binjuren, livmodern, hjärtat och fettceller. Uttrycksdata, från olika experiment, som hittats på GEO-profiler tyder på att INAVA-uttryck är uppreglerat i flera cancerformer inklusive: lunga, äggstockar, kolorektala och bröst.

C1orf106 uttrycksdata från GEO-profiler
Vävnad Procentuell ranking
B-lymfocyter 90
Trakea 89
Hud 88
Humana bronkiala epitelceller 88
Kolorektalt adenokarcinom 87
Njure 87
Tunga 85
Bukspottkörteln 84
Bilaga 82
Benmärg 80

mRNA

Isoformer

Nio förmodade isoformer produceras från INAVA-genen, varav sju förutsägs koda för proteiner. Isoform 1 och 2, som visas nedan, är de vanligaste isoformerna.

De vanligaste C1orf106-isoformerna

Isoform 1, som är den längsta, accepteras som den kanoniska isoformen. Den innehåller tio exoner, som kodar för ett protein som är 677 aminosyror långt, beroende på källan. Vissa källor rapporterar att proteinet endast består av 663 aminosyror på grund av användningen av ett startkodon som är fyrtiotvå nukleotider nedströms. Enligt NCBI har denna isoform endast förutspåtts beräkningsmässigt. Detta kan bero på att Kozak-sekvensen som omger startkodonet nedströms mer liknar konsensus-Kozak-sekvensen som visas i tabellen nedan. Softberry användes för att erhålla sekvensen av den förutsagda isoformen. Isoform 2 är kortare på grund av en trunkerad N-terminal. Båda isoformerna har ett alternativt polyadenyleringsställe.

Surrounding sequence of start codons compared to Kozak consensus sequence

miRNA-reglering

Förutspådd miRNA-målsekvens

miRNA-24 identifierades som ett mikroRNA som potentiellt skulle kunna rikta in sig på INAVA-mRNA. Bindningsstället, som är beläget i den 5' otranslaterade regionen visas.

Protein

Generella egenskaper

C1of106-protein (isoform 1)

Isoform 1, som visas nedan, innehåller en DUF3338-domän, två lågkomplexitetsregioner och en prolinrik region. Proteinet är rikt på arginin och prolin och har en lägre mängd asparagin och hydrofoba aminosyror än genomsnittet, särskilt fenylalanin och isoleucin. Den isoelektriska punkten är 9,58 och molekylvikten för det omodifierade proteinet är 72,9 kdal. Proteinet förutsägs inte ha en N-terminal signalpeptid, men det finns förutspådda nukleära lokaliseringssignaler (NLS) och en leucinrik kärnexportsignal .

Ändringar

INAVA förutspås vara högt fosforylerad. Fosfoyleringsställen som förutspås av PROSITE visas i tabellen nedan. NETPhos-förutsägelser illustreras i diagrammet. Varje linje pekar på ett förutsagt fosforyleringsställe och ansluter till en bokstav som representerar antingen serin (S), treonin (T) eller tyrosin (Y).

Phosphorylation sites predicted by PROSITE
Fosforyleringsställen förutsagda av NETPhos. Bokstaven motsvarar serin (S), treonin (T) eller tyrosin (Y).

Strukturera

Coiled-coils förutsägs sträcka sig från rest 130-160 och 200-260. Den sekundära sammansättningen förutspåddes vara cirka 60 % slumpmässiga spolar, 30 % alfaspiraler och 10 % beta-ark.

Interaktioner

Proteinerna som INAVA-proteinet interagerar med är inte väl karakteriserade. Textmining -bevis tyder på att INAVA kan interagera med följande proteiner: DNAJC5G, SLC7A13, PIEZO2, MUC19. Experimentella bevis, från en jäst två hybridscreening, tyder på att INAVA-proteinet interagerar med 14-3-3 protein sigma, vilket är ett adapterprotein.

Homologi

INAVA är välbevarat hos ryggradsdjur som visas i tabellen nedan. Sekvenser hämtades från BLAST och BLAT .

Sekvens Släkt och art Vanligt namn NCBI anslutning Längd(aa) Sekvensidentitet Tid sedan divergens (Mya)
* C1orf106 Homo sapiens Mänsklig NP_060735.3 667 100 % NA
* C1orf106 Macaca fascicularis Krabbätande makak XP_005540414.1 703 97 % 29,0
* LOC289399 Rattus norvegicus Norge råtta NP_001178750.1 667 86 % 92,3
* Förutspådd C1orf106-homolog Odobenus rosmarus divergens Valross XP_004392787.1 672 85 % 94,2
* C1orf106-liknande Loxodonta africana Elefant XP_003410255.1 663 84 % 98,7
* Förutspådd C1orf106-homolog Dasypus novemcinctus Niobandad bältdjur XP_004478752.1 676 81 % 104,2
* Förutspådd C1orf106-homolog Ochotona princeps Amerikansk pika XP_004578841.1 681 78 % 92,3
* Förutspådd C1orf106-homolog Monodelphis domestica Grå kortstjärtad opossum XP_001367913.2 578 76 % 162,2
* Förutspådd C1orf106-homolog Chrysemys picta bellii Målad sköldpadda XP_005313167.1 602 56 % 296,0
* Förutspådd C1orf106-homolog Geospiza fortis Mellanmarksfink XP_005426868.1 542 50 % 296,0
* Förutspådd C1orf106-homolog Alligator mississippiensis Alligator XP_006278041.1 547 49 % 296,0
* Förutspådd C1orf106-homolog Ficedula albicollis Halsband flugsnappare XP_005059352.1 542 49 % 296,0
Förutspådd C1orf106-homolog Latimeria chalumnae Coelacanth i västra Indiska oceanen XP_005988436.1 613 46 % 414,9
* Förutspådd C1orf106-homolog Lepisosteus oculatus Fläckig gar XP_006628420.1 637 44 % 400,1
* FERM-domän som innehåller 4A Xenopus (Silurana) tropicalis Västerländsk klös groda XP_002935289.2 695 43 % 371,2
* Förutspådd C1orf106-homolog Oreochromis niloticus Nilen tilapia XP_005478188.1 576 40 % 400,1
Förutspådd C1orf106-homolog Haplochromis burtoni Astatotilapia burtoni XP_005914919.1 576 40 % 400,1
Förutspådd C1orf106-homolog Pundamilia nyererei Haplochromis nyererei XP_005732720.1 577 40 % 400,1
* LOC563192 Danio rerio Zebrafisk NP_001073474.1 612 37 % 400,1
LOC101161145 Oryzias latipes Japansk risfisk XP_004069287.1 612 33 % 400,1

En graf över sekvensidentiteten mot tiden sedan divergensen för de asteriskmarkerade posterna visas nedan. Färgerna motsvarar graden av släktskap (grön = närbesläktad, lila = avlägsen besläktad).

Procent sekvensidentitet i relation till artsläktskap

Paraloger

Proteiner som anses vara INAVA paraloger är inte konsekventa mellan databaser. En multipelsekvensinriktning (MSA) av potentiellt paraloga proteiner gjordes för att bestämma sannolikheten för ett verkligt paralogt förhållande. Sekvenserna hämtades från en BLAST-sökning på människor med C1orf106-proteinet. MSA föreslår att proteinerna delar en homolog domän, DUF3338, som finns i eukaryoter. En del av multipelsekvensinriktningen visas nedan. Bortsett från DUF-domänen (inramad i grönt) var det lite bevarande. DUF3338-domänen har inga extraordinära fysikaliska egenskaper, men en anmärkningsvärd upptäckt är att vart och ett av proteinerna i MSA förutspås ha två nukleära lokaliseringssignaler. Proteinerna i MSA förutsägs alla lokaliseras till kärnan. En jämförelse av de fysikaliska egenskaperna hos proteinerna utfördes också med användning av SAPS och visas i tabellen.

Bevarande av DUF3338-domänen hos människor
Physical properties of potential paralogs

Klinisk signifikans

Totalt 556 singelnukleotidpolymorfismer (SNP) har identifierats i genregionen av INAVA, varav 96 är associerade med en klinisk källa. Rivas et al. identifierade fyra SNP, som visas i tabellen nedan, som kan vara associerade med inflammatorisk tarmsjukdom och Crohns sjukdom . Enligt GeneCards kan andra sjukdomsassociationer inkludera multipel skleros och ulcerös kolit .

Återstod Förändra Anteckningar
333 (rs41313912) Tyrosin ⇒ fenylalanin Fosforylerad, måttlig konservering
376 Arginin ⇒ cystein Måttlig bevarande
397 Arginin ⇒ treonin Ej konserverad
554 (rs61745433) Arginin ⇒ cystein Måttlig bevarande

Modellorganismer

Modellorganismer har använts i studiet av INAVA-funktion. En villkorlig knockout-muslinje kallad 5730559C18Rik tm2a(EUCOMM)Wtsi genererades på Wellcome Trust Sanger Institute . Han- och hondjur genomgick en standardiserad fenotypisk screening för att bestämma effekterna av deletion. Ytterligare undersökningar utförda: - Djupgående immunologisk fenotypning - djupgående ben- och broskfenotypning

externa länkar