CEFIP
Hjärtanrikat FHL2-interagerande protein ( CEFIP ) är ett protein som kodas av genen C10orf71 på kromosom 10 öppen läsram 71. Det är i första hand underförstått att denna gen är måttligt uttryckt i muskelvävnad och hjärtvävnad.
Gen
Det cytogena stället finns vid 10q11.23. C10orf71 kodar för 28294 baspar (bp) inom kromosom 10 vid 49299193-49327487 bp. Den ligger på plussträngen och flankeras av flera andra gener .
mRNA
mRNA - sekvensen för C10orf71 har 3 exoner och 10 stoppkodon i den gynnsamma splitsningsformen. De två alternativa splitsningsformerna hade 47 och 75 stoppkodon insprängda genom sekvensen så att de inte användes för att erhålla ytterligare sekvensinformation. Den huvudsakliga splitsningsformen som analyserades hade tio stoppkodonen insprängda genom 5' och 3' UTR, vilket var anledningen till att denna splitsningsform användes för ytterligare analys. mRNA från Homo sapiens ortolog av C10orf71 var 5286 bp lång.
Skarv 1 | Stoppkodon hittade från bp: 4, 150, 247, 310, 4645, 4774, 4783, 4855, 4986 och 5250 Exoner hittade mellan bp: 431/432, 544/545 och 5285/5286 Kozak-webbplatsen finns på bp 332-334 |
Skarv 2 | 47 stoppkodon hittade insprängda genom hela sekvensen |
Skarv 3 | 75 stoppkodon hittade spridda genom hela sekvensen |
De tre alternativa splitsningsformerna som hittades av C10orf71-mRNA-sekvensen och platserna stoppar kodon, exoner och Kozak-stället som finns i Splits 1. Splits 1 användes för att analysera och erhålla information om eftersom alla stoppkodoner som hittades i denna splitsningsform hittades i 5'- och 3'-UTR-regionerna av sekvensen. Det fanns tre exoner i Splice 1 med en Kozak-konsensussekvens också i den övergripande sekvensen.
Protein
Den mogna Homo sapiens- homologen av CEFIP- proteinet som kodas av C10orf71 är 1435 aminosyror (aa) lång och väger cirka 156,5 kDa. Denna homolog har en isoelektrisk punkt på 5,94. Området för pH-värden från Homo sapiens till den senast analyserade ortologen , Rhincodon-typer , varierade från 5,94-6,93, med det gradvis ökande allt eftersom det gick senare i divergensen av ortologen.
Arter | Längd (aa) | Molekylvikt (kDa) | Isoelektrisk punkt |
Homo sapiens | 1 435 | 156,5 | 5,94 |
Gorilla gorilla | 1 435 | 156,2 | 5,91 |
Mus muculus | 1,412 | 154,5 | 5,81 |
Gallus gallus | 1,521 | 167,7 | 6.15 |
Rhincodon typus | 1 253 | 138,8 | 6,93 |
Jämförelse av några av de analyserade ortologerna jämfört med Homo sapiens . Orthologerna är ordnade från arter som är närmast släkt med Homo sapiens ortolog till minst närbesläktade (uppifrån respektive nederkant).
Sammansättning av protein
CEFIP förutspås vara ett icke-transmembrant, lösligt protein. Det förutspås vara ett nukleärt protein med 91,3% tillförlitlighet och det är ganska säkert att vara ett nukleärt protein genom hela ortologerna. Det fanns ett positivt laddningskluster i CEFIP-proteinsekvensen, som är lokaliserat från aminosyrorna 1165–1193. Detta kluster var måttligt konserverat under de analyserade ortologerna. Det fanns också ett blandat laddningskluster i Homo sapiens sekvens av detta protein, beläget från aminosyra 750–778, även om detta kluster inte var mycket konserverat genom de analyserade ortologerna. Det fanns också en upprepad sekvens, TASKPPA, belägen vid aminosyrorna 163-169 och 116-1172. Detta protein är också rikt på prolin och serin .
Arter | Kärn | Cytoplasmatisk | Cytoskelett |
Homo sapiens | 91,3 % | 4,3 % | 4,3 % |
Gorilla gorilla | 91,3 % | 4,3 % | 4,3 % |
Mus musculus | 82,6 % | 13,0 % | — |
Gallus gallus | 69,6 % | 17,4 % | 4,3 % |
Rhincodon typus | 69,6 % | 21,7 % | — |
Domäner och motiv
En bekräftad domän med okänd funktion (DUF) hittades inom CEFIP-proteinsekvensen, DUF4585. DUF4585 är belägen på Homo sapiens- proteinsekvensen från aminosyra 311–334. DUF4585 var höggradigt konserverad genom hela ortologerna som analyserades. Det fanns också ett litet vakuolärt målinriktningsmotiv (VAC) inom den analyserade proteinsekvensen som spänner över aminosyrorna 543–546.
Proteinstruktur
Det mogna CEFIP-proteinet innehåller nukleära lokaliseringssignaler (NLS), pat4 (RKPK vid aa 382, RPRK vid aa 640, KRRK vid aa 1190) och pat7 (PPWRKPK vid aa 379 och PWRKPKT vid aa 380) med en NLS-poäng på 0,94. En sekundär struktur konstruerades med en konfidensnivå på 6,1 %.
Post-translationella modifieringar
Det fanns sju GlcNAc O-glykosyleringsställen som förutspåddes inom proteinsekvensen påträffad vid aminosyrorna 116, 120, 139, 165, 468, 470 och 844. Det fanns också flera fosforyleringsställen insprängda genom sekvensen. Ett propeptidklyvningsställe förutspåddes vid aminosyra 38. Det fanns tre förutsagda sumoyleringsställen vid aminosyrorna 599, 890 och 1176.
Uttryck
C10orf71 mRNA visade sig vara starkt uttryckt i hjärt- , muskel- och levervävnad (biologi) .
Reglering av uttryck
Det fanns 6 möjliga promotorer i sekvensen. Promoter GXP_6729162 är 1403 bp lång. Denna promotor hade flera transkriptionsfaktorer av intresse inklusive de involverade med myocyter .
Fungera
Det finns lite vetenskaplig information känd om funktionen av CEFIP.
Interagerande proteiner
Det genererades totalt 25 proteiner som förutspåddes interagera med CEFIP ( Homo sapiens ortholog). De flesta av de förutspådda interaktionerna var fysiska interaktioner med CEFIP. Dessa interaktioner upptäcktes genom en mängd olika mekanismer inklusive, men inte begränsat till: affinitetskromatografi , mikroarrayanalys och tandemmasspektrometri bland andra. Se tabellen för detaljer om de interagerande proteinerna i CEFIP.
Interagerande protein | Proteinets namn | Känd funktion | Platsuttryckta eller associerade sjukdomar |
C20orf78 | Kromosom 20 öppen läsram 78 | Okänd | Obekräftad |
BPIFA2 | BPI-vik som innehåller familj A-medlem 2 | Spelar en roll i antibakteriell resistens i övre luftvägarna | Uttryckt i spottkörtlar |
PPIL6 | Peptidyl Prolyl Isomerase Like 6 | Påskyndar veckningen av proteiner | Obekräftad |
KIF17 | Kinesin familjemedlem 17 | Transporterar vesiklar som innehåller NMDA-receptor 2B | Uttryckt i mikrotubuli |
KRT78 | Keratin 78 | Bildar cytoplasmatiskt nätverk; kodar för proteiner med mellanliggande filamentdomäner | Uttryckt i mellanliggande filament |
TBX4 | T-box4 transkriptionsfaktor | Koda transkriptionsfaktorer involverade i reglering av utvecklingsprocesser; hjälper till med reglering av mesodermdifferentiering; kan spela en roll i lemmönsterbildningen | Förknippas med Small Patella Syndrome och ärftlig pulmonell arteriell hypertoni |
DNAH8 | Dynein Axonemal Heavy Chain 8 | tung kedja av ett axonemalt dynein involverat i spermier och respiratoriska flimmerhår motilitet. | Associerad med kolkicinresistens och mitokondriekomplex V-brist, nukleär typ 1 |
TSPAN17 | Tetraspanin 17 | Förutspått att reglera ADAM10-mognad | Obekräftad |
C14orf80 | Kromosom 14 öppen läsram 80 | Okänd | Obekräftad |
SLC35F4 | Solute Carrier Family 35 medlem F4 | Lösningstransportör | Obekräftad |
LHX4 | LIM Homeobox 4 | Förutspås spela en roll i mognad lungor, utveckling av andningsmekanismer och utveckling av hypofysen | Associerad med hypofyshormonbrist, kombinerat 4 och Lhx4=relaterat kombinerat hypofyshormon |
FAM53A | Familj med sekvenslikhet 53 Medlem A | Spelar en roll i neural utveckling | Möjligen uttryckt i ventrikelvävnad |
GRIK5 | Glutamatjonotropisk receptor Kainastyp subenhet 5 | Bildar funktionella heteromera kainit-föredragande jonkanaler | Förknippas med schizofreni |
FADS2 | Fettsyradenaturas 2 | Reglerar omättnad av fettsyror genom införande av dubbelbindningar mellan definierade cysteiner i fettsyrakedjorna | Förknippad med Best Vitelliform Makula Dystrophy |
GDF2 | Tillväxtdifferentieringsfaktor 2 | Reglerar utvecklingen av brosk och ben; differentiering av kolinerga receptorer i CNS | Obekräftad |
C17orf77 | Kromosom 17 öppen läsram 77 | Okänd | Obekräftad |
CFAP45 (CCDC19) | Cilia And Flagella Associated Protein 45 | Förknippas med cancer i svalget | Obekräftad |
DCST2 | DC-STAMP-domän som innehåller 2 | Okänd | Obekräftad |
CTXN1 | Cortexin 1 | Förutspås spela en roll i IC- eller EC-signalering av de kortikala neuronerna under utvecklingen av framhjärnan. | Obekräftad |
C19orf68 | Kromosom 19 öppen läsram 68 | Okänd | Obekräftad |
DCAF7 | DDB1 och CUL4 associerad faktor 7 | Det har visat sig fungera som ett ställningsprotein i kinassignalering. Det har också varit känt för att vara involverat i kraniofacial utveckling | Obekräftad |
DYRK1A | Dubbel specificitet YAK1-relaterat kinas | Kan spela en roll i hjärnans utveckling och cellproliferation; nukleärt lokaliserat protein | Förknippas med mental retardation, autosomal dominant 7 och mikrocefali |
DYRK1B | Dubbel specificitet tyrosin-(Y)-fosforyleringsreglerad kinas 1B | Spelar en roll i cellcykeln; nukleärt lokaliserat protein | Associerad med bukfetma-metaboliskt syndrom 3 och bukfetma-metaboliskt syndrom |
FNTA | Protein Farnesyltransferas/Geranylgeranyltransferas Typ-1 Subunit Alpha | Hjälper till att reglera utvecklingen av neuromuskulära korsningar | Obekräftad |
FNTB | Protein Farnesyltransferas Subunit Beta | Katalyserar överföringen av en farnesyldel från farnesyldifosfat till ett cystein | Obekräftad |
Interagerande proteiner, deras funktion om känd, och eventuella vävnader som de har hittats eller förutspåtts uttrycka i och alla sjukdomar de har associerats med.
Homologer
Paraloger
Det finns för närvarande inga kända paraloger till C10orf71-genen.
Ortologer
C10orf71 är känd för att ha 68 ortologer i olika arter , inklusive primater (11 arter), gnagare (8 arter), Laurasiatheria carnivores (14 arter), placenta däggdjur (38 arter), Sauropsida- fåglar och reptiler (7 arter) och fiskar (11) arter). De mycket konserverade sekvenserna är primärt från primater där identitetsprocenten för dessa arter är >90 %, medan arter som reptiler, fåglar och fiskar hade en identitetsprocent ≤30 %. Se tabellen för ytterligare information om datum för divergens, sekvenslängd och sekvensidentitet och likhet för ortologer. C10orf71 finns inte i prokaryoter , arkéer eller svampar .
Förkortning (för Phylogenetic Tree) | Arter | Vanligt namn | Proteinaccessionsnummer | Beräknat datum för avvikelse (MYA) | Sekvenslängd (aa) | Sekvensidentitet till humant mRNA/protein (%) | Sekvenslikhet med humant mRNA/protein (%) |
HomS | Homo sapiens | mänsklig | NP_001128668.1 | 1435 | 100 | 100 | |
GorG | Gorilla gorilla | västra gorilla | XP_018889898.1 | 9.06 | 1435 | 98,3 | 98,7 |
RhiR | Rhinopithecus roxellana | Gyllene snubbnäsapa | XP_010381152.1 | 29,44 | 1435 | 93,4 | 95,3 |
OtoG | Otolemur garnettii | småörad galago | XP_003801705.1 | 74 | 1419 | 74,9 | 81,5 |
TupC | Tupaia chinensis | Kinesisk trädknäppa | XP_014439281.1 | 82 | 1186 | 61,5 | 67,8 |
MusM | Mus musculus | husmus | NP_001182026.1 | 90 | 1412 | 65,4 | 74,3 |
oktD | Octodon degus | Vanlig degu | XP_004647022.1 | 90 | 1407 | 63,3 | 73,1 |
HetG | Heterocephalus glaber | Naken mullvadsråtta | XP_004874589.1 | 90 | 1411 | 63,2 | 73,3 |
CerS | Ceratotherium simum simum | Södra vit noshörning | XP_004432504.1 | 96 | 1436 | 74 | 81 |
OrcO | Orcinus späckhuggare | späckhuggare | XP_004286436 | 96 | 1433 | 72,6 | 79,4 |
LoxA | Loxodonta Africana | Afrikansk buske elefant | XP_003408977.1 | 105 | 1438 | 65,5 | 74,5 |
SarH | Sarcophilus harrisii | Tasmansk djävul | XP_003755230.2 | 159 | 1470 | 49,0 | 62,5 |
GavG | Gavialis gangeticus | krokodil | XP_019358113.1 | 312 | 1538 | 32,8 | 46,7 |
TinG | Tinamus guttatus | Vitstrupig tinamou | XP_010216992.1 | 312 | 1529 | 32.4 | 46,3 |
PelS | Pelodiscus sinensis | sköldpadda | XP_006118195.1 | 312 | 1505 | 32,0 | 46,2 |
GalG | Gallus gallus | kyckling | XP_421655.3 | 312 | 1521 | 30,5 | 44,7 |
MelU | Melopsittacus böljar | papegoja | XP_005153970 | 312 | 1538 | 30.3 | 45,1 |
OreN | Oreochromis niloticus | Nilen tilapia | XP_019221822 | 435 | 661 | 12,0 | 18.7 |
SclF | Skleropager formosus | Asiatisk arowana | XP_018580403 | 435 | 3125 | 11.5 | 17.9 |
DanR | Danio rerio | Zebrafisk | XP_005157004.1 | 435 | 3591 | 9.2 | 16,0 |
CluH | Clupea harengus | Atlantisk sill | XP_012687674.1 | 435 | 3633 | 9.1 | 13.8 |
RhiT | Rhincodon typus | val haj | XP_020385611.1 | 473 | 1253 | 40,0 | 24.8 |
Ortologtabell i fallande ordning till senaste ortolog divergerad. Den här tabellen jämför de analyserade ortologerna, deras artnamn, vanliga namn, datum för avvikelse från Homo sapiens ortholog (MYA), längd (aa) och procentandel av likhet och identitet.
Fylogeni
Ett fylogenetiskt träd konstruerades för ortologerna som analyserades i jämförelse med Homo sapiens. Med arten av senaste divergens är Rhincodon-typer, eller valhajen.
Evolutionshastighet
C10orf71s divergenshastighet var snabbare än för fibrinogen eller Cytokrom C .
Klinisk signifikans
Det fanns ett mikroarrayexperiment som också visade bevis för att C10orf71s uttryck sänktes i skelettmuskelvävnader som upplevde sepsis . Det fanns klinisk signifikans i uttrycksnivån av C10orf71 i ett experiment som tittade på de med myotonisk dystrofi . En mikroarrayanalys gav resultat som visade att C10orf71s uttrycksnivå minskade även hos de med prostatacancer.