CEFIP

Hjärtanrikat FHL2-interagerande protein ( CEFIP ) är ett protein som kodas av genen C10orf71 på kromosom 10 öppen läsram 71. Det är i första hand underförstått att denna gen är måttligt uttryckt i muskelvävnad och hjärtvävnad.

Gen

Det cytogena stället finns vid 10q11.23. C10orf71 kodar för 28294 baspar (bp) inom kromosom 10 vid 49299193-49327487 bp. Den ligger på plussträngen och flankeras av flera andra gener .

Kromosom 10-representation som visar C10orf71-lokalisering och andra närliggande gener som den flankeras av.

mRNA

mRNA - sekvensen för C10orf71 har 3 exoner och 10 stoppkodon i den gynnsamma splitsningsformen. De två alternativa splitsningsformerna hade 47 och 75 stoppkodon insprängda genom sekvensen så att de inte användes för att erhålla ytterligare sekvensinformation. Den huvudsakliga splitsningsformen som analyserades hade tio stoppkodonen insprängda genom 5' och 3' UTR, vilket var anledningen till att denna splitsningsform användes för ytterligare analys. mRNA från Homo sapiens ortolog av C10orf71 var 5286 bp lång.

Alternativa skarvformer av C10orf7
Skarv 1 Stoppkodon hittade från bp: 4, 150, 247, 310, 4645, 4774, 4783, 4855, 4986 och 5250

Exoner hittade mellan bp: 431/432, 544/545 och 5285/5286

Kozak-webbplatsen finns på bp 332-334

Skarv 2 47 stoppkodon hittade insprängda genom hela sekvensen
Skarv 3 75 stoppkodon hittade spridda genom hela sekvensen

De tre alternativa splitsningsformerna som hittades av C10orf71-mRNA-sekvensen och platserna stoppar kodon, exoner och Kozak-stället som finns i Splits 1. Splits 1 användes för att analysera och erhålla information om eftersom alla stoppkodoner som hittades i denna splitsningsform hittades i 5'- och 3'-UTR-regionerna av sekvensen. Det fanns tre exoner i Splice 1 med en Kozak-konsensussekvens också i den övergripande sekvensen.

Protein

Den mogna Homo sapiens- homologen av CEFIP- proteinet som kodas av C10orf71 är 1435 aminosyror (aa) lång och väger cirka 156,5 kDa. Denna homolog har en isoelektrisk punkt på 5,94. Området för pH-värden från Homo sapiens till den senast analyserade ortologen , Rhincodon-typer , varierade från 5,94-6,93, med det gradvis ökande allt eftersom det gick senare i divergensen av ortologen.

Arter Längd (aa) Molekylvikt (kDa) Isoelektrisk punkt
Homo sapiens 1 435 156,5 5,94
Gorilla gorilla 1 435 156,2 5,91
Mus muculus 1,412 154,5 5,81
Gallus gallus 1,521 167,7 6.15
Rhincodon typus 1 253 138,8 6,93

Jämförelse av några av de analyserade ortologerna jämfört med Homo sapiens . Orthologerna är ordnade från arter som är närmast släkt med Homo sapiens ortolog till minst närbesläktade (uppifrån respektive nederkant).

Sammansättning av protein

CEFIP förutspås vara ett icke-transmembrant, lösligt protein. Det förutspås vara ett nukleärt protein med 91,3% tillförlitlighet och det är ganska säkert att vara ett nukleärt protein genom hela ortologerna. Det fanns ett positivt laddningskluster i CEFIP-proteinsekvensen, som är lokaliserat från aminosyrorna 1165–1193. Detta kluster var måttligt konserverat under de analyserade ortologerna. Det fanns också ett blandat laddningskluster i Homo sapiens sekvens av detta protein, beläget från aminosyra 750–778, även om detta kluster inte var mycket konserverat genom de analyserade ortologerna. Det fanns också en upprepad sekvens, TASKPPA, belägen vid aminosyrorna 163-169 och 116-1172. Detta protein är också rikt på prolin och serin .

Förutspådd C10orf71-plats i ortologer.
Arter Kärn Cytoplasmatisk Cytoskelett
Homo sapiens 91,3 % 4,3 % 4,3 %
Gorilla gorilla 91,3 % 4,3 % 4,3 %
Mus musculus 82,6 % 13,0 %
Gallus gallus 69,6 % 17,4 % 4,3 %
Rhincodon typus 69,6 % 21,7 %
Denna tecknade serie representerar den grundläggande layouten för CEFIP-proteinet. Det totala proteinet representeras av den orangea rektangeln, DUF4585 representeras av den blå femhörningen, VAC representeras av den gröna ovalen, nukleära lokaliseringssignaler representeras av de grå diamanterna och N-glykosyleringsställena representeras av de röda diamanterna.

Domäner och motiv

En bekräftad domän med okänd funktion (DUF) hittades inom CEFIP-proteinsekvensen, DUF4585. DUF4585 är belägen på Homo sapiens- proteinsekvensen från aminosyra 311–334. DUF4585 var höggradigt konserverad genom hela ortologerna som analyserades. Det fanns också ett litet vakuolärt målinriktningsmotiv (VAC) inom den analyserade proteinsekvensen som spänner över aminosyrorna 543–546.

Proteinstruktur

Det mogna CEFIP-proteinet innehåller nukleära lokaliseringssignaler (NLS), pat4 (RKPK vid aa 382, ​​RPRK vid aa 640, KRRK vid aa 1190) och pat7 (PPWRKPK vid aa 379 och PWRKPKT vid aa 380) med en NLS-poäng på 0,94. En sekundär struktur konstruerades med en konfidensnivå på 6,1 %.

Förutspådd CEFIP-proteinstruktur.

Post-translationella modifieringar

Det fanns sju GlcNAc O-glykosyleringsställen som förutspåddes inom proteinsekvensen påträffad vid aminosyrorna 116, 120, 139, 165, 468, 470 och 844. Det fanns också flera fosforyleringsställen insprängda genom sekvensen. Ett propeptidklyvningsställe förutspåddes vid aminosyra 38. Det fanns tre förutsagda sumoyleringsställen vid aminosyrorna 599, 890 och 1176.

Uttryck

C10orf71 mRNA visade sig vara starkt uttryckt i hjärt- , muskel- och levervävnad (biologi) .

Reglering av uttryck

Det fanns 6 möjliga promotorer i sekvensen. Promoter GXP_6729162 är 1403 bp lång. Denna promotor hade flera transkriptionsfaktorer av intresse inklusive de involverade med myocyter .

Fungera

Det finns lite vetenskaplig information känd om funktionen av CEFIP.

Interagerande proteiner

Det genererades totalt 25 proteiner som förutspåddes interagera med CEFIP ( Homo sapiens ortholog). De flesta av de förutspådda interaktionerna var fysiska interaktioner med CEFIP. Dessa interaktioner upptäcktes genom en mängd olika mekanismer inklusive, men inte begränsat till: affinitetskromatografi , mikroarrayanalys och tandemmasspektrometri bland andra. Se tabellen för detaljer om de interagerande proteinerna i CEFIP.

Interagerande protein Proteinets namn Känd funktion Platsuttryckta eller associerade sjukdomar
C20orf78 Kromosom 20 öppen läsram 78 Okänd Obekräftad
BPIFA2 BPI-vik som innehåller familj A-medlem 2 Spelar en roll i antibakteriell resistens i övre luftvägarna Uttryckt i spottkörtlar
PPIL6 Peptidyl Prolyl Isomerase Like 6 Påskyndar veckningen av proteiner Obekräftad
KIF17 Kinesin familjemedlem 17 Transporterar vesiklar som innehåller NMDA-receptor 2B Uttryckt i mikrotubuli
KRT78 Keratin 78 Bildar cytoplasmatiskt nätverk; kodar för proteiner med mellanliggande filamentdomäner Uttryckt i mellanliggande filament
TBX4 T-box4 transkriptionsfaktor Koda transkriptionsfaktorer involverade i reglering av utvecklingsprocesser; hjälper till med reglering av mesodermdifferentiering; kan spela en roll i lemmönsterbildningen Förknippas med Small Patella Syndrome och ärftlig pulmonell arteriell hypertoni
DNAH8 Dynein Axonemal Heavy Chain 8 tung kedja av ett axonemalt dynein involverat i spermier och respiratoriska flimmerhår motilitet. Associerad med kolkicinresistens och mitokondriekomplex V-brist, nukleär typ 1
TSPAN17 Tetraspanin 17 Förutspått att reglera ADAM10-mognad Obekräftad
C14orf80 Kromosom 14 öppen läsram 80 Okänd Obekräftad
SLC35F4 Solute Carrier Family 35 medlem F4 Lösningstransportör Obekräftad
LHX4 LIM Homeobox 4 Förutspås spela en roll i mognad lungor, utveckling av andningsmekanismer och utveckling av hypofysen Associerad med hypofyshormonbrist, kombinerat 4 och Lhx4=relaterat kombinerat hypofyshormon
FAM53A Familj med sekvenslikhet 53 Medlem A Spelar en roll i neural utveckling Möjligen uttryckt i ventrikelvävnad
GRIK5 Glutamatjonotropisk receptor Kainastyp subenhet 5 Bildar funktionella heteromera kainit-föredragande jonkanaler Förknippas med schizofreni
FADS2 Fettsyradenaturas 2 Reglerar omättnad av fettsyror genom införande av dubbelbindningar mellan definierade cysteiner i fettsyrakedjorna Förknippad med Best Vitelliform Makula Dystrophy
GDF2 Tillväxtdifferentieringsfaktor 2 Reglerar utvecklingen av brosk och ben; differentiering av kolinerga receptorer i CNS Obekräftad
C17orf77 Kromosom 17 öppen läsram 77 Okänd Obekräftad
CFAP45 (CCDC19) Cilia And Flagella Associated Protein 45 Förknippas med cancer i svalget Obekräftad
DCST2 DC-STAMP-domän som innehåller 2 Okänd Obekräftad
CTXN1 Cortexin 1 Förutspås spela en roll i IC- eller EC-signalering av de kortikala neuronerna under utvecklingen av framhjärnan. Obekräftad
C19orf68 Kromosom 19 öppen läsram 68 Okänd Obekräftad
DCAF7 DDB1 och CUL4 associerad faktor 7 Det har visat sig fungera som ett ställningsprotein i kinassignalering. Det har också varit känt för att vara involverat i kraniofacial utveckling Obekräftad
DYRK1A Dubbel specificitet YAK1-relaterat kinas Kan spela en roll i hjärnans utveckling och cellproliferation; nukleärt lokaliserat protein Förknippas med mental retardation, autosomal dominant 7 och mikrocefali
DYRK1B Dubbel specificitet tyrosin-(Y)-fosforyleringsreglerad kinas 1B Spelar en roll i cellcykeln; nukleärt lokaliserat protein Associerad med bukfetma-metaboliskt syndrom 3 och bukfetma-metaboliskt syndrom
FNTA Protein Farnesyltransferas/Geranylgeranyltransferas Typ-1 Subunit Alpha Hjälper till att reglera utvecklingen av neuromuskulära korsningar Obekräftad
FNTB Protein Farnesyltransferas Subunit Beta Katalyserar överföringen av en farnesyldel från farnesyldifosfat till ett cystein Obekräftad

Interagerande proteiner, deras funktion om känd, och eventuella vävnader som de har hittats eller förutspåtts uttrycka i och alla sjukdomar de har associerats med.

Homologer

Paraloger

Det finns för närvarande inga kända paraloger till C10orf71-genen.

Ortologer

C10orf71 är känd för att ha 68 ortologer i olika arter , inklusive primater (11 arter), gnagare (8 arter), Laurasiatheria carnivores (14 arter), placenta däggdjur (38 arter), Sauropsida- fåglar och reptiler (7 arter) och fiskar (11) arter). De mycket konserverade sekvenserna är primärt från primater där identitetsprocenten för dessa arter är >90 %, medan arter som reptiler, fåglar och fiskar hade en identitetsprocent ≤30 %. Se tabellen för ytterligare information om datum för divergens, sekvenslängd och sekvensidentitet och likhet för ortologer. C10orf71 finns inte i prokaryoter , arkéer eller svampar .

Förkortning (för Phylogenetic Tree) Arter Vanligt namn Proteinaccessionsnummer Beräknat datum för avvikelse (MYA) Sekvenslängd (aa) Sekvensidentitet till humant mRNA/protein (%) Sekvenslikhet med humant mRNA/protein (%)
HomS Homo sapiens mänsklig NP_001128668.1 1435 100 100
GorG Gorilla gorilla västra gorilla XP_018889898.1 9.06 1435 98,3 98,7
RhiR Rhinopithecus roxellana Gyllene snubbnäsapa XP_010381152.1 29,44 1435 93,4 95,3
OtoG Otolemur garnettii småörad galago XP_003801705.1 74 1419 74,9 81,5
TupC Tupaia chinensis Kinesisk trädknäppa XP_014439281.1 82 1186 61,5 67,8
MusM Mus musculus husmus NP_001182026.1 90 1412 65,4 74,3
oktD Octodon degus Vanlig degu XP_004647022.1 90 1407 63,3 73,1
HetG Heterocephalus glaber Naken mullvadsråtta XP_004874589.1 90 1411 63,2 73,3
CerS Ceratotherium simum simum Södra vit noshörning XP_004432504.1 96 1436 74 81
OrcO Orcinus späckhuggare späckhuggare XP_004286436 96 1433 72,6 79,4
LoxA Loxodonta Africana Afrikansk buske elefant XP_003408977.1 105 1438 65,5 74,5
SarH Sarcophilus harrisii Tasmansk djävul XP_003755230.2 159 1470 49,0 62,5
GavG Gavialis gangeticus krokodil XP_019358113.1 312 1538 32,8 46,7
TinG Tinamus guttatus Vitstrupig tinamou XP_010216992.1 312 1529 32.4 46,3
PelS Pelodiscus sinensis sköldpadda XP_006118195.1 312 1505 32,0 46,2
GalG Gallus gallus kyckling XP_421655.3 312 1521 30,5 44,7
MelU Melopsittacus böljar papegoja XP_005153970 312 1538 30.3 45,1
OreN Oreochromis niloticus Nilen tilapia XP_019221822 435 661 12,0 18.7
SclF Skleropager formosus Asiatisk arowana XP_018580403 435 3125 11.5 17.9
DanR Danio rerio Zebrafisk XP_005157004.1 435 3591 9.2 16,0
CluH Clupea harengus Atlantisk sill XP_012687674.1 435 3633 9.1 13.8
RhiT Rhincodon typus val haj XP_020385611.1 473 1253 40,0 24.8

Ortologtabell i fallande ordning till senaste ortolog divergerad. Den här tabellen jämför de analyserade ortologerna, deras artnamn, vanliga namn, datum för avvikelse från Homo sapiens ortholog (MYA), längd (aa) och procentandel av likhet och identitet.

Fylogeni

Ett fylogeniskt träd skapat av ortologerna. De är grupperade i liknande djurarter. Grenarna är märkta med koden på fyra bokstäver som de fått, fullständigt artnamn och vanliga namn på dessa koder finns i tabellen ovan .

Ett fylogenetiskt träd konstruerades för ortologerna som analyserades i jämförelse med Homo sapiens. Med arten av senaste divergens är Rhincodon-typer, eller valhajen.

Evolutionshastighet

C10orf71s divergenshastighet var snabbare än för fibrinogen eller Cytokrom C .

D e korrigerade % av divergensen jämfört med datumet för divergensen för ortologerna. Ortologpunkterna på grafen kan identifieras genom att hänvisa till tabellen ovan. C10orf71 (blå linje) verkar ha divergerat snabbare än både fibrinogener (röd linje) och Cytokrom C (grön linje). Den korrekta % av divergensen beräknades med hjälp av ekvationen m/100 = –ln(1- n/100) där m= totalt antal aminosyraförändringar som har inträffat i ett 100-aminosyrors segment av ett protein och n=observerat antal aminosyraförändringar per 100 rester.

Klinisk signifikans

Det fanns ett mikroarrayexperiment som också visade bevis för att C10orf71s uttryck sänktes i skelettmuskelvävnader som upplevde sepsis . Det fanns klinisk signifikans i uttrycksnivån av C10orf71 i ett experiment som tittade på de med myotonisk dystrofi . En mikroarrayanalys gav resultat som visade att C10orf71s uttrycksnivå minskade även hos de med prostatacancer.