ORF1ab

Replika
polyproteinidentifierare
Organism SARS-CoV
Symbol rep
UniProt P0C6X7
Söka efter
Strukturer Schweizisk modell
Domäner InterPro
Replika
polyproteinidentifierare
Organism SARS-CoV-2
Symbol rep
UniProt P0DTD1
Söka efter
Strukturer Schweizisk modell
Domäner InterPro

ORF1ab (även ORF1a/b ) hänvisar kollektivt till två öppna läsramar (ORF), ORF1a och ORF1b , som är konserverade i genomen av nidovirus , en grupp av virus som inkluderar koronavirus . Generna uttrycker stora polyproteiner som genomgår proteolys för att bilda flera icke-strukturella proteiner med olika funktioner i den virala livscykeln , inklusive proteaser och komponenterna i replikas-transkriptaskomplexet (RTC). Tillsammans kallas de två ORF ibland som replikasgenen . De är relaterade av en programmerad ribosomal ramförskjutning som gör att ribosomen kan fortsätta att translatera förbi stoppkodonet i slutet av ORF1a, i en -1 läsram . De resulterande polyproteinerna är kända som pp1a och pp1ab .

Uttryck

Genomisk information
SARS-CoV-2 genome.svg
Genomisk organisation av isolatet Wuhan-Hu-1, det tidigaste sekvenserade provet av SARS-CoV-2, som indikerar platsen för ORF1a och ORF1b
NCBI genom ID
Genomstorlek 29 903 baser
År för färdigställande 2020
( UCSC )

ORF1a är den första öppna läsramen vid 5'-änden av genomet. Tillsammans upptar ORF1ab cirka två tredjedelar av genomet, med den återstående tredjedelen i 3'-änden som kodar för de strukturella proteinerna och accessoriska proteinerna . Det translateras från ett 5'-kapslat RNA genom cap-beroende translation . Nidovirus har ett komplext system av diskontinuerlig subgenomisk RNA- produktion för att möjliggöra uttryck av gener i deras relativt stora RNA-genom (vanligtvis 27-32 kb för coronavirus), men ORF1ab översätts direkt från det genomiska RNA:t. ORF1ab-sekvenser har observerats i icke-kanoniska subgenomiska RNA, även om deras funktionella betydelse är oklar.

En programmerad ribosomal ramförskjutning tillåter läsning genom stoppkodonet som avslutar ORF1a att fortsätta i en -1 läsram , vilket producerar det längre polyproteinet pp1ab. Ramförskjutningen sker vid en hal sekvens som följs av en sekundär struktur för pseudoknot- RNA . Detta har uppmätts till mellan 20-50% effektivitet för murint coronavirus , eller 45-70% i SARS-CoV-2, vilket ger en stökiometri på ungefär 1,5 till 2 gånger så mycket pp1a som pp1ab-protein uttryckt.

Bearbetning

Överst: Organisation av coronavirusets genom, illustrerar icke-strukturella proteiner inom ORF1a och ORF1b. Mitten: Domänorganisation av nsp14 ( exonukleas och metyltransferas ). Nederst: Komponenter i koronavirus -replikas-transkriptaskomplexet .

Polyproteinerna pp1a och pp1ab innehåller cirka 13 till 17 icke - strukturella proteiner . De genomgår autoproteolys för att frigöra de icke - strukturella proteinerna på grund av verkan av interna cysteinproteasdomäner .

I coronavirus finns det totalt 16 icke-strukturella proteiner; pp1a-proteinet innehåller icke-strukturella proteiner nsp1-11 och pp1ab-proteinet innehåller nsp1-10 och nsp12-16. Proteolytisk bearbetning utförs av två proteaser: den papainliknande proteasproteindomänen belägen i multidomänproteinet nsp3 klyver upp till nsp4, och 3CL-proteaset (även känt som huvudproteaset, nsp5) utför de återstående klyvningarna av nsp5 genom polyproteinet C -terminal . Proteinerna nsp12-16, de C-terminala komponenterna i pp1ab-polyproteinet, innehåller de enzymatiska kärnaktiviteterna som är nödvändiga för viral replikation . Efter proteolytisk bearbetning samlas flera av de icke-strukturella proteinerna till ett stort proteinkomplex känt som replikas-transkriptaskomplexet (RTC) som utför genomreplikation och transkription .

Komponenter

Kärnreplikadomäner

Fylogenetiska relationer mellan nidovirus och deras pp1ab- proteindomänorganisation , med konserverade domäner markerade. NendoU representerar endoribonukleaset och 3CLpro representerar det huvudsakliga 3C-liknande proteaset .

En uppsättning av fem konserverade "kärnreplikas" -proteindomäner är närvarande i alla nidoviruslinjer ( arterivirus , mesonivirus , ronivirus och koronavirus ): från ORF1a, huvudproteaset flankerat på vardera änden av transmembrandomäner ; och från ORF1b, en nukleotidyltransferasdomän känd som NiRAN, RNA-beroende RNA-polymeras (RdRp), en zinkbindande domän och ett helikas . (Detta anses ibland vara sju domäner, räknar transmembranregionerna separat.) Dessutom finns en endoribonukleasdomän i alla nidovirus som infekterar ryggradsdjursvärdar . Arterivirus, som har mindre genom än de andra nidoviruslinjerna, saknar också metyltransferaser såväl som ett korrekturläsande exoribonukleas , en domän som är konserverad i nidovirus med större genom. Denna korrekturläsningsfunktion tros vara nödvändig för tillräcklig trohet för att replikera stora RNA-genom, men kan också spela ytterligare roller i vissa virus.

Coronavirus

I coronavirus innehåller pp1a och pp1ab tillsammans sexton icke-strukturella proteiner, som har följande funktioner:

Icke-strukturella proteiner härledda från coronavirus pp1a och pp1ab proteiner
Icke-strukturellt protein Fungera
icke-strukturellt protein 1 Cellulär mRNA- nedbrytning, värdcellstranslationshämning , interferoninhibering ; finns inte i Gammacoronavirus
icke-strukturellt protein 2 Okänd; binder prohibitin
icke-strukturellt protein 3 Multidomänprotein med en eller två papainliknande proteasdomäner för polyproteinbearbetning ; interferonantagonist; flera andra roller
icke-strukturellt protein 4 Dubbelmembran vesikelbildning _
icke-strukturellt protein 5 3CL-proteas för polyproteinbearbetning; interferon-hämning
icke-strukturellt protein 6 Dubbelmembran vesikelbildning _
icke-strukturellt protein 7 Kofaktor och processivitetsfaktor för RdRp ; bildar komplex med nsp8 och nsp12
icke-strukturellt protein 8 Kofaktor och processivitetsfaktor för RdRp ; bildar komplex med nsp7 och nsp12
icke-strukturellt protein 9 Enkelsträngad RNA-bindning
icke-strukturellt protein 10 Kofaktor för nsp14 och nsp16
icke-strukturellt protein 11 Okänd
icke-strukturellt protein 12 RNA-beroende RNA-polymeras (RdRp) och nukleotidyltransferas
icke-strukturellt protein 13 Helikas och RNA trifosfatas
icke-strukturellt protein 14 Korrekturläsning av exonukleas , bildning av RNA-kapsel, guanosin N7- metyltransferas
icke-strukturellt protein 15 Endoribonukleas , immunflyktsfunktion _
icke-strukturellt protein 16 Ribos 2'-O- metyltransferas , RNA-kapselbildning

Evolution

Strukturen och organisationen av genomet, inklusive ORF1a, ORF1b, och ramförskjutningen som separerar dem, bevaras bland nidovirus. Vissa "icke-kanoniska" nidovirusstrukturer har beskrivits, huvudsakligen involverade genfusioner . Det största kända nidoviruset, planärt sekretoriskt cell nidovirus (PSCNV), med ett 41 kb genom, har en icke-kanonisk genomstruktur i vilken ORF1a, ORF1b och nedströms ORF innehållande strukturproteiner är sammansmälta och uttrycks som en enda stor ORF som kodar för ett polyprotein av över 13 000 aminosyror . I dessa icke-kanoniska genom kan andra ramförskjutningsplatser eller av stoppkodon användas för att reglera stökiometrin hos virala proteiner.

Nidovirus varierar stort i genomstorlek, från arterivirus med typiskt 12-15 kb genom till coronavirus på 27-32 kb. Deras evolutionära historia har varit av forskningsintresse för att förstå replikationen av mycket stora RNA-genom trots den relativt lågtrogna replikationsmekanismen för det virala RNA-beroende RNA-polymeraset (RdRp). De större nidovirusgenomen (över cirka 20 kb) kodar för ett korrekturläsande exoribonukleas (nsp14 i coronavirus) som tros vara nödvändigt för replikationstrohet.

Bland koronavirus är ORF1ab mer konserverat än 3' ORF som kodar för strukturella proteiner . Under hela COVID-19-pandemin har genomet av SARS-CoV-2-virus sekvenserats många gånger , vilket resulterat i identifiering av tusentals distinkta varianter . I en analys från Världshälsoorganisationen från juli 2020 var ORF1ab den mest muterade genen, följt av S-genen som kodar för spikeproteinet . Det vanligaste muterade proteinet inom ORF1ab var papainliknande proteas (nsp3), och den enskilt vanligaste missense-mutationen var i RNA-beroende RNA-polymeras . Vissa PCR- tester som detekterar COVID-19 analyserar provet för ORF1ab-genen, bland annat.