ORF1ab
Replika | |||||||
---|---|---|---|---|---|---|---|
polyproteinidentifierare | |||||||
Organism | |||||||
Symbol | rep | ||||||
UniProt | P0C6X7 | ||||||
|
Replika | |||||||
---|---|---|---|---|---|---|---|
polyproteinidentifierare | |||||||
Organism | |||||||
Symbol | rep | ||||||
UniProt | P0DTD1 | ||||||
|
ORF1ab (även ORF1a/b ) hänvisar kollektivt till två öppna läsramar (ORF), ORF1a och ORF1b , som är konserverade i genomen av nidovirus , en grupp av virus som inkluderar koronavirus . Generna uttrycker stora polyproteiner som genomgår proteolys för att bilda flera icke-strukturella proteiner med olika funktioner i den virala livscykeln , inklusive proteaser och komponenterna i replikas-transkriptaskomplexet (RTC). Tillsammans kallas de två ORF ibland som replikasgenen . De är relaterade av en programmerad ribosomal ramförskjutning som gör att ribosomen kan fortsätta att translatera förbi stoppkodonet i slutet av ORF1a, i en -1 läsram . De resulterande polyproteinerna är kända som pp1a och pp1ab .
Uttryck
NCBI genom ID | |
---|---|
Genomstorlek | 29 903 baser |
År för färdigställande | 2020 |
( UCSC ) |
ORF1a är den första öppna läsramen vid 5'-änden av genomet. Tillsammans upptar ORF1ab cirka två tredjedelar av genomet, med den återstående tredjedelen i 3'-änden som kodar för de strukturella proteinerna och accessoriska proteinerna . Det translateras från ett 5'-kapslat RNA genom cap-beroende translation . Nidovirus har ett komplext system av diskontinuerlig subgenomisk RNA- produktion för att möjliggöra uttryck av gener i deras relativt stora RNA-genom (vanligtvis 27-32 kb för coronavirus), men ORF1ab översätts direkt från det genomiska RNA:t. ORF1ab-sekvenser har observerats i icke-kanoniska subgenomiska RNA, även om deras funktionella betydelse är oklar.
En programmerad ribosomal ramförskjutning tillåter läsning genom stoppkodonet som avslutar ORF1a att fortsätta i en -1 läsram , vilket producerar det längre polyproteinet pp1ab. Ramförskjutningen sker vid en hal sekvens som följs av en sekundär struktur för pseudoknot- RNA . Detta har uppmätts till mellan 20-50% effektivitet för murint coronavirus , eller 45-70% i SARS-CoV-2, vilket ger en stökiometri på ungefär 1,5 till 2 gånger så mycket pp1a som pp1ab-protein uttryckt.
Bearbetning
Polyproteinerna pp1a och pp1ab innehåller cirka 13 till 17 icke - strukturella proteiner . De genomgår autoproteolys för att frigöra de icke - strukturella proteinerna på grund av verkan av interna cysteinproteasdomäner .
I coronavirus finns det totalt 16 icke-strukturella proteiner; pp1a-proteinet innehåller icke-strukturella proteiner nsp1-11 och pp1ab-proteinet innehåller nsp1-10 och nsp12-16. Proteolytisk bearbetning utförs av två proteaser: den papainliknande proteasproteindomänen belägen i multidomänproteinet nsp3 klyver upp till nsp4, och 3CL-proteaset (även känt som huvudproteaset, nsp5) utför de återstående klyvningarna av nsp5 genom polyproteinet C -terminal . Proteinerna nsp12-16, de C-terminala komponenterna i pp1ab-polyproteinet, innehåller de enzymatiska kärnaktiviteterna som är nödvändiga för viral replikation . Efter proteolytisk bearbetning samlas flera av de icke-strukturella proteinerna till ett stort proteinkomplex känt som replikas-transkriptaskomplexet (RTC) som utför genomreplikation och transkription .
Komponenter
Kärnreplikadomäner
En uppsättning av fem konserverade "kärnreplikas" -proteindomäner är närvarande i alla nidoviruslinjer ( arterivirus , mesonivirus , ronivirus och koronavirus ): från ORF1a, huvudproteaset flankerat på vardera änden av transmembrandomäner ; och från ORF1b, en nukleotidyltransferasdomän känd som NiRAN, RNA-beroende RNA-polymeras (RdRp), en zinkbindande domän och ett helikas . (Detta anses ibland vara sju domäner, räknar transmembranregionerna separat.) Dessutom finns en endoribonukleasdomän i alla nidovirus som infekterar ryggradsdjursvärdar . Arterivirus, som har mindre genom än de andra nidoviruslinjerna, saknar också metyltransferaser såväl som ett korrekturläsande exoribonukleas , en domän som är konserverad i nidovirus med större genom. Denna korrekturläsningsfunktion tros vara nödvändig för tillräcklig trohet för att replikera stora RNA-genom, men kan också spela ytterligare roller i vissa virus.
I coronavirus innehåller pp1a och pp1ab tillsammans sexton icke-strukturella proteiner, som har följande funktioner:
Icke-strukturellt protein | Fungera |
---|---|
icke-strukturellt protein 1 | Cellulär mRNA- nedbrytning, värdcellstranslationshämning , interferoninhibering ; finns inte i Gammacoronavirus |
icke-strukturellt protein 2 | Okänd; binder prohibitin |
icke-strukturellt protein 3 | Multidomänprotein med en eller två papainliknande proteasdomäner för polyproteinbearbetning ; interferonantagonist; flera andra roller |
icke-strukturellt protein 4 | Dubbelmembran vesikelbildning _ |
icke-strukturellt protein 5 | 3CL-proteas för polyproteinbearbetning; interferon-hämning |
icke-strukturellt protein 6 | Dubbelmembran vesikelbildning _ |
icke-strukturellt protein 7 | Kofaktor och processivitetsfaktor för RdRp ; bildar komplex med nsp8 och nsp12 |
icke-strukturellt protein 8 | Kofaktor och processivitetsfaktor för RdRp ; bildar komplex med nsp7 och nsp12 |
icke-strukturellt protein 9 | Enkelsträngad RNA-bindning |
icke-strukturellt protein 10 | Kofaktor för nsp14 och nsp16 |
icke-strukturellt protein 11 | Okänd |
icke-strukturellt protein 12 | RNA-beroende RNA-polymeras (RdRp) och nukleotidyltransferas |
icke-strukturellt protein 13 | Helikas och RNA trifosfatas |
icke-strukturellt protein 14 | Korrekturläsning av exonukleas , bildning av RNA-kapsel, guanosin N7- metyltransferas |
icke-strukturellt protein 15 | Endoribonukleas , immunflyktsfunktion _ |
icke-strukturellt protein 16 | Ribos 2'-O- metyltransferas , RNA-kapselbildning |
Evolution
Strukturen och organisationen av genomet, inklusive ORF1a, ORF1b, och ramförskjutningen som separerar dem, bevaras bland nidovirus. Vissa "icke-kanoniska" nidovirusstrukturer har beskrivits, huvudsakligen involverade genfusioner . Det största kända nidoviruset, planärt sekretoriskt cell nidovirus (PSCNV), med ett 41 kb genom, har en icke-kanonisk genomstruktur i vilken ORF1a, ORF1b och nedströms ORF innehållande strukturproteiner är sammansmälta och uttrycks som en enda stor ORF som kodar för ett polyprotein av över 13 000 aminosyror . I dessa icke-kanoniska genom kan andra ramförskjutningsplatser eller av stoppkodon användas för att reglera stökiometrin hos virala proteiner.
Nidovirus varierar stort i genomstorlek, från arterivirus med typiskt 12-15 kb genom till coronavirus på 27-32 kb. Deras evolutionära historia har varit av forskningsintresse för att förstå replikationen av mycket stora RNA-genom trots den relativt lågtrogna replikationsmekanismen för det virala RNA-beroende RNA-polymeraset (RdRp). De större nidovirusgenomen (över cirka 20 kb) kodar för ett korrekturläsande exoribonukleas (nsp14 i coronavirus) som tros vara nödvändigt för replikationstrohet.
Bland koronavirus är ORF1ab mer konserverat än 3' ORF som kodar för strukturella proteiner . Under hela COVID-19-pandemin har genomet av SARS-CoV-2-virus sekvenserats många gånger , vilket resulterat i identifiering av tusentals distinkta varianter . I en analys från Världshälsoorganisationen från juli 2020 var ORF1ab den mest muterade genen, följt av S-genen som kodar för spikeproteinet . Det vanligaste muterade proteinet inom ORF1ab var papainliknande proteas (nsp3), och den enskilt vanligaste missense-mutationen var i RNA-beroende RNA-polymeras . Vissa PCR- tester som detekterar COVID-19 analyserar provet för ORF1ab-genen, bland annat.