Phred (programvara)
Phred är ett datorprogram för basanrop , det vill säga identifiera en nukleobassekvens från fluorescens-"spår"-data som genereras av en automatiserad DNA-sekvenserare som använder elektrofores och 4-fluorescerande färgmetod. När den ursprungligen utvecklades producerade Phred betydligt färre fel i de undersökta datamängderna än andra metoder, i genomsnitt 40–50 % färre fel. Phred-kvalitetspoäng har blivit allmänt accepterade för att karakterisera kvaliteten på DNA-sekvenser och kan användas för att jämföra effektiviteten hos olika sekvenseringsmetoder.
Bakgrund
DNA - sekvensering av fluorescerande färgämne är en molekylärbiologisk teknik som involverar märkning av enkelsträngade DNA - sekvenser av varierande längd med 4 fluorescerande färgämnen (motsvarande 4 olika baser som används i DNA) och därefter separering av DNA-sekvenserna med "plattagel" - eller kapillär - elektroforesmetod (se DNA-sekvensering ). Elektroforeskörningen övervakas av en CCD på DNA-sekvenseraren och detta producerar tids-"spårdata" (eller " kromatogram ") av de fluorescerande "topparna" som passerade CCD-punkten. Genom att undersöka fluorescenstopparna i spårdata kan vi bestämma ordningen för individuella baser ( nukleobas ) i DNA :t . Eftersom intensiteten, formen och platsen för en fluorescenstopp inte alltid är konsekventa eller entydiga, är det ibland svårt eller tidskrävande att bestämma (eller "kalla") de korrekta baserna för topparna exakt om det görs manuellt.
Automatiserade DNA-sekvenseringstekniker har revolutionerat området molekylärbiologi – genererat stora mängder DNA - sekvensdata. Emellertid produceras sekvensdata med en betydligt högre hastighet än vad som kan bearbetas manuellt (dvs. tolka spårdata för att producera sekvensdata), vilket skapar en flaskhals. För att ta bort flaskhalsen behövs både automatiserad programvara som kan snabba upp bearbetningen med förbättrad noggrannhet och ett tillförlitligt mått på noggrannheten. För att möta detta behov har många program utvecklats. Ett sådant program är Phred.
Historia
Phred föddes ursprungligen i början av 1990-talet av Phil Green , då professor vid Washington University i St. Louis . LaDeana Hillier , Michael Wendl , David Ficenec, Tim Gleeson, Alan Blanchard och Richard Mott bidrog också till kodbasen och algoritmen. Green flyttade till University of Washington i mitten av 1990-talet, varefter utvecklingen i första hand sköttes av honom själv och Brent Ewing. Phred spelade en anmärkningsvärd roll i Human Genome Project , där stora mängder sekvensdata bearbetades av automatiserade skript. Det var vid den tiden det mest använda basanropsprogrammet av både akademiska och kommersiella DNA-sekvenseringslaboratorier på grund av dess höga basanropsnoggrannhet . Phred distribueras kommersiellt av CodonCode Corporation och används för att utföra "Call bases"-funktionen i programmet CodonCode Aligner . Det används också av MacVector -plugin Assembler.
Metoder
Phred använder ett fyrfasförfarande som beskrivs av Ewing et al. för att bestämma en sekvens av basanrop från den bearbetade DNA-sekvensspårningen:
- Förutspådda toppplatser bestäms, baserat på antagandet att fragment är relativt jämnt fördelade, i genomsnitt, i de flesta regioner av gelén, för att bestämma det korrekta antalet baser och deras idealiserade jämnt fördelade platser i regioner där topparna inte är väl upplösta, bullriga eller förskjutna (som vid kompressioner)
- Observerade toppar identifieras i spåret
- Observerade toppar matchas till de förutsagda toppplatserna, utelämnar vissa toppar och delar upp andra; eftersom varje observerad topp kommer från en specifik array och därmed är associerad med 1 av de 4 baserna (A, G, T eller C), bestämmer den ordnade listan över matchade observerade toppar en bassekvens för spåret.
- De omatchade observerade topparna kontrolleras för varje topp som verkar representera en bas men som inte kunde tilldelas en förutsagd topp i den tredje fasen och om den hittas infogas motsvarande bas i lässekvensen.
Hela proceduren är snabb och tar vanligtvis mindre än en halv sekund per spår. Resultaten kan matas ut som en PHD-fil, som innehåller basdata som tripplar bestående av basanropet, kvalitet och position.
Ansökningar
Phred används ofta tillsammans med ett annat program som heter Phrap , som är ett program för DNA-sekvensmontering. Phrap användes rutinmässigt i några av de största sekvenseringsprojekten i Human Genome Sequencing Project och är för närvarande ett av de mest använda programmen för sammansättning av DNA-sekvenser inom bioteknikindustrin. Phrap använder Phred-kvalitetspoäng för att bestämma mycket exakta konsensussekvenser och för att uppskatta kvaliteten på konsensussekvenserna. Phrap använder också Phred-kvalitetspoäng för att uppskatta om avvikelser mellan två överlappande sekvenser är mer sannolikt att uppstå från slumpmässiga fel eller från olika kopior av en upprepad sekvens.
- ^ Ewing B, Hillier L , Wendl MC , Grön P. (1998): Bas-anrop av automatiserade sequencer spår genom att använda phred. I. Noggrannhetsbedömning. Genome Res. 8(3):175–185. PMID 9521921 hela artikeln
- ^ Ewing, Brent; Green, Phil (1998-03-01). "Basanrop av automatiserade sequencer-spår med hjälp av Phred. II. Felsannolikheter" . Genomforskning . Cold Spring Harbor Laboratory. 8 (3): 186–194. doi : 10.1101/gr.8.3.186 . ISSN 1088-9051 . PMID 9521922 .
- ^ Richterich P. (1998): Uppskattning av fel i "rå" DNA-sekvenser: en valideringsstudie. Genome Res. 8(3):251–259. PMID 9521928
- ^ Grön, Phil; Ewing, Brent. "PHRED-dokumentation" . Laboratoriet av Phil Green . University of Washington . Hämtad 30 september 2021 .
externa länkar
- Laboratory of Phil Green Phraps hemsida.