PatternHunter
PatternHunter är en kommersiellt tillgänglig programvara för homologisökinstrument som använder sekvensanpassningstekniker . Det utvecklades ursprungligen år 2002 av tre forskare: Bin Ma, John Tramp och Ming Li. Dessa forskare drevs av önskan att lösa det problem som många forskare möter under studier som involverar genomik och proteomik . Dessa forskare insåg att sådana studier i hög grad förlitade sig på homologistudier som etablerade korta frömatchningar som sedan förlängdes. Att beskriva homologa gener var en viktig del av de flesta evolutionära studier och var avgörande för förståelsen av utvecklingen av genfamiljer, förhållandet mellan domäner och familjer. Homologa gener kunde endast studeras effektivt med hjälp av sökverktyg som etablerade liknande delar eller lokal placering mellan två proteiner eller nukleinsyrasekvenser . Homologi kvantifierades genom poäng erhållna från matchande sekvenser, "felmatchning och gappoäng".
Utveckling
I jämförande genomik , till exempel, är det nödvändigt att jämföra enorma kromosomer som de som finns i det mänskliga genomet. Emellertid introducerar den enorma expansionen av genomiska data ett problem i de tillgängliga metoderna för att utföra homologisökningar. Till exempel, förstoring av fröstorleken minskar känsligheten medan minskning av fröstorleken minskar hastigheten på beräkningarna. Flera sekvensanpassningsprogram har utvecklats för att bestämma homologi mellan gener. Dessa inkluderar FASTA , BLAST -familjen, QUASAR, MUMmer , SENSEI, SIM och REPuter. De använder mestadels Smith-Waterman alignment-teknik, som jämför baser med andra baser, men är för långsam. BLAST gör en förbättring av denna teknik genom att skapa korta, exakta frömatchningar som den senare sammanfogar för att bilda längre linjer. Men när man har att göra med långa sekvenser är de ovan nämnda teknikerna extremt tröga och kräver avsevärda minnesstorlekar. SENSEI är dock mer effektiv än de andra metoderna, men är inkompetent i andra former av uppriktning eftersom dess styrka ligger i att hantera ouppriktade uppriktningar. Kvaliteten på produktionen från Megablast är å andra sidan av dålig kvalitet och anpassar sig inte bra till stora sekvenser. Tekniker som MUmmer och QUASAR använder suffixträd, som är tänkta att hantera exakta matchningar. Dessa metoder kan dock endast tillämpas på jämförelse av sekvenser som uppvisar förhöjda likheter. Alla ovan nämnda problem kräver utveckling av ett snabbt tillförlitligt verktyg som kan hantera alla typer av sekvenser effektivt utan att förbruka för mycket resurser i en dator.
Närma sig
PatternHunter använder många frön (små söksträngar) med optimala intervall mellan dem. Sökningar som använder frön är extremt snabba eftersom de bara bestämmer homologi på platser där träffar etableras. Känsligheten hos en söksträng påverkas i hög grad av mängden utrymme mellan intilliggande strängar. Stora frön kan inte hitta isolerade homologier, medan små genererar många godtyckliga träffar som fördröjer beräkningen. PatternHunter uppnår en delikat balans i detta område genom att tillhandahålla optimalt avstånd mellan söksträngar. Den använder alternativa k ( k = 11) bokstäver som frön i motsats till BLAST, som använder på varandra följande k bokstäver som frön. Det första steget i PatternHunter-analysen innebär en filtreringsfas där programmet jagar matcher i k alternerande punkter enligt det mest fördelaktiga mönstret. Det andra steget är inriktningsfasen, som är identisk med BLAST. Dessutom är det möjligt att använda mer än ett frö samtidigt med PatternHunter. Detta höjer verktygets känslighet utan att störa dess hastighet.
Fart
PatternHunter tar kort tid att analysera alla typer av sekvenser. På en modern dator kan det ta några sekunder att hantera prokaryota genom, minuter att bearbeta Arabidopsis thaliana- sekvenser och flera timmar att bearbeta en mänsklig kromosom. Jämfört med andra verktyg uppvisar PatternHunter hastigheter som är ungefär hundra gånger snabbare än BLAST och Mega BLAST. Dessa hastigheter är 3000 gånger de som uppnås med en Smith-Waterman- algoritm. Dessutom har programmet ett användarvänligt gränssnitt som gör att man kan anpassa sökparametrarna.
Känslighet
När det gäller känslighet är det möjligt att uppnå den optimala känsligheten med PatternHunter samtidigt som man behåller samma hastighet som en konventionell BLAST-sökning.
Specifikationer
Designen av PatternHunter använder Java -teknik. Följaktligen körs programmet smidigt när det installeras i alla Java 1.4-miljöer.
Framtida framsteg
Homologisökning är en mycket lång procedur som kräver mycket tid. Det finns fortfarande utmaningar att hantera DNA-DNA-sökningar såväl som översatta DNA-proteinsökningar på grund av databasernas enorma storlek och den lilla frågan som används. PatternHunter har förbättrats till en uppgraderad PatternHunter II-version, som påskyndar DNA-proteinsökningar hundra gånger utan att ändra känsligheten. Det finns dock planer på att förbättra PatternHunter för att uppnå den höga känsligheten hos Smith - Waterman-verktyget samtidigt som man får BLAST-tempo. En roman översatt PatternHunter som har för avsikt att påskynda tBLASTx. är också i utvecklingsstadiet.