Lista över programvara för sekvensjustering

Denna lista över sekvensanpassningsprogram är en sammanställning av mjukvaruverktyg och webbportaler som används i parvis sekvensanpassning och multipelsekvensanpassning . Se programvara för strukturell anpassning för strukturell anpassning av proteiner.

Endast databassökning

namn Beskrivning Sekvenstyp* Författare År
KUL Lokal sökning med snabb k-tuple-heuristik (Basic Local Alignment Search Tool) Både Altschul SF , Gish W , Miller W , Myers EW , Lipman DJ 1990
HPC-BLAST NCBI-kompatibel multinod- och multicore BLAST-omslag. Distribuerad med den senaste versionen av BLAST, underlättar detta omslag parallellisering av algoritmen på moderna hybridarkitekturer med många noder och många kärnor inom varje nod. Protein Burdyshaw CE, Sawyer S, Horton MD, Brook RG, Rekapalli B 2017
CS-BLAST Sekvenskontextspecifik BLAST, känsligare än BLAST, FASTA och SSEARCH. Positionsspecifik iterativ version CSI-BLAST känsligare än PSI-BLAST Protein Angermueller C, Biegert A, Soeding J 2013
CUDASW++ GPU-accelererad Smith Waterman-algoritm för flera delade värd-GPU:er Protein Liu Y, Maskell DL och Schmidt B 2009/2010
DIAMANT BLASTX och BLASTP aligner baserad på dubbel indexering Protein Buchfink B, Xie C, Huson DH, Reuter K, Drost HG 2015/2021
FASTA Lokal sökning med snabb k -tupel heuristik, långsammare men känsligare än BLAST Både
GGSEARCH, GLSEARCH Global:Global (GG), Global:Local (GL) anpassning till statistik Protein
Genomtrollkarl Programvara för ultrasnabb lokal DNA-sekvensmotivsökning och parvis anpassning för NGS-data (FASTA, FASTQ). DNA Hepperle D (www.sequentix.de) 2020
Genoogle Genoogle använder indexerings- och parallellbearbetningstekniker för att söka efter DNA- och proteinsekvenser. Den är utvecklad i Java och öppen källkod. Både Albrecht F 2015
HMMER Lokal och global sökning med profilen Hidden Markov-modeller, känsligare än PSI-BLAST Både Durbin R , Eddy SR , Krogh A , Mitchison G 1998
HH-svit Parvis jämförelse av profil Hidden Markov-modeller; väldigt känslig Protein Söding J 2005/2012
IDF Omvänd dokumentfrekvens Både
Infernalisk Profil SCFG- sökning RNA Eddy S
KLAST Högpresterande sökverktyg för sekvenslikhet för allmänna ändamål Både 2009/2014
LAMBDA Högpresterande lokal aligner kompatibel med BLAST, men mycket snabbare; stöder SAM/BAM Protein Hannes Hauswedell, Jochen Singer, Knut Reinert 2014
MMseqs2 Programsvit för att söka och gruppera enorma sekvensuppsättningar. Liknande känslighet för BLAST och PSI-BLAST men storleksordningar snabbare Protein Steinegger M, Mirdita M, Galiez C, Söding J 2017
ANVÄNDASÖKNING Ultrasnabbt sekvensanalysverktyg Både   Edgar, RC (2010). "Sök och gruppera storleksordningar snabbare än BLAST" . Bioinformatik . 26 (19): 2460–2461. doi : 10.1093/bioinformatics/btq461 . PMID 20709691 . offentliggörande 2010
OSVALD OpenCL Smith-Waterman på Alteras FPGA för stora proteindatabaser Protein Rucci E, García C, Botella G, De Giusti A, Naiouf M, Prieto-Matías M 2016
parasail Snabb Smith-Waterman-sökning med SIMD-parallellisering Både Dagligen J 2015
PSI-BLAST Positionsspecifik iterativ BLAST, lokal sökning med positionsspecifika poängmatriser , mycket känsligare än BLAST Protein Altschul SF , Madden TL, Schäffer AA, Zhang J, Zhang Z, Miller W , Lipman DJ 1997
PSI-sökning Kombinera Smith-Waterman-sökalgoritmen med PSI-BLAST- profilkonstruktionsstrategin för att hitta avlägset relaterade proteinsekvenser och förhindra homologa överextensionsfel. Protein Li W, McWilliam H, Goujon M, Cowley A, Lopez R, Pearson WR 2012
R&R Retrieve and Relate (R&R) är en högpresterande men ändå känslig sökmotor för flera databaser, som kan söka parallellt genom DNA-, RNA- och proteinsekvenser. Både 2019
ScalaBLAST Mycket parallell skalbar BLAST Både Oehmen et al. 2011
Sequilab Länka och profilera sekvensanpassningsdata från NCBI-BLAST-resultat med större sekvensanalysservrar/tjänster Nukleotid, peptid 2010
SAM Lokal och global sökning med profilen Hidden Markov-modeller, känsligare än PSI-BLAST Både Karplus K , Krogh A 1999
SÖK Smith-Waterman-sökning, långsammare men känsligare än FASTA Både
SWAPHI Första parallelliserade algoritmen som använder den framväxande Intel Xeon Phis för att accelerera Smith-Waterman proteindatabassökning Protein Liu Y och Schmidt B 2014
SWAPHI-LS Första parallella Smith-Waterman-algoritmen som utnyttjar Intel Xeon Phi-kluster för att påskynda anpassningen av långa DNA-sekvenser DNA Liu Y, Tran TT, Lauenroth F, Schmidt B 2014
SIMM Smith-Waterman implementering för Intel Multicore och Manycore arkitekturer Protein Rucci E, García C, Botella G, De Giusti A, Naiouf M och Prieto-Matías M 2015
SWIMM2.0 Förbättrad Smith-Waterman på Intels multicore- och Manycore-arkitekturer baserade på AVX-512 vektortillägg Protein Rucci E, García C, Botella G, De Giusti A, Naiouf M och Prieto-Matías M 2018
HÅRT SLAG Snabb Smith-Waterman-sökning med SIMD-parallellisering Både Rognes T 2011

* Sekvenstyp: protein eller nukleotid

Parvis inriktning

namn Beskrivning Sekvenstyp* Inriktningstyp** Författare År
ACANA Snabb heuristisk ankarbaserad parvis inriktning Både Både Huang, Umbach, Li 2005
AlignMe Inriktningar för membranproteinsekvenser Protein Både M. Stamm, K. Khafizov, R. Staritzbichler, LR Forrest 2013
ALLALIGN För DNA-, RNA- och proteinmolekyler upp till 32MB, justerar alla sekvenser av storlek K eller större. Liknande justeringar grupperas tillsammans för analys. Automatiskt repetitivt sekvensfilter. Både Lokal E. Wachtel 2017
Bioconductor Biostrings::pairwiseAlignment Dynamisk programmering Både Båda + Slutfri P. Aboyoun 2008
BioPerl dpAlign Dynamisk programmering Både Båda + Slutfri YM Chan 2003
BLASTZ, LASTZ Seeded mönster-matchning Nukleotid Lokal Schwartz et al. 2004,2009
CUDAlign DNA-sekvensanpassning av obegränsad storlek i enstaka eller flera GPU:er Nukleotid Lokalt, SemiGlobalt, Globalt E. Sandes 2011-2015
DNADot Webbaserat dot-plot-verktyg Nukleotid Global R. Bowen 1998
DOTLET Java-baserat dot-plot-verktyg Både Global M. Pagni och T. Junier 1998
FEST Posteriort baserad lokal förlängning med beskrivande evolutionsmodell Nukleotid Lokal AK Hudek och DG Brown 2010
Genome Compiler Genome Compiler Justera kromatogramfiler (.ab1, .scf) mot en mallsekvens, lokalisera fel och korrigera dem direkt. Nukleotid Lokal Genome Compiler Corporation 2014
G-PAS GPU-baserad dynamisk programmering med backtracking Både Lokalt, SemiGlobalt, Globalt W. Frohmberg, M. Kierzynka et al. 2011
GapMis Gör parvis sekvensinriktning med ett gap Både SemiGlobal K. Frousios, T. Flouri, CS Iliopoulos, K. Park, SP Pissis, G. Tischler 2012
Genomtrollkarl Programvara för ultrasnabb lokal DNA-sekvensmotivsökning och parvis anpassning för NGS-data (FASTA, FASTQ). DNA Lokalt, SemiGlobalt, Globalt Hepperle D (www.sequentix.de) 2020
GGSEARCH, GLSEARCH Global:Global (GG), Global:Local (GL) anpassning till statistik Protein Global i fråga W. Pearson 2007
JAligner Java -implementering med öppen källkod av Smith-Waterman Både Lokal A. Moustafa 2005
K*Sync Proteinsekvens till strukturanpassning som inkluderar sekundär struktur, strukturell bevarande, strukturhärledda sekvensprofiler och konsensusjusteringspoäng Protein Både D. Chivian & D. Baker 2003
LALIGN Multipel, icke-överlappande, lokal likhet (samma algoritm som SIM) Både Lokal icke-överlappande W. Pearson 1991 (algoritm)
NW-justera Standard Needleman-Wunsch dynamisk programmeringsalgoritm Protein Global Y Zhang 2012
baktala modellering inriktning; modellerar informationsinnehållet i sekvenserna Nukleotid Både D. Powell, L. Allison och TI Dix 2004
matchare Waterman-Eggert lokal anpassning (baserat på LALIGN) Både Lokal I. Longden (modifierad från W. Pearson) 1999
MCALIGN2 explicita modeller av indel evolution DNA Global J. Wang et al. 2006
MegAlign Pro (Lasergene Molecular Biology) Programvara för att justera DNA, RNA, protein eller DNA + proteinsekvenser via parvisa och multipla sekvensanpassningsalgoritmer inklusive MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson och Dotplot-analys. Både Både DNASTAR 1993-2016
MUMMER suffix träd baserat Nukleotid Global S. Kurtz et al. 2004
nål Needleman-Wunsch dynamisk programmering Både SemiGlobal A. Bleasby 1999
Ngila logaritmiska och affina gapkostnader och explicita modeller för indel-evolution Både Global R. Cartwright 2007
NW Needleman-Wunsch dynamisk programmering Både Global ACR Martin 1990-2015
parasail C/C++/Python/Java SIMD dynamiskt programmeringsbibliotek för SSE, AVX2 Både Globalt, Slutfritt, Lokalt J. Daily 2015
Väg Smith-Waterman proteinbakåtöversättningsgraf ( upptäcker ramförskjutningar proteinnivå ) Protein Lokal M. Gîrdea et al. 2009
PatternHunter Seeded mönster-matchning Nukleotid Lokal B. Ma et al. 2002–2004
ProbA (även propA) Stokastisk partitionsfunktionssampling via dynamisk programmering Både Global U. Mückstein 2002
PyMOL "align"-kommandot justerar sekvensen och tillämpar den på struktur Protein Globalt (genom urval) WL DeLano 2007
REPuter suffix träd baserat Nukleotid Lokal S. Kurtz et al. 2001
SABELTAND Justering med förutspådda anslutningsprofiler Protein Global F. Teichert, J. Minning, U. Bastolla och M. Porto 2009
Satsuma Parallella syntenyjusteringar av hela genomet DNA Lokal MG Grabherr et al. 2010
SEQALN Diverse dynamisk programmering Både Lokalt eller globalt MS Waterman och P. Hardy 1996
SIM, GAP, NAP, LAP Lokal likhet med varierande gapbehandlingar Både Lokalt eller globalt X. Huang och W. Miller 1990-6
SIM Lokal likhet Både Lokal X. Huang och W. Miller 1991
SPA: Super parvis inriktning Snabb parvis global anpassning Nukleotid Global Shen, Yang, Yao, Hwang 2002
SÖK Lokal ( Smith-Waterman ) anpassning till statistik Protein Lokal W. Pearson 1981 (algoritm)
Sequences Studio Java-applet som visar olika algoritmer från Generisk sekvens Lokalt och globalt A.Meskauskas 1997 (uppslagsbok)
SWIFOLD Smith-Waterman Acceleration på Intels FPGA med OpenCL för långa DNA-sekvenser Nukleotid Lokal E. Rucci 2017-2018
SWIFT kostym Snabb lokal anpassningssökning DNA Lokal K. Rasmussen, W. Gerlach 2005,2008
bår Minnesoptimerad Needleman-Wunsch dynamisk programmering Både Global I. Longden (modifierad från G. Myers och W. Miller) 1999
transalign Justerar nukleinsyrasekvenser givet en proteininriktning Nukleotid NA G. Williams (modifierad från B. Pearson) 2002
UGENE Opensource Smith-Waterman för SSE/CUDA, Suffix array-baserad upprepningssökare och punktplot Både Både UniPro 2010
vatten Smith-Waterman dynamisk programmering Både Lokal A. Bleasby 1999
wordmatch k -tuppel parvis matchning Både NA I. Longden 1998
YASS Seeded mönster-matchning Nukleotid Lokal L. Noe och G. Kucherov 2004

* Sekvenstyp: protein eller nukleotid ** Justeringstyp: lokal eller global

Multipelsekvensinriktning

namn Beskrivning Sekvenstyp* Inriktningstyp** Författare År Licens
ABA A-Bruijn inriktning Protein Global B. Raphael et al. 2004 Proprietär , gratisprogram för utbildning, forskning, ideell verksamhet
ALE manuell justering ; viss mjukvaruhjälp Nukleotider Lokal J. Blandy och K. Fogel 1994 (senaste versionen 2007) Gratis, GPL 2
ALLALIGN För DNA-, RNA- och proteinmolekyler upp till 32MB, justerar alla sekvenser av storlek K eller större, MSA eller inom en enda molekyl. Liknande justeringar grupperas tillsammans för analys. Automatiskt repetitivt sekvensfilter. Både Lokal E. Wachtel 2017 Fri
EN KARTA Sekvensglödgning Både Global A. Schwartz och L. Pachter 2006
anon. snabb, optimal anpassning av tre sekvenser med hjälp av linjära gapkostnader Nukleotider Global D. Powell, L. Allison och TI Dix 2000
BAli-Phy Träd+multijustering; probabilistisk-bayesiansk; gemensam uppskattning Båda + kodoner Global BD Redelings och MA Suchard 2005 (senaste versionen 2018) Gratis, GPL
Bas för bas Java-baserad redigerare för multipelsekvensjustering med integrerade analysverktyg Både Lokalt eller globalt R. Brodie et al. 2004 Proprietär , gratisprogram , måste registreras
KAOS, DIALIGN Iterativ justering Både Lokalt (föredraget) M. Brudno och B. Morgenstern 2003
Clustal W Progressiv anpassning Både Lokalt eller globalt Thompson et al. 1994 Gratis, LGPL
CodonCode Aligner Multi-inriktning; Support för ClustalW och Phrap Nukleotider Lokalt eller globalt P. Richterich et al. 2003 (senaste versionen 2009)
Kompass Jämförelse av multipla proteinsekvensanpassningar med bedömning av statistisk signifikans Protein Global RI Sadrejev, et al. 2009
DECHIFFRERA Progressiv-iterativ anpassning Både Global Erik S. Wright 2014 Gratis, GPL
DIALIGN-TX och DIALIGN-T Segmentbaserad metod Både Lokalt (föredraget) eller globalt ASUbramanian 2005 (senaste versionen 2008)
DNA-justering Segmentbaserad metod för intraspecifika anpassningar Både Lokalt (föredraget) eller globalt A. Roehl 2005 (senaste versionen 2008)
DNA Baser Sequence Assembler Multi-inriktning; Helautomatisk sekvensjustering; Automatisk tvetydighetskorrigering; Intern basanropare; Kommandoradsföljande justering Nukleotider Lokalt eller globalt Heracle BioSoft SRL 2006 (senaste versionen 2018) Kommersiell (vissa moduler är gratisprogram)
DNADynamo kopplat DNA till protein multipel anpassning med MUSCLE , Clustal och Smith-Waterman Både Lokalt eller globalt DNADynamo 2004 (senaste versionen 2017)
EDNA Energibaserad multipelsekvensjustering för DNA-bindningsställen Nukleotider Lokalt eller globalt Salama, RA. et al. 2013
FAMSA Progressiv anpassning för extremt stora proteinfamiljer (hundratusentals medlemmar) Protein Global Deorowicz et al. 2016 Gratis, GPL 3
FSA Sekvensglödgning Både Global RK Bradley et al. 2008
Genialiskt Progressiv-Iterativ anpassning; ClustalW-plugin Både Lokalt eller globalt AJ Drummond et al. 2005 (senaste versionen 2017)
Kalign Progressiv anpassning Både Global T. Lassmann 2005
MAFFT Progressiv-iterativ anpassning Både Lokalt eller globalt K. Katoh et al. 2005 Gratis, BSD
MARNA Multi-alignment av RNA RNA Lokal S. Siebert et al. 2005
MAVID Progressiv anpassning Både Global N. Bray och L. Pachter 2004
MegAlign Pro (Lasergene Molecular Biology) Programvara för att justera DNA, RNA, protein eller DNA + proteinsekvenser via parvisa och multipla sekvensanpassningsalgoritmer inklusive MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson och Dotplot-analys. Både Lokalt eller globalt DNASTAR 1993-2016
MSA Dynamisk programmering Både Lokalt eller globalt DJ Lipman et al. 1989 (modifierad 1995)
MSAProbs Dynamisk programmering Protein Global Y. Liu, B. Schmidt, D. Maskell 2010
MULTALIN Dynamisk programmering-klustring Både Lokalt eller globalt F. Corpet 1988
Multi-LAGAN Progressiv dynamisk programmeringsinriktning Både Global M. Brudno et al. 2003
MUSKEL Progressiv-iterativ anpassning Både Lokalt eller globalt R. Edgar 2004
Opal Progressiv-iterativ anpassning Både Lokalt eller globalt T. Wheeler och J. Kececioglu 2007 (senaste stall 2013, senaste beta 2016)
Pekannöt Probabilistisk-konsistens DNA Global B. Paten et al. 2008
Phylo Ett mänskligt datorramverk för jämförande genomik för att lösa multipel anpassning Nukleotider Lokalt eller globalt McGill bioinformatik 2010
PMFastR Progressiv strukturmedveten anpassning RNA Global D. DeBlasio, J Braund, S Zhang 2009
Pralin Progressiv-iterativ-konsistens-homologi-utvidgad anpassning med förprofilering och förutsägelse av sekundär struktur Protein Global J. Heringa 1999 (senaste versionen 2009)
PicXAA Icke-progressiv, maximal förväntad noggrannhetsjustering Både Global SME Sahraeian och BJ Yoon 2010
POA Delordning/dold Markov-modell Protein Lokalt eller globalt C. Lee 2002
Probalign Probabilistisk/överensstämmelse med partitionsfunktionssannolikheter Protein Global Roshan och Livesay 2006 Gratis, allmän egendom
ProbCons Sannolikhet/konsistens Protein Lokalt eller globalt C. Do et al. 2005 Gratis, allmän egendom
PROMALS3D Progressiv uppriktning/dold Markov-modell/Sekundär struktur/3D-struktur Protein Global J. Pei et al. 2008
PRRN/PRRP Iterativ justering (särskilt förfining) Protein Lokalt eller globalt Y. Totoki (baserat på O. Gotoh) 1991 och senare
PSAlign Inriktning som bevarar icke-heuristisk Både Lokalt eller globalt SH Sze, Y. Lu, Q. Yang. 2006
RevTrans Kombinerar DNA- och proteinanpassning genom att återöversätta proteinanpassningen till DNA. DNA/protein (speciellt) Lokalt eller globalt Wernersson och Pedersen 2003 (senaste versionen 2005)
SAGA Sekvensjustering med genetisk algoritm Protein Lokalt eller globalt C. Notredame et al. 1996 (ny version 1998)
SAM Dold Markov-modell Protein Lokalt eller globalt A. Krogh et al. 1994 (senaste versionen 2002)
Täta Manuell inriktning Både Lokal A. Rambaut 2002
StatAlign Bayesiansk samuppskattning av anpassning och fylogeni (MCMC) Både Global A. Novak et al. 2008
Stemloc Multipel inriktning och förutsägelse av sekundär struktur RNA Lokalt eller globalt I. Holmes 2005 Gratis, GPL 3 (parte de DART)
T-kaffe Mer känslig progressiv uppriktning Både Lokalt eller globalt C. Notredame et al. 2000 (senaste versionen 2008) Gratis, GPL 2
UGENE Stöder flera justeringar med MUSCLE , KAlign, Clustal och MAFFT plugins Både Lokalt eller globalt UGENE-teamet 2010 (nyaste versionen 2020) Gratis, GPL 2
VectorFriends VectorFriends Aligner, MUSCLE plugin och Clustal W plugin Både Lokalt eller globalt BioFriends team 2013 Proprietär , gratisprogram för akademiskt bruk
GLProbs Adaptivt par-Hidden Markov Modellbaserad tillvägagångssätt Protein Global Y. Ye et al. 2013

* Sekvenstyp: protein eller nukleotid. ** Inriktningstyp: lokal eller global

Genomisk analys

namn Beskrivning Sekvenstyp*
ÖRN Ett ultrasnabbt verktyg för att hitta relativt frånvarande ord i genomisk data Nukleotid
ACT (Artemis Comparison Tool) Synteny och jämförande genomik Nukleotid
IVRIG Parvis global anpassning med hela genom Nukleotid
BLAT Justering av cDNA-sekvenser till ett genom. Nukleotid
DECHIFFRERA Justering av omarrangerade genom med användning av 6-ramars translation Nukleotid
FLAK Fuzzy hela genomet anpassning och analys Nukleotid
GMAP Justering av cDNA-sekvenser till ett genom. Identifierar skarvställen med hög noggrannhet. Nukleotid
Splign Justering av cDNA-sekvenser till ett genom. Identifierar skarvställen med hög noggrannhet. Kunna känna igen och separera gendupliceringar. Nukleotid
Mauve Multipel anpassning av omarrangerade genom Nukleotid
MGA Multiple Genome Aligner Nukleotid
Mulan Lokala multipla anpassningar av genomlängdssekvenser Nukleotid
Multiz Multipel anpassning av genom Nukleotid
PLAST-ncRNA Sök efter ncRNA i genom genom lokal anpassning av partitionsfunktioner Nukleotid
Sequerome Profilering av sekvensanpassningsdata med större servrar/tjänster Nukleotid, peptid
Sequilab Profilering av sekvensanpassningsdata från NCBI-BLAST resultat med stora servrar-tjänster Nukleotid, peptid
Blanda-LAGAN Parvis glokal anpassning av färdiga genomregioner Nukleotid
SIBsim4, Sim4 Ett program utformat för att anpassa en uttryckt DNA-sekvens med en genomisk sekvens, vilket möjliggör introner Nukleotid
SLAM Genfynd, anpassning, annotering (identifiering av homologi mellan människa och mus) Nukleotid
SRPRISM En effektiv aligner för sammansättningar med explicita garantier, justering av läsningar utan skarvar Nukleotid

* Sekvenstyp: protein eller nukleotid


Motivfynde

namn Beskrivning Sekvenstyp*
PMS Motivsökning och upptäckt Både
FMM Motivsökning och upptäckt (kan även få positiva och negativa sekvenser som input för berikad motivsökning) Nukleotid
BLOCKAR Oupplåst motividentifiering från BLOCKS databas Både
eMOTIF Utdrag och identifiering av kortare motiv Både
Gibbs motivprovtagare Stokastisk motivextraktion genom statistisk sannolikhet Både
HMMTOP Förutsägelse av transmembranspiraler och topologi för proteiner Protein
I-sajter Lokal struktur motiv bibliotek Protein
JCoils Förutsägelse av Coiled coil och Leucine Zipper Protein
MEME /MAST Motivupptäckt och sökande Både
CUDA-MEME GPU-accelererad MEME (v4.4.0)-algoritm för GPU-kluster Både
MERCI Diskriminerande motiv upptäckt och sökning Både
PHI-Blast Verktyg för motivsökning och justering Både
Phyloscan Verktyg för motivsökning Nukleotid
PRATT Mönstergenerering för användning med ScanProsite Protein
ScanProsite Sökverktyg för motivdatabas Protein
TEIRESIAS Motivextraktion och databassökning Både
BASALT Sök efter flera motiv och reguljära uttryck Både

* Sekvenstyp: protein eller nukleotid


Benchmarking

namn Författare
PFAM 30.0 (2016)
SMART (2015) Letunic, Copley, Schmidt, Ciccarelli, Doerks, Schultz, Ponting, Bork
BAliBASE 3 (2015) Thompson, Plewniak, Poch
Oxbench (2011) Raghava, Searle, Audley, Barber, Barton
Benchmark-samling (2009) Edgar
HOMSTRAD (2005) Mizuguchi
PREFAB 4.0 (2005) Edgar
SABmark (2004) Van Walle, Lasters, Wyns

Justera tittare, redaktörer

Se Lista över programvara för inriktningsvisualisering .

Kortläst sekvensjustering

namn Beskrivning alternativet för parad ände Använd FASTQ-kvalitet Glappade Flertrådig Licens Referens År
Arioc Beräknar Smith-Waterman gapade justeringar och mappningskvaliteter på en eller flera GPU:er. Stöder BS-seq-justeringar. Bearbetar 100 000 till 500 000 läsningar per sekund (varierar med data, hårdvara och konfigurerad känslighet). Ja Nej Ja Ja Gratis, BSD 2015
Barracuda Ett GPGPU-accelererat Burrows–Wheeler-transformation (FM-index) kortläsningsprogram baserat på BWA, stöder inriktning av indelar med gapöppningar och förlängningar. Ja Nej Ja Ja, POSIX-trådar och CUDA Gratis, GPL
BBmap Använder en kort kmers för att snabbt indexera genomet; ingen storleks- eller ställningsgräns. Högre känslighet och specificitet än Burrows–Wheeler aligners, med liknande eller högre hastighet. Utför affin-transform-optimerad global anpassning, som är långsammare men mer exakt än Smith-Waterman. Hanterar Illumina, 454, PacBio, Sanger och Ion Torrent-data. Skarvmedveten; kapabel att bearbeta långa indelar och RNA-seq. Ren Java; körs på vilken plattform som helst. Används av Joint Genome Institute . Ja Ja Ja Ja Gratis, BSD 2010
FAST Explicit avvägning mellan tid och noggrannhet med en tidigare noggrannhetsuppskattning, stödd av indexering av referenssekvenserna. Komprimerar index optimalt. Kan hantera miljarder korta läsningar. Kan hantera infogningar, raderingar, SNP:er och färgfel (kan kartlägga ABI SOLiD-färgrymdsläsningar). Utför en fullständig Smith Waterman-justering. Ja, POSIX-trådar Gratis, GPL 2009
BigBWA Kör Burrows–Wheeler Aligner -BWA på ett Hadoop- kluster. Den stöder algoritmerna BWA-MEM, BWA-ALN och BWA-SW, och arbetar med parade och enstaka läsningar. Det innebär en viktig minskning av beräkningstiden när man kör i ett Hadoop-kluster, vilket lägger till skalbarhet och feltolerans. Ja Bastrimning av låg kvalitet Ja Ja Gratis, GPL 3 2015
BLASTN BLASTs nukleotidanpassningsprogram, långsamt och inte exakt för korta läsningar, och använder en sekvensdatabas (EST, Sanger-sekvens) snarare än ett referensgenom.
BLAT Tillverkad av Jim Kent . Kan hantera en missmatchning i det första inriktningssteget. Ja, klient-server Proprietär , gratisprogram för akademisk och icke-kommersiell användning 2002
Fluga Använder en Burrows–Wheeler-transform för att skapa ett permanent, återanvändbart index av genomet; 1,3 GB minnesfotavtryck för mänskligt genom. Justerar mer än 25 miljoner Illumina-läsningar på 1 CPU-timme. Stöder Maq-liknande och SOAP-liknande anpassningspolicyer Ja Ja Nej Ja, POSIX-trådar Gratis, konstnärlig 2009
BWA Använder en Burrows–Wheeler-transform för att skapa ett index över genomet. Den är lite långsammare än Bowtie men tillåter indels inriktning. Ja Bastrimning av låg kvalitet Ja Ja Gratis, GPL 2009
BWA-PSSM En probabilistisk kortläsningsinriktning baserad på användningen av positionsspecifika poängmatriser (PSSM). Justeraren är anpassningsbar i den meningen att den kan ta hänsyn till kvalitetspoängen för läsningarna och modellerna av dataspecifika fördomar, såsom de som observeras i forntida DNA, PAR-CLIP-data eller genom med partiska nukleotidkompositioner. Ja Ja Ja Ja Gratis, GPL 2014
CASHX Kvantifiera och hantera stora mängder kortläst sekvensdata. CASHX pipeline innehåller en uppsättning verktyg som kan användas tillsammans eller separat som moduler. Denna algoritm är mycket exakt för perfekta träffar på ett referensgenom. Nej Proprietär , gratisprogram för akademisk och icke-kommersiell användning
Skyfall Kortläst kartläggning med Hadoop MapReduce Ja, Hadoop MapReduce Gratis, konstnärlig
CUDA-EC Kortläst justering av felkorrigering med GPU:er. Ja, GPU aktiverad
CUSHAW En CUDA-kompatibel kortläst aligner till stora genom baserad på Burrows–Wheeler-transform Ja Ja Nej Ja (GPU-aktiverad) Gratis, GPL 2012
CUSHAW2 Gappad kortläst och långläst justering baserat på maximala exakt matchande frön. Denna aligner stöder både bas-rymd (t.ex. från Illumina, 454, Ion Torrent och PacBio-sequencers) och ABI SOLiD-färgrymdsläsjusteringar. Ja Nej Ja Ja Gratis, GPL 2014
CUSHAW2-GPU GPU-accelererad CUSHAW2 kortläst aligner. Ja Nej Ja Ja Gratis, GPL
CUSHAW3 Känslig och exakt kortavläsning av basutrymme och färgrymd med hybridsådd Ja Nej Ja Ja Gratis, GPL 2012
drFAST Läsmappningsprogramvara som implementerar cacheminne för att minimera huvud-/cacheminnesöverföringar som mrFAST och mrsFAST, dock utformad för SOLiD-sekvenseringsplattformen (färgrymdsavläsningar). Den returnerar också alla möjliga kartplatser för förbättrad upptäckt av strukturella variationer. Ja Ja, för strukturell variation Ja Nej Gratis, BSD
ELAND Implementerad av Illumina. Inkluderar opåverkad justering med en ändlig läslängd.
ERNE Utökad randomiserad numerisk alignEr för exakt justering av NGS-avläsningar. Den kan kartlägga bisulfitbehandlade läsningar. Ja Bastrimning av låg kvalitet Ja Multithreading och MPI-aktiverad Gratis, GPL 3
GASSST Hittar globala anpassningar av korta DNA-sekvenser mot stora DNA-banker Multithreading CeCILL version 2-licens. 2011
PÄRLA Högkvalitativ uppriktningsmotor (uttömmande kartläggning med ersättningar och indelar). Mer exakt och flera gånger snabbare än BWA eller Bowtie 1/2. Många fristående biologiska applikationer (kartläggning, delad kartläggning, kartläggning och annat) tillhandahålls. Ja Ja Ja Ja Gratis, GPL 3 2012
Genalice KARTA Ultrasnabb och omfattande NGS-läsjustering med hög precision och litet lagringsutrymme. Ja Bastrimning av låg kvalitet Ja Ja Proprietär , kommersiell
Genial montör Snabb, exakt överlappssamlare med förmågan att hantera vilken kombination av sekvenseringsteknik som helst, läslängd, valfri parningsorientering, med valfri spacerstorlek för parningen, med eller utan referensgenom. Ja Proprietär , kommersiell
GensearchNGS Komplett ramverk med användarvänligt GUI för att analysera NGS-data. Den integrerar en egenutvecklad högkvalitativ anpassningsalgoritm och insticksmöjlighet för att integrera olika publika aligner i ett ramverk som gör det möjligt att importera korta läsningar, anpassa dem, upptäcka varianter och generera rapporter. Den är gjord för återsekvensering av projekt, nämligen i en diagnostisk miljö. Ja Nej Ja Ja Proprietär , kommersiell
GMAP och GSNAP Robust, snabb kortavläsningsuppriktning. GMAP: längre läsningar, med flera indelar och skarvar (se posten ovan under Genomicsanalys); GSNAP: kortare läsningar, med en indel eller upp till två skarvar per läsning. Användbar för digitalt genuttryck, SNP och indel genotypning. Utvecklad av Thomas Wu på Genentech. Används av National Center for Genome Resources (NCGR) i Alpheus. Ja Ja Ja Ja Proprietär , gratisprogram för akademisk och icke-kommersiell användning
GNUMAP Utför noggrant gapad anpassning av sekvensdata erhållna från nästa generations sekvenseringsmaskiner (särskilt från Solexa-Illumina) tillbaka till ett genom av valfri storlek. Inkluderar adaptertrimning, SNP-anrop och Bisulfite-sekvensanalys. Ja, stöder även Illumina *_int.txt- och *_prb.txt-filer med alla fyra kvalitetspoäng för varje bas Multithreading och MPI-aktiverad 2009
HIVE-hexagon Använder en hashtabell och blommatris för att skapa och filtrera potentiella positioner på genomet. För högre effektivitet används korslikhet mellan korta läsningar och undviker att omjustera icke-unika redundanta sekvenser. Det är snabbare än Bowtie och BWA och tillåter indels och divergerande känsliga justeringar på virus, bakterier och mer konservativa eukaryota justeringar. Ja Ja Ja Ja Proprietär , gratisprogram för akademiska och icke-kommersiella användare registrerade på HIVE-distributionsinstansen 2014
IMOS Förbättrad Meta-aligner och Minimap2 On Spark. En långläst distribuerad aligner på Apache Spark-plattformen med linjär skalbarhet i förhållande till exekvering av en enda nod. Ja Ja Ja Fri
Isaac Använder fullt ut all datorkraft som finns tillgänglig på en servernod; sålunda skalar den över ett brett spektrum av hårdvaruarkitekturer, och anpassningsprestanda förbättras med hårdvaruförmågor Ja Ja Ja Ja Gratis, GPL
SISTA Använder adaptiva frön och klarar mer effektivt repeteringsrika sekvenser (t.ex. genom). Till exempel: den kan anpassa läsningar till genom utan att upprepa maskering, utan att bli överväldigad av repetitiva träffar. Ja Ja Ja Ja Gratis, GPL 2011
MAQ Ouppspelad anpassning som tar hänsyn till kvalitetspoäng för varje bas. Gratis, GPL
mrFAST, mrFAST Gapped (mrFAST) och ohapped (mrsFAST) justeringsprogramvara som implementerar cacheminneslöshet för att minimera huvud-/cacheminnesöverföringar. De är designade för Illumina-sekvenseringsplattformen och de kan returnera alla möjliga kartplatser för förbättrad upptäckt av strukturella variationer. Ja Ja, för strukturell variation Ja Nej Gratis, BSD
MAMMA MOM eller maximal oligonukleotidmappning är ett frågematchningsverktyg som fångar en maximal längdmatchning inom den korta läsningen. Ja
MOSAIK Snabbt gapad aligner och referensstyrd assembler. Justerar läsningar med en bandad Smith-Waterman- algoritm seedad av resultat från ett k-mer-hashningsschema. Stöder läsningar i storlek från mycket kort till mycket lång. Ja
MPscan Snabb aligner baserad på en filtreringsstrategi (ingen indexering, använd q-gram och bakåt nondeterministisk DAWG -matchning) 2009
Novoalign & NovoalignCS Gappad justering av enkel ände och parad ände Illumina GA I & II, ABI Color space & ION Torrent läser. Hög känslighet och specificitet, med baskvaliteter i alla steg i anpassningen. Inkluderar adaptertrimning, baskvalitetskalibrering, Bi-Seq-justering och alternativ för att rapportera flera justeringar per läsning. Användning av tvetydiga IUPAC-koder som referens för vanliga SNP kan förbättra SNP-återkallelse och ta bort allelisk bias. Ja Ja Ja Flertråds- och MPI-versioner tillgängliga med betald licens Proprietär , gratis enkelgängad version för akademisk och icke-kommersiell användning
NextGENe Utvecklad för användning av biologer som utför analys av nästa generations sekvenseringsdata från Roche Genome Sequencer FLX, Illumina GA/HiSeq, Life Technologies Applied BioSystems SOLiD System, PacBio och Ion Torrent-plattformar. Ja Ja Ja Ja Proprietär , kommersiell
NextGenMap Flexibelt och snabbt avläst kartprogram (dubbelt så snabbt som BWA), uppnår en kartläggningskänslighet jämförbar med Stampy. Internt använder en minneseffektiv indexstruktur (hash-tabell) för att lagra positioner för alla 13-merer som finns i referensgenomet. Kartläggningsområden där parvisa justeringar krävs bestäms dynamiskt för varje läsning. Använder snabba SIMD-instruktioner (SSE) för att påskynda inriktningsberäkningar på CPU. Om tillgängligt, beräknas justeringar på GPU (med OpenCL/CUDA), vilket ytterligare minskar körtiden med 20-50%. Ja Nej Ja Ja, POSIX-trådar , OpenCL/ CUDA , SSE Fri 2013
Omixon Variant Toolkit Innehåller mycket känsliga och mycket exakta verktyg för att upptäcka SNP:er och indelar. Det erbjuder en lösning för att kartlägga NGS korta avläsningar med ett måttligt avstånd (upp till 30 % sekvensavvikelse) från referensgenom. Det innebär inga begränsningar för storleken på referensen, vilket i kombination med dess höga känslighet gör Variant Toolkit väl lämpad för riktade sekvenseringsprojekt och diagnostik. Ja Ja Ja Ja Proprietär , kommersiell
PALMapper Beräknar effektivt både skarvade och oskarvade uppriktningar med hög noggrannhet. Genom att förlita sig på en maskininlärningsstrategi kombinerat med en snabb kartläggning baserad på en bandad Smith-Waterman-liknande algoritm, anpassar den cirka 7 miljoner avläsningar per timme på en CPU. Den förfinar den ursprungligen föreslagna QPALMA-metoden. Ja Gratis, GPL
Partek Flow För användning av biologer och bioinformatiker. Den stöder oavslutad, gapad och skarvövergångsinriktning från enkel- och paradändsläsningar från Illumina, Life technologies Solid TM, Roche 454 och Ion Torrent rådata (med eller utan kvalitetsinformation). Den integrerar kraftfull kvalitetskontroll på FASTQ/Qual nivå och på anpassade data. Ytterligare funktionalitet inkluderar trimning och filtrering av råavläsningar, SNP- och InDel-detektion, mRNA- och mikroRNA-kvantifiering och fusionsgendetektion. Ja Ja Ja Multiprocessor-core, klient-server installation möjlig Proprietär , kommersiell , gratis testversion
PASSERA Indexerar genomet och utökar sedan frön med hjälp av förberäknade justeringar av ord. Fungerar med basutrymme, färgrymd (SOLID) och kan anpassa genomiska och splitsade RNA-seq-läsningar. Ja Ja Ja Ja Proprietär , gratisprogram för akademisk och icke-kommersiell användning
PerM Indexerar genomet med periodiska frön för att snabbt hitta anpassningar med full känslighet upp till fyra felmatchningar. Den kan kartlägga Illumina- och SOLiD-läsningar. Till skillnad från de flesta kartprogram ökar hastigheten för längre läslängder. Ja Gratis, GPL
PRIMEX Indexerar genomet med en k-mer-uppslagstabell med full känslighet upp till ett justerbart antal felmatchningar. Det är bäst för att kartlägga 15-60 bp sekvenser till ett genom. Nej Nej Ja Nej, flera processer per sökning [1] 2003
QPalma Kan använda kvalitetspoäng, intronlängder och beräkningssplitsplatsförutsägelser för att utföra och utföra en opartisk anpassning. Kan tränas till detaljerna i ett RNA-seq experiment och genom. Användbar för upptäckt av skarvställen/introner och för att bygga genmodeller. (Se PALMapper för en snabbare version). Ja, klient-server Gratis, GPL 2
RazerS Ingen läslängdsbegränsning. Hamming eller redigera avståndskartläggning med konfigurerbara felfrekvenser. Konfigurerbar och förutsägbar känslighet (runtime/sensitivity tradeoff). Stöder parad läsmapping. Gratis, LGPL
RIKTIGT, VERKLIGT REAL är ett effektivt, exakt och känsligt verktyg för att justera korta avläsningar som erhålls från nästa generations sekvensering. Programmet kan hantera en enorm mängd single-end-läsningar som genereras av nästa generations Illumina/Solexa Genome Analyzer. cREAL är en enkel förlängning av REAL för att anpassa korta avläsningar från nästa generations sekvensering till ett genom med cirkulär struktur. Ja Ja Gratis, GPL
RMAP Kan kartläsa med eller utan felsannolikhetsinformation (kvalitetspoäng) och stöder läsavläsningar i par eller bisulfitbehandlad avläsning. Det finns inga begränsningar för läslängden eller antalet felmatchningar. Ja Ja Ja Gratis, GPL 3
rNA En randomiserad numerisk justering för exakt justering av NGS-avläsningar Ja Bastrimning av låg kvalitet Ja Multithreading och MPI-aktiverad Gratis, GPL 3
RTG-utredare Extremt snabb, tolerant mot höga indel- och substitutionsvärden. Inkluderar fullständig läsjustering. Produkten inkluderar omfattande pipelines för variantdetektion och metagenomisk analys med valfri kombination av Illumina-, Complete Genomics- och Roche 454-data. Ja Ja, för variantsamtal Ja Ja Proprietär , gratisprogram för individuell utredare
Segemehl Kan hantera infogningar, borttagningar, felmatchningar; använder utökade suffixarrayer Ja Nej Ja Ja Proprietär , gratisprogram för icke-kommersiellt bruk 2009
SeqMap Upp till 5 blandade substitutioner och insättningar-deletioner; olika inställningsalternativ och ingångs-utgångsformat Proprietär , gratisprogram för akademisk och icke-kommersiell användning
Shrec Kort läsfelkorrigering med en suffixträddatastruktur Ja, Java
Räka Indexerar referensgenomet från och med version 2. Använder masker för att generera möjliga nycklar. Kan kartlägga ABI SOLiD färgrymdsavläsningar. Ja Ja Ja Ja, OpenMP Gratis, [[BSD-licenser| style="background: #DFF; vertical-align: middle; text-align: center; " class="free table-free"|Free, BSD ] ] derivativ

2009-2011
SLIDER Slider är en applikation för Illumina Sequence Analyzer-utgången som använder "sannolikhet"-filerna istället för sekvensfilerna som en ingång för anpassning till en referenssekvens eller en uppsättning referenssekvenser. Ja Ja Nej Nej 2009-2010
SOAP, SOAP2, SOAP3, SOAP3-dp TVÅL: robust med ett litet (1-3) antal luckor och oöverensstämmelse. Hastighetsförbättring jämfört med BLAT, använder en hashtabell på 12 bokstäver. SOAP2: använder dubbelriktad BWT för att bygga referensindexet, och det är mycket snabbare än den första versionen. SOAP3: GPU-accelererad version som kunde hitta alla 4-felmatchningar på tiotals sekunder per en miljon läsningar. SOAP3-dp, även GPU-accelererad, stöder godtyckliga antal felmatchningar och luckor enligt affin gap penalty-poäng. Ja Nej Ja, SOAP3-dp Ja, POSIX-trådar ; SOAP3, SOAP3-dp behöver GPU med CUDA- stöd Gratis, GPL
SOCS För ABI SOLiD-teknologier. Betydande ökning av tiden till kartläsning med felmatchningar (eller färgfel). Använder en iterativ version av Rabin-Karps strängsökningsalgoritm. Ja Gratis, GPL
SparkBWA Integrerar Burrows–Wheeler Aligner (BWA) på ett Apache Spark- ramverk som körs ovanpå Hadoop . Version 0.2 från oktober 2016, stöder algoritmerna BWA-MEM, BWA-backtrack och BWA-ALN. Alla av dem fungerar med enkelläsningar och parade läsningar. Ja Bastrimning av låg kvalitet Ja Ja Gratis, GPL 3 2016
SSAHA, SSAHA2 Snabbt för ett litet antal varianter Proprietär , gratisprogram för akademisk och icke-kommersiell användning
Stampy För Illumina läser. Hög specificitet och känslig för läsningar med indelar, strukturella varianter eller många SNP. Långsamt, men hastigheten ökade dramatiskt genom att använda BWA för första inriktningspasset. Ja Ja Ja Nej Proprietär , gratisprogram för akademisk och icke-kommersiell användning 2010
Storm För Illumina eller ABI SOLiD läsningar, med SAM native output. Mycket känslig för läsningar med många fel, indels (full från 0 till 15, utökat stöd annars). Använder spridda frön (single hit) och ett mycket snabbt SSE - SSE2 - AVX2 - AVX-512 banded alignment filter. Endast för läsning med fast längd rekommenderar författare SHRiMP2 annars. Nej Ja Ja Ja, OpenMP Fri 2010
Subread, Subjunc Supersnabba och exakta läsjusteringar. Subread kan användas för att kartlägga både gDNA-seq och RNA-seq reads. Subjunc upptäcker exon-exon-övergångar och kartlägger RNA-seq-läsningar. De använder ett nytt kartläggningsparadigm som heter seed-and-vote . Ja Ja Ja Ja Gratis, GPL 3
Taipan De-novo assembler för Illumina läser Proprietär , gratisprogram för akademisk och icke-kommersiell användning
UGENE Visuellt gränssnitt både för Bowtie och BWA, och en inbäddad aligner Ja Ja Ja Ja Gratis, GPL
VelociMapper FPGA-accelererat verktyg för kartläggning av referenssekvenser från TimeLogic . Snabbare än Burrows–Wheeler transform -baserade algoritmer som BWA och Bowtie. Stöder upp till 7 felmatchningar och/eller indelar utan prestationsstraff. Producerar känsliga Smith–Waterman-gaplinjer. Ja Ja Ja Ja Proprietär , kommersiell
XpressAlign FPGA-baserad skjutfönster kortläsjustering som utnyttjar den pinsamt parallella egenskapen med kortläsjustering. Prestanda skalas linjärt med antalet transistorer på ett chip (dvs prestanda garanteras fördubblas med varje iteration av Moores lag utan modifiering av algoritmen). Låg strömförbrukning är användbart för datacenterutrustning. Förutsägbar körtid. Bättre pris/prestanda än mjukvaruskjutbara fönsterriktare på nuvarande hårdvara, men inte bättre än mjukvara BWT-baserade aligners för närvarande. Kan hantera ett stort antal (>2) felmatchningar. Kommer att hitta alla träffpositioner för alla frön. Single-FPGA experimentell version, behöver arbete för att utveckla den till en multi-FPGA produktionsversion. Proprietär , gratisprogram för akademisk och icke-kommersiell användning
ZOOM 100 % känslighet för en avläsning mellan 15 och 240 bp med praktiska felmatchningar. Väldigt snabbt. Stöd insättningar och raderingar. Fungerar med Illumina & SOLiD-instrument, inte 454. Ja (GUI), nej (CLI) Proprietär , kommersiell

Se även