UKLUST

UCLUST är en algoritm utformad för att klustera nukleotid- eller aminosyrasekvenser i kluster baserat på sekvenslikhet. Algoritmen publicerades 2010 och implementerades i ett program även kallat UCLUST. Algoritmen beskrivs av författaren som att följa två enkla klustringskriterier, med avseende på den begärda likhetströskeln T. Det första kriteriet anger att varje givet klusters tyngdpunktssekvens kommer att ha en likhet som är mindre än T med alla andra klusters tyngdpunktssekvens. Det andra kriteriet anger att varje medlemssekvens i ett givet kluster kommer att ha likhet med klustrets tyngdpunktssekvens som är lika med eller större än T.

UCLUST-algoritmen är girig. Som ett resultat kommer ordningen på sekvenserna i indatafilen att påverka de resulterande klustren och deras kvalitet. Av denna anledning rekommenderas det att sekvenserna kommer att sorteras innan de går in i klustringsstadiet. Programmet UCLUST är utrustat med några alternativ för att sortera inmatningssekvenserna innan de klusteras.

UCLUST-programmet används i stor utsträckning inom det bioinformatiska forskarsamhället, där det används för flera applikationer inklusive OTU-tilldelning (t.ex. 16s), skapande av icke-redundanta genkataloger , taxonomisk tilldelning och fylogenetisk analys .

externa länkar

  • Edgar, RC "UCLUST-algoritm" . köra5 .
  • "Bio-Linux Software Documentation Project" . NEBC.

Se även