Fiocruz Genome Comparison Project

Fiocruz Genome Comparison Project är ett samarbete mellan Brasiliens Oswaldo Cruz Institute och IBM :s World Community Grid, utformat för att producera en databas som jämför generna från många genom med varandra med hjälp av SSEARCH. Programmet SSEARCH utför en rigorös Smith–Waterman-anpassning mellan en proteinsekvens och en annan proteinsekvens, en proteindatabas, ett DNA- eller ett DNA-bibliotek.


Beräkningens natur i projektet gör att det enkelt kan dra fördel av volontärberäkningar . Detta, tillsammans med de troliga humanitära fördelarna med forskningen, har lett till att World Community Grid (ett frivilligt datornät som använder ledig datorklocktid) har drivit Fiocruz-projektet. Alla produkter är offentliga enligt avtal med WCG.

Beskrivning

Problemet är att en mycket stor informationskropp (strukturell, funktionell, korsreferenser, etc.) är kopplad till proteindatabasposter. När informationen väl har skrivits in uppdateras eller korrigeras den sällan. Denna annotering av förutsagd proteinfunktion är ofta ofullständig, använder icke-standard nomenklatur eller kan vara felaktig när den korsreferens från tidigare ibland felaktigt kommenterade sekvenser. Dessutom förbises många proteiner som består av flera strukturella och/eller funktionella domäner av automatiserade system. Den jämförande informationen idag är enorm jämfört med genomikens tidiga dagar. Ett enda fel förvärras och görs sedan komplext.

Genome Comparison Project utför en komplett parvis jämförelse mellan alla förutsagda proteinsekvenser , och erhåller index som används (tillsammans med standardiserad Gene Ontology) som referensförråd för annotatorgemenskapen. Projektet tillhandahåller ovärderliga datakällor för biologer. Sekvenslikhetsjämförelseprogrammet som används i Genome Comparison Project kallas SSEARCH. Detta program hittar matematiskt den bästa lokala anpassningen mellan sekvenspar och är en fritt tillgänglig implementering av Smith-Waterman-algoritmen.

SSEARCHs användning möjliggör en exakt anteckning, inkonsekvenskorrigering och möjlig funktionstilldelning till hypotetiska proteiner med okänd funktion. Dessutom är proteiner med flera domäner och funktionella element korrekt upptäckta. Även avlägsna relationer upptäcks.

Se även

Anteckningar

externa länkar