Likhetsmatris av proteiner

Similarity Matrix of Proteins ( SIMAP ) är en databas över proteinlikheter skapade med hjälp av volontärberäkningar . Den är fritt tillgänglig för vetenskapliga ändamål. SIMAP använder FASTA- algoritmen för att förberäkna proteinlikhet, medan en annan applikation använder dolda Markov-modeller för att söka efter proteindomäner . SIMAP är ett gemensamt projekt av Münchens tekniska universitet , Helmholtz Zentrum München och Wiens universitet .

Projekt

Projektet fick oftast nya arbetsenheter i början av varje månad. På senare tid (2010) har införandet av miljösekvenser i databasen krävt längre perioder av aktivitet, till exempel flera månaders kontinuerligt arbete. Vanligtvis inträffade dessa uppdateringar två gånger varje år. [ citat behövs ]

Under det fjärde kvartalet 2010 flyttade projektet till Wiens universitet på grund av den felaktiga elektriska infrastrukturen vid Münchens tekniska universitet. En del av denna övning involverade skapandet av en projektspecifik URL som kräver att befintliga volontärer och användare kopplas loss/återkopplar till projektet.

Den 30 maj 2014 tillkännagavs det av projektadministratörer att SIMAP efter en 10-årig historia skulle lämna BOINC i slutet av 2014. SIMAP-forskningen kommer dock att fortsätta med användning av lokal hårdvara bestående av "vanlig multi -kärnprocessorer (några hundratals), knäpper en SSE-optimerad version av Smith-Waterman-algoritmen ."

Datorplattform

SIMAP använde Berkeley Open Infrastructure for Network Computing (BOINC) distribuerad datorplattform .

Anteckningar om applikationsprestanda

Arbetsenhetens CPU-tider varierade kraftigt, mellan 15 minuter och 3 timmar. Arbetsenheterna varierade i storlek från 1,5 till 2,2 MB vardera, i genomsnitt cirka 2 MB. SIMAP tillhandahöll klientprogramvara optimerad för SSE- aktiverade processorer och x86-64- processorer. För äldre processorer tillhandahålls icke SSE-applikationer men kräver manuella installationssteg. Operativsystem som stöds av SIMAP är Linux , Windows , Mac OS , Android och andra UNIX-plattformar. Eftersom databasen ibland hade kompletterats med alla allmänt kända proteinsekvenser och metagenomer som förberäknats av projektet, bestod det tillgängliga arbetet av nypublicerade proteinsekvenser och metagenomer som behövde förberäknas för SIMAP.

Se även

externa länkar