Proteomics Identifications Database

PRIDE (PROteomics IDentifications-databasen) är ett offentligt datalager för masspektrometri (MS) baserad proteomikdata , och underhålls av European Bioinformatics Institute som en del av Proteomics Team.

Ursprungligen designad av Lennart Martens 2003 under en vistelse på European Bioinformatics Institute som Marie Curie-stipendiat vid Europeiska kommissionen i programmet "Quality of Life" (kontraktsnummer: QLRI-1999-50595), PRIDE etablerades som en produktionstjänst år 2005. Det ursprungliga bidragsansökningsdokumentet från juni 2013 för att starta byggandet av PRIDE har sedan dess publicerats i en synvinkelartikel. Flera liknande proteomikdatabaser har byggts, inklusive GPMDB, PeptideAtlas , Proteinpedia och NCBI Peptidome.

PRIDE-databasen utgör ett strukturerat datalager och lagrar den ursprungliga experimentella data från forskarna utan redaktionell kontroll över inlämnad data.

Totalt innehåller PRIDE data från cirka 60 arter, den största delen av dem kommer från mänskliga prover (inklusive data från de två mänskliga proteomerna) följt av fruktflugan Drosophila melanogaster och mus.

Format och inlämningsprocessen

Eftersom detaljerade proteomikdata för närvarande inte kan sammanställas från den befintliga litteraturen, är källan till PRIDE-data endast inlämningar av akademiska forskare.

PRIDE är ett standardkompatibelt offentligt arkiv, vilket innebär att dess egna XML -baserade datautbytesformat för inlämningar, PRIDE XML, byggdes kring Proteomics Standards Initiative mzData-standarden för masspektrometri . Nyligen har PRIDE anpassats för att fungera med de moderna mzML- och mzIdentML-standarderna i Proteomics Standards Initiative . Ett ytterligare format, kallat mzTab, kan användas som ett förenklat sätt att skicka in kvantitativa proteomikdata.

Eftersom det finns många typer av olika masspektrometriinstrument och mjukvaruformat för närvarande finns på marknaden, hade våtlabbforskare utan en stark bioinformatikbakgrund eller informatikstöd problem med att konvertera sina data till PRIDE XML. Utvecklingen av PRIDE Converter hjälpte till att tackla denna situation. PRIDE Converter är ett verktyg, skrivet i programmeringsspråket Java , som konverterar 15 olika indataformat för masspektrometri till PRIDE XML via ett guideliknande grafiskt användargränssnitt. Den är fritt tillgänglig och är öppen källkod under den tillåtande Apache-licensen . En ny version av PRIDE Converter släpptes 2012 som PRIDE Converter 2. Denna nya version utgjorde en fullständig omskrivning, fokuserad på enkel anpassning till olika (och utvecklande) datakällor.

Bläddring, sökning och datautvinning PRIDE

För närvarande kan data sökas från PRIDE via PRIDE-webbgränssnittet, genom den fristående Java-klienten PRIDE Inspector, eller kopplas direkt till flera sökmotorer via PeptideShaker. Dessutom ger ett nytt RESTful API bekväm programmatisk åtkomst till PRIDE-arkivet.

Den omfattande användningen av kontrollerade vokabulärer (CV) och ontologier för flexibel men ändå kontextkänslig annotering av data, tillsammans med förmågan att utföra intelligenta frågor med dessa annoteringar, är nyckelfunktioner i PRIDE.

Engagemang i ProteomeXchange

ProteomeXchange-konsortiet har bildats för att tillhandahålla en samordnad inlämning av MS-proteomikdata till de viktigaste befintliga proteomikförråden och för att uppmuntra optimal dataspridning. Konsortiet innehåller flera medlemsdatabaser, inklusive PRIDE och PeptideAtlas . Den tidigaste uppfattningen om ProteomeXchange härrör från ett möte vid HUPO 2005-konferensen i München, där de viktigaste proteomikdataförråden vid den tidpunkten i princip kom överens om att utbyta sina data, och därmed tillhandahålla ett sätt för användaren att hitta offentliga proteomikdata på någon av de deltagande databaserna. På grund av den snabba utvecklingen av området och behovet av att först utveckla lämpliga standarder för datautbyte tog det nästan tio år från det mötet att faktiskt implementera detta system, en insats som finansierades av "ProteomeXchange" Coordination Action-anslaget från Europeiska kommissionens sjunde ramprogram.

Dataåterställning efter avslutad behandling med Peptidome

NCBI Peptidome-databasen avbröts 2011, men en gemensam ansträngning av PRIDE- och Peptidome-teamen resulterade i att all Peptidome-data överfördes till PRIDE.

externa länkar