Omfattande antibiotikaresistensdatabas

Den omfattande databasen över antibiotikaresistens
McArthur Lab Logo.png
Innehåll
Beskrivning The Comprehensive Antibiotic Resistance Database tillhandahåller data, modeller och algoritmer relaterade till den molekylära basen för antimikrobiell resistens.

Datatyper infångade
Antimikrobiell resistensgener och fenotyper
Organismer Bakterie
Kontakt
Forskningscenter McMaster University
Primärt citat   PMID 27789705
Tillgång
Hemsida kort .mcmaster .ca
Ladda ner URL Ladda ner
Diverse

Bokmärkbara enheter
ja

The Comprehensive Antibiotic Resistance Database (CARD) är en biologisk databas som samlar in och organiserar referensinformation om antimikrobiella resistensgener, proteiner och fenotyper. Databasen täcker alla typer av läkemedelsklasser och resistensmekanismer och strukturerar sina data utifrån en ontologi. CARD-databasen var en av de första resurserna som täckte gener för antimikrobiella resistens. Resursen uppdateras varje månad och tillhandahåller verktyg som gör det möjligt för användare att hitta potentiella antibiotikaresistensgener i nyligen sekvenserade genom.

Ontologi

Varje resistensbestämningsfaktor som beskrivs av CARD Antibiotic Resistance Ontology (ARO) måste inkludera en koppling till var och en av tre grenar: Determinant för antibiotikaresistens, Antibiotikummolekyl och Mechanism of Antibiotic Resistance. CARD har nyligen också lanserat utkast till ontologier för både virulens och mobila genetiska element, som är i aktiv utveckling.

Kuration

CARD-kuration sker kontinuerligt, med månatliga uppdateringar som släpps av ett team av biokuratorer. Kurationsprocessen innebär i första hand regelbunden granskning av tillgänglig vetenskaplig litteratur. Påtvingade riktlinjer för kurering tillhandahåller det nödvändiga sammanhanget för att säkerställa korrekt hierarkisk klassificering, definierade semantiska relationer och datastandardisering. Biokurationsteamet kommenterar dessutom varje ARO-term med kompletterande information från externa referenser, inklusive relevanta publikationer, kemiska strukturer eller proteinstruktur via Protein Data Bank . ARO-termer för AMR-determinanter är parade med en AMR-detektionsmodell, som inkluderar nukleotid- och peptidsekvensen hämtad från NCBI GenBank och eventuella ytterligare parametrar som behövs för att förutsäga determinanten från rå DNA-sekvens. Kuration kompletteras ibland med de novo-analyser, ofta för att lösa problematisk nomenklatur.

Sammantaget är CARD:s primära kurationsparadigm följande: för att inkluderas i CARD måste en AMR-determinant beskrivas i en fackgranskad vetenskaplig publikation, med dess DNA-sekvens tillgänglig i GenBank, inklusive tydliga experimentella bevis på förhöjd minimiinhibitorisk koncentration (MIC) över kontroller. AMR-gener som förutspås av in silico-metoder, men som inte karakteriseras experimentellt, ingår inte i CARDs primära kuration. Ändå avslöjade dataharmoniseringsinsatser under 2019, som involverade en jämförelse av ResFinder, ARG-ANNOT och NCBI:s katalog över β-laktamasalleler, ett stort antal historiska β-laktamaser utan tillhörande referentgranskad publikation. Eftersom β-laktamaser utgör nästan en tredjedel av ARO-termer i CARD, leder den konventionen till att varje β-laktamassekvensvariant får ett nytt namn i litteraturen och saknar β-laktamasreferenssekvenser i CARD, vilket leder till annoteringsoprecision av RGI och anmärkningsvärt innehållsskillnader mellan CARD och andra databaser. CARD inkluderar nu β-laktamasreferenssekvenser och namn även om de saknar publicerade experimentella bevis på förhöjd MIC. Denna back-kuration av äldre β-laktamassekvenser pågår.

Medan en stor del av CARDs värde är expert biokurering av AMR-sekvensdata och dess relation till antibiotika, med AMR-publikationer i PubMed som överstiger över 5000 per år under de senaste 10 åren är uppgiften att hålla CARD både heltäckande och uppdaterad. skrämmande. CARD tar itu med detta problem med hjälp av tre metoder: ad hoc-biokurering, patogen AMR-genomgångar och datorstödd litteraturtriage. Ad hoc-biokurering innebär att ta itu med feedback från AMR-forskningssamhället samt litteratur som upptäckts under kvalitetskontroller eller granskning av AMR-gennomenklaturen. Patogen AMR-granskning innebär systematisk genomgång av AMR-litteraturen för specifika patogener. Under 2017 introducerades CARD*Shark text-mining-algoritmen för datorstödd litteraturtriage, som har utökats baserat på de nya ARO Drug Class-klassificeringstaggarna. CARD*Shark tilldelar publikationer prioriterade poäng från en allmän PubMed Medical Subject Headings (MeSH)-sökning baserat på relevans och tilldelar resultaten till en CARD-biokurator för manuell granskning.

CARD-kuratorteamet uppdaterar kontinuerligt databasen på en utvecklingsserver och före release implementeras rigorösa QC-skript för att validera dessa data innan de porteras till den allmänt tillgängliga webbplatsen. Dessa QC-steg verifierar användningen av externa identifierare, publikationscitat, parametrar för AMR-detektionsmodeller och påtvingade regler för ontologistrukturen. Eventuella upptäckta problem löses före release. Efter QC uppdateras den offentliga CARD-webbplatsen varje månad. Webbplatsen innehåller också en inbyggd BLAST-instans för att jämföra sekvenser med CARD-referenssekvenser och en webbinstans av RGI för resistomprediktion med datavisualiseringsverktyg.

Samhällsengagemang

Som svar på 2019 års Europeiska kommissionens gemensamma forskningscenter (JRC) AMR Databases Workshop, etablerades det offentliga arkivet 'AMR_Curation' för kollektiv kurering av AMR-gener och mutationer som involverar majoriteten av AMR-databaskuratorer (t.ex. NCBI, Resfinder, MEGARes, etc.). ) med en aktiv och övervakad kuratorspårare, en parallell e-postlista för AMR-kuration, redigerbar Google-kalkylbladslista över AMR-databaser och programvara och en kurerad Wikipedia-lista över AMR-databaser, allt tillgängligt på https://github.com/arpcard/amr_curation . CAD uppmuntrar forskare, mjukvaruutvecklare och AMR-datakuratorer att använda detta arkiv och tillhörande resurser för att skicka in, diskutera och lösa AMR-kuratorproblem. Alla med ett GitHub-konto kan skicka in ett problem.

AMR-detekteringsmodeller

CARDs modellontologi inkluderar referensnukleotid- och proteinsekvenser, såväl som ytterligare sökparametrar inklusive mutationer som ger AMR (om tillämpligt) och kurerade BLAST(P/N)-bitpoänggränser. Majoriteten av CARD AMR-determinanter använder antingen en proteinhomologmodell (PHM) eller en proteinvariantmodell (PVM). PHM förutsäger AMR-proteinsekvenser från rå DNA-sekvens baserad på homologi till en kurerad referenssekvens, baserad på en kurerad BLAST-bitpoänggräns. PVM:er utför en liknande sökning, men inkluderar ytterligare parametrar för detektion av specifika kurerade icke-synonyma mutationer eller andra genetiska varianter (dvs. INDELs, ramskiftningar) som skiljer mellan antibiotikakänsliga vildtyps- och antibiotikaresistenta alleler.

Från 2017 övergick CARD varje detektionsmodell till kurerade BLAST-bitpoänggränser, vilket avbröt användningen av mindre diskriminerande BLAST-förväntningsvärden (E). Bitpoäng cut-offs väljs baserat på värden som utför denna diskriminering när den kurerade referenssekvensen jämförs av BLAST mot CARD självt och mot GenBanks icke-redundanta databas, med handinspektion för att fastställa ett värde som korrekt klassificerar matchningar som homologer av liknande antimikrobiella medel funktion eller liknande proteiner med annan funktion eller medlemskap i AMR-genfamiljen. Den asymptotiska karaktären hos BLAST-förväntningsvärdet (E) gav det mycket låg diskriminerande kraft mellan olika β-laktamasgenfamiljer (nästan ⅓ av CARDs innehåll), men den linjära karaktären hos BLAST-bitpoängen tillät denna nivå av diskriminering.

Se även