Kolhydratstrukturdatabas
Innehåll | |
---|---|
Beskrivning | Naturliga kolhydratstrukturer med NMR , bibliografiska och biologiska anteckningar. |
Datatyper infångade |
kolhydratstrukturer och relaterade data |
Organismer |
|
Kontakt | |
Forskningscenter | Zelinsky Institute of Organic Chemistry |
Författare | Philip V. Toukach, Ksenia S. Egorova, Yuri A. Knirel, et al. |
Primärt citat | Kolhydratstrukturdatabas |
Utgivningsdatum | 2005 |
Tillgång | |
Hemsida | http://csdb.glycoscience.ru/ |
Ladda ner URL | exportfunktion i webbgränssnitt |
Verktyg | |
webb | |
Diverse | |
Versionering | ja |
Frekvens för datautgivning |
årlig |
Version | 1 (sammanslagna) |
Kurationspolicy | ja (manuell och automatisk) |
Carbohydrate Structure Database (CSDB) är en gratis kurerad databas och tjänsteplattform inom glykoinformatik , lanserad 2005 av en grupp ryska forskare från ND Zelinsky Institute of Organic Chemistry, Russian Academy of Sciences. CSDB lagrar publicerade strukturella, taxonomiska, bibliografiska och NMR-spektroskopiska data om naturliga kolhydrater och kolhydratrelaterade molekyler.
Översikt
Huvuddata som lagras i CSDB är kolhydratstrukturer av bakteriellt, svamp- och växtursprung. Varje struktur tilldelas en organism och är försedd med länken/länkarna till motsvarande vetenskapliga publikation/er, där den beskrevs. Förutom strukturella data lagrar CSDB även NMR- spektra, information om metoder som används för att dechiffrera en viss struktur och en del annan data. CSDB ger tillgång till flera kolhydratrelaterade forskningsverktyg:
- Simulering av 1D och 2D NMR- spektra av kolhydrater ( GODDESS: glykanorienterad databasdriven empirisk spektrumsimulering) .
- Automatiserad NMR -baserad strukturbelysning ( GRASS: generering, rangordning och tilldelning av sackaridstrukturer ).
- Statistisk analys av strukturell egenskapsfördelning i glykomer hos levande organismer
- Generering av optimerade atomkoordinater för en godtycklig sackarid och subdatabas av konformationskartor.
- Taxonkluster baserat på likheter mellan glykomer ( kolhydratbaserat livets träd )
- Glycosyltransferase subdatabas ( GT-explorer )
Historia och finansiering
Fram till 2015 fanns databaserna Bacterial Carbohydrate Structure Database (BCSDB) och Plant & Fungal Carbohydrate Structure Database (PFCSDB) parallellt. 2015 slogs de samman i den enda kolhydratstrukturdatabasen (CSDB). Utvecklingen och underhållet av CSDB har finansierats av International Science and Technology Center (2005-2007), Rysslands presidents anslagsprogram (2005-2006), Russian Foundation for Basic Research (2005-2007,2012-2014,2015-2017, 2018-2020), Deutsches Krebsforschungszentrum (kort sikt 2006-2010) och Russian Science Foundation (2018-2020).
Datakällor och täckning
De huvudsakliga källorna till CSDB-data är:
- Vetenskapliga publikationer indexerade i de dedikerade citeringsdatabaserna, inklusive NCBI Pubmed och Thomson Reuters Web Of Science (ca 18 000 poster).
- CCSD (Carbbank ) databas (ca 3000 poster).
Data väljs ut och läggs till CSDB manuellt genom att bläddra i original vetenskapliga publikationer. Uppgifterna som kommer från andra databaser är föremål för felkorrigering och godkännandeförfaranden. Från och med 2017 är täckningen för bakterier och arkéer ca. 80 % av kolhydratstrukturerna publicerade i vetenskaplig litteratur. Tidsförskjutningen mellan publicering av relativa data och deras deponering i CSDB är cirka 18 månader. Växter täcks fram till 1997 och svampar fram till 2012. CSDB täcker inte data från animaliadomänen, förutom encelliga metazoer . Det finns ett antal dedikerade databaser över animaliska kolhydrater , t.ex. UniCarbKB eller GLYCOSCIENCES.de .
CSDB rapporteras som ett av de största projekten inom glykoinformatik . Det används i strukturella studier av naturliga kolhydrater och i glykoprofilering. Innehållet i CSDB har använts som datakälla i andra glykoinformatikprojekt .
Deponerade föremål
- Molekylära strukturer av glykaner , glykopolymerer och glykokonjugat : primär struktur, aglykoninformation , polymerisationsgrad och molekylklass. Strukturell omfattning inkluderar molekyler sammansatta av rester ( monosackarider , alditoler , aminosyror , fettsyror etc.) sammanlänkade med glykosid- , ester-, amid-, ketal-, fosfo- eller sulfodiesterbindningar, i vilka minst en rest är en monosackarid eller dess derivat. .
- Bibliografi förknippad med strukturer: avtrycksdata, nyckelord, sammandrag, ID:n i bibliografiska databaser
- Biologiskt sammanhang för strukturer: associerat taxon , stam , serogrupp , värdorganism, sjukdomsinformation. De täckta domänerna är: prokaryoter, växter, svampar och utvalda patogena encelliga metazoer . Databasen innehåller endast glykaner som härrör från dessa domäner eller erhålls genom kemisk modifiering av sådana glykaner.
- Tilldelade NMR- spektra och experimentella förhållanden.
- Glykosyltransferaser associerade med taxoner: gen- och enzymidentifierare , fullständiga strukturer, donator och substrat, metoder som används för att bevisa enzymatisk aktivitet, tillförlitlighetsnivå.
- Referenser till andra databaser
- Övriga uppgifter insamlade från originalpublikationer
- Konformationskartor över disackarider härledda från simuleringar av molekylär dynamik .
Samverkan med andra databaser
CSDB är tvärlänkad till andra glykomiska databaser, såsom MonosaccharideDB , Glycosciences.DE , NCBI Pubmed , NCBI Taxonomy , NLM catalog , International Classification of Diseases 11 , etc. Förutom en inbyggd notation, CSDB Linjär, presenteras strukturer i multipla kolhydratnotationer. (SNFG, SweetDB, GlycoCT, WURCS , GLYCAM , etc.). CSDB kan exporteras som ett Resource Description Framework ) enligt GlycoRDF- ontologin.
externa länkar
- CSDB hemsida
- Exempel på användning av CSDB
- CSDB teknisk dokumentation
- CSDB linjär (strukturkodningsnotation)
- Kolhydratdatabaser registrerade i NAR-samling
- Kolhydratdatabaser under det senaste decenniet (lection)