PubChem
Innehåll | |
---|---|
Beskrivning | Kemikalier och deras bioanalyser |
Organismer | Människor och andra djur |
Kontakt | |
Forskningscenter | NCBI |
Primärt citat | PMID 15879180 |
Tillgång | |
Hemsida | https://pubchem.ncbi.nlm.nih.gov/ |
Ladda ner URL | FTP |
Webbtjänstens URL | PUG-vy |
Diverse | |
Licens | Allmängods |
PubChem är en databas över kemiska molekyler och deras aktiviteter mot biologiska analyser . Systemet underhålls av National Center for Biotechnology Information (NCBI), en komponent i National Library of Medicine , som är en del av United States National Institute of Health (NIH). PubChem kan nås gratis via ett webbanvändargränssnitt . Miljontals sammansatta strukturer och beskrivande datamängder kan laddas ner gratis via FTP . PubChem innehåller flera ämnesbeskrivningar och små molekyler med färre än 100 atomer och 1 000 bindningar. Mer än 80 databasleverantörer bidrar till den växande PubChem-databasen.
Historia
PubChem släpptes 2004 som en del av Molecular Libraries Program (MLP) av NIH. Från och med november 2015 innehåller PubChem mer än 150 miljoner substansbeskrivningar tillhandahållna av insättare, 60 miljoner unika kemiska strukturer och 225 miljoner testresultat för biologisk aktivitet (från över 1 miljon analysexperiment utförda på mer än 2 miljoner små molekyler som täcker nästan 10 000 unika proteinmålsekvenser som motsvarar mer än 5 000 gener). Den innehåller också screeninganalyser för RNA-interferens (RNAi) som riktar sig mot över 15 000 gener.
Från och med augusti 2018 innehåller PubChem 247,3 miljoner ämnesbeskrivningar, 96,5 miljoner unika kemiska strukturer, bidragit med 629 datakällor från 40 länder. Den innehåller också 237 miljoner bioaktivitetstestresultat från 1,25 miljoner biologiska analyser, som täcker >10 000 målproteinsekvenser.
Från och med 2020, med dataintegration från över 100 nya källor, innehåller PubChem mer än 293 miljoner substansbeskrivningar tillhandahållna av insättare, 111 miljoner unika kemiska strukturer och 271 miljoner bioaktivitetsdatapunkter från 1,2 miljoner biologiska analysexperiment.
Databaser
PubChem består av tre dynamiskt växande primära databaser. Från och med den 5 november 2020 (antal bioanalyser är oförändrat):
- Föreningar, 111 miljoner poster (upp från 94 miljoner poster 2017), innehåller rena och karakteriserade kemiska föreningar.
- Ämnen, 293 miljoner poster (upp från 236 miljoner poster 2017 och 163 miljoner i september 2014), innehåller även blandningar, extrakt , komplex och okarakteriserade ämnen.
- BioAssay, bioaktivitet är resultatet av 1,25 miljoner (upp från 6 000 i september 2014) screeningprogram med hög genomströmning med flera miljoner värden.
Sökande
Det är möjligt att söka i databaserna efter ett brett utbud av egenskaper, inklusive kemisk struktur, namnfragment, kemisk formel , molekylvikt , XLogP och antal vätebindningsdonatorer och acceptorer.
PubChem innehåller en egen online- molekylredigerare med SMILES /SMARTS och InChI- stöd som tillåter import och export av alla vanliga kemiska filformat för att söka efter strukturer och fragment.
Varje träff ger information om synonymer, kemiska egenskaper, kemisk struktur inklusive SMILES och InChI-strängar, bioaktivitet och länkar till strukturellt relaterade föreningar och andra NCBI-databaser som PubMed .
I textsökningsformuläret kan databasfälten sökas genom att lägga till fältnamnet inom hakparenteser till sökordet. Ett numeriskt område representeras av två tal separerade med ett kolon. Söktermerna och fältnamnen är skiftlägesokänsliga. Parenteser och de logiska operatorerna AND, OR och NOT kan användas. OCH antas om ingen operator används.
Exempel ( Lipinskis regel om fem ):
0:500[mw] 0:5[hbdc] 0:10[hbac] -5:5[logp]
Databasfält
Identifikationsnummer |
||
• | Identifikationsnummer i aktuell databas | [UID] |
• | Ämnets identifieringsnummer | [SID] |
• | Sammansatt identifikationsnummer | [CID] |
• | BioAssay identifikationsnummer | [BAID], [AID] |
Allmän |
||
• | Vilket databasfält som helst | [ALLT] |
• | Kommentar | [CMT] |
• | Deponeringsdatum | [DDAT], [DEPDAT] |
• | Insättarens externa ID | [SRID], [SRCID] |
• | KÄLLNAMN | [SRC], [SRCNAM], [SRCNAME] |
• | Releasedatum för källan | [SRD], [SRDAT], [RLSDAT] |
• | Medicinsk ämnesrubrik (MeSH) term | [MSHT], [MESHT] |
• | MeSH-trädnod | [MSHN], [MESHTN] |
• | MeSH farmakologiska effekter | [PHMA], [PHARMA] |
Ämnesegenskaper |
||
• | Ämnessynonymer | [SYNO] |
• | IUPAC-namn | [UPAC], [IUPAC] |
• | International Chemical Identifier (InChI) | [INCHI] |
• | Molekylvikt | [MW], [MWT], [MOLWT] |
• | Kemiska grundämnen | [ELMT], [EL] |
• | Icke-väteatomer | [HAC], [HACNT] |
• | Antal isotoper | [IAC], [IACNT] |
• | Total formell avgift | [TFC], [CHG], [CHRG] |
• | Chiral atomantal | [ACC], [ACCNT] |
• | Definierat antal kirala atomer | [ACDC], [ACDCNT] |
• | Odefinierat antal kirala atomer | [ACUC], [ACUCNT] |
• | Antal vätebindningsacceptorer | [HBAC], [HBACNT] |
• | Antal vätebindningsgivare | [HBDC], [HBDCNT] |
• | Tautomer räkning | [TC], [TCNT], [TTMC] |
• | Roterbart bindningsantal | [RBC], [RBCNT] |
• | XLogP | [XLGP], [LOGP] |
Sammansatta egenskaper |
||
• | Sammansatta synonymer | [CSYN], [CSYNO] |
• | Antal komponenter | [CC], [CCNT] |
• | Antal kovalenta enheter (molekyler). | [CUC], [CUCNT] |
• | Totalt antal bioaktivitet | [TAC] |
Se även
-
Kemisk databas
- CAS Common Chemistry - drivs av American Chemical Society
- Comparative Toxicogenomics Database - drivs av North Carolina State University
- ChEMBL - drivs av European Bioinformatics Institute
- ChemSpider - drivs av Storbritanniens Royal Society of Chemistry
- DrugBank - drivs av University of Alberta
- IUPAC - drivs av den schweiziska baserade International Union of Pure and Applied Chemistry (IUPAC)
- Moltable - drivs av Indiens National Chemical Laboratory
- PubChem - drivs av National Institute of Health, USA
- BindingDB - drivs av University of California, San Diego
- SCRIPDB - drivs av University of Toronto, Kanada
- National Center for Biotechnology Information (NCBI) - drivs av National Institute of Health, USA
- Entrez - drivs av National Institute of Health, USA
- GenBank - drivs av National Institute of Health, USA