PubChem

PubChem
PubChem logo.svg
Innehåll
Beskrivning Kemikalier och deras bioanalyser
Organismer Människor och andra djur
Kontakt
Forskningscenter NCBI
Primärt citat   PMID 15879180
Tillgång
Hemsida https://pubchem.ncbi.nlm.nih.gov/
Ladda ner URL FTP
Webbtjänstens URL PUG-vy
Diverse
Licens Allmängods

PubChem är en databas över kemiska molekyler och deras aktiviteter mot biologiska analyser . Systemet underhålls av National Center for Biotechnology Information (NCBI), en komponent i National Library of Medicine , som är en del av United States National Institute of Health (NIH). PubChem kan nås gratis via ett webbanvändargränssnitt . Miljontals sammansatta strukturer och beskrivande datamängder kan laddas ner gratis via FTP . PubChem innehåller flera ämnesbeskrivningar och små molekyler med färre än 100 atomer och 1 000 bindningar. Mer än 80 databasleverantörer bidrar till den växande PubChem-databasen.

Historia

PubChem släpptes 2004 som en del av Molecular Libraries Program (MLP) av NIH. Från och med november 2015 innehåller PubChem mer än 150 miljoner substansbeskrivningar tillhandahållna av insättare, 60 miljoner unika kemiska strukturer och 225 miljoner testresultat för biologisk aktivitet (från över 1 miljon analysexperiment utförda på mer än 2 miljoner små molekyler som täcker nästan 10 000 unika proteinmålsekvenser som motsvarar mer än 5 000 gener). Den innehåller också screeninganalyser för RNA-interferens (RNAi) som riktar sig mot över 15 000 gener.

Från och med augusti 2018 innehåller PubChem 247,3 miljoner ämnesbeskrivningar, 96,5 miljoner unika kemiska strukturer, bidragit med 629 datakällor från 40 länder. Den innehåller också 237 miljoner bioaktivitetstestresultat från 1,25 miljoner biologiska analyser, som täcker >10 000 målproteinsekvenser.

Från och med 2020, med dataintegration från över 100 nya källor, innehåller PubChem mer än 293 miljoner substansbeskrivningar tillhandahållna av insättare, 111 miljoner unika kemiska strukturer och 271 miljoner bioaktivitetsdatapunkter från 1,2 miljoner biologiska analysexperiment.

Databaser

PubChem består av tre dynamiskt växande primära databaser. Från och med den 5 november 2020 (antal bioanalyser är oförändrat):

  • Föreningar, 111 miljoner poster (upp från 94 miljoner poster 2017), innehåller rena och karakteriserade kemiska föreningar.
  • Ämnen, 293 miljoner poster (upp från 236 miljoner poster 2017 och 163 miljoner i september 2014), innehåller även blandningar, extrakt , komplex och okarakteriserade ämnen.
  • BioAssay, bioaktivitet är resultatet av 1,25 miljoner (upp från 6 000 i september 2014) screeningprogram med hög genomströmning med flera miljoner värden.

Sökande

Det är möjligt att söka i databaserna efter ett brett utbud av egenskaper, inklusive kemisk struktur, namnfragment, kemisk formel , molekylvikt , XLogP och antal vätebindningsdonatorer och acceptorer.

PubChem innehåller en egen online- molekylredigerare med SMILES /SMARTS och InChI- stöd som tillåter import och export av alla vanliga kemiska filformat för att söka efter strukturer och fragment.

Varje träff ger information om synonymer, kemiska egenskaper, kemisk struktur inklusive SMILES och InChI-strängar, bioaktivitet och länkar till strukturellt relaterade föreningar och andra NCBI-databaser som PubMed .

I textsökningsformuläret kan databasfälten sökas genom att lägga till fältnamnet inom hakparenteser till sökordet. Ett numeriskt område representeras av två tal separerade med ett kolon. Söktermerna och fältnamnen är skiftlägesokänsliga. Parenteser och de logiska operatorerna AND, OR och NOT kan användas. OCH antas om ingen operator används.

Exempel ( Lipinskis regel om fem ):

0:500[mw] 0:5[hbdc] 0:10[hbac] -5:5[logp]

Databasfält


Identifikationsnummer
Identifikationsnummer i aktuell databas [UID]
Ämnets identifieringsnummer [SID]
Sammansatt identifikationsnummer [CID]
BioAssay identifikationsnummer [BAID], [AID]

Allmän
Vilket databasfält som helst [ALLT]
Kommentar [CMT]
Deponeringsdatum [DDAT], [DEPDAT]
Insättarens externa ID [SRID], [SRCID]
KÄLLNAMN [SRC], [SRCNAM], [SRCNAME]
Releasedatum för källan [SRD], [SRDAT], [RLSDAT]
Medicinsk ämnesrubrik (MeSH) term [MSHT], [MESHT]
MeSH-trädnod [MSHN], [MESHTN]
MeSH farmakologiska effekter [PHMA], [PHARMA]

Ämnesegenskaper
Ämnessynonymer [SYNO]
IUPAC-namn [UPAC], [IUPAC]
International Chemical Identifier (InChI) [INCHI]
Molekylvikt [MW], [MWT], [MOLWT]
Kemiska grundämnen [ELMT], [EL]
Icke-väteatomer [HAC], [HACNT]
Antal isotoper [IAC], [IACNT]
Total formell avgift [TFC], [CHG], [CHRG]
Chiral atomantal [ACC], [ACCNT]
Definierat antal kirala atomer [ACDC], [ACDCNT]
Odefinierat antal kirala atomer [ACUC], [ACUCNT]
Antal vätebindningsacceptorer [HBAC], [HBACNT]
Antal vätebindningsgivare [HBDC], [HBDCNT]
Tautomer räkning [TC], [TCNT], [TTMC]
Roterbart bindningsantal [RBC], [RBCNT]
XLogP [XLGP], [LOGP]

Sammansatta egenskaper
Sammansatta synonymer [CSYN], [CSYNO]
Antal komponenter [CC], [CCNT]
Antal kovalenta enheter (molekyler). [CUC], [CUCNT]
Totalt antal bioaktivitet [TAC]

Se även

externa länkar