Nationellt centrum för bioteknikinformation


Nationellt centrum för bioteknikinformation
Förkortning NCBI
Grundad 1988 ; 35 år sedan ( 1988 )
Huvudkontor Bethesda , Maryland
Plats
Koordinater Koordinater :
Officiellt språk
engelsk
Direktör

Stephen Sherry (sedan 26 september 2022)
Föräldraorganisation
United States National Library of Medicine
Tillhörigheter National Institutes of Health
Hemsida ncbi.nlm.nih.gov

National Center for Biotechnology Information ( NCBI ) är en del av United States National Library of Medicine (NLM), en gren av National Institutes of Health (NIH). Det är godkänt och finansierat av USA: s regering . NCBI ligger i Bethesda, Maryland , och grundades 1988 genom lagstiftning sponsrad av den amerikanska kongressledamoten Claude Pepper .

NCBI har en serie databaser som är relevanta för bioteknik och biomedicin och är en viktig resurs för bioinformatiska verktyg och tjänster. Viktiga databaser inkluderar GenBank för DNA-sekvenser och PubMed , en bibliografisk databas för biomedicinsk litteratur. Andra databaser inkluderar databasen NCBI Epigenomics . Alla dessa databaser är tillgängliga online via Entrez sökmotor. NCBI regisserades av David Lipman , en av de ursprungliga författarna till BLAST -sekvensanpassningsprogrammet och en allmänt respekterad figur inom bioinformatik .

GenBank

NCBI har haft ansvaret för att tillgängliggöra GenBanks DNA- sekvensdatabas sedan 1992. GenBank samordnar med enskilda laboratorier och andra sekvensdatabaser, såsom de från European Molecular Biology Laboratory (EMBL) och DNA Data Bank of Japan (DDBJ).

Sedan 1992 har NCBI vuxit till att tillhandahålla andra databaser utöver GenBank. NCBI tillhandahåller Gene, Online Mendelian Inheritance in Man , Molecular Modeling Database (3D-proteinstrukturer), dbSNP (en databas med enkelnukleotidpolymorfismer ), Reference Sequence Collection, en karta över det mänskliga genomet och en taxonomiwebbläsare och koordinater med National Cancer Institute för att tillhandahålla Cancer Genome Anatomy Project. NCBI tilldelar en unik identifierare (taxonomi-ID-nummer) till varje art av organism.

NCBI har mjukvaruverktyg som är tillgängliga via webbläsare eller via FTP . Till exempel BLAST ett program för sökning av sekvenslikheter. BLAST kan göra sekvensjämförelser mot GenBank DNA-databasen på mindre än 15 sekunder.

NCBI bokhylla

NCBI Bookshelf är en samling fritt tillgängliga, nedladdningsbara onlineversioner av utvalda biomedicinska böcker. Bokhyllan täcker ett brett spektrum av ämnen inklusive molekylärbiologi , biokemi , cellbiologi , genetik , mikrobiologi , sjukdomstillstånd ur molekylär och cellulär synvinkel, forskningsmetoder och virologi . Vissa av böckerna är onlineversioner av tidigare publicerade böcker, medan andra, som Coffee Break , är skrivna och redigerade av NCBI-personal. Bokhyllan är ett komplement till Entrez PubMed -arkivet av referentgranskade publikationssammandrag genom att bokhyllans innehåll ger etablerade perspektiv på utvecklande studieområden och ett sammanhang där många olika enskilda delar av rapporterad forskning kan organiseras. [ citat behövs ]

Basic Local Alignment Search Tool (BLAST)

BLAST är en algoritm som används för att beräkna sekvenslikhet mellan biologiska sekvenser, såsom nukleotidsekvenser av DNA och aminosyrasekvenser av proteiner. BLAST är ett kraftfullt verktyg för att hitta sekvenser som liknar frågesekvensen inom samma organism eller i olika organismer. Den söker igenom frågesekvensen på NCBI-databaser och servrar och skickar tillbaka resultaten till personens webbläsare i det valda formatet. Inmatningssekvenser till BLAST är oftast i FASTA- eller GenBank-format medan utdata kan levereras i en mängd olika format som HTML, XML-formatering och vanlig text. HTML är standardutdataformatet för NCBI:s webbsida. Resultaten för NCBI-BLAST presenteras i grafiskt format med alla hittade träffar, en tabell med sekvensidentifierare för träffarna som har poängrelaterade data, tillsammans med anpassningarna för sekvensen av intresse och träffarna som mottagits med analoga BLAST-poäng för dessa.

Entrez

Entrez Global Query Cross-Database Search System används på NCBI för alla stora databaser som nukleotid- och proteinsekvenser, proteinstrukturer, PubMed, taxonomi, kompletta genom, OMIM och flera andra . Entrez är både ett indexerings- och hämtningssystem med data från olika källor för biomedicinsk forskning. NCBI distribuerade den första versionen av Entrez 1991, sammansatt av nukleotidsekvenser från PDB och GenBank , proteinsekvenser från SWISS-PROT, översatta GenBank, PIR, PRF, PDB och tillhörande sammanfattningar och citat från PubMed. Entrez är speciellt utformad för att integrera data från flera olika källor, databaser och format till en enhetlig informationsmodell och hämtningssystem som effektivt kan hämta relevanta referenser, sekvenser och strukturer.

Gen

Gene har implementerats vid NCBI för att karakterisera och organisera informationen om gener. Den fungerar som en huvudnod i kopplingen till den genomiska kartan, uttryck, sekvens, proteinfunktion, struktur och homologidata. Ett unikt GeneID tilldelas varje genpost som kan följas genom revisionscykler. Genposter för kända eller förutspådda gener etableras här och är avgränsade av kartpositioner eller nukleotidsekvenser. Gene har flera fördelar jämfört med sin föregångare, LocusLink, inklusive bättre integration med andra databaser i NCBI, bredare taxonomisk räckvidd och förbättrade alternativ för sökning och hämtning från Entrez-systemet.

Protein

Proteindatabasen upprätthåller textposten för individuella proteinsekvenser, härledda från många olika resurser såsom NCBI Reference Sequence (RefSeq)-projektet, GenBank, PDB och UniProtKB/SWISS-Prot. Proteinposter finns i olika format inklusive FASTA och XML och är länkade till andra NCBI-resurser. Protein tillhandahåller relevant data till användarna såsom gener, DNA/RNA-sekvenser, biologiska vägar, expressions- och variationsdata och litteratur. Den tillhandahåller också de förutbestämda uppsättningarna av liknande och identiska proteiner för varje sekvens som beräknats av BLAST. Strukturdatabasen för NCBI innehåller 3D-koordinatuppsättningar för experimentellt bestämda strukturer i PDB som importeras av NCBI. Den konserverade domändatabasen ( CDD ) av protein innehåller sekvensprofiler som karaktäriserar mycket konserverade domäner inom proteinsekvenser. Den har också uppgifter från externa resurser som SMART och Pfam . Det finns en annan databas med proteiner känd som Protein Clusters databas, som innehåller uppsättningar av proteinsekvenser som är klustrade enligt de maximala anpassningarna mellan de individuella sekvenserna som beräknats av BLAST.

Pubchem databas

PubChem databas av NCBI är en offentlig resurs för molekyler och deras aktiviteter mot biologiska analyser. PubChem är sökbart och tillgängligt av Entrez informationshämtningssystem.

Se även

externa länkar