Nationellt centrum för bioteknikinformation

Nationellt centrum för bioteknikinformation
Förkortning	NCBI
Grundad	1988 ; 35 år sedan
Huvudkontor	Bethesda , Maryland
Plats	Förenta staterna;
Koordinater	Koordinater :
Officiellt språk	engelsk
Direktör	; Stephen Sherry (sedan 26 september 2022)
Föräldraorganisation	United States National Library of Medicine
Tillhörigheter	National Institutes of Health
Hemsida	ncbi.nlm.nih.gov

National Center for Biotechnology Information ( NCBI ) är en del av United States National Library of Medicine (NLM), en gren av National Institutes of Health (NIH). Det är godkänt och finansierat av USA: s regering . NCBI ligger i Bethesda, Maryland , och grundades 1988 genom lagstiftning sponsrad av den amerikanska kongressledamoten Claude Pepper .

NCBI har en serie databaser som är relevanta för bioteknik och biomedicin och är en viktig resurs för bioinformatiska verktyg och tjänster. Viktiga databaser inkluderar GenBank för DNA-sekvenser och PubMed , en bibliografisk databas för biomedicinsk litteratur. Andra databaser inkluderar databasen NCBI Epigenomics . Alla dessa databaser är tillgängliga online via Entrez sökmotor. NCBI regisserades av David Lipman , en av de ursprungliga författarna till BLAST -sekvensanpassningsprogrammet och en allmänt respekterad figur inom bioinformatik .

GenBank

NCBI har haft ansvaret för att tillgängliggöra GenBanks DNA- sekvensdatabas sedan 1992. GenBank samordnar med enskilda laboratorier och andra sekvensdatabaser, såsom de från European Molecular Biology Laboratory (EMBL) och DNA Data Bank of Japan (DDBJ).

Sedan 1992 har NCBI vuxit till att tillhandahålla andra databaser utöver GenBank. NCBI tillhandahåller Gene, Online Mendelian Inheritance in Man , Molecular Modeling Database (3D-proteinstrukturer), dbSNP (en databas med enkelnukleotidpolymorfismer ), Reference Sequence Collection, en karta över det mänskliga genomet och en taxonomiwebbläsare och koordinater med National Cancer Institute för att tillhandahålla Cancer Genome Anatomy Project. NCBI tilldelar en unik identifierare (taxonomi-ID-nummer) till varje art av organism.

NCBI har mjukvaruverktyg som är tillgängliga via webbläsare eller via FTP . Till exempel BLAST ett program för sökning av sekvenslikheter. BLAST kan göra sekvensjämförelser mot GenBank DNA-databasen på mindre än 15 sekunder.

NCBI bokhylla

NCBI Bookshelf är en samling fritt tillgängliga, nedladdningsbara onlineversioner av utvalda biomedicinska böcker. Bokhyllan täcker ett brett spektrum av ämnen inklusive molekylärbiologi , biokemi , cellbiologi , genetik , mikrobiologi , sjukdomstillstånd ur molekylär och cellulär synvinkel, forskningsmetoder och virologi . Vissa av böckerna är onlineversioner av tidigare publicerade böcker, medan andra, som Coffee Break , är skrivna och redigerade av NCBI-personal. Bokhyllan är ett komplement till Entrez PubMed -arkivet av referentgranskade publikationssammandrag genom att bokhyllans innehåll ger etablerade perspektiv på utvecklande studieområden och ett sammanhang där många olika enskilda delar av rapporterad forskning kan organiseras. ^{[ citat behövs ]}

Basic Local Alignment Search Tool (BLAST)

BLAST är en algoritm som används för att beräkna sekvenslikhet mellan biologiska sekvenser, såsom nukleotidsekvenser av DNA och aminosyrasekvenser av proteiner. BLAST är ett kraftfullt verktyg för att hitta sekvenser som liknar frågesekvensen inom samma organism eller i olika organismer. Den söker igenom frågesekvensen på NCBI-databaser och servrar och skickar tillbaka resultaten till personens webbläsare i det valda formatet. Inmatningssekvenser till BLAST är oftast i FASTA- eller GenBank-format medan utdata kan levereras i en mängd olika format som HTML, XML-formatering och vanlig text. HTML är standardutdataformatet för NCBI:s webbsida. Resultaten för NCBI-BLAST presenteras i grafiskt format med alla hittade träffar, en tabell med sekvensidentifierare för träffarna som har poängrelaterade data, tillsammans med anpassningarna för sekvensen av intresse och träffarna som mottagits med analoga BLAST-poäng för dessa.

Entrez

Entrez Global Query Cross-Database Search System används på NCBI för alla stora databaser som nukleotid- och proteinsekvenser, proteinstrukturer, PubMed, taxonomi, kompletta genom, OMIM och flera andra . Entrez är både ett indexerings- och hämtningssystem med data från olika källor för biomedicinsk forskning. NCBI distribuerade den första versionen av Entrez 1991, sammansatt av nukleotidsekvenser från PDB och GenBank , proteinsekvenser från SWISS-PROT, översatta GenBank, PIR, PRF, PDB och tillhörande sammanfattningar och citat från PubMed. Entrez är speciellt utformad för att integrera data från flera olika källor, databaser och format till en enhetlig informationsmodell och hämtningssystem som effektivt kan hämta relevanta referenser, sekvenser och strukturer.

Gen

Gene har implementerats vid NCBI för att karakterisera och organisera informationen om gener. Den fungerar som en huvudnod i kopplingen till den genomiska kartan, uttryck, sekvens, proteinfunktion, struktur och homologidata. Ett unikt GeneID tilldelas varje genpost som kan följas genom revisionscykler. Genposter för kända eller förutspådda gener etableras här och är avgränsade av kartpositioner eller nukleotidsekvenser. Gene har flera fördelar jämfört med sin föregångare, LocusLink, inklusive bättre integration med andra databaser i NCBI, bredare taxonomisk räckvidd och förbättrade alternativ för sökning och hämtning från Entrez-systemet.

Protein

Proteindatabasen upprätthåller textposten för individuella proteinsekvenser, härledda från många olika resurser såsom NCBI Reference Sequence (RefSeq)-projektet, GenBank, PDB och UniProtKB/SWISS-Prot. Proteinposter finns i olika format inklusive FASTA och XML och är länkade till andra NCBI-resurser. Protein tillhandahåller relevant data till användarna såsom gener, DNA/RNA-sekvenser, biologiska vägar, expressions- och variationsdata och litteratur. Den tillhandahåller också de förutbestämda uppsättningarna av liknande och identiska proteiner för varje sekvens som beräknats av BLAST. Strukturdatabasen för NCBI innehåller 3D-koordinatuppsättningar för experimentellt bestämda strukturer i PDB som importeras av NCBI. Den konserverade domändatabasen ( CDD ) av protein innehåller sekvensprofiler som karaktäriserar mycket konserverade domäner inom proteinsekvenser. Den har också uppgifter från externa resurser som SMART och Pfam . Det finns en annan databas med proteiner känd som Protein Clusters databas, som innehåller uppsättningar av proteinsekvenser som är klustrade enligt de maximala anpassningarna mellan de individuella sekvenserna som beräknats av BLAST.

Pubchem databas

PubChem databas av NCBI är en offentlig resurs för molekyler och deras aktiviteter mot biologiska analyser. PubChem är sökbart och tillgängligt av Entrez informationshämtningssystem.

Se även

DNA Data Bank of Japan (DDBJ)
European Bioinformatics Institute (EBI)

externa länkar

Officiell hemsida
Officiell webbplats för National Library of Medicine]
Officiell webbplats för National Institutes of Health

Bioinformatik
Databaser	Sekvensdatabaser: GenBank , European Nucleotide Archive och DNA Data Bank of Japan Sekundära databaser: UniProt , databas med proteinsekvenser som grupperar Swiss-Prot , TrEMBL och Protein Information Resource Övriga databaser: Protein Data Bank , Ensembl och InterPro Specialiserade genomiska databaser: BOLD , Saccharomyces Genome Database , FlyBase , VectorBase , WormBase , Rat Genome Database , PHI-base , Arabidopsis Information Resource och Zebrafish Information Network
programvara	KUL Fluga Clustal UTFÖRA I RELIEF HMMER MUSKEL SAMtools SOAP-svit TopHat
Övrig	Server: ExPASy Ontologi: Genontologi Rosalind (utbildningsplattform)
institutioner	Breda Institutet China National GeneBank (CNGB) Beräkningsbiologiska avdelningen (CBD) Microsoft Research - University of Trento Center for Computational and Systems Biology (COSBI) Databas Center for Life Science (DBCLS) DNA Data Bank of Japan (DDBJ) European Bioinformatics Institute (EMBL-EBI) European Molecular Biology Laboratory (EMBL) Flatiron Institute J. Craig Venter Institute (JCVI) Max Planck Institute of Molecular Cell Biology and Genetics (MPI-CBG) US National Center for Biotechnology Information (NCBI) Japanska institutet för genetik Netherlands Bioinformatics Centre (NBIC) Philippine Genome Center (PGC) Scripps Research Schweiziska institutet för bioinformatik (SIB) Välkommen Sanger Institute Whitehead Institute
Organisationer	African Society for Bioinformatics and Computational Biology (ASBCB) Australiens bioinformatikresurs (EMBL-AR) European Molecular Biology Network (EMBnet) International Nucleotide Sequence Database Collaboration (INSDC) International Society for Biocuration (ISB) International Society for Computational Biology (ISCB) Studentråd (ISCB-SC) Institutet för genomik och integrativ biologi (CSIR-IGIB) Japanese Society for Bioinformatics (JSBi)
Möten	([BC Basel Computational Biology Conference <a i=1>‎ ( ² ]) European Conference on Computational Biology (ECCB) Intelligenta system för molekylärbiologi (ISMB) Internationell konferens om bioinformatik (InCoB) Internationell konferens om Computational Intelligence Methods for Bioinformatics and Biostatistics ( CIBB) ISCB Africa ASBCB-konferens om bioinformatik Pacific Symposium on Biocomputing (PSB) Forskning i beräkningsmolekylär biologi (RECOMB)
Filformat	CRAM-format FASTA-format FASTQ-format NeXML-format Nexus-format Pileup-format SAM-format Stockholmsformat VCF-format
Relaterade ämnen	Beräkningsbiologi Lista över biobanker Lista över biologiska databaser Molekylär fylogenetik Sekvensering Sekvensdatabas Sekvensjustering
Kategori Commons

Myndighetskontroll
Allmän	ISNI VIAF WorldCat
Nationalbibliotek	Katalonien Tyskland Israel Förenta staterna Tjeckien