GeneCards

GeneCards
Innehåll

Datatyper infångade
Mänskliga gener och modellortologer
Organismer Homo sapiens
Kontakt
Forskningscenter Crown Human Genome Center, WIS
Primärt citat   PMID 9097728
Tillgång
Dataformat HTML
Hemsida www .genecards .org

GeneCards är en databas med mänskliga gener som tillhandahåller genomisk , proteomisk , transkriptomisk , genetisk och funktionell information om alla kända och förutspådda mänskliga gener. Den utvecklas och underhålls av Crown Human Genome Center vid Weizmann Institute of Science, i samarbete med LifeMap Sciences.

Databasen syftar till att ge en heltäckande bild av den aktuella tillgängliga biomedicinska informationen om den sökta genen, inklusive dess alias och identifierare, de kodade proteinerna , associerade sjukdomar och variationer, dess funktion, relevanta publikationer och mer. GeneCards databas ger tillgång till gratis webbresurser om mer än 350 000 kända och förutspådda mänskliga gener, integrerade från >150 dataresurser, såsom HGNC , Ensembl och NCBI . Kärngenlistan är baserad på NCBI, Ensembl och godkända gensymboler publicerade av HUGO Gene Nomenclature Committee (HGNC). Informationen samlas noggrant in och väljs från dessa databaser av dess integrationsmotor.

Med tiden har GeneCards-databasen utvecklat en uppsättning verktyg (VarElect, GeneALaCart, etc.) som har mer specialiserade möjligheter som utnyttjar databasen. Sedan 1998 har GeneCards-databasen använts i stor utsträckning av bioinformatik , genomik och medicinska samhällen i mer än 24 år.

Historia

Sedan 1980-talet har sekvensinformation blivit allt rikligare; senare insåg många laboratorier detta och började lagra sådan information i centrala arkiv - den primära databasen. Informationen från de primära sekvensdatabaserna (databaser på lägre nivå) fokuserar dock på olika aspekter. För att samla in dessa spridda data utvecklade Weizmann Institute of Sciences Crown Human Genome Center en databas som heter "GeneCards" 1997. Denna databas behandlade huvudsakligen information om mänskligt genom, mänskliga gener, de kodade proteinernas funktioner och relaterade sjukdomar, även om den har utökats sedan dess.

Tillväxt

Till en början hade GeneCards-databasen två huvudfunktioner: leverans av integrerad biomedicinsk information för en gen i "kort"-format och en textbaserad sökmotor . Sedan 1998 har databasen integrerat fler dataresurser och datatyper, såsom proteinuttryck och gennätverksinformation. Den har också förbättrat hastigheten och sofistikeringen av sökmotorn och expanderat från en gencentrerad dogm till att innehålla genuppsättningsanalyser. Version 3 av databasen samlar information från mer än 90 databasresurser baserat på en konsoliderad genlista. Den har också lagt till en uppsättning GeneCards-verktyg som fokuserar på mer specifika syften. "GeneNote och GeneAnnot för transkriptomanalyser , GeneLoc för genomiska platser och markörer, GeneALaCart för batchfrågor och GeneDecks för att hitta funktionella partners och för genuppsättningsdestillationer." Databasen uppdateras på en 3-årig cykel av planering, implementering, utveckling, halvautomatisk kvalitetssäkring och implementering. Tekniker som används inkluderar Eclipse , Apache , Perl , XML , PHP , Propel , Java , R och MySQL .

Pågående GeneCards-expansioner

Tillgänglighet

GeneCards kan fritt nås av ideella institutioner för utbildnings- och forskningsändamål https://www.genecards.org/ och akademiska spegelsidor . Kommersiell användning kräver licens. [ citat behövs ]

Svit GeneCards

GeneDecks

GeneDecks är ett nytt analysverktyg för att identifiera liknande gener eller partnergener, vilket ger ett likhetsmått genom att lyfta fram delade deskriptorer mellan gener, baserat på GeneCards unika mängd kombinatoriska annoteringar av mänskliga gener.

  1. Annotation combinatory : Med hjälp av GeneDecks kan man få en uppsättning liknande gener för en viss gen med en vald kombinatorisk annotering . Sammanfattningstabellen resulterar i rangordning av de olika nivåerna av likhet mellan de identifierade generna och sondgenen.
  2. Annoteringssammanslutning : Olika datakällor erbjuder ofta annoteringar med heterogent namnsystem. Annoteringssammanslutning av GeneDecks är baserad på likheten i GeneCards algoritmer för detektering av geninnehållsutrymme .
  3. Partnerjakt : I GeneDecks Partner Hunter ger användare en frågegen, och systemet söker liknande gener baserat på kombinatoriska likheter mellan viktade attribut.
  4. Set destillation : I Set destiller ger användarna en uppsättning gener, och systemet rangordnar attribut efter deras grad av delning inom en given genuppsättning. Liksom Partner Hunter möjliggör den sofistikerad undersökning av en mängd olika genuppsättningar, av olika ursprung, för att upptäcka och belysa relevanta biologiska mönster, vilket förbättrar systematisk genomik och systembiologisk granskning.

GeneALaCart

GeneALaCart är en genuppsättningsorienterad batch-frågamotor baserad på den populära GeneCards-databasen. Det tillåter hämtning av information om flera gener i en batchfråga.

GeneLoc

Medlemmen i GeneLoc-dräkten presenterar en integrerad mänsklig kromosomkarta , vilket är mycket viktigt för att designa ett skräddarsytt fångstchip , baserat på data integrerad med GeneLoc-algoritmen. GeneLoc inkluderar ytterligare länkar till GeneCards, NCBI:s Human Genome Sequencing, UniGene och kartläggningsresurser.

Användande

Sök

Ange först en sökterm i det tomma på hemsidorna. Sökmetoder inkluderar nyckelord, endast symbol, symbol/alias/identifierare och symbol/alias. Standardsökalternativet är att söka efter nyckelord. När en användare söker med nyckelord visas MicroCard och MiniCard. Men när en användare endast söker med symbol, kommer de att dirigeras till GeneCard. Sökningar kan göras vidare genom att klicka på avancerad sökning, där en användare kan välja avsnitt, kategori, GIFTS, Symbolkälla och genuppsättningar direkt. Avsnitten inkluderar alias och beskrivningar, störningar, droger och föreningar, uttryck i mänskliga vävnader, funktion, genomisk plats, genomiska varianter, ortologer, paraloger, vägar och interaktioner, proteindomäner/familjer, proteiner, publikationer, sammanfattningar och transkriptioner. Standardalternativet är att söka efter alla avsnitt. Kategorier inkluderar proteinkodande , Pseudogener , RNA-gener Genetic Loci , Genkluster och Okategoriserade. Standardalternativet är att söka efter alla kategorier. GIFtS är GeneCards Inferred Functionality Scores, som ger objektiva siffror för att visa kunskapsnivån om funktionaliteten hos mänskliga gener. Det inkluderar högt, medium, lågt och anpassat sortiment. Symbolkällor inkluderar HGNC ( HUGO Gene Nomenclature Committee ), EntrezGene (gencentrerad information vid NCBI), Ensembl, GeneCards RNA-gener, CroW21 och så vidare.

Dessutom kan användaren välja att söka efter Alla GeneCards eller Within Gene Subset, vilket skulle vara mer specifikt och med prioritet.

För det andra visar sökresultatsidan alla relevanta minikort. Symbol, beskrivning, kategori, GIFTS, GC-id och poäng visas på sidan. En användare kan klicka på plusknappen för vart och ett av minikorten för att öppna minikortet. Användaren kan också klicka direkt på symbolen för att se detaljerna för ett visst GeneCard.

Expressionsprofil för FAM214A som finns i normal mänsklig vävnad, som visas i GeneCards.

GeneCards innehåll

För ett visst GeneCard (exempel: GeneCard för TGFB1 ) består det av följande innehåll.

  1. Rubrik : Rubriken består av genens symbol, kategori (dvs. proteinkodande), GIFtS(dvs. 74) och GCID(GC19M041837). Olika kategorier har olika färger att uttrycka: proteinkodande, pseudogen, RNA-gen, genkluster , genetiskt lokus och okategoriserade. Bakgrunden indikerar symbolkällorna: HGNC-godkända gener, EntrezGene Database, Ensembl Gene Database eller GeneCards Generated Genes.
  2. Alias : Alias, som namnet indikerar, visar synonymer och alias för genen enligt olika källor som HGNC. Den högra kolumnen visar hur de alias som är kopplade till resurserna och ger tidigare GC-identifierare.
  3. Sammanfattningar : Den vänstra kolumnen är densamma som den i Aliasen, som visar källorna. Den högra kolumnen här ger en kort sammanfattning av genens funktion, lokalisering och effekt på fenotyp från olika källor.
  4. Genomiska vyer : Förutom källor ger detta avsnitt referens-DNA-sekvens, regulatoriska element, epigenetik, kromosomband och genomisk placering av olika källor. Den röda linjen på bilden indikerar den integrerade platsen för GeneLoc. I synnerhet, om den integrerade platsen för GeneLoc skiljer sig från platsen i Entrez Gene, visas den i grönt; Blått visas när den integrerade platsen för GeneLoc skiljer sig från platsen i Ensembl. Tilläggsinformation kan nås via länkarna i avsnittet.
  5. Proteiner : Detta avsnitt presenterar kommenterad information om gener, inklusive rekommenderat namn, storlek, subenhet, subcellulär plats och sekundära accessioner. Post-translationella modifieringar, proteinuttrycksdata, REF SEQ-proteiner, ENSEMBL-proteiner, Reaktomproteindetaljer, humana rekombinanta proteinprodukter, genontologi, antikroppsprodukter och analysprodukter introduceras.
  6. Proteindomäner/familjer : Det här avsnittet visar annoterad information om proteindomäner och familjer.
  7. Funktion : Funktionsavsnittet beskriver genfunktion, inklusive: mänskliga fenotyper , bundna mål, shRNA för människa och/eller mus/råtta, miRNA -genmål, RNAi -produkter, mikroRNA för ortologer från människor och/eller mus/råtta, genredigering , kloner , Cellinjer , djurmodeller, in situ hybridiseringsanalyser .
  8. Vägar och interaktioner : Det här avsnittet visar förenade GeneCards vägar och interaktioner som kommer från olika källor. Unified GeneCards vägar samlas in i superbanor, som visar kopplingen mellan olika vägar. Interaktion visar interaktant och interaktionsdetaljer.
  9. Läkemedel och föreningar : Det här avsnittet kopplar GeneCards till droger och föreningar. Föreningar visar kemisk förening, verkan och CAS-nummer. DrugBank-förening ger förening, synonymer, CAS-nummer (Chemical Abstracts Registernummer), typ (transportör/mål/bärare/enzym), åtgärder och PubMed-ID. HMDB och Novoseek visar sambanden mellan kemiska föreningar, vilket inkluderar sammansättning, synonymer, CAS-nummer och PubMed ID (artiklar relaterade till substansen). BitterDB visar sammansättning, CAS-nummer och SMILES ( Simplified Molecular Input Line Entry Specification) . PharmGKB ger läkemedel/förening och dess anteckning.
  10. Transkript : Detta avsnitt består av referenssekvens-mRNA, Unigene -kluster och representativ sekvens, miRNA-produkter, inhib.RNA-produkter, klonprodukter, primerprodukter och ytterligare mRNA-sekvens. Användaren kan också få exonstruktur från GeneLoc.
  11. Uttryck : Den vänstra kolumnen visar resurserna för data. Expressionsbilder och data, liknande gener, PCR-arrayer, primers för humana och in situ hybridiseringsanalyser ingår i detta avsnitt.
  12. Ortologer : Detta avsnitt ger ortologer för en viss gen från ett antal arter. Tabellen visar motsvarande organism, taxonomisk klassificering, gen, beskrivning, mänsklig likhet, ortologityp och detaljer. Den är kopplad till ENSEMBL Gene Tree, TreeFam Gene Tree och Aminode.
  13. Paraloger : Det här avsnittet visar paraloger och pseudogener för en viss gen.
  14. Genomiska varianter : De genomiska varianterna visar resultatet av NCBI SNPs/varianter, HapMap-länkningsojämviktsrapport, strukturella variationer, human genmutationsdatabas (HGMD), QIAGEN SeqTarget långväga PCR-primers i human, mus & råtta och SABiosciences cancermutation PCR-matriser. Tabellen i det här avsnittet visar SNP ID, Giltigt, Klinisk signifikans, Chr pos, Sekvens för genomiska data, AAChg, Typ och Mer för transkriptionsrelaterade data, Allel frekv , Pop, Totalt prov och Mer för Allel Frequency. För Valid representerar det olika tecknet olika valideringsmetoder. "C" betyder bi-kluster; 'A' är by-2hit-2allel; 'F' är bifrekvens; 'H' är by-hapmap och 'O' är by-other-pop. Klinisk signifikans kan vara en av följande: icke-patogen, patogen, läkemedelsrespons, histokompatibilitet, trolig-icke-patogen, trolig-patogen, oprövad, okänd och annat. Typen ska vara en av dessa: nonsynon, syn, cds, spl, utr, int, exc, loc, stg, ds500, spa, spd, us2k, us5k, PupaSUITE-beteckningar.
  15. Störningar/sjukdomar : Visar störningar/sjukdomar associerade med genen.
  16. Publikationer : Visar publikationer associerade med genen.
  17. Externa sökningar : Söker mer information i PubMed , OMIM och NCBI.
  18. Genomdatabaser : Andra databaser och specialiserade databaser.
  19. Immateriella rättigheter : Detta avsnitt ger patentinformation och licenserbar teknik.
  20. Produkter

Ansökningar

GeneCards används flitigt inom de biologiska och biomedicinska områdena. Till exempel extraherade SH Shah data om tidig kranskärlssjukdom från GeneCards för att identifiera gener som bidrar till sjukdomen . Det har bekräftats att kromosom 3q13, 1q25 etc. har effekt och denna artikel diskuterade vidare sambandet mellan sjukliga gener och serumlipoproteiner med hjälp av GeneCard.

Ett annat exempel är en forskningsstudie om syntetisk dödlighet vid cancer . Syntetisk dödlighet uppstår när en mutation i en enskild gen inte har någon effekt på en cells funktion men en mutation i en ytterligare gen leder till celldöd. Denna studie syftade till att hitta nya metoder för att behandla cancer genom att blockera dödligheten av läkemedel. GeneCards användes när man jämförde data för en given målgen med alla möjliga gener. I denna process beräknades annoteringsdelningspoängen med hjälp av GeneDecks Partner Hunter (nu kallad Genes Like Me) för att ge paralogi. Inaktiveringsmål extraherades efter mikroarray-experiment av resistenta och icke-resistenta neuroblastomcellinjer .

externa länkar