Cancergenomatlasen
Cancer Genome Atlas ( TCGA ) är ett projekt för att katalogisera de genetiska mutationer som är ansvariga för cancer med hjälp av genomsekvensering och bioinformatik . Det övergripande målet var att tillämpa genomanalystekniker med hög genomströmning för att förbättra förmågan att diagnostisera, behandla och förebygga cancer genom en bättre förståelse av den genetiska grunden för sjukdomen.
TCGA övervakades av National Cancer Institutes Center for Cancer Genomics och National Human Genome Research Institute finansierat av den amerikanska regeringen. Ett treårigt pilotprojekt, som inleddes 2006, fokuserade på karakterisering av tre typer av humana cancerformer: glioblastoma multiforme , lungsquamous carcinom och ovarial seröst adenokarcinom . Under 2009 expanderade den till fas II, som planerade att slutföra den genomiska karaktäriseringen och sekvensanalysen av 20–25 olika tumörtyper till 2014. I slutändan överträffade TCGA det målet och karakteriserade 33 cancertyper inklusive 10 sällsynta cancerformer.
Projektet syftade initialt till att samla in och karakterisera 500 patientprover, fler än de flesta genomikstudier på sin tid, och använde en mängd olika molekylära tekniker. Tekniker inkluderade genuttrycksprofilering , profilering av kopienummervariationer , SNP-genotypning , genomomfattande DNA-metyleringsprofilering , mikroRNA - profilering och exonsekvensering . Med begränsningar av begynnande teknologi och kostnader i början av projektet, utfördes många array-baserade teknologier och begränsad riktad gensekvensering. Under II kunde TCGA börja utföra hela exom- och heltranskriptomsekvensering på alla fall och helgenomsekvensering på 10% av fallen som användes i projektet.
Mål
Målet med TCGA:s pilotprojekt var att etablera en infrastruktur för att samla in, molekylärt karakterisera och analysera 500 cancerformer och matchade kontroller. Arbetet krävde omfattande samarbete mellan ett team av forskare från olika institutioner och utvärdering av flera spirande högkapacitetsteknologier. TCGA ville inte bara generera högkvalitativ och biologiskt meningsfull genomisk data, utan också göra denna data fritt tillgänglig för cancerforskningssamhället.
Tre tumörtyper undersöktes under pilotfasen, glioblastoma multiforme (GBM) och högkvalitativt seröst ovarieadenokarcinom och skivepitelcancer i lungorna. Efter framgången med pilotfasen utökade TCGA sin ansträngning för att karakterisera ytterligare cancertyper och tillhandahålla en rik och stor genomisk datauppsättning för ytterligare cancerforskning.
Förvaltning
TCGA samordnades av forskare och chefer från National Cancer Institute (NCI) och National Human Genome Research Institute (NHGRI). Med expansionen av TCGA från pilotfasen till fas II i oktober 2009 skapade NCI ett TCGA-programkontor för att hjälpa till att hantera projektet. Dr Jean Claude Zenklusen har varit direktör för kontoret sedan augusti 2013.
TCGA Program Office ansvarade för driften av sex Genome Characterization Centers, sju Genome Analysis Centers, Biospecimen Core Resource, Data Coordination Center och ungefär en tredjedel av den sekvensering som gjorts för projektet av de tre Genome Sequencing Centers. Dessutom ansvarade TCGA-projektkontoret för att samordna ansamlingen av vävnader för TCGA. Dr Carolyn Hutter, projektledare för NHGRI, riktade två tredjedelar av sekvenseringen vid Genome Sequencing Centers.
Medlemmar från NCI- och NHGRI-teamen, tillsammans med huvudutredare som finansierades av projektet, utgjorde styrkommittén. Styrkommittén fick i uppdrag att övervaka projektets vetenskapliga giltighet medan NCI/NHGRI:s administrativa team säkerställde att de vetenskapliga framstegen och målen för projektet uppfylldes, att projektet slutfördes i tid och inom budget, och de olika komponenterna i projektet arbetat tillsammans.
Vävnadstillväxt
Vävnadsbehoven varierade från vävnadstyp till vävnadstyp och från cancertyp till cancertyp. Sjukdomsexperter från projektets Disease Working Groups hjälpte till att definiera egenskaperna hos de typiska vävnadsprover som samlats in som "standard of care" i USA och hur TCGA bäst kunde utnyttja vävnaden. Till exempel Brain Disease Working Group att prover innehållande mer än 50 % nekros inte skulle vara lämpliga för TCGA och att 80 % tumörkärnor krävdes i den livskraftiga delen av tumören. TCGA följde några allmänna riktlinjer som utgångspunkt för att samla in prover från alla typer av tumörer, inklusive minst 200 mg i storlek, inte mindre än 80 % tumörkärnor och en matchad källa till könscells -DNA (som blod eller renat DNA ). Dessutom krävdes institutioner som skickade vävnader till TCGA att inkludera en minimal klinisk datauppsättning enligt definitionen av Disease Working Group, undertecknade medgivanden som har godkänts av deras institutions IRB, samt ett materialöverföringsavtal med TCGA.
Under 2009 tog NCI bort cirka 130 miljoner USD av ARRA från NCI:s "Prime Contract" med Science Applications International Corporation (SAIC) för att finansiera vävnadstillväxt och en mängd andra aktiviteter genom NCI Office of Acquisition. 42 miljoner dollar var tillgängliga för vävnadstillväxt genom NCI med hjälp av "Requests for Quotations" (RFQs) och "Requests for Proposals" (RFPs) för att generera inköpsorder och kontrakt, respektive. Anbudsförfrågningar användes i första hand för insamling av retrospektiva prover från etablerade banker medan anbudsförfrågan användes för den framtida insamlingen av prover. TCGA avslutade provinsamlingen i december 2013, med nästan 20 000 bioprover.
Institutioner som bidrog med prover till TCGA fick betalt och fick förhandstillgång till molekylär data som genererades på deras prover, samtidigt som en koppling mellan TCGA:s unika identifierare och deras egen unika identifierare bibehölls. Detta gjorde det möjligt för bidragande institutioner att länka tillbaka till kliniska data för sina prover och att ingå samarbeten med andra institutioner som hade liknande data om TCGA-prover, vilket ökade kraften i resultatanalys.
Organisation
TCGA hanterade ett antal olika typer av center som finansierades för att generera och analysera data. TCGA var det första storskaliga genomikprojektet som finansierades av NIH för att inkludera betydande resurser för bioinformatisk upptäckt. NCI har avsatt 50 % av TCGA anslagna medel, cirka 12 miljoner USD/år, för att finansiera bioinformatisk upptäckt. Genome Characterization Centers och Genome Sequencing Centers genererade data. Två separata Genome Data Analysis Centers använde data för bioinformatisk upptäckt. Två centra finansierades för att isolera biomolekyler från patientprover och ett center finansierades för att lagra data. Detta arbetsflöde har utvecklats under åren och är inte känt som NCI:s Genome Characterization Pipeline.
Biospecimen kärnresurs
Biospecimen Core Resource (BCR) ansvarade för att verifiera kvaliteten och kvantiteten av vävnad som skickades av vävnadskällor, isolera DNA och RNA från proverna, utföra kvalitetskontroll av dessa biomolekyler och skicka bearbetade prover till GSC och GCC. International Genomics Consortium tilldelades kontraktet att initiera BCR för pilotprojektet. Det fanns två BCR som finansierades av NCI i början av hela projektet: Nationwide Children's Hospital och International Genomics Consortium. BCR:erna tävlades om 2010 och Nationwide Children's Hospital tilldelades kontraktet.
Genome Sequencing Centers
Tre Genome Sequencing Centers (GCC) samfinansierades av NCI och NHGRI: Broad Institute , McDonnell Genome Institute vid Washington University och Baylor College of Medicine. Alla dessa tre sekvenseringscenter har skiftat från Sanger-sekvensering till nästa generations sekvensering (NGS). En mängd olika NGS-tekniker testades och implementerades samtidigt.
Genome Characterization Centers
NCI finansierade sju genomkarakteriseringscenter: Broad Institute, Harvard, University of North Carolina, MD Anderson Cancer Center, Van Andel Institute, Baylor College of Medicine och British Columbia Cancer Center.
Datakoordineringscenter
Data Coordinating Center (DCC) var det centrala arkivet för TCGA-data. Den ansvarade också för kvalitetskontrollen av data som kom in i TCGA-databasen. DCC upprätthöll också TCGA Data Portal, där användare kunde få tillgång till bearbetad TCGA-data. Detta arbete utfördes under kontrakt av bioinformatikforskare och utvecklare från SRA International , Inc. DCC var dock inte värd för rå sekvenseringsdata. NCI:s Cancer Genomics Hub (CGHub) var det säkra arkivet för lagring, katalogisering och åtkomst av sekvensrelaterad data. Detta arbete utfördes av forskare och personal vid University of California, Santa Cruz Genomics Institute . Sedan 2017 har alla typer av data flyttats till NCI:s Genomic Data Commons.
Genom Data Analysis Centers
Sju genomdataanalyscenter (GDAC) finansierade av NCI/NHGRI ansvarade för integreringen av data över alla karakteriserings- och sekvenseringscenter samt biologisk tolkning av TCGA-data. GDACs inkluderade The Broad Institute, University of North Carolina, Oregon Health and Science University, University of California, Santa Cruz, MD Anderson Cancer Center, Memorial Sloan Kettering Cancer Center och The Institute for Systems Biology. Alla sju GDAC arbetade tillsammans för att utveckla en integrerad dataanalyspipeline.
Cancertyper utvalda för studier
En preliminär lista över tumörer för TCGA att studera genererades genom att sammanställa incidens- och överlevnadsstatistik från webbplatsen SEER Cancer Statistic. Dessutom övervägdes USA:s nuvarande "Standard of Care" vid valet av de 25 bästa tumörtyperna, eftersom TCGA riktade in sig på tumörtyper där resektion före tilläggsbehandling var standardvården. Tillgängligheten av prover spelade också en avgörande roll för att bestämma vilka tumörtyper som skulle studeras och i vilken ordning tumörprojekt startas; ju vanligare cancertypen är, desto mer sannolikt kommer prover att samlas in snabbt för studier. Detta resulterade i att vanliga tumörtyper, såsom tjocktarms-, lung- och bröstcancer, blev de första tumörtyperna som gick in i projektet, före sällsynta tumörtyper.
Cancertyper som valts ut för studie av TCGA inkluderade: skivepitelcancer i lungor , njurpapillärkarcinom, klarcellig njurkarcinom, duktalt bröstkarcinom, njurcellscancer, livmoderhalscancer ( skivepitelcancer), kolonadenokarcinom , magadenokarcinom, ändtarmscancer, hepatocellulär karcinom , huvudkarcinom , nacke (oralt) skivepitelcancer, sköldkörtelkarcinom , urinblåsa-uroteliala karcinom – icke-papillärt, livmoderkropp ( endometriekarcinom ) , pankreatisk duktalt adenokarcinom , akut myeloid leukemi , prostataadenokarcinom , lungom i lungorna , cutocarcinom och lungom i lägre grad. gliom , esofagus karcinom , seröst cystadenocarcinom i äggstockarna , skivepitelcancer i lungorna , binjurebarkcarcinom , diffust storcelligt B-cells lymfom , paragangliom & feokromocytom , kolangiokarcinom , livmoderkarcinosarkom , uvealt germanom , mesotymom , m cellcancer .
TCGA började samla in prover för alla dessa tumörtyper samtidigt. Tumörtyperna med flest insamlade prover infördes först i karakteriseringspipelinen. De sällsynta tumörtyperna som var svårare att samla och tumörtyperna för vilka TCGA inte kunde identifiera en källa till högkvalitativa prover lades in i TCGA-produktionspipelinen under projektets andra år. Detta gav TCGA Program Office ytterligare tid för att samla tillräckligt med prover för projektet.
TCGA och Mouse Organogenesis Cell Atlas (MOCA) utvecklades genom maskininlärning och djupinlärning för att jämföra och hitta korrelation mellan cancer och embryonala celler i tidig cellutveckling och differentiering . De användes också för att skilja förändringar i genuttrycksmönster mellan olika typer av tumörer från en okänd källa.
TCGA-publikationer
Cancertyp studeras | Slutlig Antal analyserat i originalpapper |
TCGA-analysresultat |
---|---|---|
Glioblastoma Multiforme | 206 | GBM-subtyper Klassisk, Mesenkymal och Proneural definieras av EGFR- , NF1- respektive PDGFRA / IDH1 -mutationer; över 40 % av tumörerna har mutationer i kromatinmodifierande gener; andra ofta muterade gener inkluderar TP53 , PlK3R1 , PIK3CA , IDH1 , PTEN , RB1 , LZTR1 |
Gliom av lägre grad | 293 | Definierat tre subtyper som korrelerar med patientens resultat: IDH1- mutant med 1p/19q-deletion, IDH- mutant utan 1p/19q-deletion och IDH -vildtyp; IDH -vildtyp är genomiskt lik glioblastom |
Bröstlobular karcinom | 203 | Lobulärt karcinom skiljer sig från duktalt karcinom; FOXA1 förhöjt i lobulärt karcinom, GATA3 förhöjt i duktalt karcinom; lobulärt karcinom berikat för PTEN- förlust och Akt-aktivering |
Duktalt bröstkarcinom | 784 | Fyra distinkta genomiska subtyper: basal, Her2, luminal A, luminal B; vanligaste drivrutinmutationerna TP53 , PIK3CA , GATA3 ; basal subtyp liknande serös äggstockscancer |
Kolorektalt adenokarcinom | 276 | Kolon- och rektalcancer har liknande genomiska profiler; hypermuterad subtyp (16 % av proverna) som oftast finns i höger kolon och förknippas med gynnsam prognos; nya potentiella drivrutiner: ARlD1A , SOX9 , FAM123B / WTX ; överuttryck av: ERBB2 , IGF2 ; mutationer i WNT-vägen |
Adenocarcinom i magen | 295 | Identifierade fyra subtyper: EBV karakteriserat av Epstein-Barr-virusinfektion, MSI (mikrosatellitinstabilitet) karakteriserat av hypermutation, GS karakteriserat av genomisk stabilitet, CIN karakteriserat av kromosomal instabilitet; CIN berikad för mutationer i tyrosinkinaser |
Esofaguskarcinom | 164 | Skivepitelceller och adenokarcinom är molekylärt distinkta; skivepitelcancer liknade skivepitelcancer i huvud och hals och hade frekventa förstärkningar av CCND1, SOX2 och TP63; adenokarcinom liknade kromosomalt instabilt gastriskt adenokarcinom och hade frekventa amplifieringar i ERBB2, VEGFA, GATA4 och GATA6 |
Ovarialt seröst cystadenocarcinom | 489 | Mutationer i TP53 förekom i 96 % av de studerade fallen; mutationer i BRCA1 och BRCA2 förekom i 21 % av fallen och var förknippade med mer gynnsamma resultat |
Uterin Corpus Endometrial karcinom | 373 | Klassificerade endometriecancer i fyra kategorier: POLE ultramuterad, MSI (mikrosatellitinstabilitet) hypermuterad, kopietal lågt och kopieantal högt; serösa livmoderkarcinom liknade serösa och basalliknande bröstkarcinom och hade mindre gynnsamma prognoser än livmoderendometrioidkarcinom |
Cervikal skivepitelcancer och adenokarcinom | 228 | Identifiering av HPV-negativa, endometrieliknande livmoderhalscancer med mutationer i KRAS- , ARID1A- och PTEN- gener; amplifiering av CD274 och PDCD1LG2 immunkontrollpunktsgener; förändringar av gener inklusive MED1 , ERBB3 , CASP8 , HLA-A och TGFBR2 och fusioner som involverar lncRNA BCAR4 ; nästan tre fjärdedelar av proverna hade förändringar i antingen en eller båda av PI3K/MAPK- och TGF-beta-signalvägarna |
Skivepitelcancer i huvud och nacke | 279 | Identifierade genomiska egenskaper hos HPV- och rökningsrelaterade cancerformer: HPV-positiv kännetecknad av förkortad eller raderad TRAF3 , HPV-negativ kännetecknad av sam-amplifiering av 11q13 och 11q22, rökrelaterad kännetecknad av TP53 -mutationer, CDKN2A- inaktivering och kopieantalförändringar |
Sköldkörtelkarcinom | 496 | Majoriteten drivs av RAS- eller BRAFV600E-mutationer; tumörer som drivs av dessa mutationer är distinkta |
Akut myeloid leukemi | 200 | Låg mutationsbörda, med endast 13 kodande mutationer i genomsnitt per tumör; klassificerade förarhändelser i nio kategorier inklusive transkriptionsfaktorfusioner, histonmodifieringsmutationer, spliceosommutationer och andra |
Kutant melanom | 331 | Etablerade fyra subtyper: BRAF- mutant, RAS- mutant, NF1 -mutant och trippel vildtyp baserad på förarmutationer; högre nivåer av immunlymfocytinfiltration korrelerade med bättre patientöverlevnad |
Lungadenokarcinom | 230 | Hög mutationsbörda; 76 % av tumörerna visade aktivering av receptortyrosinkinasvägar |
Lung skivepitelcancer | 178 | Högt genomsnittligt antal mutationer och kopia avvikelser; liksom seröst cystadenocarcinom i äggstockarna innehöll nästan alla skivepitelcancer i lungorna en mutation i TP53 ; många tumörer innehöll inaktiverande mutationer i HLA-A som kan hjälpa cancern att undvika immundetektering |
Clear Cell Renal Cell Carcinom | 446 | Vanligt muterade gener inkluderade VHL involverad i syreavkänning, SED2 involverad i epigenetiska modifieringar som resulterar i global hypometylering och gener från PI3K/AKT/mTOR-vägen; metabolisk förändring som liknar "Warburg-effekten" korrelerar med en dålig prognos |
Njure papillärt karcinom | 161 | 81 % av typ 1-tumörerna innehöll en förändring av MET; genomiska profiler av typ 2-tumörer var heterogena, med förändringar av CDKN2A, SETD2, TFE3 eller ökat uttryck av NRF2-ARE-vägen; förlust av uttryck av CDKN2A och CpG-ömetyleringsfenotyp var associerade med dåligt resultat |
Invasiv urinblåsecancer | 131 | Rökning är förknippat med ökad risk; ofta muterade gener inkluderar TP53, som inaktiverades i 76 % av tumörerna och ERBB2 (HER2), gener i receptortyrosinkinas (RTK)/RAS-vägar förändrade i 44 % av tumörerna; |
Prostata adenokarcinom | 333 | Mycket heterogen med 26% av proverna drivna av okända molekylära förändringar; 7 subtyper definierade av ETS transkriptionsfaktor genfusioner eller mutationer i SPOP , FOXA1 eller IDH1 ; handlingsbara lesioner i PI3K-, MAPK- och DNA-reparationsvägarna |
Kromofob njurcellscancer | 66 | Extremt låg mutationsbörda; karcinomet härstammar från mer distala regioner av njuren jämfört med klarcellscancer, som primärt kommer från proximala regioner; metabolisk förändring skild från "Warburg-effekten"-förskjutningen som observerats i klarcellscancer; TP53- och PTEN- tumörsuppressorgener muterades ofta; TERT- genpromotorn ändrades ofta |
Binjurebarkcarcinom | 91 | Överuttryck av IGF2 , mutationer i TP53 , PRKAR1A och andra gener, och kopienummerförändringar var vanliga kännetecken; hypoploidi följt av fördubbling av hela genomet kan vara en drivande mekanism för tumörutveckling |
Paragangliom och feokromocytom | 173 | Fyra distinkta subtyper: Wnt-förändrad, kortikal blandning, pseudohypoxi och kinassignalering; MAML3-fusionsgenen och CSDE1 somatisk mutation definierar och driver den dåliga prognosen, Wnt-förändrad subtyp |
Cholangiocarcinom | 38 | Lågt uttryck av CDKN2-, BAP1- och ARID1-gener och överuttryck av FGFR2- och IDH1/2-gener; fyra subtyper, en subtyp som kännetecknas av förändringar i IDH, tystnad av ARID1A och lågt uttryck av andra kromatinmodifierare och högt mitokondriellt genuttryck; en annan subtyp kännetecknad av BAP1-mutationer och FGFR2-genfusioner; cancern kan existera på ett kontinuerligt spektrum med en undergrupp av leverkarcinom med IDH- eller FGFR-mutationer |
Lever Hepatocellulärt karcinom | 363 | TERT-promotormutationer, identifierade i 44 % av tumörerna, associerade med ökad förlängning av telomerer och tystnad av CDKN2A; TP53 muterat eller underuttryckt; CTNNBB1 muterade signifikant; många tumörer med höga nivåer av lymfocytinfiltration eller överuttryckta immunkontrollpunktsgener CTLA4, PD-1 och PD-L1 |
Duktalt adenokarcinom i bukspottkörteln | 150 | Använde djup och riktad sekvensering för att bättre analysera låg neoplastisk cellularitet; KRAS-mutationer finns i 93 % av tumörerna; mutationer i RREB1 eller andra medlemmar av RAS-MAPK-signalvägen |
Livmoderkarcinosarkom | 57 | Identifierade en stark och varierad grad av epitelial-mesenkymal övergång; TP53-mutationer finns i 91 % av proverna; förändringar i PI3K som finns i hälften av proverna |
Uveal melanom | 80 | Komplexa mutationer i BAP1; identifierade distinkta underavdelningar av disomi 3 (D3) och monosomi 3 (M3) subtyper; i M3 har ömsesidigt exklusiva EIF1AX- och SRSF2/SF3B1-mutationer distinkta metyleringsprofiler och prognoser |
Thymoma | 117 | Fyra stora molekylära subtyper hittades som motsvarar kända histopatologiska subtyper B, TC, AB och en blandning av A och AB; låg mutationsbörda; anrikning av HRAS , NRAS , TP53 och återkommande GTF2I- mutationer observerades; uttryck av autoimmuna mål och aneuploidi kopplar tymom till myasthenia gravis. |
Sarkom | 206 | TP53, ATRX och RB1 bland de få gener som återkommande muterades över sarkomtyper; kopienummerförändringar förekom ofta i komplexa karyotypsarkom, vilket påverkar p53- och RB1-cellcykeln och andra vägar; synovial sarkom sarkom uttryckte fusioner i SSX1 eller SSX2 och TERT; För dedifferentierat liposarkom associerar JUN-amplifiering med sämre överlevnad; förändrad PI3K-AKT-mTOR-väg i leiomyosarkom; odifferentierat pleomorft sarkom och myxofibrosarkom kan drivas av förändringar i flodhästens väg |
Mesoteliom | 74 | Identifierade en ny genomisk subtyp som står för cirka 3% av proverna med: TP53- och SETDB1-mutationer och förlust av en kopia av nästan alla kromosomer (som forskare kallade genomisk "nära haploidisering"); förändringar av BAP1 var närvarande i över hälften av de studerade fallen och kan påverka transkriptionsfaktoraktivitet och immunsignalering; immunkontrollpunktsgenen VISTA uttrycktes starkt i epiteloid mesoteliom. |
Testikelkönscellscancer | 137 | De huvudsakliga histologiska subtyperna av sjukdomen (seminom, embryonalt karcinom, gulesäck, teratom) hade distinkta molekylära mönster; alla histologityper uppvisade omfattande aneuploidi och låg mutationsfrekvens men distinkta mönster av DNA-metylering och miRNA-uttryck; en undergrupp av rena seminom definieras av KIT- mutationer, distinkta DNA-metylerings- och immuninfiltrationsprofiler och minskat antal KRAS- kopior. signifikanta somatiska mutationer finns endast i tumörer med seminomkomponenter. |
Glioblastoma multiforme
2008 publicerade TCGA sina första resultat om glioblastoma multiforme (GBM) i Nature . Dessa första resultat karakteriserade och analyserade 91 tumörnormala matchade par. Medan 587 bioprover samlades in för studien, avvisades de flesta under kvalitetskontroll: tumörproverna behövde innehålla minst 80 % tumörkärnor och inte mer än 50 % nekros, och en sekundär patologibedömning måste överensstämma om att den ursprungliga diagnosen GBM var korrekt. En sista sats av prover uteslöts eftersom det insamlade DNA eller RNA inte var av tillräcklig kvalitet eller kvantitet för att kunna analyseras av alla de olika plattformarna som användes i studien.
Alla data från denna studie, såväl som data som har samlats in sedan publiceringen gjordes allmänt tillgängliga på TCGA:s Data Coordinating Center (DCC) för allmänhetens tillgång (senare flyttade till Genomic Data Commons). De flesta av de bearbetade TCGA-data är helt öppen åtkomst. För data som potentiellt skulle kunna identifiera specifika patienter ansöker användare om kontrollerad dataåtkomst till Data Access Committee (DAC), som utvärderar om slutanvändaren är en bona fide forskare och ställer en legitim vetenskaplig fråga som förtjänar tillgång till individnivå. data. Dataåtkomstuppgifter hanteras nu genom NIH:s dbGAP.
Sedan publiceringen av det första markördokumentet har flera analysgrupper inom TCGA-nätverket presenterat mer detaljerade analyser av glioblastomdata . En analysgrupp ledd av Roel Verhaak, PhD, Katherine A. Hoadley , PhD och D. Neil Hayes, MD, korrelerade framgångsrikt gliomgenexpressionssubtyper med genomiska abnormiteter. DNA -metyleringsdataanalysteamet , ledd av Houtan Noushmehr, PhD och Peter Laird, PhD, identifierade en distinkt undergrupp av gliomprover som visar samordnad hypermetylering på ett stort antal loci, vilket indikerar förekomsten av en gliom-CpG-ömetylatorfenotyp (G -CIMP). G-CIMP-tumörer tillhör den proneurala subgruppen och var tätt associerade med IDH1 somatiska mutationer.
Seröst ovarieadenokarcinom
TCGA rapporterade om mRNA-uttryck, mikroRNA-uttryck, promotormetylering, DNA-kopiatal och exomsekvensering av 316 tumörprover av höggradig serös äggstockscancer i Nature i juni 2011. Forskarna fann mutationer av genen TP53 i överväldigande 96 % av analyserade fall, återkommande mutationer med lägre frekvens hittades i en handfull andra gener, inklusive NF1 , BRCA1 , BRCA2 , RB1 och CDK12 .
TCGA-forskare kunde också identifiera genuttrycksmönster som korrelerade med patientens överlevnad. De definierade fyra subtyper av cancern enligt genuttryck och DNA-metyleringsmönster: immunoreaktiv, differentierad, proliferativ och mesenkymal. De identifierade också 68 gener som potentiella läkemedelsmål.
Kolorektal karcinom
TCGA rapporterade om exomsekvensen, DNA-kopiatalet, promotormetylering och budbärar-RNA-karakterisering av 276 tumörprover av kolon- och rektalcancer i Nature i juli 2012. 97 av proverna genomgick också ultralågtäckande helgenomsekvensering.
TCGA-forskare upptäckte samma typ av förändringar i kolon- och rektaltumörer, vilket tyder på att de är en enda typ av cancer. Vissa skillnader, såsom hypermetylering, var uppenbara i tumörer med ursprung i höger kolon. En undergrupp av tumörerna visade sig vara hypermuterade; en majoritet av dessa hade också hög mikrosatellitinstabilitet. Två dussin signifikant muterade gener och återkommande kopia antal förändringar hittades. Studien föreslog nya markörer för aggressivt kolorektalt karcinom och en viktig roll för MYC-riktad transkriptionell aktivering och repression.
Fas II: Utöka TCGA till 33 cancertyper
Med stöd av American Recovery and Reinvestment Act från 2009 utökade NIH TCGA till att omfatta 20 typer av cancer. Detta inkluderade ett försök att studera sällsynta cancerformer, vilket möjliggjordes med stöd från patienter, patientgrupper och läkare. Från och med 2011 började TCGA hålla årliga vetenskapliga symposier för att diskutera och dela nya biologiska upptäckter om cancer, analytiska metoder och translationella metoder med hjälp av data.
I december 2013 avslutade TCGA provinsamlingen, efter att ha skickat och bearbetat över 20 000 prover. När projektet slutförts publicerade TCGA "markörpapper" som beskrev karakteriseringen och grundläggande analyser som täcker 33 cancertyper. För flera cancertyper, såsom urinblåsancarcinom och GBM, samlades ytterligare fall in och en andra analys utfördes.
Pan-Cancer Atlas Analyser
2013 publicerade TCGA en första pan-canceranalys som beskrev "mutationslandskapet" definierat som ofta återkommande mutationer identifierade från exomsekvensering av 3 281 tumörer från 12 vanliga cancersubtyper. De tolv undertyperna som studerades var bröstadenokarcinom, lungadenokarcinom , lungskivepitelcancer , endometriekarcinom , glioblastoma multiforme , skivepitelcancer i huvud och hals, tjocktarmscancer , ändtarmscancer , cancer i urinblåsan, karcinom i njure , ovarian och njure . leukemi .
Under 2018 publicerade TCGA Research Network vad som gemensamt kallas Pan-Cancer Atlas: en samling av 35 artiklar som sammanfattar det arbete som utförts av TCGA och beskriver övergripande teman inom cancerbiologi belyst genom att analysera all TCGA-data som helhet.
Huvudämnena är (1) cell-of-origin mönster, som grupperar och analyserar tumörer baserat på biologiskt system eller histologisk subtyp; (2) onkogena processer, som tar hänsyn till de komplexa effekterna nedströms förändringar kan ha på molekylära vägar och mikromiljön, och (3) signalvägar, som kartlägger vilken roll olika vägar spelar i olika cancerformer och deras potentiella sårbarheter.
Slutförandet av Pan-Cancer Atlas markerade det officiella slutet av TCGA som ett program, även om data, analysmetoder och andra resurser som produceras av TCGA fortsätter att fungera som en resurs för forskare. Till exempel analyserades TCGA:s hela genomdata som en del av Pan-Cancer Analysis of Whole Genomes (PCAWG), en internationell ansträngning för att analysera 2 600 cancerhela genom för att förstå somatiska och könscellsvariationer i både kodande och icke-kodande regioner.
Tema | Offentliggörande |
---|---|
Cell-of-origin-mönster | Cell-of-origin-mönster dominerar den molekylära klassificeringen av 10 000 tumörer från 33 typer av cancer (sammanfattning) |
Maskininlärning identifierar stamegenskaper associerade med onkogen dedifferentiering | |
En omfattande pan-cancer molekylär studie av gynekologisk och bröstcancer | |
Jämförande molekylär analys av gastrointestinala adenokarcinom | |
Genomiska, Pathway Network och immunologiska egenskaper Comparecular Carcinoma Squam | |
Cancer Karcinom Squam Njurcellscancer | |
Onkogena processer | Perspektiv på onkogena processer vid slutet av början av cancergenomik (sammanfattning) |
Patogena könscellsvarianter i 10 389 vuxna cancersjukdomar | |
Omfattande karaktärisering av cancerdrivande gener och mutationer | |
Driver fusioner och deras implikationer i utvecklingen och behandlingen av mänskliga cancersjukdomar | |
Cancerns immunlandskap | |
Rumslig organisation och molekylär korrelation av tumörinfiltrerande lymfocyter Användning av genominfiltrerande | |
lymfocyter och funktionella tillvägagångssätt för att förstå canceraneuploidi | |
En pancanceranalys av förstärkaruttryck i nästan 9 000 patientprov | |
lncRNA Epigenetisk landskapsanalys identifierar EPIC1 som ett onkogent lncRNA som interagerar med MYC och främjar cellcykelprogression av lncRNA-reglering av | |
pan-CRNA-reglering av canceranalys Deras inriktning på cancergener i varje tumörsammanhang | |
Systematisk analys av skarvningsplatsskapande mutationer i cancer | |
Skalbar öppen vetenskapsmetod för mutationsanrop av tumörexom med användning av flera genomiska pipelines | |
En integrerad TCGA Pan-Cancer klinisk dataresurs för att driva överlevnadsresultat av hög kvalitet Analys | |
omfattande analys av alternativ splitsning mellan tumörer från 8 705 patienter | |
Signaleringsvägar | Onkogena signalvägar i Cancer Genome Atlas (sammanfattning) |
Pan-cancerförändringar av MYC-onkogenen och dess proximala nätverk över cancergenomet Atlas | |
Maskininlärning upptäcker pan-cancer Ras Pathway-aktivering i cancergenomatlasen | |
Genomiskt och molekylärt landskap av DNA-skador Reparationsbrist över cancergenomet Atlas | |
Molekylär karaktärisering och klinisk relevans av metaboliska uttryckssubtyper i mänskliga cancertyper | |
Integrerad genomisk analys av Ubiquitin-vägen över cancertyper | |
Somatiskt mutationslandskap av splitsningsfaktorgener och deras funktionella konsekvenser över 33 cancertyper | |
En pan-canceranalys avslöjar högfrekventa genetiska förändringar i förmedlare av signalering av TGF -β Superfamilj | |
omfattande molekylär karaktärisering av flodhästs signaleringsväg i cancer |
Analys av icke-kodande regioner
TCGA-forskare satte sig också för att systematiskt studera de icke-kodande regionerna i genomet av flera cancerformer. Teamet tillämpade analysen för transposas-tillgängligt kromatin med hjälp av sekvensering (ATAC-seq) på 410 TCGA-tumörprover som täcker 23 primära cancerformer för att få insikter om gendysreglering i cancer. ATAC-seq är en billig metod för att identifiera regioner av öppet eller aktivt kromatin och positioner för DNA-bindande proteiner.
Genom ATAC-seq kunde forskare identifiera tiotusentals potentiella DNA-reglerande element specifika för olika cancerformer och celltyper. Detta gav insikter i hur gendysreglering kan hjälpa till att driva cancerinitiering och progression. Att förstå kromatintillgänglighet för kända immuncellspecifika regulatoriska element gav också ledtrådar till immunmikromiljön och tillgängligheten av immunterapimål. Studien, "The chromatin landscape of primary human cancers," publicerades 2018 i Science .
Se även
- Cancer Genome Project vid Wellcome Trust Sanger Institute
- International Cancer Genome Consortium
- Lista över biologiska databaser
externa länkar
- Cancergenomatlasen
- NCI Office of Cancer Genomics
- Cancer Genomics Hub vid UC Santa Cruz
- NCI Wiki