Chip-sekvensering

ChIP-sekvensering , även känd som ChIP-seq , är en metod som används för att analysera proteininteraktioner med DNA . ChIP-seq kombinerar kromatinimmunoutfällning (ChIP) med massivt parallell DNA-sekvensering för att identifiera bindningsställena för DNA-associerade proteiner. Det kan användas för att kartlägga globala bindningsställen exakt för alla proteiner av intresse. Tidigare ChIP-on-chip den vanligaste tekniken som användes för att studera dessa protein-DNA-relationer.

Används

ChIP-seq används främst för att bestämma hur transkriptionsfaktorer och andra kromatinassocierade proteiner påverkar fenotyppåverkande mekanismer. Att bestämma hur proteiner interagerar med DNA för att reglera genuttryck är väsentligt för att fullständigt förstå många biologiska processer och sjukdomstillstånd. Denna epigenetiska information är komplementär till genotyp- och uttrycksanalys. ChIP-seq-teknologi ses för närvarande främst som ett alternativ till ChIP-chip som kräver en hybridiseringsarray . Detta introducerar viss förspänning, eftersom en array är begränsad till ett fast antal sonder. Sekvensering, däremot, tros ha mindre bias, även om sekvenseringsbiasen för olika sekvenseringsteknologier ännu inte är helt klarlagda.

Specifika DNA-ställen i direkt fysisk interaktion med transkriptionsfaktorer och andra proteiner kan isoleras genom kromatinimmunutfällning . ChIP producerar ett bibliotek av mål-DNA-ställen bundna till ett protein av intresse. Massivt parallella sekvensanalyser används tillsammans med helgenomsekvensdatabaser för att analysera interaktionsmönstret för ett protein med DNA, eller mönstret för eventuella epigenetiska kromatinmodifieringar . Detta kan tillämpas på uppsättningen av chip-kapabla proteiner och modifieringar, såsom transkriptionsfaktorer, polymeraser och transkriptionsmaskineri , strukturella proteiner , proteinmodifieringar och DNA-modifieringar. Som ett alternativ till beroendet av specifika antikroppar har olika metoder utvecklats för att hitta superset av alla nukleosomutarmade eller nukleosomstörda aktiva regulatoriska regioner i genomet, som DNase-Seq och FAIRE-Seq .

Arbetsflöde för chip-sekvensering

Arbetsflöde för chip-sekvensering

Chip

ChIP är en kraftfull metod för att selektivt berika DNA-sekvenser bundna av ett visst protein i levande celler . Den utbredda användningen av denna metod har emellertid begränsats av bristen på en tillräckligt robust metod för att identifiera alla de anrikade DNA-sekvenserna. ChIP wet lab-protokollet innehåller ChIP och hybridisering. Det finns i huvudsak fem delar av ChIP-protokollet som hjälper till att bättre förstå den övergripande processen för ChIP. För att genomföra chipet är det första steget tvärbindning med formaldehyd och stora partier av DNA för att få en användbar mängd. Tvärbindningarna görs mellan proteinet och DNA, men även mellan RNA och andra proteiner. Det andra steget är processen med kromatinfragmentering som bryter upp kromatinet för att till slut få DNA-bitar av hög kvalitet för ChIP-analys. Dessa fragment bör skäras till att bli under 500 baspar vardera för att få det bästa resultatet för genomkartläggning. Det tredje steget kallas chromatin immunoprecipitation, vilket är vad ChIP är en förkortning för. ChIP-processen förbättrar specifika tvärbundna DNA-proteinkomplex med användning av en antikropp mot proteinet av intresse följt av inkubation och centrifugering för att erhålla immunoutfällningen. Immunoutfällningssteget möjliggör också avlägsnande av icke-specifika bindningsställen. Det fjärde steget är DNA-återvinning och rening, som sker genom den omvända effekten på tvärbindningen mellan DNA och protein för att separera dem och rengöra DNA med en extraktion. Det femte och sista steget är analyssteget av ChIP-protokollet genom processen med qPCR , ChIP-on-chip (hybrid array) eller ChIP-sekvensering. Oligonukleotidadaptrar läggs sedan till de små DNA-sträckorna som var bundna till proteinet av intresse för att möjliggöra massiv parallell sekvensering. Genom analysen kan sekvenserna sedan identifieras och tolkas av genen eller regionen dit proteinet var bundet.

Sekvensering

Efter storleksval sekvenseras alla de resulterande ChIP-DNA-fragmenten samtidigt med användning av en genomsekvenserare. En enda sekvenseringskörning kan skanna för genomomfattande associationer med hög upplösning, vilket innebär att funktioner kan lokaliseras exakt på kromosomerna. Chip-chip, däremot, kräver stora uppsättningar av plattsättningsarrayer för lägre upplösning.

Det finns många nya sekvenseringsmetoder som används i detta sekvenseringssteg. Vissa tekniker som analyserar sekvenserna kan använda klusteramplifiering av adapterligerade ChIP-DNA-fragment på ett cellsubstrat med fast flöde för att skapa kluster med cirka 1000 klonala kopior vardera. Den resulterande högdensitetsuppsättningen av mallkluster på flödescellytan sekvenseras av ett genomanalysprogram. Varje mallkluster genomgår sekvensering-genom-syntes parallellt med användning av nya fluorescensmärkta reversibla terminatornukleotider. Mallar sekvenseras bas för bas under varje läsning. Sedan anpassar datainsamlings- och analysmjukvaran provsekvenser till en känd genomisk sekvens för att identifiera ChIP-DNA-fragmenten. [ citat behövs ]

Kvalitetskontroll

ChIP-seq erbjuder oss en snabb analys, dock måste en kvalitetskontroll utföras för att säkerställa att de erhållna resultaten är tillförlitliga:

  • Icke-redundant fraktion : regioner med låg komplexitet bör tas bort eftersom de inte är informativa och kan störa kartläggningen i referensgenomet.
  • Fragment i toppar: förhållandet mellan läsningar som är placerade i toppar jämfört med läsningar som finns där det inte finns en topp.

Känslighet

Känsligheten hos denna teknologi beror på djupet av sekvenseringskörningen (dvs antalet kartlagda sekvenstaggar), storleken på genomet och fördelningen av målfaktorn. Sekvenseringsdjupet är direkt korrelerat med kostnaden. Om rikliga bindemedel i stora genom måste kartläggas med hög känslighet är kostnaderna höga eftersom ett enormt stort antal sekvenstaggar kommer att krävas. Detta till skillnad från Chip-chip där kostnaderna inte är korrelerade med känslighet.

Till skillnad från mikroarray -baserade ChIP-metoder begränsas inte precisionen av ChIP-seq-analysen av avståndet mellan förutbestämda sonder. Genom att integrera ett stort antal korta läsningar erhålls en mycket exakt bindningsplatslokalisering. Jämfört med ChIP-chip, kan ChIP-seq-data användas för att lokalisera bindningsstället inom några tiotals baspar från det faktiska proteinbindningsstället. Tagdensiteter vid bindningsställena är en bra indikator på protein-DNA-bindningsaffinitet, vilket gör det lättare att kvantifiera och jämföra bindningsaffiniteter för ett protein med olika DNA-ställen.

Nuvarande forskning

STAT1 DNA-association: ChIP-seq användes för att studera STAT1-mål i HeLa S3-celler som är kloner av HeLa-linjen som används för analys av cellpopulationer. Prestanda för ChIP-seq jämfördes sedan med de alternativa protein-DNA-interaktionsmetoderna för ChIP-PCR och ChIP-chip.

Nukleosomarkitektur av promotorer: Med hjälp av ChIP-seq bestämdes det att jästgener verkar ha en minimal nukleosomfri promotorregion på 150 bp där RNA-polymeras kan initiera transkription.

Transkriptionsfaktorkonservering: ChIP-seq användes för att jämföra bevarande av TF: er i framhjärnan och hjärtvävnaden hos embryonala möss. Författarna identifierade och validerade hjärtfunktionaliteten hos transkriptionsförstärkare och fastställde att transkriptionsförstärkare för hjärtat är mindre konserverade än de för framhjärnan under samma utvecklingsstadium.

Genomomfattande ChIP-seq: ChIP-sekvensering slutfördes på masken C. elegans för att utforska genomomfattande bindningsställen för 22 transkriptionsfaktorer. Upp till 20 % av de kommenterade kandidatgenerna tilldelades transkriptionsfaktorer. Flera transkriptionsfaktorer tilldelades icke-kodande RNA-regioner och kan vara föremål för utvecklings- eller miljövariabler. Funktionerna hos några av transkriptionsfaktorerna identifierades också. Några av transkriptionsfaktorerna reglerar gener som styr andra transkriptionsfaktorer. Dessa gener regleras inte av andra faktorer. De flesta transkriptionsfaktorer fungerar som både mål och regulatorer av andra faktorer, vilket visar ett nätverk av reglering.

Härleda regulatoriskt nätverk: ChIP-seq-signal av histonmodifiering visade sig vara mer korrelerad med transkriptionsfaktormotiv vid promotorer i jämförelse med RNA-nivå. Därför föreslog författaren att användning av histonmodifiering ChIP-seq skulle ge mer tillförlitlig slutledning av genreglerande nätverk i jämförelse med andra metoder baserade på uttryck.

ChIP-seq erbjuder ett alternativ till ChIP-chip. STAT1 experimentella ChIP-seq-data har en hög grad av likhet med resultat som erhållits av ChIP-chip för samma typ av experiment, med mer än 64% av topparna i delade genomiska regioner. Eftersom data är sekvensläsningar, erbjuder ChIP-seq en snabb analyspipeline så länge som en högkvalitativ genomsekvens är tillgänglig för läsning av kartläggning och genomet inte har repetitivt innehåll som förvirrar kartläggningsprocessen. ChIP-seq har också potential att upptäcka mutationer i bindningsplatssekvenser, vilket direkt kan stödja eventuella observerade förändringar i proteinbindning och genreglering.

Beräkningsanalys

Som med många sekvenseringsmetoder med hög genomströmning genererar ChIP-seq extremt stora datamängder, för vilka lämpliga beräkningsmetoder krävs. För att förutsäga DNA-bindningsställen från ChIP-seq läsräkningsdata peak calling- metoder utvecklats. En av de mest populära metoderna [ citat behövs ] är MACS som empiriskt modellerar skiftstorleken för ChIP-Seq-taggar och använder den för att förbättra den rumsliga upplösningen av förutsagda bindningsställen. MACS är optimerat för toppar med högre upplösning, medan en annan populär algoritm, SICER, är programmerad att kräva bredare toppar, som sträcker sig över kilobaser till megabaser för att söka efter bredare kromatindomäner. SICER är mer användbart för histonmärken som spänner över genkroppar. En matematisk mer rigorös metod BCP (Bayesian Change Point) kan användas för både skarpa och breda toppar med snabbare beräkningshastighet, se benchmark-jämförelse av ChIP-seq peak-calling-verktyg av Thomas et al . (2017).

Ett annat relevant beräkningsproblem är differential peak calling, som identifierar signifikanta skillnader i två ChIP-seq-signaler från distinkta biologiska förhållanden. Differentiella peak-anropare segmenterar två ChIP-seq-signaler och identifierar differentiella toppar med hjälp av Hidden Markov-modeller . Exempel på tvåstegs differentiella toppanropare är ChIPDiff och ODIN.

För att minska falska platser från ChIP-seq, kan flera experimentella kontroller användas för att detektera bindningsställen från ett IP-experiment. Bay2Ctrls använder en Bayesiansk modell för att integrera DNA-inmatningskontrollen för IP:n, den skenbara IP-adressen och dess motsvarande DNA-inmatningskontroll för att förutsäga bindningsställen från IP:n. Detta tillvägagångssätt är särskilt effektivt för komplexa prover såsom hela modellorganismer. Dessutom indikerar analysen att mock IP-kontroller för komplexa prover avsevärt överträffar DNA-inmatningskontroller troligen på grund av provernas aktiva genomen.

Se även

Liknande metoder

  • CUT&RUN-sekvensering , antikroppsriktad kontrollerad klyvning med mikrokockernukleas istället för ChIP, vilket möjliggör förbättrat signal-brusförhållande under sekvensering.
  • CUT&Tag-sekvensering , antikroppsriktad kontrollerad klyvning genom transposas Tn5 istället för ChIP, vilket möjliggör förbättrat signal-brusförhållande under sekvensering.
  • Sono-Seq , identisk med ChIP-Seq men hoppar över immunoutfällningssteget.
  • HITS-CLIP (även kallad CLIP-Seq ), för att hitta interaktioner med RNA snarare än DNA.
  • PAR-CLIP , en annan metod för att identifiera bindningsställena för cellulära RNA-bindande proteiner (RBP).
  • RIP-Chip , samma mål och första steg, men använder inte tvärlänkningsmetoder och använder mikroarray istället för sekvensering
  • SELEX , en metod för att hitta en konsensusbindningssekvens
  • Competition-ChIP , för att mäta relativ ersättningsdynamik på DNA.
  • ChiRP-Seq för att mäta RNA-bundet DNA och proteiner.
  • ChIP-exo använder exonukleasbehandling för att uppnå upp till en basparsupplösning
  • ChIP-nexus förbättrad version av ChIP-exo för att uppnå upp till en basparsupplösning.
  • DRIP-seq använder S9.6-antikropp för att fälla ut tresträngade DND:RNA-hybrider som kallas R-loopar.
  • TCP-seq , huvudsakligen liknande metod för att mäta mRNA-translationsdynamik.
  • Calling Cards, använder en transposas för att markera sekvensen där en transkriptionsfaktor binder.

externa länkar

  • ReMap-katalog : En integrerad och enhetlig ChIP-Seq- analys av regulatoriska element från +2800 ChIP-seq-datauppsättningar, vilket ger en katalog med 80 miljoner toppar från 485 transkriptionsregulatorer.
  • ChIPBase-databas : en databas för att utforska transkriptionsfaktorbindningskartor från ChIP-Seq- data. Den tillhandahåller den mest omfattande ChIP-Seq-datauppsättningen för olika cell-/vävnadstyper och tillstånd.
  • GeneProf-databas och analysverktyg : GeneProf är en fritt tillgänglig, lättanvänd analysmiljö för ChIP-seq och RNA-seq-data och levereras med en stor databas med färdiganalyserade publika experiment, t.ex. för transkriptionsfaktorbindning och histonmodifieringar.
  • Differential Peak Calling : Handledning för differential peak calling med ODIN.
  • Bioinformatisk analys av ChIP-seq-data : Omfattande analys av ChIP-seq-data.
  • KLTepigenome : Upptäcker korrelerad variabilitet i epigenomiska datamängder med hjälp av Karhunen-Loeve-transformen.
  • SignalSpider : ett verktyg för probabilistisk mönsterupptäckt på flera normaliserade ChIP-Seq- signalprofiler
  • FullSignalRanker : ett verktyg för regression och toppprediktion på flera normaliserade ChIP-Seq- signalprofiler

  1. ^    Chèneby J, Gheorghe M, Artufel M, Mathelier A, Ballester B (januari 2018). "ReMap 2018: en uppdaterad atlas över regulatoriska regioner från en integrativ analys av DNA-bindande ChIP-seq experiment" . Nukleinsyraforskning . 46 (D1): D267–D275. doi : 10.1093/nar/gkx1092 . PMC 5753247 . PMID 29126285 .
  2. ^    Bailey T, Krajewski P, Ladunga I, Lefebvre C, Li Q, Liu T, et al. (2013). "Praktiska riktlinjer för omfattande analys av ChIP-seq data" . PLOS Computational Biology . 9 (11): e1003326. Bibcode : 2013PLSCB...9E3326B . doi : 10.1371/journal.pcbi.1003326 . PMC 3828144 . PMID 24244136 .