FAIRE-Seq
FAIRE-Seq ( F formaldehyd- A ssisted I solation of R egulatory Elements ) är en metod inom molekylärbiologi som används för att bestämma sekvenserna av DNA-regioner i genomet som är associerade med regulatorisk aktivitet. Tekniken utvecklades i Jason D. Liebs laboratorium vid University of North Carolina , Chapel Hill. I motsats till DNase-Seq kräver FAIRE-Seq-protokollet inte permeabilisering av celler eller isolering av kärnor, och kan analysera vilken celltyp som helst. I en studie av sju olika mänskliga celltyper producerade DNase-seq och FAIRE-seq stark korsvalidering, där varje celltyp har 1-2% av det mänskliga genomet som öppet kromatin .
Arbetsflöde
Protokollet är baserat på det faktum att formaldehydtvärbindningen är mer effektiv i nukleosombundet DNA än i nukleosomutarmade regioner av genomet . Denna metod segregerar sedan det icke tvärbundna DNA som vanligtvis finns i öppet kromatin, som sedan sekvenseras. Protokollet består av tvärbindning, fenolextraktion och sekvensering av DNA:t i vattenfas.
FAIRE
FAIRE använder de biokemiska egenskaperna hos proteinbundet DNA för att separera nukleosomutarmade regioner i genomet. Celler kommer att utsättas för tvärbindning, vilket säkerställer att interaktionen mellan nukleosomerna och DNA är fixerad. Efter sonikering separeras det fragmenterade och fixerade DNA:t med hjälp av en fenol-kloroformextraktion. Denna metod skapar två faser, en organisk och en vattenfas. På grund av sina biokemiska egenskaper kommer DNA-fragmenten som är tvärbundna till nukleosomer företrädesvis att sitta i den organiska fasen. Nukleosomutarmade eller "öppna" regioner kommer å andra sidan att hittas i vattenfasen. Genom att specifikt extrahera den vattenhaltiga fasen kommer endast nukleosomutarmade regioner att renas och anrikas.
Sekvensering
FAIRE-extraherade DNA-fragment kan analyseras på ett sätt med hög genomströmning med hjälp av nästa generations sekvenseringstekniker . I allmänhet görs bibliotek genom att ligera specifika adaptrar till DNA-fragmenten som gör att de kan klustras på en plattform och amplifieras vilket resulterar i att DNA-sekvenserna läses/bestäms, och detta parallellt för miljoner av DNA-fragmenten.
Beroende på storleken på genomet som FAIRE-seq utförs på krävs ett minimum av läsningar för att skapa en lämplig täckning av data, vilket säkerställer att en korrekt signal kan fastställas. Dessutom sekvenseras ofta ett referens- eller ingångsgenom, som inte har tvärbundits, bredvid för att bestämma nivån av bakgrundsbrus.
Observera att de extraherade FAIRE-fragmenten kan kvantifieras i en alternativ metod genom att använda kvantitativ PCR . Denna metod tillåter dock inte en genom bred/hög genomströmningskvantifiering av de extraherade fragmenten.
Känslighet
Det finns flera aspekter av FAIRE-seq som kräver uppmärksamhet vid analys och tolkning av data. För det första har det sagts att FAIRE-seq kommer att ha en högre täckning vid förstärkarregioner än promotorregioner. Detta är i motsats till den alternativa metoden för DNase-seq som är känd för att visa en högre känslighet mot promotorregioner. Dessutom har FAIRE-seq angetts visa preferenser för interna introner och exoner. I allmänhet tror man också att FAIRE-seq-data visar en högre bakgrundsnivå, vilket gör det till en mindre känslig metod.
Beräkningsanalys
I ett första steg kartläggs FAIRE-seq-data till referensgenomet för den modellorganism som används.
Därefter görs identifieringen av genomiska regioner med öppet kromatin genom att använda en toppanropsalgoritm. Olika verktyg erbjuder paket för att göra detta (t.ex. ChIPOTle ZINBA och MACS2). ChIPOTle använder ett glidande fönster på 300 bp för att identifiera statistiskt signifikanta signaler. Däremot identifierar MACS2 den berikade signalen genom att kombinera parametern callpeak med andra alternativ som 'bred', 'bred cutoff', 'ingen modell' eller 'shift'. ZINBA är en generisk algoritm för detektering av anrikning i kortläst dataset. Det hjälper alltså till med exakt detektering av signal i komplexa datauppsättningar med lågt signal-brusförhållande.
BedTools används för att slå samman de berikade regionerna som bor nära varandra för att bilda COREs (Cluster of open regulatory elements). Detta hjälper till att identifiera kromatintillgängliga regioner och genregleringsmönster som annars skulle ha varit omöjliga att upptäcka, med tanke på den lägre upplösning som FAIRE-seq ofta för med sig.
Data visualiseras vanligtvis som spår (t.ex. bigWig) och kan laddas upp till UCSC-genomläsaren.
Den stora begränsningen av denna metod, dvs det låga signal-brusförhållandet jämfört med andra kromatintillgänglighetsanalyser, gör beräkningstolkningen av dessa data mycket svår.
Alternativa metoder
Det finns flera metoder som kan användas som ett alternativ till FAIRE-seq. DNase-seq använder förmågan hos DNas I-enzymet att klyva fritt/öppet/tillgängligt DNA för att identifiera och sekvensera öppet kromatin. Den senare utvecklade ATAC-sekvensen använder Tn5-transposaset, som infogar specificerade fragment eller transposoner i tillgängliga regioner av genomet för att identifiera och sekvensera öppet kromatin.