Perturb-seq
Perturb-seq (även känd som CRISP-seq och CROP-seq ) hänvisar till en högkapacitetsmetod för att utföra encells-RNA-sekvensering (scRNA-seq) på poolade genetiska störningsskärmar. Perturb-seq kombinerar multiplexade CRISPR- medierade geninaktiveringar med encells-RNA-sekvensering för att bedöma omfattande genuttrycksfenotyper för varje störning. Att sluta sig till en gens funktion genom att tillämpa genetiska störningar för att slå ner eller slå ut en gen och studera den resulterande fenotypen kallas omvänd genetik . Perturb-seq är en omvänd genetisk metod som möjliggör undersökning av fenotyper på nivån av transkriptomen , för att belysa genfunktioner i många celler, på ett massivt parallellt sätt.
Perturb-seq-protokollet använder CRISPR- teknologi för att inaktivera specifika gener och DNA-streckkodning av varje guide-RNA för att tillåta alla störningar att slås samman och senare dekonvoluteras, med tilldelning av varje fenotyp till ett specifikt guide-RNA . Droplet-baserade mikrofluidikplattformar (eller andra cellsorterings- och separeringstekniker) används för att isolera individuella celler, och sedan utförs scRNA-seq för att generera genuttrycksprofiler för varje cell. Efter slutförandet av protokollet genomförs bioinformatiska analyser för att associera varje specifik cell och störning med en transkriptomisk profil som karakteriserar konsekvenserna av att inaktivera varje gen.
Historia
I decembernumret 2016 av tidskriften Cell publicerades två kompletterande artiklar som var och en introducerade och beskrev denna teknik. En tredje artikel som beskriver ett konceptuellt liknande tillvägagångssätt (benämnt CRISP-seq) publicerades också i samma nummer. I oktober 2016 presenterades CROP-seq-metoden för encellig CRISPR-screening i ett förtryck på bioRxiv och publicerades senare i tidskriften Nature Methods . Medan varje artikel delade kärnprinciperna för att kombinera CRISPR-medierad störning med scRNA-seq, skilde sig deras experimentella, tekniska och analytiska tillvägagångssätt i flera aspekter, för att utforska distinkta biologiska frågor, vilket visar den breda användbarheten av denna metod. Till exempel visade CRISPR-seq-papperet genomförbarheten av in vivo -studier med denna teknik, och CROP-seq-protokollet underlättar stora skärmar genom att tillhandahålla en vektor som gör själva guide-RNA:t läsbart (istället för att förlita sig på uttryckta streckkoder), vilket möjliggör för enstegsguide RNA-kloning. En artikel från juni 2022 i Cell publicerade resultat från en av de första genomskaliga Perturb-seq-skärmarna, som upptäckte nya störningar som främjar kromosomal instabilitet såväl som variationer i uttrycket av mitokondriellt kodade transkript som svar på olika former av mitokondriell stress.
Experimentellt arbetsflöde
CRISPR Single Guide RNA Library design och urval
Poolade CRISPR- bibliotek som möjliggör geninaktivering kan komma i form av antingen knockout eller interferens. Knockout-bibliotek stör gener genom dubbelsträngade avbrott som uppmanar den felbenägna icke-homologa änden att ansluta till reparationsvägen för att introducera störande insättningar eller deletioner. CRISPR-interferens (CRISPRi) å andra sidan använder ett katalytiskt inaktivt nukleas för att fysiskt blockera RNA-polymeras , vilket effektivt förhindrar eller stoppar transkription . Perturb-seq har använts med både knockout- och CRISPRi-metoderna i Dixit et al. papper och Adamson et al. papper, respektive.
Att slå samman alla guide-RNA till en enda skärm bygger på DNA-streckkoder som fungerar som identifierare för varje unikt guide-RNA. Det finns flera kommersiellt tillgängliga poolade CRISPR-bibliotek inklusive guide streckkodsbiblioteket som används i studien av Adamson et al. CRISPR-bibliotek kan också skräddarsys med hjälp av verktyg för sgRNA-design, av vilka många finns listade på Wikipedia-sidan för CRISPR/cas9 tools .
Lentivirala vektorer
Utformningen av sgRNA-expressionsvektorn kommer till stor del att bero på det utförda experimentet men kräver följande centrala komponenter:
- Promotor
- Restriktionsplatser
- Primer- bindningsplatser
- sgRNA
- Guide streckkod
-
Reportergenen :
- Fluorescerande gen: vektorer är ofta konstruerade för att inkludera en gen som kodar för ett fluorescerande protein, så att framgångsrikt transducerade celler kan bedömas visuellt och kvantitativt genom deras uttryck.
- Antibiotikaresistensgen : liknande fluorescerande markörer, är antibiotikaresistensgener ofta inkorporerade i vektorer för att möjliggöra urval av framgångsrikt transducerade celler.
- CRISPR-associerat endonukleas: Cas9 eller andra CRISPR-associerade endonukleaser som Cpf1 måste introduceras i celler som inte uttrycker dem endogent. På grund av den stora storleken på dessa gener kan ett tvåvektorsystem användas för att uttrycka endonukleaset separat från sgRNA-expressionsvektorn.
Transduktion och urval
transduceras vanligtvis med en multiplicitet av infektion (MOI) på 0,4 till 0,6 lentivirala partiklar per cell för att maximera sannolikheten för att erhålla flest celler som innehåller ett enda guide-RNA. Om effekterna av samtidiga störningar är av intresse kan en högre MOI appliceras för att öka mängden transducerade celler med mer än ett guide-RNA. Selektion för framgångsrikt transducerade celler utförs sedan med användning av en fluorescensanalys eller en antibiotisk analys, beroende på reportergenen som används i expressionsvektorn.
Förberedelse av encellsbibliotek
Efter att framgångsrikt transducerade celler har valts ut för, behövs isolering av enstaka celler för att utföra scRNA-seq. Perturb-seq och CROP-seq har utförts med droppbaserad teknologi för encellsisolering, medan den närbesläktade CRISP-seq utfördes med en mikrobrunnsbaserad metod. När celler väl har isolerats på singelcellsnivå, omvänd transkription , amplifiering och sekvensering för att producera genuttrycksprofiler för varje cell. Många scRNA-seq-metoder innehåller unika molekylära identifierare (UMI) och cellstreckkoder under steget med omvänd transkription för att indexera enskilda RNA-molekyler respektive celler. Dessa ytterligare streckkoder tjänar till att kvantifiera RNA-transkript och att associera var och en av sekvenserna med deras ursprungscell.
Bioinformatik analys
Läsjustering och bearbetning utförs för att kartlägga kvalitetsläsningar till ett referensgenom. Dekonvolution av cellstreckkoder, guidestreckkoder och UMI:er möjliggör associering av guide-RNA med cellerna som innehåller dem, vilket gör att genuttrycksprofilen för varje cell kan kopplas till en viss störning. Ytterligare nedströmsanalyser av transkriptionsprofilerna kommer att bero helt på den biologiska frågan av intresse. T-distribuerad Stochastic Neighbor Embedding (t-SNE) är en vanlig maskininlärningsalgoritm för att visualisera högdimensionella data som resulterar från scRNA-seq i en 2-dimensionell spridningsplot. Författarna som först utförde Perturb-seq utvecklade ett internt beräkningsramverk kallat MIMOSCA som förutsäger effekterna av varje störning med hjälp av en linjär modell och är tillgänglig på ett öppet programvaruförråd.
Fördelar och begränsningar
Perturb-seq använder sig av nuvarande teknologier inom molekylärbiologi för att integrera ett arbetsflöde i flera steg som kopplar screening med hög genomströmning med komplexa fenotypiska utdata. Jämfört med alternativa metoder som används för gen knockdowns eller knockouts, såsom RNAi , zinkfingernukleaser eller transkriptionsaktivatorliknande effektornukleaser (TALENs), möjliggör tillämpningen av CRISPR-baserade störningar mer specificitet, effektivitet och användarvänlighet. En annan fördel med detta protokoll är att medan de flesta screeningmetoder endast kan analysera för enkla fenotyper, såsom cellulär viabilitet, möjliggör scRNA-seq en mycket rikare fenotypisk avläsning, med kvantitativa mätningar av genuttryck i många celler samtidigt. Perturb-seq kan därför kombinera den höga genomströmningen av framåtgenetik , i termer av antalet genetiska störningar, med den rika fenotypdimensionen av omvänd genetik .
Men även om en stor och omfattande mängd data kan vara en fördel, kan det också utgöra en stor utmaning. Encells RNA-uttrycksavläsningar är kända för att producera "bullriga" data, med ett betydande antal falska positiva. Både den stora storleken och bruset som är associerat med scRNA-seq kommer sannolikt att kräva nya och kraftfulla beräkningsmetoder och bioinformatikpipelines för att bättre förstå de resulterande data. En annan utmaning förknippad med detta protokoll är skapandet av storskaliga CRISPR-bibliotek. Förberedelsen av dessa omfattande bibliotek beror på en jämförande ökning av de resurser som krävs för att odla det enorma antal celler som behövs för att uppnå en framgångsrik screening av många störningar.
Parallellt med dessa encelliga metoder har andra tillvägagångssätt utvecklats för att rekonstruera genetiska vägar med hjälp av helorganisms RNA-sekvensering. Dessa metoder använder en enda samlad statistik, kallad transkriptomomfattande epistas-koefficient, för att vägleda rekonstruktion av vägen. I motsats till det statistiska ramverket för metoderna som beskrivs ovan, kan denna koefficient vara mer robust mot brus och är intuitivt tolkbar i termer av Batesonian epistas. Detta tillvägagångssätt användes för att identifiera ett nytt tillstånd i livscykeln för nematoden C. elegans .
Ansökningar
Perturb-seq eller andra konceptuellt liknande protokoll kan användas för att ta itu med ett brett spektrum av biologiska frågor och tillämpningarna av denna teknik kommer sannolikt att växa över tiden. Tre artiklar om detta ämne, publicerade i december 2016 av Journal Cell, visade användbarheten av denna metod genom att tillämpa den på undersökningen av flera olika biologiska funktioner. I artikeln, "Perturb-Seq: Dissecting Molecular Circuits with Scalable Single-Cell RNA Profiling of Pooled Genetic Screens", använde författarna Perturb-seq för att utföra knockouts av transkriptionsfaktorer relaterade till immunsvaret i hundratusentals celler för att undersöka de cellulära konsekvenserna av deras inaktivering. De undersökte också effekterna av transkriptionsfaktorer på celltillstånd i samband med cellcykeln . I studien ledd av UCSF , "A Multiplexed Single-Cell CRISPR Screening Platform Enables Systematic Dissection of the Unfolded Protein Response" undertryckte forskarna flera gener i varje cell för att studera den oveckade proteinresponsen (UPR). Med en liknande metod, men med termen CRISP-seq istället för Perturb-seq, utförde uppsatsen "Dissecting Immune Circuits by Linking CRISPR-Pooled Screens with Single-Cell RNA-Seq" ett proof of concept-experiment genom att använda tekniken för att sondera regulatoriska vägar relaterade till medfödd immunitet hos möss. Dödligheten av varje störnings- och epistasanalys i celler med flera störningar undersöktes också i dessa artiklar. Perturb-seq har hittills använts med väldigt få störningar per experiment, men det kan teoretiskt skalas upp för att adressera hela genomet. Slutligen demonstrerar förtrycket från oktober 2016 och efterföljande papper den bioinformatiska rekonstruktionen av T-cellsreceptorns signalväg i Jurkat- celler baserat på CROP-seq-data.
Även om dessa publikationer använde dessa protokoll för att besvara komplexa biologiska frågor, kan denna teknologi också användas som en valideringsanalys för att säkerställa specificiteten hos alla CRISPR-baserade knockdowns eller knockouts; uttrycksnivåerna för målgenerna såväl som andra kan mätas med enkelcellsupplösning parallellt, för att upptäcka om störningen var framgångsrik och för att bedöma experimentet för effekter utanför målet. Dessutom gör dessa protokoll det möjligt att utföra störningsskärmar i heterogena vävnader, samtidigt som celltypsspecifika genuttryckssvar erhålls.