Terminal restriktionsfragmentlängdpolymorfism

Terminal restriktionsfragmentlängdpolymorfism ( TRFLP eller ibland T-RFLP ) är en molekylärbiologisk teknik för profilering av mikrobiella samhällen baserat på positionen för ett restriktionsställe närmast en märkt ände av en amplifierad gen. Metoden bygger på att smälta en blandning av PCR- amplifierade varianter av en enda gen med ett eller flera restriktionsenzymer och detektera storleken på vart och ett av de individuella resulterande terminala fragmenten med hjälp av en DNA-sekvenserare . Resultatet är en grafbild där x-axeln representerar storleken på fragmentet och y-axeln representerar deras fluorescensintensitet.

Bakgrund



TRFLP är en av flera molekylära metoder som syftar till att generera ett fingeravtryck av en okänd mikrobiell gemenskap. Andra liknande metoder inkluderar DGGE, TGGE , ARISA , ARDRA , PLFA , etc. Dessa relativt höga genomströmningsmetoder utvecklades för att minska kostnaden och ansträngningen för att analysera mikrobiella samhällen med användning av ett klonbibliotek . Metoden beskrevs först av Avaniss-Aghajani et al 1994 och senare av Liu 1997 som använde amplifiering av 16S rDNA -målgenen från DNA från flera isolerade bakterier såväl som miljöprover. Sedan dess har metoden använts för användning av andra markörgener såsom den funktionella markörgenen pmoA för att analysera metanotrofa samhällen.

Metod

Liksom de flesta andra samhällsanalysmetoder är TRFLP också baserad på PCR-amplifiering av en målgen. I fallet med TRFLP utförs amplifieringen med en eller båda primrarna som har sin 5'-ände märkt med en fluorescerande molekyl. Om båda primrarna är märkta krävs olika fluorescerande färgämnen . Medan flera vanliga fluorescerande färgämnen kan användas för märkning som 6-karboxifluorescein (6-FAM), ROX, karboxytetrametylrhodamin (TAMRA, ett rhodaminbaserat färgämne) och hexaklorfluorescein (HEX), är det mest använda färgämnet 6 -FAM. Blandningen av amplikoner utsätts sedan för en restriktionsreaktion, normalt med användning av ett restriktionsenzym med fyra skärare . Efter restriktionsreaktionen separeras blandningen av fragment med användning av antingen kapillär- eller polyakrylamidelektrofores i en DNA-sekvenserare och storlekarna på de olika terminala fragmenten bestäms av fluorescensdetektorn . Eftersom den utskurna blandningen av amplikoner analyseras i en sekvenserare läses endast de terminala fragmenten (dvs. den märkta änden eller ändarna av amplikonen) medan alla andra fragment ignoreras. Således skiljer sig T-RFLP från ARDRA och RFLP där alla restriktionsfragment visualiseras. Utöver dessa steg inkluderar TRFLP-protokollet ofta en rensning av PCR-produkterna före restriktionen och om en kapillärelektrofores används utförs också ett avsaltningssteg innan provet körs.

Dataformat och artefakter

Resultatet av en T-RFLP-profilering är en graf som kallas elektroferogram som är en intensitetsdiagram representation av ett elektroforesexperiment (gel eller kapillär). I ett elektroferogram markerar X-axeln storleken på fragmenten medan Y-axeln markerar fluorescensintensiteten för varje fragment. Sålunda framträder det som uppträder på en elektroforesgel som ett band som en topp på elektroferogrammet vars integral är dess totala fluorescens. I en T-RFLP-profil motsvarar varje topp antagligen en genetisk variant i det ursprungliga provet medan dess höjd eller area motsvarar dess relativa överflöd i det specifika samhället. Båda antagandena ovan är dock inte alltid uppfyllda. Ofta kan flera olika bakterier i en population ge en enda topp på elektroferogrammet på grund av närvaron av ett restriktionsställe för det speciella restriktionsenzym som används i experimentet vid samma position. För att övervinna detta problem och för att öka upplösningsförmågan hos denna teknik kan ett enda prov smältas parallellt av flera enzymer (ofta tre) vilket resulterar i tre T-RFLP-profiler per prov som var och en löser vissa varianter medan andra saknas. En annan modifiering som ibland används är att fluorescerande märka den omvända primern också med användning av ett annat färgämne, vilket återigen resulterar i två parallella profiler per prov som var och en löser ett annat antal varianter.

Förutom konvergens av två distinkta genetiska varianter till en enda topp kan artefakter också dyka upp, främst i form av falska toppar. Falska toppar är vanligtvis av två typer: bakgrundsljud och "pseudo" TRF. Bakgrundstoppar (brus) är toppar som härrör från känsligheten hos detektorn som används. Dessa toppar är ofta små i sin intensitet och utgör vanligtvis ett problem om profilens totala intensitet är låg (dvs låg koncentration av DNA). Eftersom dessa toppar är ett resultat av bakgrundsbrus är de normalt irreproducerbara i replikatprofiler, sålunda kan problemet lösas genom att producera en konsensusprofil från flera replikat eller genom att eliminera toppar under en viss tröskel. Flera andra beräkningstekniker introducerades också för att hantera detta problem. Pseudo-TRF är å andra sidan reproducerbara toppar och är linjära i förhållande till mängden laddat DNA. Dessa toppar tros vara resultatet av ssDNA som hybridiserar till sig själv och skapar dubbelsträngade slumpmässiga restriktionsställen som senare känns igen av restriktionsenzymet vilket resulterar i ett terminalt fragment som inte representerar någon äkta genetisk variant. Det har föreslagits att applicering av ett DNA- exonukleas såsom Mungbön-exonukleas före digestionsstadiet kan eliminera en sådan artefakt.

Tolkning av data

Data som resulterar från elektroferogrammet tolkas normalt på något av följande sätt.

Mönsterjämförelse

I mönsterjämförelse jämförs de allmänna formerna av elektroferogram för olika prover för förändringar som närvaro-frånvaro av toppar mellan behandlingar, deras relativa storlek, etc.

Komplettera med ett klonbibliotek

Om ett klonbibliotek konstrueras parallellt med T-RFLP-analysen kan klonerna användas för att bedöma och tolka T-RFLP-profilen. I denna metod bestäms TRF för varje klon antingen direkt (dvs att utföra T-RFLP-analys på varje enskild klon) eller genom in silicoanalys av den klonens sekvens. Genom att jämföra T-RFLP-profilen med ett klonbibliotek är det möjligt att validera var och en av topparna som äkta såväl som att bedöma den relativa förekomsten av varje variant i biblioteket.

Topplösning med hjälp av en databas

Flera datorapplikationer försöker relatera topparna i ett elektroferogram till specifika bakterier i en databas. Normalt görs denna typ av analys genom att samtidigt lösa upp flera profiler av ett enda prov erhållet med olika restriktionsenzymer. Mjukvaran löser sedan profilen genom att försöka maximera matchningarna mellan topparna i profilerna och posterna i databasen så att antalet toppar som lämnas utan en matchande sekvens är minimalt. Mjukvaran tar endast bort de sekvenser från databasen som har sina TRF:er i alla analyserade profiler.

Multivariat analys

Ett nyligen växande sätt att analysera T-RFLP-profiler är att använda multivariata statistiska metoder för att tolka T-RFLP-data. Vanligtvis är de metoder som används de som vanligtvis används inom ekologi och särskilt i studiet av biologisk mångfald. Bland dem är ordinationer och klusteranalys de mest använda. För att kunna utföra multivariat statistisk analys på T-RFLP-data måste data först konverteras till en tabell som kallas "prov för arttabell" som visar de olika proverna (T-RFLP-profiler) kontra arten (T-RFS) med höjden eller arean av topparna som värden.

Fördelar och nackdelar

Eftersom T-RFLP är en fingeravtrycksteknik diskuteras dess fördelar och nackdelar ofta i jämförelse med andra liknande tekniker, mestadels DGGE.

Fördelar

Den stora fördelen med T-RFLP är användningen av en automatiserad sekvenserare som ger mycket reproducerbara resultat för upprepade prover. Även om de genetiska profilerna inte är fullständigt reproducerbara och flera mindre toppar som uppträder är irreproducerbara anses den övergripande formen av elektroferogrammet och förhållandena mellan de större topparna reproducerbara. Användningen av en automatiserad sequencer som matar ut resultaten i ett digitalt numeriskt format möjliggör också ett enkelt sätt att lagra data och jämföra olika prover och experiment. Det numeriska formatet av data kan och har använts för relativ (men inte absolut) kvantifiering och statistisk analys. Även om sekvensdata inte definitivt kan härledas direkt från T-RFLP-profilen, är "in-silico"-tilldelning av topparna till existerande sekvenser möjlig i viss utsträckning.

Nackdelar

Eftersom T-RFLP förlitar sig på DNA-extraktionsmetoder och PCR, kommer de fördomar som är inneboende för båda att påverka resultaten av analysen. Det faktum att endast de terminala fragmenten läses betyder också att vilka två distinkta sekvenser som helst som delar ett terminalt restriktionsställe kommer att resultera i endast en topp på elektroferogrammet och kommer att vara omöjliga att särskilja. Faktum är att när T-RFLP appliceras på en komplex mikrobiell gemenskap blir resultatet ofta en komprimering av den totala mångfalden till normalt 20-50 distinkta toppar som endast representerar var och en ett okänt antal distinkta sekvenser. Även om detta fenomen gör T-RFLP-resultaten lättare att hantera, introducerar det naturligtvis fördomar och överförenkling av den verkliga mångfalden. Försök att minimera (men inte övervinna) detta problem görs ofta genom att applicera flera restriktionsenzymer och/eller märka båda primrarna med ett annat fluorescerande färgämne. Oförmågan att hämta sekvenser från T-RFLP leder ofta till behovet av att konstruera och analysera ett eller flera klonbibliotek parallellt med T-RFLP-analysen, vilket ökar ansträngningen och komplicerar analysen. Det möjliga uppkomsten av falska (pseudo) T-RF, som diskuterats ovan, är ytterligare en nackdel. För att hantera detta överväger forskare ofta bara toppar som kan kopplas till sekvenser i ett klonbibliotek.

externa länkar