Jordens mikrobiomprojekt
Earth Microbiome Project (EMP) är ett initiativ som grundades av Janet Jansson, Jack Gilbert och Rob Knight 2010 för att samla in naturliga prover och analysera det mikrobiella samhället runt om i världen.
Mikrober är mycket rikliga, mångfaldiga och har en viktig roll i det ekologiska systemet. [ vilken? ] Till exempel innehåller havet uppskattningsvis 1,3 × 10 28 arkeala celler, 3,1 × 10 28 bakterieceller och 1 × 10 30 viruspartiklar . Den bakteriella mångfalden, ett mått på antalet typer av bakterier i ett samhälle, uppskattas till cirka 160 för en ml havsvatten, 6 400–38 000 för ag jord och 70 för en ml avloppsverk. Ändå från och med 2010 uppskattades det att den totala globala miljö-DNA- sekvenseringsinsatsen hade producerat mindre än 1 procent av det totala DNA som finns i en liter havsvatten eller ett gram jord, och de specifika interaktionerna mellan mikrober är i stort sett okända.
EMP syftar till att bearbeta så många som 200 000 prover i olika biomer och generera en komplett databas över mikrober på jorden för att karakterisera miljöer och ekosystem genom mikrobiell sammansättning och interaktion. Med hjälp av dessa data kan nya ekologiska och evolutionära teorier föreslås och testas.
Skådespelare
Del av en serie om |
mikrobiomer |
---|
Det icke-statliga internationella projektet lanserades 2010. Från och med januari 2018 listade det 161 institutioner, alla universitet och universitetsanslutna institutioner, förutom IBM Research och Atlanta Zoo . Crowdsourcing har kommit från John Templeton Foundation , WM Keck Foundation , Argonne National Laboratory av US Dept. of Energy , Australian Research Council , Tula Foundation och Samuel Lawrence Foundation. Företag har tillhandahållit stöd i natura, inklusive MO BIO Laboratories, Luca Technologies, Eppendorf , Boreal Genomics, Illumina , Roche och Integrated DNA Technologies .
Mål
Det primära målet [ av vem? ] av Earth Microbiome Project (EMP) har varit [ när? ] för att kartlägga mikrobiell sammansättning i många miljöer över hela planeten, över tid såväl som rymd, med hjälp av en standarduppsättning protokoll. Utvecklingen av standardiserade protokoll är avgörande, eftersom variationer i provextraktion, amplifiering, sekvensering och analys introducerar fördomar som skulle ogiltigförklara jämförelser av mikrobiell samhällsstruktur.
Ett annat viktigt mål är att fastställa hur rekonstruktion av mikrobiella samhällen påverkas av analytiska fördomar. Hastigheten för tekniska framsteg är snabb, och det är nödvändigt att förstå hur data som använder uppdaterade protokoll kommer att jämföras med data som samlats in med tidigare tekniker. Information från detta projekt kommer att arkiveras i en databas för att underlätta analysen. Andra resultat kommer att inkludera en global atlas över proteinfunktion och en katalog över återmonterade genom klassificerade efter deras taxonomiska distributioner.
Metoder
Standardprotokoll för provtagning, DNA-extraktion, 16S rRNA- amplifiering, 18S rRNA- amplifiering och " shotgun " -metagenomik har utvecklats eller är under utveckling.
Provsamling
Prover kommer att samlas in med lämpliga metoder från olika miljöer, inklusive djuphav, sötvattensjöar, ökensand och jord. Standardiserade insamlingsprotokoll kommer att användas när det är möjligt, så att resultaten blir jämförbara. Mikrober från naturliga prover kan inte alltid odlas. På grund av detta kommer metagenomiska metoder att användas för att sekvensera allt DNA eller RNA i ett prov på ett kulturoberoende sätt.
Våtlabb
Det våta labbet behöver vanligtvis utföra en serie procedurer för att välja och rena den mikrobiella delen av proverna. Reningsprocessen kan vara mycket olika beroende på typ av prov. DNA kommer att extraheras från jordpartiklar, eller så kommer mikrober att koncentreras med hjälp av en rad filtreringstekniker. Dessutom kan olika amplifieringstekniker användas för att öka DNA-utbytet. Till exempel föredras icke- PCR- baserad multipelförskjutningsamplifiering av vissa forskare. DNA-extraktion, användning av primers och PCR-protokoll är alla områden som, för att undvika partiskhet, måste utföras enligt noggrant standardiserade protokoll.
Sekvensering
Beroende på den biologiska frågan kan forskare välja att sekvensera ett metagenomiskt prov med hjälp av två huvudsakliga tillvägagångssätt. Om den biologiska frågan som ska lösas är, vilka typer av organismer som finns och i vilket överflöd, skulle det föredragna tillvägagångssättet vara att rikta in och amplifiera en specifik gen som är mycket konserverad bland arterna av intresse. 16S ribosomala RNA -genen för bakterier och 18S ribosomala RNA- genen för protister används ofta som målgener för detta ändamål. Fördelen med att rikta in sig på en specifik gen är att genen kan amplifieras och sekvenseras med en mycket hög täckning. Detta tillvägagångssätt kallas "djup sekvensering", vilket gör att sällsynta arter kan identifieras i ett prov. Detta tillvägagångssätt kommer dock inte att möjliggöra sammansättning av några hela genom, och det kommer inte heller att ge information om hur organismer kan interagera med varandra. Den andra metoden kallas shotgun metagenomics, där allt DNA i provet klipps och de slumpmässiga fragmenten sekvenseras. I princip möjliggör detta tillvägagångssätt för sammansättning av hela mikrobiella genom, och det tillåter slutledning av metaboliska relationer. Men om de flesta mikrober är okarakteriserade i en given miljö, de novo montering att bli beräkningsmässigt dyrt.
Dataanalys
EMP föreslår att de bioinformatiska aspekterna av provbehandling ska standardiseras.
Dataanalys innefattar vanligtvis följande steg: 1) Datarensning. En förprocedur för att rensa upp eventuella läsningar med låga kvalitetspoäng som tar bort alla sekvenser som innehåller "N" eller tvetydiga nukleotider och 2) Tilldela taxonomi till sekvenserna, vilket vanligtvis görs med hjälp av verktyg som BLAST eller RDP . Mycket ofta upptäcks nya sekvenser som inte kan mappas till befintlig taxonomi. I detta fall härrör taxonomi från ett fylogenetiskt träd som skapas med de nya sekvenserna och en pool av nära besläktade kända sekvenser.
Beroende på sekvenseringstekniken och den underliggande biologiska frågan kan ytterligare metoder användas. Till exempel, om de sekvenserade läsningarna är för korta för att härleda någon användbar information, kommer en sammansättning att krävas. En sammansättning kan också användas för att konstruera hela genom, vilket kommer att ge användbar information om arten. Dessutom, om de metaboliska sambanden inom ett mikrobiellt metagenom ska förstås, måste DNA-sekvenser översättas till aminosyrasekvenser, till exempel med hjälp av genprediktionsverktyg som GeneMark eller FragGeneScan.
Projektresultat
De fyra nyckelutgångarna från EMP har varit:
- All primär data som genereras från Earth Microbiome Project, oavsett deras grad av slutgiltighet, kommer att lagras i en centraliserad databas som kallas "Gene Atlas" (GA). GA kommer att ha sekvensdata, kommentarer och miljömetadata. Kända såväl som okända sekvenser, dvs "Dark Matter", kommer att inkluderas i hopp om att, givet tiden, de okända sekvenserna så småningom kan karakteriseras.
- Sammansatta genom, annoterade med hjälp av en automatiserad pipeline, kommer att lagras i "Earth Microbiome Assembled Genomes" (EM-AG) i offentliga förråd. Dessa kommer att möjliggöra jämförande genomisk analys.
- Interaktiva visualiseringar av data kommer att tillhandahållas genom "Earth Microbiome Visualization Portal" (EM-VIP), som gör det möjligt att se förhållandet mellan mikrobiell makeup, miljöparametrar och genomisk funktion.
- Rekonstruerade metaboliska profiler kommer att erbjudas genom "Earth Microbiome Metabolic Reconstruction" (EMMR).
Utmaningar
Stora mängder sekvensdata som genereras från analys av olika mikrobiella samhällen är en utmaning att lagra, organisera och analysera. Problemet förvärras av de korta läsningar som tillhandahålls av sekvenseringsplattformen med hög genomströmning som kommer att vara standardinstrumentet som används i EMP-projektet. Förbättrade algoritmer, förbättrade analysverktyg, enorma mängder datorlagring och tillgång till många tusen timmars superdatortid kommer att behövas.
En annan utmaning blir det stora antalet sekvenseringsfel som förväntas. Nästa generations sekvenseringsteknik ger enorm genomströmning men lägre noggrannhet än äldre sekvenseringsmetoder. Vid sekvensering av ett enstaka genom kompenseras den inneboende lägre noggrannheten för dessa metoder mycket mer än av förmågan att täcka hela genomet flera gånger i motsatta riktningar från flera startpunkter, men denna förmåga ger ingen förbättring av noggrannheten vid sekvensering av en mångsidig blandning av genom. Frågan blir, hur kan sekvenseringsfel särskiljas från faktisk mångfald i de insamlade mikrobiella proverna?
Trots utfärdandet av standardprotokoll förväntas systematiska fördomar från labb till labb. Behovet av att amplifiera DNA från prover med låg biomassa kommer att introducera ytterligare förvrängningar av data. Sammansättning av genom från även de dominerande organismerna i ett skiftande prov av organismer kräver gigabyte av sekvensdata.
EMP måste undvika ett problem som har blivit vanligt i de offentliga sekvensdatabaserna. Med framstegen inom högkapacitetssekvenseringsteknologier kommer många sekvenser in i offentliga databaser utan någon experimentellt bestämd funktion, men som har annoterats på basis av observerade homologier med en känd sekvens. Den första kända sekvensen används för att kommentera den första okända sekvensen, men vad som händer är att den första okända sekvensen används för att kommentera den andra okända sekvensen och så vidare. Sekvenshomologi är endast en måttligt tillförlitlig prediktor för funktion.
Se även
Anteckningar
externa länkar
- Jordens mikrobiomprojekt
- Systembiologi och mikrobiomet
- US NIH mänskliga mikrobiom projektsida
- International Human Microbiome Consortium
- CIHR Canadian Microbiome Initiative
- Microbiome.org : En mikrobiom-wikiportalsajt.