Genomundersökningssekvens
Inom områdena bioinformatik och beräkningsbiologi är genomundersökningssekvenser (GSS) nukleotidsekvenser som liknar uttryckta sekvenstaggar (EST) att den enda skillnaden är att de flesta av dem är genomiska till sitt ursprung, snarare än mRNA .
Genomundersökningssekvenser genereras vanligtvis och skickas till NCBI av labb som utför genomsekvensering och används bland annat som ett ramverk för kartläggning och sekvensering av genomstorleksbitar som ingår i GenBank- standardavdelningarna .
Bidrag
Genomundersökningssekvensering är ett nytt sätt att kartlägga genomsekvenserna eftersom det inte är beroende av mRNA . Nuvarande genomsekvenseringsmetoder är mestadels hagelgevärsmetoder med hög genomströmning, och GSS används ofta i det första steget av sekvensering. GSS:er kan ge en initial global bild av ett genom, som inkluderar både kodande och icke-kodande DNA och innehåller en repetitiv sektion av genomet till skillnad från EST:er . För uppskattning av repetitiva sekvenser spelar GSS en viktig roll i den tidiga bedömningen av ett sekvenseringsprojekt eftersom dessa data kan påverka bedömningen av sekvenstäckning, bibliotekskvalitet och byggprocessen. Till exempel, vid uppskattning av hundens genom, kan den uppskatta de globala parametrarna, såsom neutral mutationshastighet och upprepningsinnehåll.
GSS är också ett effektivt sätt att storskaliga och snabbt karakterisera genom från besläktade arter där det bara finns få gensekvenser eller kartor. GSS med låg täckning kan generera riklig information om geninnehåll och förmodade reglerande element av jämförande arter. Den kan jämföra dessa gener av besläktade arter för att ta reda på relativt expanderade eller sammandragna familjer. Och i kombination med fysisk klontäckning kan forskare enkelt navigera genomet och karakterisera den specifika genomsektionen genom mer omfattande sekvensering.
Begränsning
Begränsningen av genomisk undersökningssekvens är att den saknar långväga kontinuitet på grund av dess fragmentariska natur, vilket gör det svårare att förutsäga gen- och markörordning. Till exempel, för att detektera repetitiva sekvenser i GSS-data, kanske det inte är möjligt att ta reda på alla repetitioner eftersom det repetitiva genomet kan vara längre än läsningarna, vilket är svårt att känna igen.
Typer av data
GSS-avdelningen innehåller (men är inte begränsad till) följande typer av data:
Slumpmässiga "single pass read" genomundersökningssekvenser
Slumpmässiga "single pass read" genomundersökningssekvenser är GSS:er som genereras längs enstaka pass som läses genom slumpmässigt urval. Enkelpasssekvensering med lägre tillförlitlighet kan användas på snabb ackumulering av genomisk data men med lägre noggrannhet. Det inkluderar RAPD , RFLP , AFLP och så vidare.
Kosmid/BAC/YAC-ändsekvenser
Kosmid/BAC/YAC-ändsekvenser använder Cosmid / bakteriell artificiell kromosom / jäst artificiell kromosom för att sekvensera genomet från ändsidan. Dessa sekvenser fungerar som plasmider med mycket låg kopia att det ibland bara finns en kopia per cell. För att få tillräckligt med kromosomer behöver de ett stort antal E. coli-odlingar som 2,5 - 5 liter kan vara en rimlig mängd.
Cosmid/BAC/YAC kan också användas för att få en större klon av DNA-fragment än vektorer som plasmid och fagemid. En större infogning är ofta till hjälp för sekvensprojektet för att organisera kloner.
Eukaryota proteiner kan uttryckas genom att använda YAC med posttranslationell modifiering. BAC kan inte göra det, men BAC kan på ett tillförlitligt sätt representera mänskligt DNA mycket bättre än YAC eller kosmid.
Exonfångade genomiska sekvenser
Exonfångad sekvens används för att identifiera gener i klonat DNA, och detta uppnås genom att känna igen och fånga bärare innehållande exonsekvens av DNA. Exonfångning har två huvuddrag: För det första är det oberoende av tillgängligheten av RNA-uttryckande mål-DNA. För det andra kan isolerade sekvenser härledas direkt från klon utan att känna till vävnader som uttrycker genen som behöver identifieras. Under skivning kan exon finnas kvar i mRNA och information som bärs av exon kan finnas i proteinet. Eftersom fragment av DNA kan infogas i sekvenser, om ett exon infogas i intron, kommer transkriptet att vara längre än vanligt och detta transkript kan fångas in genom analys.
Alu PCR- sekvenser
Alu repetitiva element är medlem av Short Interspersed Elements (SINE) i däggdjursgenom. Det finns cirka 300 till 500 tusen kopior av Alu-repetitiva element i mänskligt genom, vilket betyder att ett Alu-element finns i 4 till 6 kb i genomsnitt. Alu-element är utbredda i däggdjursgenomet, och repeterbarhet är en av egenskaperna, det är därför det kallas Alu-repetitiva element. Genom att använda speciell Alu-sekvens som mållokus kan specifikt humant DNA erhållas från klon av TAC, BAC, PAC eller human-mus cellhybrid.
PCR är ett tillvägagångssätt som används för att klona ett litet fragment av DNA. Fragmentet kan vara en gen eller bara en del av genen. PCR kan endast klona mycket små fragment av DNA, som i allmänhet inte överstiger 10 kbp.
Alu PCR är en teknik för "DNA-fingeravtryck". Detta tillvägagångssätt är snabbt och enkelt att använda. Det erhålls från analys av många genomiska loci flankerade av Alu-repetitiva element, som är icke-autonoma retrotransposoner som finns i ett stort antal kopior i primatgenom. Alu-element kan användas för genomfingeravtryck baserat på PCR, som också kallas Alu PCR.
Transposonmärkta sekvenser
Det finns flera sätt att analysera funktionen hos en viss gensekvens, den mest direkta metoden är att ersätta den eller orsaka en mutation och sedan analysera resultaten och effekterna. Det finns tre metoder som har utvecklats för detta ändamål: genersättning, sens- och antisensundertryckning och insättningsmutagenes . Bland dessa metoder visade sig insertionsmutagenes vara mycket bra och framgångsrikt tillvägagångssätt.
Först applicerades T-DNA för insättningsmutagenes. Men att använda transponerbara element kan ge fler fördelar. Transponerbara element upptäcktes först av Barbara McClintock i majsväxter . Hon identifierade det första transposerbara genetiska elementet, som hon kallade Dissociation (Ds) locus. Storleken på det transponerbara elementet är mellan 750 och 40 000 bp. Transposerbart element kan huvudsakligen klassificeras som två klasser: Den ena klassen är mycket enkel, kallas insertionssekvens (IS), den andra klassen är komplicerad, kallas transposon. Transposon har en eller flera karakteriserade gener, som lätt kan identifieras. IS har genen för transposas.
Transposon kan användas som tag för ett DNA med en känd sekvens. Transposon kan uppträda på andra ställen genom transkription eller omvänd transkription genom effekten av nukleas. Detta utseende av transposon bevisade att genomet inte är statistiskt, utan att det alltid förändrar sin struktur.
Det finns två fördelar med att använda transposontaggning. För det första, om ett transposon sätts in i en gensekvens, är denna insättning enkel och intakt. Intaktheten kan göra taggade sekvenser lätt till molekylär analys. Den andra fördelen är att många transposoner kan hittas eliminerade från taggade gensekvenser när transposas analyseras. Detta ger en bekräftelse på att den insatta gensekvensen verkligen var taggad av transposon.
Exempel på GSS-fil
Följande är ett exempel på GSS-fil som kan skickas till GenBank:
TYPE: GSS STATUS: Nytt CONT_NAME: Sikela JM GSS#: Ayh00001 KLON: HHC189 KÄLLA: ATCC SOURCE_INHOST: 65128 OTHER_GSS: GSS00093, GSS000101 CITATION: Genomiska sekvenser från människans hjärna SEQ_START 3, PRIMER 1 PRIMER: END_5 : 1 HIQUAL_STOP: 285 DNA_TYPE: Genomisk KLASS: hagelgevär BIBLIOTEK: Hippocampus, Stratagene (kat. #936205) PUBLIC: PUT_ID: Aktin, gamma, skelett KOMMENTAR: SEKVENS: AATCAGCCTGCAAGCAAAAGATAGGAATATTCACCTACAGTGGCATTGGCACCTACCTACTAGAACTAGACTAGGATATAGATAGACTAGAACTAG ATTCCGGGATTAAA CATTCTTGTCAAGAAAGGGGGAGAAGTCTGTTGTGCAAGTTTCAAAGAAAAAGGGGTACCA GCAAAAGTGATAATGATTTGAGGATTTCTGTCTCTAATTGGAGGATGATTCTCATGTAAGGT GCAAAAGTGATAATGATTTGAGGATTTCTGTCTCTAATTGGAGGAAGTGATTCAGTTAGTGT CTAGATACTTTAAC TGAGTATACGAGTGAAATACTTGAGACTCGTGTCACTT ||