Haplotyp

DNA-molekyl 1 skiljer sig från DNA-molekyl 2 vid ett enda basparsläge (en C/A-polymorfism).

En haplotyp ( haploid genotyp ) är en grupp alleler i en organism som ärvs tillsammans från en ensamstående förälder.

Många organismer innehåller genetiskt material ( DNA ) som ärvs från två föräldrar. Normalt har dessa organismer sitt DNA organiserat i två uppsättningar av parvis liknande kromosomer . Avkomman får en kromosom i varje par från varje förälder. En uppsättning kromosompar kallas diploida och en uppsättning av endast hälften av varje par kallas haploida. Den haploida genotypen (haplotypen) är en genotyp som tar hänsyn till de singulära kromosomerna snarare än kromosomparen. Det kan vara alla kromosomerna från en av föräldrarna eller en mindre del av en kromosom, till exempel en sekvens av 9000 baspar .

Det finns dock andra användningsområden för denna term. För det första används det för att betyda en samling specifika alleler (det vill säga specifika DNA- sekvenser) i ett kluster av tätt kopplade gener på en kromosom som sannolikt kommer att ärvas tillsammans - det vill säga att de sannolikt kommer att bevaras som en sekvens som överlever nedkomsten av många generationers reproduktion. En andra användning är att betyda en uppsättning länkade singelnukleotidpolymorfism (SNP) alleler som tenderar att alltid förekomma tillsammans (dvs som är associerade statistiskt ). Man tror att identifiering av dessa statistiska associationer och några få alleler av en specifik haplotypsekvens kan underlätta identifiering av alla andra sådana polymorfa ställen som finns i närheten av kromosomen. Sådan information är avgörande för att undersöka genetiken hos vanliga sjukdomar ; som faktiskt har undersökts på människor av International HapMap Project . För det tredje använder många humana genetiska testföretag termen på ett tredje sätt: för att hänvisa till en individuell samling av specifika mutationer inom ett givet genetiskt segment; (se kort tandemupprepningsmutation ).

Termen " haplogroup " hänvisar till SNP/ Unique-event Polymorphism (UEP)-mutationer som representerar kladden till vilken en samling av speciella mänskliga haplotyper hör. (Clade hänvisar här till en uppsättning haplotyper som delar en gemensam förfader.) En haplogrupp är en grupp liknande haplotyper som delar en gemensam förfader med en enkelnukleotidpolymorfismmutation . Mitokondrie-DNA passerar längs en moderns härstamning som kan gå tillbaka tusentals år.

Haplotypupplösning

En organisms genotyp kanske inte definierar dess haplotyp unikt. Tänk till exempel på en diploid organism och två bialleliska loci (som SNP ) på samma kromosom. Antag att det första stället har alleler A eller T och det andra stället G eller C . Båda loci har alltså tre möjliga genotyper : ( AA , AT och TT ) respektive ( GG , GC och CC ). För en given individ finns det nio möjliga konfigurationer (haplotyper) vid dessa två loci (visas i Punnett-rutan nedan). För individer som är homozygota vid en eller båda loci är haplotyperna entydiga - vilket betyder att det inte finns någon differentiering mellan haplotyp T1T2 och haplotyp T2T1; där T1 och T2 är märkta för att visa att de är samma locus, men märkta som sådana för att visa att det inte spelar någon roll i vilken ordning du betraktar dem i, slutresultatet är två T loci. För individer som är heterozygota på båda ställena är den gametiska fasen tvetydig - i dessa fall vet du inte vilken haplotyp du har, t.ex. TA vs AT.

AA TT
GG AG AG AG TG TG TG
GC AG AC

AG TC eller AC TG
TG TC
CC AC AC AC TC TC TC

Den enda otvetydiga metoden för att lösa fastvetydighet är genom sekvensering . Det är dock möjligt att uppskatta sannolikheten för en viss haplotyp när fasen är tvetydig med hjälp av ett urval av individer.

Givet genotyperna för ett antal individer kan haplotyperna härledas genom haplotypupplösning eller haplotypfasningstekniker. Dessa metoder fungerar genom att tillämpa observationen att vissa haplotyper är vanliga i vissa genomiska regioner. Därför, givet en uppsättning möjliga haplotypupplösningar, väljer dessa metoder de som totalt använder färre olika haplotyper. Detaljerna för dessa metoder varierar - vissa är baserade på kombinatoriska tillvägagångssätt (t.ex. sparsamhet ), medan andra använder sannolikhetsfunktioner baserade på olika modeller och antaganden som Hardy–Weinberg-principen , den koalescenta teorimodellen eller perfekt fylogeni. Parametrarna i dessa modeller uppskattas sedan med hjälp av algoritmer såsom förväntansmaximeringsalgoritmen (EM), Markovkedjan Monte Carlo (MCMC) eller dolda Markov-modeller (HMM).

Mikrofluidisk helgenom-haplotypning är en teknik för fysisk separation av individuella kromosomer från en metafascell följt av direkt upplösning av haplotypen för varje allel.

Y-DNA-haplotyper från genealogiska DNA-tester

Till skillnad från andra kromosomer kommer Y-kromosomerna i allmänhet inte i par. Varje mänsklig man (förutom de med XYY-syndrom ) har bara en kopia av den kromosomen. Detta betyder att det inte finns någon tillfällig variation av vilken kopia som ärvs, och inte heller (för större delen av kromosomen) ingen blandning mellan kopior genom rekombination ; så, till skillnad från autosomala haplotyper, finns det i praktiken ingen randomisering av Y-kromosomhaplotypen mellan generationer. En mänsklig hane bör i stort sett dela samma Y-kromosom som sin far, ge eller ta några mutationer; sålunda tenderar Y-kromosomerna att passera i stort sett intakta från far till son, med ett litet men ackumulerande antal mutationer som kan tjäna till att skilja manliga linjer. I synnerhet bör Y-DNA representerat som de numrerade resultaten av ett Y-DNA genealogiskt DNA-test matcha, förutom mutationer.

UEP-resultat (SNP-resultat)

Unique-event polymorphisms (UEPs) såsom SNPs representerar haplogroups . STR representerar haplotyper. Resultaten som omfattar den fullständiga Y-DNA-haplotypen från Y-kromosom-DNA-testet kan delas upp i två delar: resultaten för UEPs, ibland löst kallade SNP-resultaten eftersom de flesta UEP:er är enkelnukleotidpolymorfismer, och resultaten för mikrosatellitkort tandem upprepade sekvenser ( Y-STR ).

UEP-resultaten representerar arvet av händelser som man tror kan antas ha hänt bara en gång i mänsklighetens historia. Dessa kan användas för att identifiera individens Y-DNA-haplogrupp , hans plats i "släktträdet" för hela mänskligheten. Olika Y-DNA-haplogrupper identifierar genetiska populationer som ofta är distinkt associerade med särskilda geografiska regioner; deras uppträdande i nyare populationer belägna i olika regioner representerar migrationerna för tiotusentals år sedan av de direkta patrilineära förfäderna till nuvarande individer.

Y-STR-haplotyper

Genetiska resultat inkluderar även Y-STR-haplotypen , uppsättningen resultat från de testade Y-STR-markörerna.

Till skillnad från UEP:erna muterar Y-STR:erna mycket lättare, vilket gör att de kan användas för att särskilja nyare släktforskning. Men det betyder också att, snarare än att populationen av ättlingar till en genetisk händelse alla delar samma resultat , kommer Y-STR-haplotyperna sannolikt att ha spridits isär, för att bilda ett kluster av mer eller mindre liknande resultat. Vanligtvis kommer detta kluster att ha ett definitivt mest troligt centrum, den modala haplotypen (förmodligen liknar haplotypen för den ursprungliga grundhändelsen), och även en haplotypdiversitet - i vilken grad den har spridits ut. Ju längre i det förflutna den avgörande händelsen inträffade, och ju mer den efterföljande befolkningstillväxten skedde tidigt, desto större blir haplotypdiversiteten för ett visst antal ättlingar. Men om haplotypdiversiteten är mindre för ett visst antal ättlingar, kan detta tyda på en nyare gemensam förfader eller en nyligen utökad befolkning.

Det är viktigt att notera att, till skillnad från för UEP:er, kanske två individer med en liknande Y-STR-haplotyp inte nödvändigtvis delar en liknande härkomst. Y-STR-evenemang är inte unika. Istället tenderar klustren av Y-STR-haplotypresultat som ärvts från olika händelser och olika historier att överlappa varandra.

I de flesta fall är det länge sedan haplogruppernas definierande händelser, så typiskt sett har klustret av Y-STR-haplotypresultat associerade med ättlingar till den händelsen blivit ganska brett. Dessa resultat kommer att tendera att signifikant överlappa (lika breda) kluster av Y-STR-haplotyper associerade med andra haplogrupper. Detta gör det omöjligt för forskare att med absolut säkerhet förutsäga vilken Y-DNA-haplogrupp en Y-STR-haplotyp skulle peka på. Om UEP:erna inte testas, kan Y-STR:erna endast användas för att förutsäga sannolikheter för haplogrupps härkomst, men inte säkerheter.

Ett liknande scenario finns när man försöker utvärdera om delade efternamn indikerar delad genetisk härkomst. Ett kluster av liknande Y-STR-haplotyper kan indikera en delad gemensam förfader, med en identifierbar modal haplotyp, men bara om klustret är tillräckligt skilt från vad som kan ha hänt av en slump från olika individer som historiskt antagit samma namn oberoende av varandra. Många namn antogs från vanliga yrken, till exempel, eller var förknippade med bebyggelse av särskilda platser. Mer omfattande haplotyptypning behövs för att etablera genetisk genealogi. Kommersiella DNA-testningsföretag erbjuder nu sina kunder att testa fler uppsättningar markörer för att förbättra definitionen av deras genetiska härkomst. Antalet testade marköruppsättningar har ökat från 12 under de första åren till 111 på senare tid.

Att fastställa rimlig släktskap mellan olika efternamn som är dataminerade från en databas är betydligt svårare. Forskaren måste fastställa att den allra närmaste medlemmen av befolkningen i fråga, som av den anledningen medvetet valts från befolkningen, sannolikt inte skulle matcha av en slump. Detta är mer än att konstatera att en slumpmässigt utvald medlem av befolkningen sannolikt inte kommer att ha en så nära match av en slump. På grund av svårigheten är det sannolikt omöjligt att fastställa släktskap mellan olika efternamn som i ett sådant scenario, förutom i speciella fall där det finns specifik information för att drastiskt begränsa storleken på populationen av kandidater som övervägs.

Mångfald



Haplotypdiversitet är ett mått på unikheten hos en viss haplotyp i en given population. Haplotypdiversiteten (H) beräknas som: där är den (relativa) haplotypfrekvensen för varje haplotyp i provet och är provstorleken. Haplotypdiversitet ges för varje prov.

Se även

programvara

  • FAMHAP — FAMHAP är en programvara för enkelmarkörsanalys och i synnerhet gemensam analys av icke-fasade genotypdata från tätt sammanlänkade markörer (haplotypanalys).
  • Fuga EM- baserad haplotypuppskattning och associationstester i obesläktade och kärnfamiljer.
  • HPlus — Ett mjukvarupaket för imputering och testning av haplotyper i associationsstudier med en modifierad metod som innehåller förväntningsmaximeringsalgoritmen och en Bayesiansk metod känd som progressiv ligering.
  • HaploBlockFinder — Ett mjukvarupaket för analyser av haplotypblockstruktur.
  • Haploscribe — Rekonstruktion av helkromosomhaplotyper baserat på alla genotypade positioner i en kärnfamilj, inklusive sällsynta varianter.
  • Haploview — Visualisering av länkojämvikt , haplotypuppskattning och haplotyptaggning ( hemsida ) .
  • HelixTree — Haplotypanalysmjukvara - Haplotyptrendregression (HTR), haplotypiska associationstester och haplotypfrekvensuppskattning med användning av både förväntansmaximeringsalgoritmen (EM) och den sammansatta haplotypmetoden (CHM).
  • PHASE — En programvara för haplotyprekonstruktion och uppskattning av rekombinationshastighet från populationsdata.
  • SHAPEIT — SHAPEIT2 är ett program för haplotypuppskattning av SNP-genotyper i stora kohorter över hela kromosomer.
  • SNPHAP EM -baserad programvara för att uppskatta haplotypfrekvenser från opasade genotyper.
  • WHAP haplotypbaserad associationsanalys.

externa länkar