Inkluderande sammansatt intervallkartläggning

Inom statistisk genetik har inkluderande sammansatt intervallkartläggning ( ICIM ) föreslagits som ett tillvägagångssätt för kartläggning av QTL (kvantitativ egenskapslokus) för populationer som härrör från bi-parentala korsningar. QTL-kartläggning är baserad på genetisk kopplingskarta och fenotypdata och försök att lokalisera individuella genetiska faktorer på kromosomer och att uppskatta deras genetiska effekter.

Additiv och dominans QTL-mappning

Två genetiska antaganden som används i ICIM är (1) det genotypiska värdet för en individ är summeringen av effekter från alla gener som påverkar egenskapen av intresse; och (2) länkad QTL är separerad av minst ett blankt markörintervall. Under de två antagandena visade de att additiv effekt av QTL som ligger i ett markörintervall kan absorberas fullständigt av regressionskoefficienterna för de två flankerande markörerna, medan QTL-dominanseffekten orsakar markördominanseffekter, såväl som additiv genom additiv och dominans genom dominansinteraktioner mellan de två flankerande markörerna. Genom att inkludera två multiplikationsvariabler mellan flankerande markörer kan de additiva och dominanseffekterna av en QTL absorberas fullständigt. Som en konsekvens kan en inkluderande linjär modell av fenotyp som regresserar på alla genetiska markörer (och markörmultiplikationer) användas för att passa positionerna och additiva (och dominans) effekterna av alla QTL i genomet . En tvåstegsstrategi antogs i ICIM för additiv och dominans QTL-kartläggning. I det första steget tillämpades stegvis regression för att identifiera de mest signifikanta markörvariablerna i den linjära modellen. I det andra steget genomfördes endimensionell skanning eller intervallkartläggning för att detektera QTL och uppskatta dess additiva och dominanseffekter, baserat på de fenotypiska värdena justerade av regressionsmodellen i det första steget.

Genetiska och statistiska egenskaper i additiv QTL-kartläggning

Genom datorsimuleringar studerade de de asymptotiska egenskaperna hos ICIM även i additiv QTL-mappning. Teststatistikens LOD-poäng ökar linjärt när populationens storlek ökar. Ju större QTL-effekten är, desto större ökar motsvarande LOD-poäng. När populationsstorleken är större än 200 är positionsuppskattningen av ICIM för QTL som förklarar mer än 5 % av den fenotypiska variansen opartisk. För mindre populationsstorlek finns det en tendens att QTL identifierades mot centrum av kromosomen. När populationsstorleken är större än 200 är effektuppskattningen av ICIM för QTL som förklarar mer än 5 % av fenotypisk varians opartisk. För mindre provstorlek överskattades alltid QTL-effekten.

Digenisk epistas kartläggning

Under samma antaganden i additiv och dominans QTL-kartläggning av ICIM, kan en additiv genom additiv epistatisk effekt mellan två interagerande QTL absorberas fullständigt av de fyra markörinteraktionsvariablerna mellan de två paren av flankerande markörer [5]. Det vill säga, koefficienterna för fyra markörinteraktioner för två par av flankerande markörer innehåller den genetiska informationen för tillsatsen genom additiv epistas mellan de två markörintervallen. Som en konsekvens kan en linjär modell av fenotypregress på både markörer och markörmultiplikationer passa positionerna och effekterna av alla QTL och deras digeniska interaktioner. I likhet med den additiva QTL-kartläggningen av ICIM, antogs även tvåstegsstrategi i additiv genom additiv epistas-kartläggning. I det första steget tillämpades stegvis regression för att identifiera de mest signifikanta markör- och markörinteraktionerna. I det andra steget genomfördes tvådimensionell skanning för att detektera additiv genom additiv QTL och uppskatta de genetiska effekterna, baserat på de fenotypiska värdena som justerades av regressionsmodellen i det första steget.

Tillämpningar i riktiga kartläggningspopulationer

Ta en kornfördubblad haploidpopulation som ett exempel, nio additiv QTL som påverkar kärnvikten identifierades fördelade på fem av de sju kromosomerna, vilket förklarar 81% av den fenotypiska variansen. I denna population har additiva effekter förklarat det mesta av den fenotypiska variansen, och närmar sig den uppskattade ärftligheten i vid mening, vilket indikerar att det mesta av den genetiska variansen orsakades av additiv QTL.

Förutom det har ICIM framgångsrikt använts i vilda och odlade sojabönor för att kartlägga konserverad salttolerans QTL, vid kartläggning av rorkultsvinkel QTL för ris och kornlängd QTL, vid kartläggning av vetemjöl och nudelfärgkomponenter och gult pigmentinnehåll och resistens hos vuxna växter att randa rost QTL, etc. En del av dessa upptäckta QTL har finmappats.

Gemensam QTL-kartläggning i flera familjer eller populationer

Bi-parentala populationer används mest i QTL-länkskartläggning. QTL som inte segregerar mellan de två föräldrarna kan inte upptäckas. För att hitta de flesta, om inte alla, gener som kontrollerar en egenskap av intresse, måste flera föräldrar användas. Komplexa korspopulationer har föreslagits under de senaste åren för detta ändamål. Dessa korsningar möjliggör en mer kraftfull förståelse av den genetiska grunden för kvantitativa egenskaper i mer relevant genetisk bakgrund. De utökade ICIM för att kartlägga Maize Nested Association Mapping (NAM). design som nyligen föreslagits av Buckler-laboratoriet vid Cornell University . QTL-detekteringseffektiviteten för ICIM i denna design undersöktes genom omfattande simuleringar. I den faktiska majs NAM-populationen upptäckte ICIM totalt 52 additiv QTL som påverkar silkesblomningstiden i majs. Dessa QTL har förklarat 79% av den fenotypiska variansen i denna population.

Programvara för QTL-mappning

Det finns programvara som implementerar ICIM additiv och epistas kartläggning. Dess funktion är: (1) implementering av kartläggningsmetoder inklusive enkelmarköranalys, intervallkartläggning, ICIM för additiv och dominans, ICIM för digenisk epistas, selektiv fenotypning, etc.; (2) QTL-kopplingsanalys mer än tjugo kartläggningspopulationer härledda från bi-parental korsning, inklusive backcross, dubbelhaploida, rekombinanta inavlade linjer, etc.; (3) Effektanalys för simulerade populationer under de genetiska modeller som användaren definierat; och (4) QTL-mappning för icke-idealiserade kromosomsegmentsubstitutionslinjer.