Mendelsk randomisering
Inom epidemiologi är Mendelsk randomisering (vanligtvis förkortad till MR) en metod som använder uppmätta variationer i gener för att undersöka orsakseffekten av en exponering på ett resultat . Under nyckelantaganden (se nedan) minskar designen både omvänd orsakssamband och förvirring, vilket ofta avsevärt försvårar eller vilseleder tolkningen av resultat från epidemiologiska studier.
Studiedesignen föreslogs först 1986 och beskrevs därefter av Gray och Wheatley som en metod för att erhålla opartiska uppskattningar av effekterna av en förmodad orsaksvariabel utan att genomföra en traditionell randomiserad kontrollerad studie (dvs. "guldstandarden" inom epidemiologi för att fastställa kausalitet ) . . Dessa författare myntade också termen mendelsk randomisering .
Motivering
Ett av de dominerande syftena med epidemiologi är att identifiera modifierbara orsaker till hälsoresultat och sjukdomar, särskilt de som är av intresse för folkhälsan . För att fastställa om modifiering av en viss egenskap (t.ex. genom en intervention, behandling eller policyändring) kommer att förmedla en gynnsam effekt inom en population, krävs säkra bevis för att denna egenskap orsakar resultatet av intresse. Emellertid är många observationsepidemiologiska studiedesigner begränsade i förmågan att urskilja korrelation från orsakssamband - specifikt om en viss egenskap orsakar ett resultat av intresse, är helt enkelt relaterat till det resultatet (men inte orsakar det) eller är en konsekvens av själva resultatet. . Endast det förra kommer att vara fördelaktigt inom en folkhälsomiljö där målet är att modifiera den egenskapen för att minska sjukdomsbördan. Det finns många epidemiologiska studiedesigner som syftar till att förstå sambanden mellan egenskaper inom ett populationsprov, var och en med delade och unika fördelar och begränsningar när det gäller att tillhandahålla orsaksbevis, med "guldstandarden" som randomiserade kontrollerade studier .
Välkända framgångsrika demonstrationer av orsaksbevis som överensstämmer i flera studier med olika design inkluderar de identifierade orsakssambanden mellan rökning och lungcancer, och mellan blodtryck och stroke. Det har dock också förekommit anmärkningsvärda misslyckanden när exponeringar som antas vara en orsaksriskfaktor för ett visst resultat senare visades i väl genomförda randomiserade kontrollerade studier inte vara orsakssamband. Till exempel trodde man tidigare att hormonersättningsterapi skulle förebygga hjärt-kärlsjukdom , men det är nu känt att det inte har någon sådan fördel och kan till och med påverka hälsan negativt. Ett annat anmärkningsvärt exempel är selen och prostatacancer. Vissa observationsstudier fann ett samband mellan högre cirkulerande selennivåer (vanligtvis förvärvade genom olika livsmedel och kosttillskott) och lägre risk för prostatacancer. Däremot visade Selenium and Vitamin E Cancer Prevention Trial (SELECT) bevis för att kosttillskott av selen faktiskt ökade risken för prostatacancer och avancerad prostatacancer och hade en ytterligare off-target effekt på att öka risken för typ 2-diabetes.
Sådana inkonsekvenser mellan observationsepidemiologiska studier och randomiserade kontrollerade studier är sannolikt en funktion av sociala, beteendemässiga eller fysiologiska störande faktorer i många observationsepidemiologiska konstruktioner, som är särskilt svåra att mäta exakt och svåra att kontrollera för. Dessutom är randomiserade kontrollerade prövningar vanligtvis dyra, tidskrävande och arbetskrävande och många epidemiologiska fynd kan inte etiskt replikeras i kliniska prövningar.
Definition
Mendelsk randomisering (MR) är i grunden en metod för uppskattning av instrumentella variabler som kommer från Econometrics . Metoden använder egenskaperna hos genetisk variation i könsceller (vanligtvis i form av singelnukleotidpolymorfismer eller SNP) starkt associerade med en förmodad exponering som ett "proxy" eller "instrument" för den exponeringen för att testa och uppskatta en orsakseffekt av exponeringen på ett resultat av intresse från observationsdata. Den genetiska variationen som används kommer att ha antingen välkända effekter på exponeringsmönster (t.ex. benägenhet att röka kraftigt) eller effekter som efterliknar de som produceras av modifierbara exponeringar (t.ex. förhöjt kolesterol i blodet). Viktigt är att genotypen endast får påverka sjukdomsstatusen indirekt via dess effekt på exponeringen av intresse.
Eftersom genotyper tilldelas slumpmässigt när de överförs från föräldrar till avkommor under meios , borde grupper av individer som definieras av genetisk variation associerad med en exponering på populationsnivå i stort sett inte vara relaterade till de förvirrande faktorer som vanligtvis plågar observationsepidemiologiska studier. Den genetiska variationen i könsceller (dvs det som kan ärvas) fixeras också tillfälligt vid befruktningen och modifieras inte av uppkomsten av något resultat eller sjukdom, vilket utesluter omvänd orsakssamband . Dessutom, givet förbättringar i modern genotypningsteknik, är mätfel och systematisk felklassificering ofta låg med genetiska data. I detta avseende kan mendelsk randomisering ses som analog med "naturens randomiserade kontrollerade försök".
Mendelsk randomisering kräver tre centrala instrumentella variabelantaganden. Nämligen:
- Den eller de genetiska varianterna som används som instrument för exponeringen är förknippade med exponeringen. Detta är känt som "relevans"-antagandet.
- Det finns inga vanliga orsaker (dvs. konfounders ) till den eller de genetiska varianterna och resultatet av intresse. Detta är känt som antagandet om "oberoende" eller "utbytbarhet".
- Det finns ingen oberoende väg mellan den eller de genetiska varianterna och resultatet annat än genom exponeringen. Detta är känt som antagandet "uteslutningsbegränsning" eller "ingen horisontell pleiotropi".
För att säkerställa att det första kärnantagandet valideras, kräver Mendelsk randomisering karakteriserade associationer mellan genetisk variation och exponeringar av intresse. Dessa är vanligtvis hämtade från genomomfattande associationsstudier men kan också vara kandidatgenstudier. Det andra antagandet bygger på att det inte finns någon populationssubstruktur (t.ex. geografiska faktorer som inducerar ett samband mellan genotyp och utfall), val av par som inte är associerat med genotyp (dvs. slumpmässig parning eller panmixia ) och inga dynastiska effekter (dvs. föräldragenotypen i föräldrafenotypen påverkar direkt avkommans fenotyp).
Statistisk analys
Mendelsk randomisering tillämpas vanligtvis genom användning av instrumentella variabler uppskattning med genetiska varianter som fungerar som instrument för exponering av intresse. Detta kan implementeras med hjälp av data om genetiska varianter, exponering och resultat av intresse för en uppsättning individer i en enda datauppsättning eller med hjälp av sammanfattande data om sambandet mellan de genetiska varianterna och exponeringen och sambandet mellan de genetiska varianterna och resultatet i separata datamängder. Metoden har även använts i ekonomisk forskning som studerar effekterna av fetma på inkomster och andra arbetsmarknadsutfall.
När en enskild datamängd används är de metoder för skattning som används de som ofta används på andra ställen i instrumentell variabeluppskattning, såsom minsta kvadrater i två steg. Om flera genetiska varianter är associerade med exponeringen kan de antingen användas individuellt som instrument eller kombineras för att skapa en allelpoäng som används som ett enda instrument.
Analys med sammanfattande data tillämpar ofta data från genomomfattande associationsstudier. I det här fallet tas sambandet mellan genetiska varianter och exponeringen från de sammanfattande resultaten från en genomomfattande associationsstudie för exponeringen. Sambandet mellan samma genetiska varianter och utfallet tas sedan från de sammanfattande resultaten som tagits fram av en genomomfattande associationsstudie för utfallet. Dessa två uppsättningar av sammanfattande resultat används sedan för att erhålla MR-uppskattningen. Med tanke på följande notation:
effekt av genetisk variant på exponeringen ;
uppskattad effekt av genetisk variant g på resultatet ;
uppskattat standardfel för denna uppskattade effekt;
MR-uppskattning av den kausala effekten av exponeringen på utfallet ;
och med tanke på effekten av en enskild genetisk variant kan MR-uppskattningen erhållas från Wald-förhållandet:
När flera genetiska varianter används, kombineras de individuella förhållandena för varje genetisk variant med omvänd variansviktning där varje individuell kvot viktas av osäkerheten i deras uppskattning. Detta ger IVW-uppskattningen som kan beräknas som:
Alternativt kan samma uppskattning erhållas från en linjär regression som använde den genetiska variant-utfall-associationen som utfall och den genetiska variant-exponeringsassociationen som exponeringen. Denna linjära regression viktas av osäkerheten i den genetiska varianten av utfallsassociationen och inkluderar inte en konstant.
Dessa metoder ger endast tillförlitliga uppskattningar av den kausala effekten av exponeringen på utfallet under de centrala instrumentella variablernas antaganden. Alternativa metoder finns tillgängliga som är robusta mot ett brott mot det tredje antagandet, dvs som ger tillförlitliga resultat under vissa typer av horisontell pleiotropi. Dessutom kan vissa fördomar som uppstår från kränkningar av det andra IV-antagandet, såsom dynastiska effekter, övervinnas genom användning av data som inkluderar syskon eller föräldrar och deras avkomma.
Historia
Den mendelska randomiseringsmetoden beror på två principer som härrör från originalverket av Gregor Mendel om genetiskt arv. Dess grund kommer från Mendels lagar, nämligen 1) segregationens lag där det finns fullständig segregering av de två allelomorferna i lika antal könsceller av en heterozygot och 2) separata par av allelomorfer segregerar oberoende av varandra och som först publicerades som sådan 1906 av Robert Heath Lock . En annan stamfader till mendelsk randomisering är Sewall Wright som introducerade väganalys , en form av kausaldiagram som används för att dra kausala slutsatser från icke-experimentella data. Metoden bygger på kausala ankare, och ankarna i de flesta av hans exempel tillhandahölls av mendelskt arv , vilket är grunden för MR. En annan komponent i MR-logiken är den instrumentella genen, vars koncept introducerades av Thomas Hunt Morgan . Detta är viktigt eftersom det tog bort behovet av att förstå genens fysiologi för att dra slutsatser om genetiska processer. [ citat behövs ]
Sedan dess innehåller litteraturen exempel på forskning som använder molekylär genetik för att dra slutsatser om modifierbara riskfaktorer, vilket är kärnan i MR. Ett exempel är Gerry Lowers och kollegors arbete 1979 som använde fenotypen N-acetyltransferas som ett ankare för att dra slutsatser om olika exponeringar inklusive rökning och aminfärgämnen som riskfaktorer för cancer i urinblåsan. Ett annat exempel är arbetet av Martijn Katan (då vid Wageningen University & Research, Nederländerna ) där han förespråkade en studiedesign som använder Apolipoprotein E-allelen som ett instrumentellt variabelt ankare för att studera det observerade sambandet mellan låga kolesterolnivåer i blodet och ökad risk för cancer . Faktum är att termen "mendelsk randomisering" först användes i tryck av Richard Gray och Keith Wheatley (båda från Radcliffe Infirmary , Oxford, Storbritannien ) 1991 i ett något annat sammanhang; i en metod som tillåter uppskattning av instrumentella variabler men i relation till ett tillvägagångssätt som förlitar sig på mendelskt arv snarare än genotyp. I sin uppsats från 2003 använder Shah Ebrahim och George Davey Smith termen igen för att beskriva metoden att använda genetiska varianter av könsceller för att förstå kausalitet i en instrumentell variabelanalys, och det är denna metod som nu används allmänt och som innebörden tillskrivs . Den mendelska randomiseringsmetoden är nu allmänt antagen inom kausal epidemiologi, och antalet MR-studier som rapporterats i den vetenskapliga litteraturen har ökat varje år sedan 2003 års artikel. År 2021 publicerades STROBE-MR-riktlinjer för att hjälpa läsare och granskare av Mendelska randomiseringsstudier att utvärdera validiteten och användbarheten av publicerade studier.
Vidare läsning
- Davey Smith G, Ebrahim S, Lewis S, Hansell AL, Palmer LJ, Burton PR (2005). "Genetisk epidemiologi och folkhälsa: hopp, hype och framtidsutsikter". Lancet . 366 (9495): 1484–1498. doi : 10.1016/S0140-6736(05)67601-5 . PMID 16243094 . S2CID 38483453 .
- Davey Smith G, Ebrahim S (maj 2005). "Vad kan mendelsk randomisering säga oss om modifierbara beteende- och miljöexponeringar?" . BMJ . 330 (7499): 1076–1079. doi : 10.1136/bmj.330.7499.1076 . PMC 557238 . PMID 15879400 .
- Maier RM, Visscher PM, Robinson MR, Wray NR (maj 2018). "Embracing polygenicity: a review of methods and tools for psychiatric genetics research" . Psykologisk medicin . 48 (7): 1055–1067. doi : 10.1017/S0033291717002318 . PMC 6088780 . PMID 28847336 .