Stegkilförsök

Inom medicin är en stegvis studie (eller SWT ) en typ av randomiserad kontrollerad studie (RCT). En RCT är ett vetenskapligt experiment som är utformat för att minska fördomar när man testar en ny medicinsk behandling , en social intervention eller annan testbar hypotes .

I en traditionell RCT delar forskaren slumpmässigt in experimentdeltagarna i två grupper samtidigt:

I en SWT förhindrar en logistisk begränsning vanligtvis samtidig behandling av vissa deltagare, och istället får alla eller de flesta deltagare behandlingen i vågor eller "steg".

Forskaren vill till exempel mäta om att lära högskolestudenter hur man gör flera måltider ökade deras benägenhet att laga mat hemma istället för att äta ute.

  • I en traditionell RCT skulle ett urval av studenter väljas ut och några skulle utbildas i hur man lagar dessa måltider, medan andra inte skulle göra det. Båda grupperna skulle övervakas för att se hur ofta de åt ute. I slutändan skulle antalet gånger behandlingsgruppen åt ute jämföras med antalet gånger kontrollgruppen åt ute, troligen med ett t-test eller någon variant.
  • Men om forskaren bara kunde utbilda ett begränsat antal studenter varje vecka, skulle forskaren kunna anställa en SWT, som slumpmässigt tilldelar eleverna vilken vecka de skulle utbildas till.

Termen "stepped wedge" myntades av The Gambia Hepatitis Intervention Study på grund av den stegade kilformen som framgår av en schematisk illustration av designen . Övergången är i en riktning, vanligtvis från kontroll till ingripande, med interventionen inte borttagen när den väl har implementerats. Den stegvisa designen kan användas för individuellt randomiserade prövningar, dvs prövningar där varje individ behandlas sekventiellt, men används oftare som en klusterrandomiserad studie (CRT) .

Experimentdesign

Den stegvisa designen involverar insamling av observationer under en baslinjeperiod då inga kluster exponeras för interventionen. Efter detta, med jämna mellanrum, eller steg, randomiseras ett kluster (eller grupp av kluster) för att ta emot interventionen och alla deltagare mäts återigen. Denna process fortsätter tills alla kluster har mottagit interventionen. Slutligen görs ytterligare en mätning efter att alla kluster har fått insatsen.

Lämplighet

Hargreaves och kollegor erbjuder en serie av fem frågor som forskare bör svara på för att avgöra om SWT verkligen är den optimala designen och hur man ska gå vidare i varje steg av studien. Specifikt bör forskare kunna identifiera:

Skälen till att SWT är den föredragna designen
Om mätning av en behandlingseffekt är det primära målet för forskning, kanske SWT inte är den optimala designen. SWT är lämpliga när forskningsfokus är på behandlingens effektivitet snarare än på dess existens. Sammantaget, om studien är pragmatisk (dvs. främst syftar till att implementera en viss policy), logistiska och andra praktiska problem vara de bästa skälen att vända sig till en stegad kildesign. Dessutom, om behandlingen förväntas vara fördelaktig, och det inte skulle vara etiskt att neka det till vissa deltagare, tillåter SWT alla deltagare att få behandlingen samtidigt som det tillåter en jämförelse med en kontrollgrupp. I slutet av studien kommer alla deltagare att ha möjlighet att prova behandlingen. Observera att det fortfarande kan etiska problem genom att försena tillgången till behandlingen för vissa deltagare.
Vilken SWT-design som är mer lämplig
SWT:er kan ha tre huvuddesigner som använder en sluten kohort , en öppen kohort och en kontinuerlig rekrytering med kort exponering. :I den slutna kohorten deltar alla försökspersoner i experimentet från början till slut. Alla utfall mäts upprepade gånger vid bestämda tidpunkter som kan eller inte kan vara relaterade till varje steg.
I den öppna kohortdesignen mäts utfall på samma sätt som den tidigare designen, men nya försökspersoner kan komma in i studien och vissa deltagare från ett tidigt stadium kan lämna innan slutförandet. Endast en del av motiven exponeras från början och fler exponeras gradvis i efterföljande steg. Exponeringstiden varierar alltså för varje motiv.
I en kontinuerlig rekryteringsdesign med kort exponering deltar väldigt få eller inga försökspersoner i början av experimentet men fler blir berättigade och utsätts för kort intervention gradvis. I denna design tilldelas varje ämne till antingen behandlingen eller kontrolltillståndet. Eftersom deltagarna tilldelas antingen behandlingen eller kontrollgruppen, är risken för överföringseffekter, som kan vara en utmaning för slutna och öppna kohortdesigner, minimal.
Vilken analysstrategi som är lämplig
Linjära blandade modeller (LMM), generaliserade linjära blandade modeller (GLMM) och generaliserade skattningsekvationer (GEE) är de huvudsakliga estimatorerna som rekommenderas för att analysera resultaten. Även om LMM erbjuder högre effekt än GLMM och GEE, kan det vara ineffektivt om storleken på klustren varierar och svaret inte är kontinuerligt och normalfördelat. Om något av dessa antaganden kränks är GLMM och GEE att föredra. [ citat behövs ]
Hur stort provet ska vara
Effektanalys och beräkning av provstorlek finns. Generellt kräver SWT mindre urvalsstorlek för att upptäcka effekter eftersom de utnyttjar både jämförelser mellan och inom kluster.
Bästa metoder för att rapportera utformningen och resultaten av försöket
Att rapportera utformningen, provprofilen och resultaten kan vara utmanande, eftersom inga Consolidated Standards Of Reporting Trials (CONSORT) har utsetts för SWT. Vissa studier har dock tillhandahållit både formaliseringar och flödesscheman som hjälper till att rapportera resultat och upprätthålla ett balanserat urval över vågorna.

Modell

Medan det finns flera andra potentiella metoder för att modellera utfall i en SWT, beskrev Husseys och Hughes arbete "först metoder för att bestämma statistisk kraft tillgänglig när man använder en stegad kildesign." Vad som följer är deras design.

Anta att det finns sampel uppdelade i -kluster. Vid varje tidpunkt , företrädesvis jämnt fördelade i faktisk tid, behandlas ett visst antal kluster. Låt vara om kluster har behandlats vid tidpunkten och annars. Observera särskilt att om så är .

För varje deltagare i kluster , mät resultatet som ska studeras vid tidpunkten . Observera att notationen tillåter klustring genom att inkludera i subskriptet av , , och . Vi modellerar dessa resultat som:

var:
  • är ett stort medelvärde ,
  • är en slumpmässig effekt på klusternivå på resultatet,
  • är en tidspunktsspecifik fixerad effekt,
  • är den uppmätta effekten av behandlingen, och
  • är restbruset.

Denna modell kan ses som en hierarkisk linjär modell där på den lägsta nivån där är medelvärdet av ett givet kluster vid en given tidpunkt, och på klusternivå betyder varje kluster .

Uppskattning av varians

Designeffekten (uppskattning av enhetsvarians) av en stegad kildesign ges av formeln :

var:
  • ρ är intra-klusterkorrelationen (ICC) ,
  • n är antalet ämnen inom ett kluster (som antas vara konstant),
  • k är antalet steg,
  • t är antalet mätningar efter varje steg, och
  • bi s antalet baslinjemätningar.

För att beräkna provstorleken behövs den enkla formeln:

var:

  • N sw är den nödvändiga urvalsstorleken för SWT
  • N u är den totala ojusterade urvalsstorleken som skulle krävas för en traditionell RCT.

Observera att ökning av antingen k , t eller b kommer att resultera i att den erforderliga urvalsstorleken för en SWT minskas.

ges den erforderliga storleken på kluster c av:

För att beräkna hur många kluster c behöver för att byta från kontrollen till behandlingstillståndet finns följande formel tillgänglig:

Om c och c s inte är heltal måste de avrundas till nästa större heltal och fördelas så jämnt som möjligt mellan k.

Fördelar

Stegformad kildesign har många komparativa fördelar jämfört med traditionella RCT ( randomiserade kontrollerade försök) .

  • För det första är SWT mest lämpliga både etiskt och praktiskt när interventionen förväntas ge ett positivt resultat. Eftersom alla försökspersoner så småningom kommer att få fördelarna med interventionen, etiska farhågor mildras, och rekryteringen av deltagare kan bli lättare.
  • För det andra kan SWT:er "förena behovet av robusta utvärderingar med politiska eller logistiska begränsningar." Specifikt kan den användas för att mäta effekterna av behandling när resurserna för att utföra en intervention är knappa.
  • För det tredje, eftersom varje kluster får både kontroll- och behandlingstillståndet i slutet av försöket, är jämförelser både mellan och inom kluster möjliga. På så sätt ökar den statistiska kraften samtidigt som provet hålls betydligt mindre än vad det skulle behövas i en traditionell RCT.
  • För det fjärde har en designeffekt (används för att blåsa upp urvalsstorleken i en individuellt randomiserad studie till den som krävs i en klusterförsök) etablerats, som har visat att CRT med stegvis kil kan minska antalet patienter som krävs i studien jämfört med andra mönster.
  • Slutligen, eftersom varje kluster växlar slumpmässigt från kontroll till behandlingstillstånd vid olika tidpunkter, är det möjligt att undersöka tidseffekter. Det är till exempel möjligt att studera hur upprepad eller långvarig exponering för experimentella stimuli påverkar effektiviteten i behandlingen. Upprepade mätningar i regelbundna tidsramar kan medelvärdet av bruset ut, vilket i sin tur ökar precisionen i uppskattningarna. Denna fördel blir mest uppenbar när mätningen är bullrig och utfallsautokorrelationen är låg.

Nackdelar

SWT kan lida av vissa nackdelar.

  • För det första, eftersom i SWTs studieperioden varar längre och alla försökspersoner så småningom får behandlingen, kan kostnaderna öka avsevärt. Eftersom designen kan vara dyr, kanske SWT inte är den optimala lösningen när mätprecisionen och utfallsautokorrelationen är hög. Dessutom, eftersom alla så småningom behandlas, underlättar SWT inte nedströmsanalys.
  • För det andra, i en SWT exponeras fler kluster för interventionen vid senare än tidigare tidsperioder. Som sådan är det möjligt att en underliggande tidstrend kan förvirra interventionseffekten, och därför måste den förvirrande effekten av tid beaktas i både effektberäkningar före försök och analys efter försök. rekommenderas användning av generaliserade linjära blandade modeller eller generaliserade skattningsekvationer .
  • Slutligen är utformningen och analysen av stegvisa försök därför mer komplex än för andra typer av randomiserade försök. Tidigare systematiska översikter] framhävde den dåliga rapporteringen av beräkningar av urvalsstorlek och bristen på konsekvens i analysen av sådana försök. Hussey och Hughes var de första författarna som föreslog en struktur och en formel för att uppskatta makt i stegvisa studier där data samlades in vid varje steg. Detta har nu utökats för konstruktioner där observationer inte görs vid varje steg samt flera lager av klustring.

Pågående arbete

Antalet studier som använder designen har ökat. 2015 publicerades en tematisk serie i tidskriften Trials . 2016 hölls den första internationella konferensen tillägnad ämnet vid University of York .