Klinisk signifikans
Inom medicin och psykologi är klinisk betydelse den praktiska betydelsen av en behandlingseffekt – om den har en verklig äkta, påtaglig, märkbar effekt på det dagliga livet.
Typer av betydelse
Statistisk signifikans
Statistisk signifikans används i hypotestestning , där nollhypotesen (att det inte finns något samband mellan variabler ) testas. En signifikansnivå väljs (oftast α = 0,05 eller 0,01), vilket anger sannolikheten för att felaktigt förkasta en sann nollhypotes. Om det finns en signifikant skillnad mellan två grupper vid α = 0,05, betyder det att det bara finns en 5% sannolikhet att erhålla de observerade resultaten under antagandet att skillnaden helt och hållet beror på slumpen (dvs. nollhypotesen är sann); den ger ingen indikation på storleken eller den kliniska betydelsen av skillnaden. När statistiskt signifikanta resultat uppnås, gynnar de förkastande av nollhypotesen, men de bevisar inte att nollhypotesen är falsk. På samma sätt bevisar inte icke-signifikanta resultat att nollhypotesen är sann; de ger inte heller några bevis för sanningen eller falskheten i den hypotes som forskaren har genererat. Statistisk signifikans avser endast kompatibiliteten mellan observerade data och vad som skulle förväntas under antagandet att nollhypotesen är sann.
Praktisk betydelse
I bred användning svarar den "praktiska kliniska betydelsen" på frågan, hur effektiv är interventionen eller behandlingen, eller hur mycket förändring orsakar behandlingen. När det gäller att testa kliniska behandlingar ger praktisk betydelse optimalt kvantifierad information om vikten av ett fynd, med hjälp av mått som effektstorlek , antal som behövs för att behandla (NNT) och preventiv fraktion . Praktisk betydelse kan också förmedla semikvantitativa, jämförande eller genomförbarhetsbedömningar av användbarhet.
Effektstorlek är en typ av praktisk betydelse. Den kvantifierar i vilken utsträckning ett urval avviker från förväntningarna. Effektstorlek kan ge viktig information om resultaten av en studie, och rekommenderas för inkludering utöver statistisk signifikans. Effektstorlekar har sina egna källor till bias, är föremål för förändringar baserat på populationsvariabilitet hos den beroende variabeln och tenderar att fokusera på gruppeffekter, inte individuella förändringar.
Även om klinisk betydelse och praktisk betydelse ofta används synonymt, betecknar en mer teknisk restriktiv användning detta som felaktigt. Denna tekniska användning inom psykologi och psykoterapi är inte bara ett resultat av en noggrant ritad precision och särart i språket, utan den möjliggör ett skifte i perspektiv från gruppeffekter till specifika förändringar inom en individ.
Specifik användning
Däremot, när den används som en teknisk term inom psykologi och psykoterapi, ger klinisk betydelse information om huruvida en behandling var tillräckligt effektiv för att ändra en patients diagnostiska etikett. När det gäller kliniska behandlingsstudier svarar klinisk signifikans på frågan "Är en behandling tillräckligt effektiv för att få patienten att vara normal [med hänsyn till de diagnostiska kriterierna i fråga]?"
Till exempel kan en behandling signifikant förändra depressiva symtom (statistisk signifikans), förändringen kan vara en stor minskning av depressiva symtom (praktisk signifikans-effektstorlek), och 40 % av patienterna uppfyllde inte längre de diagnostiska kriterierna för depression (klinisk signifikans). ). Det är mycket möjligt att ha en behandling som ger en signifikant skillnad och medelstora eller stora effektstorlekar, men som inte flyttar en patient från dysfunktionell till funktionell.
Inom psykologi och psykoterapi föreslogs klinisk betydelse först av Jacobson, Follette och Revenstorf som ett sätt att svara på frågan, är en terapi eller behandling tillräckligt effektiv så att en klient inte uppfyller kriterierna för en diagnos ? Jacobson och Truax definierade senare klinisk betydelse som "i vilken utsträckning terapi flyttar någon utanför intervallet för den dysfunktionella befolkningen eller inom intervallet för den funktionella befolkningen." De föreslog två komponenter i detta förändringsindex: statusen för en patient eller klient efter att behandlingen har avslutats, och "hur mycket förändring som har skett under terapins gång."
Klinisk betydelse är också ett övervägande när man tolkar resultaten av den psykologiska bedömningen av en individ. Ofta kommer det att finnas en skillnad på poäng eller delpoäng som är statistiskt signifikanta , som sannolikt inte har inträffat av en slump. Men inte alla dessa statistiskt signifikanta skillnader är kliniskt signifikanta, eftersom de varken förklarar befintlig information om klienten eller ger användbar vägledning för intervention. Skillnader som är små i storleksordningen saknar vanligtvis praktisk relevans och är osannolikt att vara kliniskt signifikanta. Skillnader som är vanliga i befolkningen är också osannolikt att vara kliniskt signifikanta, eftersom de helt enkelt kan återspegla en nivå av normal mänsklig variation. Dessutom letar läkare efter information i bedömningsdata och klientens historia som bekräftar relevansen av den statistiska skillnaden, för att fastställa sambandet mellan prestation på det specifika testet och individens mer allmänna funktion.
Beräkning av klinisk betydelse
Precis som det finns många sätt att beräkna statistisk signifikans och praktisk signifikans, finns det en mängd olika sätt att beräkna klinisk signifikans. Fem vanliga metoder är Jacobson-Truax-metoden, Gulliksen-Lord-Novick-metoden, Edwards-Nunnally-metoden, Hageman-Arrindell-metoden och hierarkisk linjär modellering.
Jacobson-Truax
Jacobson-Truax är en vanlig metod för att beräkna klinisk signifikans. Det innebär att man beräknar ett RCI (Reliability Change Index). RCI är lika med skillnaden mellan en deltagares resultat före och efter testet, dividerat med standardfelet för skillnaden. Cutoff-poäng fastställs för att placera deltagare i en av fyra kategorier: återhämtade, förbättrade, oförändrade eller försämrade, beroende på RCI:s riktning och om cutoff-poängen uppfylldes.
Gulliksen-Lord-Novick
Gulliksen-Lord-Novick-metoden liknar Jacobson-Truax, förutom att den tar hänsyn till regression till medelvärdet . Detta görs genom att subtrahera pre- och post-testresultaten från ett populationsmedelvärde och dividera med standardavvikelsen för populationen.
Edwards-Nunnally
Edwards-Nunnally-metoden för att beräkna klinisk signifikans är ett strängare alternativ till Jacobson-Truax-metoden. Tillförlitlighetspoäng används för att föra pre-testpoängen närmare medelvärdet, och sedan utvecklas ett konfidensintervall för detta justerade pre-testpoäng. Konfidensintervall används vid beräkning av förändringen från pre-test till post-test, så större faktisk förändring i poäng är nödvändig för att visa klinisk signifikans, jämfört med Jacobson-Truax-metoden.
Hageman-Arrindell
Hageman-Arrindells beräkning av klinisk signifikans innefattar index för gruppförändring och individuell förändring. Förändringens tillförlitlighet indikerar om en patient har förbättrats, förblivit densamma eller försämrats. Ett andra index, den kliniska betydelsen av förändring, indikerar fyra kategorier som liknar de som används av Jacobson-Truax: försämrad, inte tillförlitligt förändrad, förbättrad men inte återhämtad och återhämtad.
Hierarkisk linjär modellering (HLM)
HLM involverar analys av tillväxtkurvor istället för jämförelser före test efter test, så tre datapunkter behövs från varje patient, istället för endast två datapunkter (förtest och eftertest). Ett datorprogram, såsom Hierarchical Linear and Nolinar Modeling, används för att beräkna förändringsuppskattningar för varje deltagare. HLM möjliggör också analys av tillväxtkurvmodeller av dyader och grupper.
Se även