Welchs t -test

Inom statistik är Welchs t -test , eller ojämlika varianser t -test , ett lokaliseringstest med två urval som används för att testa (noll)hypotesen att två populationer har lika medelvärden. Den är uppkallad efter sin skapare, Bernard Lewis Welch , är en anpassning av Students t -test och är mer tillförlitlig när de två stickproven har ojämna varianser och möjligen olika urvalsstorlekar. Dessa tester hänvisas ofta till som "oparade" eller "oberoende sampel" t -test, eftersom de vanligtvis används när de statistiska enheterna som ligger till grund för de två stickproven som jämförs är icke-överlappande. Med tanke på att Welchs t -test har varit mindre populärt än Students t -test och kanske är mindre bekant för läsarna, är ett mer informativt namn "Welchs ojämna varianser t -test" - eller "ojämna varianser t -test" för korthetens skull.

Antaganden

Elevens t -test antar att urvalet betyder att jämföras för två populationer är normalfördelade, och att populationerna har lika varianser. Welchs t -test är utformat för ojämlika populationsvarianser, men antagandet om normalitet bibehålls. Welchs t -test är en ungefärlig lösning på Behrens–Fisher-problemet .

Beräkningar

Welchs t -test definierar statistiken t med följande formel:

där och är de provmedelvärde och dess standardfel , med som anger den korrigerade standardavvikelsen för provet , och provstorleken . Till skillnad från i Students t -test är nämnaren inte baserad på en poolad variansuppskattning .

Frihetsgraderna förknippade med denna variansuppskattning uppskattas med hjälp av Welch–Satterthwaite- ekvationen :

Detta uttryck kan förenklas när :

Här är frihetsgraderna förknippade med den i -te variansuppskattningen.

Statistiken är ungefär från t -fördelningen eftersom vi har en approximation av chi-kvadratfördelningen . Denna uppskattning görs bättre när både och är större än 5.

Statistiskt test

När t och har beräknats kan denna statistik användas med t -fördelningen för att testa en av två möjliga nollhypoteser :

  • att de två populationsmedelvärdena är lika, i vilket ett tvåsidigt test tillämpas; eller
  • att ett av populationsmedelvärdena är större än eller lika med det andra, där ett ensidigt test tillämpas.

De ungefärliga frihetsgraderna är reella tal och används som sådana i statistikorienterad programvara, medan de är avrundas nedåt till närmaste heltal i kalkylblad.

Fördelar och begränsningar

Welchs t -test är mer robust än Students t -test och upprätthåller typ I-felfrekvenser nära nominella för ojämna varianser och för ojämna urvalsstorlekar under normalitet. Dessutom styrkan i Welchs t -test nära kraften i Students t -test, även när populationsvarianserna är lika och urvalsstorlekarna är balanserade. Welchs t -test kan generaliseras till fler än 2-prov, vilket är mer robust än envägsvariansanalys ( ANOVA).

Det rekommenderas inte att förtesta för lika varianser och sedan välja mellan Students t -test eller Welchs t -test. Snarare kan Welchs t -test appliceras direkt och utan några väsentliga nackdelar till Students t -test som nämnts ovan. Welchs t -test förblir robust för snedfördelningar och stora urvalsstorlekar. Tillförlitligheten minskar för snedfördelningar och mindre sampel, där man eventuellt skulle kunna utföra Welchs t -test.

Exempel

Följande tre exempel jämför Welchs t -test och Students t -test. Proverna kommer från slumpmässiga normalfördelningar med programmeringsspråket R.

För alla tre exemplen var populationsmedelvärdena och .

Det första exemplet är för ojämna men nära varianser ( σ ) och lika provstorlekar ( ). Låt A1 och A2 beteckna två slumpmässiga urval:

Det andra exemplet är för ojämna varianser ( σ ) och ojämna urvalsstorlekar ( , ). Det mindre urvalet har den större variansen:

Det tredje exemplet är för ojämna varianser ( σ ) och ojämna urvalsstorlekar ( , ). Det större urvalet har den större variansen:

Referens p-värden erhölls genom att simulera fördelningarna av t- statistiken för nollhypotesen för lika populationsmedelvärden ( . Resultaten sammanfattas i tabellen nedan, med tvåsvansade p-värden:

Prov A1 Prov A2 Elevens t -test Welchs t -test
Exempel
1 15 20.8 7.9 15 23,0 3.8 −2,46 28 0,021 0,021 −2,46 24.9 0,021 0,017
2 10 20.6 9,0 20 22.1 0,9 −2.10 28 0,045 0,150 −1,57 9.9 0,149 0,144
3 10 19.4 1.4 20 21.6 17.1 −1,64 28 0,110 0,036 −2.22 24.5 0,036 0,042

Welchs t -test och Students t -test gav identiska resultat när de två proverna har liknande varianser och provstorlekar (exempel 1). Men observera att även om du provar data från populationer med identiska varianser kommer urvalsvarianserna att skilja sig åt, liksom resultaten från de två t-testerna. Så med faktiska data kommer de två testerna nästan alltid att ge något olika resultat.

För ojämna varianser gav Students t-test ett lågt p-värde när det mindre urvalet hade en större varians (exempel 2) och ett högt p-värde när det större urvalet hade en större varians (exempel 3 ) . För ojämna varianser gav Welchs t -test p-värden nära simulerade p-värden.

Mjukvaruimplementationer

Språk/program Fungera Dokumentation
LibreOffice TTEST( Data1; Data2; Läge; Typ )
MATLAB test2(data1, data2, 'Vartype', 'ojämn')
Microsoft Excel före 2010 (Studentens T-test) TTEST( array1 , array2 , tails , typ )
Microsoft Excel 2010 och senare (Studentens T-test) T.TEST( array1 , array2 , tails , typ )
Minitab Nås via menyn
SAS (programvara) Standardutgång från proc ttest (märkt "Satterthwaite")
Python (genom tredje parts bibliotek SciPy ) scipy.stats.ttest_ind( a , b , equal_var=False )
R t.test(data1, data2)
Haskell Statistics.Test.StudentT.welchTTest SamplesDiffer data1 data2
JMP Oneway( Y( YColumn), X( XColumn), Ojämna varianser( 1 ) );
Julia UnequalVarianceTTest(data1, data2)
Stata test varname1 == varname2 , welch
Google Kalkylark TTEST(område1; område2; svansar; typ)
GraphPad Prism Det är ett val i t-testdialogrutan.
IBM SPSS-statistik Ett alternativ i menyn
GNU Octave welch_test(x, y)

Se även