Förtroendefördelning

I statistisk slutledning har begreppet en konfidensfördelning ( CD ) ofta löst refererat till som en fördelningsfunktion på parameterutrymmet som kan representera konfidensintervall för alla nivåer för en parameter av intresse. Historiskt sett har det vanligtvis konstruerats genom att invertera de övre gränserna för nedre sidors konfidensintervall på alla nivåer, och det var också vanligt förknippat med en trovärdig tolkning ( fiducial distribution ), även om det är ett rent frekventistiskt koncept. En konfidensfördelning är INTE en sannolikhetsfördelningsfunktion för parametern av intresse, men kan ändå vara en funktion användbar för att dra slutsatser.

Under de senaste åren har det skett ett förnyat intresse för förtroendefördelningar. I den senare utvecklingen har begreppet förtroendefördelning dykt upp som ett rent frekventistiskt begrepp, utan någon trovärdig tolkning eller resonemang. Begreppsmässigt skiljer sig en konfidensfördelning inte från en punktskattare eller en intervalluppskattare ( konfidensintervall ), men den använder en urvalsberoende fördelningsfunktion på parameterutrymmet (istället för en punkt eller ett intervall) för att uppskatta parametern av intresse.

Ett enkelt exempel på en konfidensfördelning, som har använts i stor utsträckning i statistisk praxis, är en bootstrap- fördelning. Utvecklingen och tolkningen av en bootstrap-distribution involverar inte något förtroendeingivande resonemang; detsamma gäller begreppet förtroendefördelning. Men begreppet förtroendefördelning är mycket bredare än för en bootstrap-distribution. I synnerhet tyder nyare forskning på att den omfattar och förenar ett brett spektrum av exempel, från vanliga parametriska fall (inklusive de flesta exempel på den klassiska utvecklingen av Fishers fiducial distribution) till bootstrap-fördelningar, p-värdesfunktioner, normaliserade sannolikhetsfunktioner och i vissa fall . fall, Bayesian priors och Bayesian posteriors .

Precis som en Bayesiansk bakre fördelning innehåller en mängd information för alla typer av Bayesiansk slutledning , innehåller en konfidensfördelning en mängd information för att konstruera nästan alla typer av frekventistiska slutledningar, inklusive punktuppskattningar , konfidensintervall , kritiska värden, statistisk styrka och p- värderingar, bland annat. Vissa nya utvecklingar har lyft fram de lovande potentialerna hos CD-konceptet, som ett effektivt slutledningsverktyg.

Historia

Neyman (1937) introducerade idén om "förtroende" i sin uppsats om konfidensintervall som klargjorde den frekventistiska upprepningsegenskapen. Enligt Fraser kan fröet (idén) till förtroendefördelning till och med spåras tillbaka till Bayes (1763) och Fisher (1930). Även om frasen verkar användas först i Cox (1958). Vissa forskare ser på förtroendefördelningen som "den neymanska tolkningen av Fishers trovärdiga fördelningar", som "rasande ifrågasattes av Fisher". Man tror också att dessa "improduktiva tvister" och Fishers "envisa envishet" kan vara orsaken till att begreppet förtroendefördelning länge har misstolkats som ett förtroendebegrepp och inte utvecklats fullt ut under det frekventistiska ramverket. I själva verket är förtroendefördelningen ett rent frekventistiskt begrepp med en rent frekventistisk tolkning, och det har också kopplingar till Bayesianska slutledningsbegrepp och de fiduciala argumenten.

Definition

Klassisk definition

Klassiskt definieras en konfidensfördelning genom att invertera de övre gränserna för en serie konfidensintervall på lägre sidor. [ sida behövs ] Särskilt,

För varje α i (0, 1), låt (−∞, ξ n ( α )] vara ett 100α % konfidensintervall på lägre sida för θ , där ξ n ( α ) = ξ n ( X n , α) är kontinuerlig och ökande i α för varje prov X n . Då är H n (•) = ξ n −1 (•) en konfidensfördelning för θ .

Efron uppgav att denna fördelning "tilldelar sannolikheten 0,05 till θ som ligger mellan de övre ändpunkterna för 0,90 och 0,95 konfidensintervall, etc ." och "den har en kraftfull intuitiv överklagande". I den klassiska litteraturen tolkas konfidensfördelningsfunktionen som en fördelningsfunktion av parametern θ , vilket är omöjligt om inte tillförlitliga resonemang är inblandade eftersom parametrarna i en frekventistisk miljö är fasta och icke-slumpmässiga.

Att tolka CD-funktionen helt ur en frekventistisk synvinkel och inte tolka den som en fördelningsfunktion av en (fixerad/icke-slumpmässig) parameter är en av de stora avvikelserna från den senaste utvecklingen i förhållande till det klassiska tillvägagångssättet. Det fina med att behandla konfidensfördelningar som ett rent frekventistiskt koncept (liknande en punktskattare) är att det nu är fritt från de restriktiva, om inte kontroversiella, begränsningar som Fisher har angett för tilltroendefördelningar.

Den moderna definitionen

Följande definition gäller; Θ är parameterutrymmet för den okända parametern av intresse θ , och χ är sampelutrymmet som motsvarar data Xn ={ X 1 , ..., X n }:

En funktion H n (•) = H n ( X n , •) på χ × Θ → [0, 1] kallas en konfidensfördelning (CD) för en parameter θ , om den följer två krav:
  • (R1) För varje given X n χ , är H n (•) = H n ( X n , •) en kontinuerlig kumulativ fördelningsfunktion på Θ ;
  • 000 (R2) Vid det sanna parametervärdet θ = θ , H n ( θ ) ≡ H n ( X n , θ ), som en funktion av provet X n , följer den enhetliga fördelningen U [0, 1].

Funktionen H är också en asymptotisk CD ( aCD ), om U [0, 1]-kravet endast är sant asymptotiskt och kontinuitetskravet på H n (•) tas bort.

I icke-tekniska termer är en konfidensfördelning en funktion av både parametern och slumpmässigt urval, med två krav. Det första kravet (R1) kräver helt enkelt att en CD ska vara en distribution på parameterutrymmet. Det andra kravet (R2) sätter en begränsning på funktionen så att slutledningar (punktuppskattare, konfidensintervall och hypotestestning etc.) baserade på konfidensfördelningen har önskade frekventistiska egenskaper. Detta liknar begränsningarna i punktuppskattning för att säkerställa vissa önskade egenskaper, såsom opartiskhet, konsekvens, effektivitet, etc.

En konfidensfördelning härledd genom att invertera de övre gränserna för konfidensintervall (klassisk definition) uppfyller också kraven i ovanstående definition och denna version av definitionen överensstämmer med den klassiska definitionen.

Till skillnad från den klassiska konfidensinferensen kan mer än en konfidensfördelning vara tillgänglig för att uppskatta en parameter under någon specifik inställning. Till skillnad från den klassiska fiduciala slutledningen är optimalitet inte en del av kravet. Beroende på inställningen och det kriterium som används finns det ibland en unik "bästa" (i termer av optimalitet) förtroendefördelning. Men ibland finns det ingen optimal förtroendefördelning tillgänglig eller, i vissa extrema fall, kanske vi inte ens kan hitta en meningsfull förtroendefördelning. Detta skiljer sig inte från praxis med poänguppskattning.

En definition med mätbara utrymmen

En konfidensfördelning för en ) \ displaystyle C ( A_ för en familj av konfidensregioner för med nivå för alla nivåer . Familjen av förtroenderegioner är inte unik. Om endast finns för , så är en konfidensfördelning med nivåuppsättning . Både och alla är mätbara funktioner för data. Detta innebär att är ett slumpmässigt mått och är en slumpmässig mängd. Om det definierande kravet , så är konfidensfördelningen per definition exakt. Om dessutom är en reell parameter, så sammanfaller den måttteoretiska definitionen med ovanstående klassiska definition.

Exempel

Exempel 1: Normalt medelvärde och varians

Antag att ett normalt prov X i ~ N ( μ , σ 2 ), i = 1, 2, ..., n ges.

(1) Varians σ 2 är känd

Låt, Φ vara den kumulativa fördelningsfunktionen för standardnormalfördelningen, och den kumulativa fördelningsfunktionen för Student distribution. Både funktionerna och ges av

uppfyller de två kraven i CD-definitionen, och de är konfidensfördelningsfunktioner för μ . Dessutom,

uppfyller definitionen av en asymptotisk konfidensfördelning när n →∞, och det är en asymptotisk konfidensfördelning för μ . Användningarna av och ekvivalenta med att säga att vi använder och för att uppskatta respektive.

(2) Varians σ 2 är okänd

För parametern μ , eftersom involverar den okända parametern σ och den bryter mot de två kraven i CD-definitionen, är den inte längre en " distribution estimator" eller en konfidensfördelning för μ . dock fortfarande en CD för μ och är en aCD för μ .

För parametern σ 2 , den sampelberoende kumulativa fördelningsfunktionen

är en konfidensfördelningsfunktion för σ 2 . Här den kumulativa fördelningsfunktionen för distribution .

I fallet då variansen σ 2 är känd, vid vilken nivå som helst. I fallet då variansen σ 2 är okänd, för μ .

Exempel 2: Bivariat normalkorrelation

Låt ρ beteckna korrelationskoefficienten för en bivariat normalpopulation. Det är välkänt att Fishers z definierad av Fisher-transformationen :

har den begränsande fördelningen med en snabb konvergenshastighet, där r är urvalskorrelationen och n är urvalsstorleken.

Funktionen

är en asymptotisk konfidensfördelning för ρ .

En exakt konfidensdensitet för ρ är

där är den Gaussiska hypergeometriska funktionen och . Detta är också den bakre densiteten för en Bayes-matchning före de fem parametrarna i den binormala fördelningen.

Den allra sista formeln i den klassiska boken av Fisher ger

där och . Denna formel härleddes av CR Rao .

Exempel 3: Binormalt medelvärde

Låt data genereras av där är en okänd vektor i planet och har en binormal och känd fördelning i plan. Fördelningen av definierar en konfidensfördelning för . Konfidensregionerna kan väljas som det inre av ellipser centrerade vid och axlar som ges av egenvektorerna för kovariansmatrisen för . Konfidensfördelningen är i detta fall binormal med medelvärde , och konfidensregionerna kan väljas på många andra sätt. Förtroendefördelningen sammanfaller i detta fall med den Bayesianska posterioren med den högra Haar prior. Argumentet generaliserar till fallet med ett okänt medelvärde i ett oändligt dimensionellt Hilbert-rum , men i det här fallet är inte konfidensfördelningen en Bayesiansk posterior.

Använda konfidensfördelningar för slutledning

Konfidensintervall

CDinference1.png

Från CD-definitionen är det uppenbart att intervallet och α )%-nivå konfidensintervall av olika slag, för θ , för alla α ∈ (0, 1). Även är en nivå 100(1 − α 1 α 2 )% konfidensintervall för parametern θ för alla α 1 > 0, α 2 > 0 och α 1 + α 2 < 1. Här är 100 β % av eller så löser den för θ i ekvation . Detsamma gäller för en CD, där konfidensnivån uppnås i limit. Vissa författare har föreslagit att de ska användas för att grafiskt se vilka parametervärden som överensstämmer med data, istället för täckning eller prestanda.

Poänguppskattning

Punktuppskattare kan också konstrueras givet en konfidensfördelningsuppskattare för parametern av intresse. Till exempel, givet H n ( θ ) CD för en parameter θ , inkluderar naturliga val av punktuppskattare medianen M n = H n −1 (1/2), medelvärdet , och maxpunkten för CD-densiteten

Under vissa blygsamma förhållanden, bland andra egenskaper, kan man bevisa att dessa punktuppskattare alla är konsekventa. Vissa konfidensfördelningar kan ge optimala frekventistskattare.

Hypotestestning

Man kan härleda ett p-värde för ett test, antingen ensidigt eller dubbelsidigt, avseende parametern θ ur dess konfidensfördelning H n ( θ ). Beteckna med sannolikhetsmassan för en mängd C under konfidensfördelningsfunktionen p s ( C) kallas "support" i CD-inferens och även känd som "tro" i den förtroendelitteraturen. Vi har

0 (1) För det ensidiga testet K : θ C vs. K 1 : θ C c , där C är av typen (−∞, b ] eller [ b , ∞), kan man visa från CD:n definition att sup θ C P θ ( p s ( C ) ≤ α ) = α . Således p s ( C ) = H n ( C ) motsvarande p-värde för testet.

0 (2) För singeltestet K : θ = b vs. K 1 : θ b , P 0 { K : θ = b } (2 min{ p s ( C lo ), kan man från CD-definitionen visa att p s ( C up )} ≤ α ) = α . Således är 2 min{ p s ( Clo ), p s ( C up )} = 2 min { H n ( b ), 1 − H n ( b ) } motsvarande p - värde för testet . Här är C lo = (−∞, b ] och C up = [ b , ∞).

Se figur 1 från Xie och Singh (2011) för en grafisk illustration av CD-inferensen.

Genomföranden

Ett fåtal statistiska program har implementerat förmågan att konstruera och rita konfidensfördelningar.

R , via paketen concurve , pvaluefunctions och episheet

Excel , via episheet

Stata , via konkurva

Se även

Bibliografi