McCullaghs parametrisering av Cauchy-distributionerna
I sannolikhetsteorin är "standard" Cauchy-fördelningen sannolikhetsfördelningen vars sannolikhetstäthetsfunktion ( pdf) är
för x real . Detta har median 0, och första och tredje kvartilen −1 respektive +1. Generellt sett är en Cauchy-fördelning vilken sannolikhetsfördelning som helst som tillhör samma platsskalafamilj som denna. Således, om X har en standard Cauchy-fördelning och μ är vilket reellt tal som helst och σ > 0, så har Y = μ + σX en Cauchy-fördelning vars median är μ och vars första och tredje kvartil är μ − σ respektive μ + σ .
McCulaghs parametrisering , introducerad av Peter McCulagh , professor i statistik vid University of Chicago , använder de två parametrarna för den icke-standardiserade fördelningen för att bilda en enda komplexvärderad parameter, närmare bestämt det komplexa talet θ = μ + iσ , där i är den imaginära enheten . Den utökar också det vanliga skalparameterintervallet till att inkludera σ < 0.
Även om parametern teoretiskt uttrycks med ett komplext tal, är densiteten fortfarande en densitet över den reella linjen. I synnerhet kan densiteten skrivas med hjälp av de reella parametrarna μ och σ , som var och en kan ha positiva eller negativa värden, som
där fördelningen betraktas som degenererad om σ = 0. En alternativ form för densiteten kan skrivas med den komplexa parametern θ = μ + iσ som
där .
Till frågan "Varför introducera komplexa tal när endast slumpmässiga variabler med reellt värde är inblandade?", skrev McCullagh:
På denna fråga kan jag inte ge något bättre svar än att presentera det märkliga resultatet som
för alla reella tal a , b , c och d . ...den inducerade transformationen på parameterutrymmet har samma linjära bråkdelform som transformationen på sampelutrymmet endast om parameterutrymmet tas som det komplexa planet.
Med andra ord, om den slumpmässiga variabeln Y har en Cauchy-fördelning med den komplexa parametern θ , så har den ovan definierade slumpvariabeln Y * en Cauchy-fördelning med parametern ( aθ + b )/( cθ + d ).
McCullagh skrev också, "Fördelningen av den första utgångspunkten från det övre halvplanet av en Brownsk partikel som börjar vid θ är Cauchy-densiteten på den verkliga linjen med parametern θ ." Dessutom visar McCullagh att den komplext värderade parametriseringen tillåter ett enkelt förhållande att göras mellan Cauchy och den "cirkulära Cauchy-fördelningen".
Genom att använda den komplexa parametern kan man också enkelt bevisa invariansen av f-divergenser (t.ex. Kullback-Leibler-divergens, chi-kvadratdivergens, etc.) med avseende på verkliga linjära fraktionerade transformationer (gruppverkan av SL(2,R)), och visa att alla f-divergenser mellan univariata Cauchy-densiteter är symmetriska.
- Peter McCulagh , "Conditional inference and Cauchy models" , Biometrika , volym 79 (1992), sidorna 247–259. PDF från McCulaghs hemsida.
- Frank Nielsen och Kazuki Okamura, "Om f-divergenser mellan Cauchy-distributioner" , arXiv 2101.12459 (2021).