CLs metod (partikelfysik)
Inom partikelfysik representerar CLs en statistisk metod för att sätta övre gränser (även kallade exkluderingsgränser ) för modellparametrar , en speciell form av intervalluppskattning som används för parametrar som endast kan ta icke-negativa värden. Även om CL sägs hänvisa till konfidensnivåer är "metodens namn ... missvisande, eftersom CLs uteslutningsregion inte är ett konfidensintervall ." Det introducerades först av fysiker som arbetade vid LEP -experimentet vid CERN och har sedan dess använts av många högenergifysikexperiment . Det är en frekventistisk metod i den meningen att gränsens egenskaper definieras med hjälp av felsannolikheter , men den skiljer sig från standardkonfidensintervall genom att den angivna konfidensnivån för intervallet inte är lika med dess täckningssannolikhet . Anledningen till denna avvikelse är att övre standardgränser baserade på ett mest kraftfullt test med nödvändighet ger tomma intervall med viss fast sannolikhet när parametervärdet är noll, och denna egenskap anses vara oönskad av de flesta fysiker och statistiker.
Övre gränser härledda med CLs-metoden innehåller alltid parameterns nollvärde och därför är täckningssannolikheten vid denna punkt alltid 100 %. Definitionen av CL följer inte av någon exakt teoretisk ram för statistisk slutledning och beskrivs därför ibland som ad hoc . Det har dock nära likhet med begreppen statistiska bevis som föreslagits av statistikern Allan Birnbaum .
Definition
Låt X vara ett slumpmässigt urval från en sannolikhetsfördelning med en reell icke-negativ parameter . En CLs övre gräns för parametern θ , med konfidensnivå , är en statistik (dvs observerbar slumpvariabel ) som har egenskapen:
-
()
Ojämlikheten används i definitionen för att redogöra för fall där fördelningen av X är diskret och en jämlikhet inte kan uppnås exakt. Om fördelningen av X är kontinuerlig bör denna ersättas med en likhet. Observera att definitionen innebär att täckningssannolikheten är alltid större än .
En ekvivalent definition kan göras genom att betrakta ett hypotestest av nollhypotesen mot alternativet . Då motsvarar täljaren i ( 1 ), när den utvärderas vid typ-I-felsannolikheten ( ) för testet (dvs. förkastas när ) och nämnaren i potensen ( ). Kriteriet för att förkasta kräver alltså att förhållandet blir mindre än . Detta kan tolkas intuitivt som att är uteslutet eftersom det är mindre sannolikt att observera ett så extremt utfall som X när är sant än när alternativet är sant.
Beräkningen av den övre gränsen görs vanligtvis genom att konstruera en teststatistik och hitta värdet på för vilket
där är det observerade resultatet av experimentet.
Användning inom högenergifysik
Övre gränser baserade på CLs-metoden användes i många publikationer av experimentella resultat som erhållits vid partikelacceleratorexperiment som LEP , Tevatron och LHC , mest anmärkningsvärda i sökningar efter nya partiklar.
Ursprung
Den ursprungliga motiveringen för CLs baserades på en villkorad sannolikhetsberäkning som föreslagits av fysikern G. Zech för ett händelseräkningsexperiment. Antag att ett experiment består av att mäta händelser som kommer från signal- och bakgrundsprocesser, båda beskrivna av Poisson-fördelningar med respektive hastigheter och , nämligen . antas vara känd och är parametern som ska uppskattas av experimentet. Standardproceduren för att sätta en övre gräns för givet ett experimentellt resultat består av att exkludera värden på för vilka vilket garanterar minst täckning . Betrakta till exempel ett fall där och händelser observeras, då finner man att exkluderas vid 95 % konfidensnivå. Men detta innebär att är exkluderad, nämligen alla möjliga värden på . Ett sådant resultat är svårt att tolka eftersom experimentet inte i huvudsak kan särskilja mycket små värden på från hypotesen endast för bakgrunden, och att förklara att sådana små värden är uteslutna (till förmån för enbart bakgrundshypotesen) verkar olämplig. För att övervinna denna svårighet föreslog Zech att betinga sannolikheten för att på observationen att , där är det (omätbara) antalet bakgrundshändelser. Resonemanget bakom detta är att när är liten är det mer sannolikt att proceduren ger ett fel (dvs ett intervall som inte täcker det sanna värdet) än när är stor, och fördelningen av i sig är oberoende av . Det vill säga att inte den totala felsannolikheten ska rapporteras utan den villkorade sannolikheten givet den kunskap man har om antalet bakgrundshändelser i urvalet. Denna villkorade sannolikhet är
som motsvarar ovanstående definition av CL. Den första likheten använder bara definitionen av villkorlig sannolikhet , och den andra likheten kommer från det faktum att om och antalet bakgrundshändelser är per definition oberoende av signalstyrkan.
Generalisering av det villkorliga argumentet
Zechs villkorliga argument kan formellt utsträckas till det allmänna fallet. Antag att är en teststatistik från vilken konfidensintervallet härleds, och låt
där är resultatet som observerats av experimentet. Då betraktas som en omätbar (eftersom är okänd) slumpvariabel, vars fördelning är likformig mellan 0 och 1 oberoende av . Om testet är opartiskt innebär resultatet
från vilket man, på samma sätt som konditionering på i det föregående fallet, erhåller
Förhållande till grundläggande principer
Argumenten ovan kan ses som att de följer andan i villkorlighetsprincipen om statistisk slutledning, även om de uttrycker en mer generaliserad uppfattning om villkorlighet som inte kräver att det finns en underordnad statistik . Konditionalitetsprincipen innebär dock, redan i sin ursprungliga mer begränsade version, formellt sannolikhetsprincipen, ett resultat som Birnbaum berömt visar . CLs följer inte sannolikhetsprincipen och därför kan sådana överväganden endast användas för att antyda rimlighet, men inte teoretisk fullständighet ur en grundläggande synvinkel. (Detsamma kan dock sägas om vilken frekventistisk metod som helst om konditionalitetsprincipen anses nödvändig).
Birnbaum själv föreslog i sin artikel från 1962 att CLs-förhållandet skulle användas som ett mått på styrkan hos statistiska bevis som tillhandahålls av signifikanstester, snarare än enbart. Detta följde av en enkel tillämpning av sannolikhetsprincipen : om resultatet av ett experiment endast ska rapporteras i form av ett "acceptera"/"avvisa"-beslut, så är det övergripande förfarandet likvärdigt med ett experiment som endast har två möjliga utfall, med sannolikheter , och , under . Sannolikhetsförhållandet som är förknippat med resultatet "avvisa är därför ) och bör därför avgöra den bevismässiga tolkningen av detta resultat. (Eftersom, för ett test av två enkla hypoteser, är sannolikhetsförhållandet en kompakt representation av sannolikhetsfunktionen ) . Å andra sidan, om sannolikhetsprincipen ska följas konsekvent, ska sannolikhetsförhållandet för det ursprungliga resultatet användas och inte vilket gör grunden för en sådan tolkning tveksam. Birnbaum beskrev senare att detta hade "högst ett heuristiskt, men inte väsentligt, värde för bevistolkning".
Ett mer direkt tillvägagångssätt som leder till en liknande slutsats kan hittas i Birnbaums formulering av konfidensprincipen , som till skillnad från den vanligare versionen hänvisar till felsannolikheter av båda slagen. Detta står så här:
"Ett koncept med statistiska bevis är inte rimligt om det inte hittar 'starka bevis för mot ' med liten sannolikhet när är sann, och med mycket större sannolikhet när är sant."
En sådan definition av förtroende kan naturligtvis tyckas vara tillfredsställd av definitionen av CL. Det förblir sant att både denna och de vanligare (som förknippas med Neyman - Pearson- teorin) versioner av konfidensprincipen är oförenliga med sannolikhetsprincipen, och därför kan ingen frekventistisk metod betraktas som en verkligt fullständig lösning på de problem som tas upp av med tanke på konfidensintervallens villkorliga egenskaper.
Beräkning i den stora urvalsgränsen
Om vissa regularitetsvillkor är uppfyllda, kommer en generell sannolikhetsfunktion att bli en Gaussisk funktion i den stora urvalsgränsen. I sådana fall ges CLs övre gräns vid konfidensnivå (härledd från det enhetligt mest kraftfulla testet ) av
där är den normala kumulativa normalfördelningen , är den maximala sannolikhetsskattaren för och är dess standardavvikelse ; den senare kan uppskattas från inversen av Fishers informationsmatris eller genom att använda "Asimov"-datauppsättningen. Detta resultat råkar vara ekvivalent med ett Bayesianskt trovärdigt intervall om en enhetlig prior för används.
Vidare läsning
- Leon Jay Gleser (2002). "[Ställa in konfidensintervall för begränsade parametrar]: Kommentar" . Statistisk vetenskap . 17 (2): 161–163. doi : 10.1214/ss/1030550859 . JSTOR 3182818 .
- Fraser, DAS; Reid N.; Wong, ACM (2004). "Inferens för avgränsade parametrar". Phys. Rev. D. 69 (3): 033002. arXiv : fysik/0303111 . doi : 10.1103/PhysRevD.69.033002 . S2CID 18947032 .
- Robert D. Cousins (2011). "Negativt partiska relevanta delmängder inducerade av de mest kraftfulla ensidiga övre konfidensgränserna för en begränsad fysisk parameter". arXiv : 1109.2023 [ physics.data-an ].