Statistiskt bevis

Statistiskt bevis är den rationella demonstrationen av graden av säkerhet för en proposition , hypotes eller teori som används för att övertyga andra efter ett statistiskt test av stödbevisen och de typer av slutsatser som kan dras från testresultaten . Statistiska metoder används för att öka förståelsen av fakta och beviset visar giltigheten och logiken i slutledning med explicit hänvisning till en hypotes, experimentella data , fakta, testet och oddsen . Bevis har två väsentliga syften: det första är att övertyga och det andra är att förklara förslaget genom sakkunnig och offentlig granskning.

Bevisbördan vilar på den påvisbara tillämpningen av den statistiska metoden, avslöjandet av antagandena och den relevans som testet har med avseende på en genuin förståelse av data i förhållande till omvärlden. Det finns anhängare till flera olika statistiska inferensfilosofier, såsom Bayes sats mot sannolikhetsfunktionen , eller positivism mot kritisk rationalism . Dessa förnuftsmetoder har direkt betydelse för statistiska bevis och dess tolkningar i den bredare vetenskapsfilosofin.

En vanlig gränsdragning mellan vetenskap och icke-vetenskap är det hypotetiskt-deduktiva beviset på förfalskning som utvecklats av Karl Popper , vilket är en väletablerad praxis inom statistiktraditionen. Andra slutledningssätt kan emellertid innefatta induktiva och abduktiva bevismetoder. Forskare använder inte statistiska bevis som ett sätt att uppnå säkerhet, utan för att förfalska påståenden och förklara teorier. Vetenskapen kan inte uppnå absolut säkerhet och det är inte heller en kontinuerlig marsch mot en objektiv sanning som folkspråket i motsats till den vetenskapliga innebörden av termen "bevis" kan antyda. Statistiska bevis erbjuder ett slags bevis på en teoris falskhet och sättet att lära sig heuristiskt genom upprepade statistiska försök och experimentella fel. Statistiska bevis har även tillämpningar i juridiska frågor med konsekvenser för den rättsliga bevisbördan .

Axiom

Det finns två typer av axiom , 1) konventioner som tas som sanna som bör undvikas eftersom de inte kan testas, och 2) hypoteser. Bevis i sannolikhetsteorin byggdes på fyra axiom utvecklade i slutet av 1600-talet:

  1. Sannolikheten för en hypotes är ett icke-negativt reellt tal: ;
  2. Sannolikheten för nödvändig sanning är lika med en: ;
  3. Om två hypoteser h 1 och h 2 utesluter varandra, så är summan av deras sannolikheter lika med sannolikheten för deras disjunktion : ;
  4. Den villkorliga sannolikheten för h 1 givet h 2 lika till den ovillkorliga sannolikheten för konjunktionen h 1 och h 2 , dividerat med den ovillkorliga sannolikheten för h 2 där sannolikheten är positiv , där .

De föregående axiomen ger det statistiska beviset och grunden för slumpmässighetens lagar , eller objektiv slump, varifrån modern statistisk teori har avancerat. Experimentella data kan dock aldrig bevisa att hypoteserna (h) är sanna, utan förlitar sig på en induktiv slutledning genom att mäta hypotesernas sannolikhet i förhållande till empiriska data. Beviset ligger i den rationella demonstrationen av att använda logiken för slutledning , matematik , testning och deduktiva resonemang av betydelse .

Test och bevis

Termen bevis härstammar från dess latinska rötter (bevisbar, trolig, probare L.) som betyder att testa . Därför är bevis en form av slutledning med hjälp av ett statistiskt test. Statistiska tester är formulerade på modeller som genererar sannolikhetsfördelningar . Exempel på sannolikhetsfördelningar kan inkludera binär- , normal- eller giftfördelningen som ger exakta beskrivningar av variabler som beter sig enligt naturliga lagar för slumpmässig slump . När ett statistiskt test tillämpas på urval av en population avgör testet om urvalsstatistiken skiljer sig signifikant från den antagna nollmodellen . Sanna värden för en befolkning, som är okända i praktiken, kallas parametrar för befolkningen. Forskare prov från populationer, som ger uppskattningar av parametrarna, för att beräkna medelvärdet eller standardavvikelsen. Om hela populationen provtas, kommer provets statistiska medelvärde och distribution att konvergera med den parametriska fördelningen.

Med hjälp av den vetenskapliga falsifieringsmetoden ges sannolikhetsvärdet att provstatistiken är tillräckligt skild från nollmodellen än vad som kan förklaras av enbart slumpen före testet. De flesta statistiker sätter det tidigare sannolikhetsvärdet till 0,05 eller 0,1, vilket innebär att om urvalsstatistiken avviker från den parametriska modellen mer än 5 (eller 10) gånger av 100, är ​​det osannolikt att avvikelsen kan förklaras av enbart slumpen och noll- hypotesen förkastas. Statistiska modeller ger exakta utfall av parametrin och uppskattningar av provstatistiken. Bevisbördan vilar därför i urvalsstatistiken som ger uppskattningar av en statistisk modell. Statistiska modeller innehåller det matematiska beviset för de parametriska värdena och deras sannolikhetsfördelningar.

Bayes teorem

Bayesiansk statistik är baserad på ett annat filosofiskt tillvägagångssätt för bevis på slutledning . Den matematiska formeln för Bayes teorem är:

Formeln läses som sannolikheten för parametern (eller hypotes =h , som används i notationen om axiom ) "given" data (eller empirisk observation), där den horisontella stapeln refererar till "given". Den högra sidan av formeln beräknar den tidigare sannolikheten för en statistisk modell (Pr [Parameter]) med sannolikheten ( Pr [Data | Parameter]) för att producera en posterior sannolikhetsfördelning av parametern (Pr [Parameter | Data]). Den bakre sannolikheten är sannolikheten att parametern är korrekt givet observerad data eller provstatistik. Hypoteser kan jämföras med Bayesiansk slutledning med hjälp av Bayes-faktorn, som är förhållandet mellan det bakre oddset och det föregående oddset. Det ger ett mått på data och om det har ökat eller minskat sannolikheten för en hypotes i förhållande till en annan.

Det statistiska beviset är den Bayesianska demonstrationen att en hypotes har en högre (svag, stark, positiv) sannolikhet. Det råder stor debatt om den bayesianska metoden överensstämmer med Karl Poppers metod för bevis för förfalskning, där vissa har föreslagit att "...det finns inget sådant som att "acceptera" hypoteser alls. Allt man gör inom vetenskapen är att tilldela grader av tro..." Enligt Popper, hypoteser som har stått emot tester och ännu inte har falsifierats är inte verifierade utan bekräftade . Vissa undersökningar har föreslagit att Poppers strävan att definiera bekräftelse på antagandet om sannolikhet satte hans filosofi i linje med det Bayesianska synsättet. I detta sammanhang kan sannolikheten för en hypotes i förhållande till en annan vara ett index för bekräftelse, inte bekräftelse, och därmed statistiskt bevisad genom rigorös objektiv ställning.

I rättsprocesser

"Där grova statistiska skillnader kan visas, kan de ensamma i ett riktigt fall utgöra prima facie -bevis för ett mönster eller praxis av diskriminering."

Statistiska bevis i ett rättsligt förfarande kan sorteras i tre kategorier av bevis:

  1. Förekomsten av en händelse, handling eller typ av beteende,
  2. Identiteten på den eller de ansvariga individerna
  3. Avsikten eller det psykologiska ansvaret

Statistiska bevis tillämpades inte regelbundet i beslut rörande USA:s rättsliga förfaranden förrän i mitten av 1970-talet efter ett landmärke jurydiskrimineringsmål i Castaneda v. Partida . USA:s högsta domstol slog fast att grova statistiska skillnader utgör " prima facie proof" för diskriminering, vilket resulterar i en förskjutning av bevisbördan från kärande till svarande. Sedan den domen har statistiska bevis använts i många andra fall om ojämlikhet, diskriminering och DNA-bevis. Det finns dock ingen en-till-en-överensstämmelse mellan statistiska bevis och den juridiska bevisbördan. "Högsta domstolen har uttalat att de rigoritetsgrader som krävs i rätts- och vetenskapsprocesserna inte nödvändigtvis överensstämmer."

I ett exempel på en dödsdömd ( Mcclekey v. Kemp ) angående rasdiskriminering, anklagades framställaren, en svart man vid namn McCleskey för mordet på en vit polis under ett rån. Expertvittnesmål för McClesky introducerade ett statistiskt bevis som visar att "tilltalade som anklagades för att ha dödat vita offer hade 4,3 gånger så stor risk att få en dödsdom som anklagade för att ha dödat svarta." Ändå var statistiken otillräcklig "för att bevisa att beslutsfattarna i hans fall handlade med diskriminerande syfte". Det hävdades vidare att det fanns "inneboende begränsningar av det statistiska beviset", eftersom det inte hänvisade till individens detaljer. Trots det statistiska beviset på en ökad sannolikhet för diskriminering, måste den juridiska bevisbördan (det hävdades) granskas från fall till fall.

Se även

Anteckningar

externa länkar