Statistisk slumpmässighet
En numerisk sekvens sägs vara statistiskt slumpmässig när den inte innehåller några igenkännbara mönster eller regelbundenheter; sekvenser som resultatet av ett idealt tärningskast eller siffrorna i π uppvisar statistisk slumpmässighet.
Statistisk slumpmässighet innebär inte nödvändigtvis "sann" slumpmässighet , dvs objektiv oförutsägbarhet . Pseudoslumpmässighet är tillräckligt för många användningsområden, såsom statistik, därav namnet statistisk slumpmässighet.
Global slumpmässighet och lokal slumpmässighet är olika. De flesta filosofiska uppfattningar om slumpmässighet är globala – eftersom de bygger på idén att "i det långa loppet" ser en sekvens verkligen slumpmässig ut, även om vissa delsekvenser inte skulle se slumpmässiga ut. I en "verkligt" slumpmässig sekvens av tal av tillräcklig längd, till exempel, är det troligt att det skulle finnas långa sekvenser av ingenting annat än upprepade siffror, även om sekvensen på det hela taget kan vara slumpmässig. Lokal slumpmässighet hänvisar till idén att det kan finnas minsta sekvenslängder där slumpmässiga fördelningar approximeras. Långa sträckor av samma siffror, även de som genereras av "verkligt" slumpmässiga processer, skulle minska den "lokala slumpmässigheten" för ett urval (det kan bara vara lokalt slumpmässigt för sekvenser med 10 000 nummer; att ta sekvenser på mindre än 1 000 kanske inte verkar slumpmässigt alls, till exempel).
En sekvens som uppvisar ett mönster är därmed inte visat sig vara statistiskt slumpmässig. Enligt principerna för Ramsey-teorin måste tillräckligt stora föremål nödvändigtvis innehålla en given understruktur ("fullständig oordning är omöjlig").
Lagstiftningen om hasardspel ställer vissa standarder för statistisk slumpmässighet för spelautomater .
Tester
De första testerna för slumptal publicerades av MG Kendall och Bernard Babington Smith i Journal of the Royal Statistical Society 1938. De byggde på statistiska verktyg som Pearsons chi-kvadrattest som utvecklades för att särskilja om experimentella fenomen matchade deras teoretiska sannolikheter. Pearson utvecklade sitt test ursprungligen genom att visa att ett antal tärningsexperiment av WFR Weldon inte visade "slumpmässigt" beteende.
Kendall och Smiths ursprungliga fyra test var hypotestest , som tog som sin nollhypotes idén att varje nummer i en given slumpmässig sekvens hade en lika stor chans att inträffa, och att olika andra mönster i datan också skulle fördelas lika sannolikt.
- Frekvenstestet var väldigt grundläggande: kontrollera för att se till att det fanns ungefär samma antal 0:or, 1:or, 2:or, 3:or, etc.
- Serietestet gjorde samma sak men för sekvenser med två siffror åt gången (00, 01, 02, etc.), och jämförde deras observerade frekvenser med deras hypotetiska förutsägelser om de var jämnt fördelade .
- Pokertestet , testade för vissa sekvenser av fem nummer åt gången (AAAAA , AAAAB, AAABB, etc.) baserat på händer i spelet poker .
- Spalttestet tittade på avstånden mellan nollor (00 skulle vara ett avstånd på 0, 030 skulle vara ett avstånd på 1, 02250 skulle vara ett avstånd på 3, etc.) .
Om en given sekvens kunde klara alla dessa test inom en given grad av signifikans (i allmänhet 5%), så bedömdes den vara, med deras ord "lokalt slumpmässig". Kendall och Smith särskiljde "lokal slumpmässighet" från "verklig slumpmässighet" genom att många sekvenser genererade med verkligt slumpmässiga metoder kanske inte visar "lokal slumpmässighet" i en viss grad - mycket stora sekvenser kan innehålla många rader med en enda siffra. Detta kan vara "slumpmässigt" på skalan för hela sekvensen, men i ett mindre block skulle det inte vara "slumpmässigt" (det skulle inte klara deras tester) och skulle vara värdelöst för ett antal statistiska tillämpningar.
När slumpmässiga nummeruppsättningar blev mer och mer vanliga användes fler tester med ökande sofistikering. Vissa moderna test plottar slumpmässiga siffror som punkter på ett tredimensionellt plan, som sedan kan roteras för att leta efter dolda mönster. 1995 skapade statistikern George Marsaglia en uppsättning tester kända som diehard-testerna , som han distribuerar med en CD-ROM med 5 miljarder pseudoslumptal . 2015 Yongge Wang ett Java-programpaket för statistiskt distansbaserad slumpmässig testning.
Pseudoslumptalsgeneratorer kräver tester som exklusiva verifikationer för deras "slumpmässighet", eftersom de definitivt inte produceras av "verkligen slumpmässiga" processer, utan snarare av deterministiska algoritmer. Under slumptalsgenereringens historia har många källor till siffror som tros verka "slumpmässiga" under testning senare upptäckts vara mycket icke-slumpmässiga när de utsätts för vissa typer av tester. Begreppet kvasi- slumptal utvecklades för att kringgå några av dessa problem, även om pseudoslumptalsgeneratorer fortfarande används flitigt i många applikationer (även sådana som är kända för att vara extremt "icke-slumpmässiga"), eftersom de är "tillräckligt bra" för de flesta applikationer.
Andra tester:
- Monobit-testet behandlar varje utgångsbit från slumptalsgeneratorn som ett myntvändningstest och avgör om det observerade antalet huvuden och svansar är nära den förväntade frekvensen på 50 %. Antalet huvuden i ett myntspår bildar en binomialfördelning .
- Wald –Wolfowitz kör testtester för antalet bitövergångar mellan 0 bitar och 1 bitar, och jämför de observerade frekvenserna med förväntad frekvens för en slumpmässig bitsekvens.
- Informationsentropi
- Autokorrelationstest _
- Kolmogorov–Smirnov test
- Statistiskt avståndsbaserat slumpmässigt test. Yongge Wang visade att NIST SP800-22-teststandarder inte är tillräckliga för att upptäcka vissa svagheter i slumpgeneratorer och föreslog statistiskt avståndsbaserat slumpmässigt test.
- Spektraldensitetsuppskattning - genom att utföra en Fouriertransform på en "slumpmässig" signal omvandlas den till en summa av periodiska funktioner för att upptäcka icke-slumpmässiga repetitiva trender
- Maurers universella statistiska test
- Diehard -testerna
Se även
- Algoritmisk slumpmässighet
- Kontroll
- Fullständig rumslig slumpmässighet
- Normalt antal
- Engångsdyna
- Slumpmässigt fel
- Slumpmässighet
- Slumpmässighetstester
- Statistisk hypotesprövning
- Sju tillstånd av slumpmässighet
- TestU01
externa länkar
- DieHarder : En gratis ( GPL ) C -svit för slumptalstest.
- Generera normalfördelade slumptal