Små-bias provutrymme
Inom teoretisk datavetenskap är ett sampelutrymme med liten bias (även känd som -biased sample space , -biased generator eller small-bias probability space ) en sannolikhetsfördelning som narrar paritetsfunktioner . Med andra ord kan ingen paritetsfunktion skilja mellan ett sampelutrymme med liten bias och den enhetliga fördelningen med hög sannolikhet, och följaktligen ger små bias sampelutrymmen naturligtvis upphov till pseudoslumpgeneratorer för paritetsfunktioner.
Den viktigaste användbara egenskapen hos sampelutrymmen med liten bias är att de behöver mycket färre verkligt slumpmässiga bitar än den enhetliga fördelningen för att lura pariteter. Effektiva konstruktioner av provutrymmen med liten bias har hittat många tillämpningar inom datavetenskap, av vilka några är derandomisering , felkorrigerande koder och sannolikhetskontrollerbara bevis . Sambandet med felkorrigerande koder är i själva verket mycket starkt eftersom -biased sample spaces motsvarar -balanserade felkorrigerande koder .
Definition
Partiskhet
Låt vara en sannolikhetsfördelning över . Biasen för på en uppsättning index } definieras som
där summan tas över , det finita fältet med två element. Med andra ord, summan är lika med om antalet ettor i provet vid positionerna definierade av är jämn, och annars är summan . För definieras den tomma summan till noll, och därför .
ϵ-förspänt sampelutrymme
En sannolikhetsfördelning över kallas ett -biased sample space if gäller för alla icke-tomma delmängder .
ϵ-förspänd uppsättning
Ett -biased sample space som genereras genom att välja ett enhetligt element från en multiset kallas -biased set . Storleken s för en -förspänd uppsättning är storleken på den multiset som genererar sampelutrymmet.
ϵ-förspänd generator
En -biased generator är en funktion som mappar strängar med längden till strängar med längden så att multiuppsättningen en -biased set. Generatorns frölängd är talet ℓ och är relaterad till storleken på -förspänd mängd via ekvationen .
Anslutning med epsilon-balanserade felkorrigeringskoder
Det finns ett nära samband mellan -biased sets och -balanserade linjära felkorrigerande koder . En linjär kod av meddelandelängd och blocklängd är -balanserad om Hamming-vikten för varje kodord som inte är noll är mellan och . Eftersom är en linjär kod är dess generatormatris en -matris över med .
Då gäller att en multimängd är -förspänd om och endast om den linjära koden , vars kolumner är exakt element av , är -balanserad.
Konstruktioner av små epsilon-biased set
Vanligtvis är målet att hitta -biased set som har en liten storlek i förhållande till parametrarna och . Detta beror på att en mindre storlek betyder att mängden slumpmässighet som behövs för att välja ett slumpmässigt element från mängden är mindre, och så kan mängden användas för att lura pariteter med några slumpmässiga bitar.
Teoretiska gränser
Den probabilistiska metoden ger en icke-explicit konstruktion som uppnår storlek . Konstruktionen är icke-explicit i den meningen att hitta den -biased uppsättningen kräver mycket sann slumpmässighet, vilket inte hjälper mot målet att minska den övergripande slumpen. Denna icke-explicita konstruktion är dock användbar eftersom den visar att dessa effektiva koder existerar. Å andra sidan är den mest kända nedre gränsen för storleken på -biased set det vill säga, för att en uppsättning ska vara -biased, måste den vara minst så stor.
Explicita konstruktioner
Det finns många explicita, dvs deterministiska konstruktioner av -förspända uppsättningar med olika parameterinställningar:
- Naor & Naor (1990) uppnår . Konstruktionen använder sig av Justesen-koder (som är en sammanlänkning av Reed–Solomon-koder med Wozencraft-ensemblen ) såväl som expanderpromenadsampling .
- Alon et al. (1992) uppnå . En av deras konstruktioner är sammanlänkningen av Reed–Solomon-koder med Hadamard-koden ; denna sammanlänkning visar sig vara en -balanserad kod, vilket ger upphov till ett -förspänt sampelutrymme via ovan nämnda koppling.
- Att sammanfoga algebraiska geometriska koder med Hadamard-koden ger en -balanserad kod med .
- Ben-Aroya & Ta-Shma (2009) uppnår .
- Ta-Shma (2017) uppnår vilket är nästan optimalt på grund av den nedre gränsen.
Dessa gränser är ömsesidigt ojämförliga. I synnerhet ger ingen av dessa konstruktioner de minsta -förspända uppsättningarna för alla inställningar av och .
Användning: nästan k-mässigt oberoende
En viktig tillämpning av små-bias-uppsättningar ligger i konstruktionen av nästan k-mässigt oberoende sampelutrymmen.
k-mässigt oberoende utrymmen
En slumpvariabel över är ett k-mässigt oberoende mellanslag om, för alla indexuppsättningar av storleken , marginalfördelningen är exakt lika med den enhetliga fördelningen över . Det vill säga, för alla sådana och alla strängar uppfyller fördelningen .
Konstruktioner och gränser
k-mässigt oberoende utrymmen är ganska väl förstådda.
- En enkel konstruktion av Joffe (1974) uppnår storlek .
- Alon, Babai & Itai (1986) konstruerar ett k-mässigt oberoende utrymme vars storlek är .
- Chor et al. (1985) bevisar att inget k-mässigt oberoende utrymme kan vara betydligt mindre än .
Joffes konstruktion
Joffe (1974) konstruerar ett -vis oberoende utrymme över det finita fältet med något primtal av element, dvs är en fördelning över . De initiala -marginalerna för fördelningen ritas oberoende och enhetligt slumpmässigt:
- .
För varje med definieras då marginalfördelningen av
där beräkningen görs i . Joffe (1974) bevisar att fördelningen konstruerad på detta sätt är -vis oberoende som en fördelning över . Fördelningen bildar stödet för -vis oberoende uppsättning . Den innehåller alla strängar i som har utökats till strängar med längden med den deterministiska regeln ovan.
Nästan k-mässigt oberoende utrymmen
En slumpvariabel över är ett -nästan k-mässigt oberoende mellanslag om, för alla indexuppsättningar av storleken , den begränsade fördelningen och den enhetliga fördelningen på är -close i 1-norm , dvs .
Konstruktioner
Naor & Naor (1990) ger ett allmänt ramverk för att kombinera små k-vis oberoende utrymmen med små -biased spaces för att erhålla -nästan k-vis oberoende utrymmen av ännu mindre storlek . Låt särskilt vara en linjär mappning som genererar ett k-vis oberoende utrymme och låt vara en generator av en -förspänd uppsättning över . Det vill säga, när den ges en likformigt slumpmässig ingång, är utsignalen från ett k-vis oberoende mellanslag, och utsignalen från är -partisk. Sedan med är en generator av en -nästan -vis oberoende utrymme, där .
Som nämnts ovan konstruerar Alon, Babai & Itai (1986) en generator med och Naor & Naor (1990) konstruerar en generator med . Följaktligen har sammanlänkningen av och frölängd . För att ska ge ett -nästan k-mässigt oberoende utrymme måste vi sätta , vilket leder till en frölängd på och ett sampelutrymme med total storlek .
Anteckningar
- Alon, Noga; Babai, László; Itai, Alon (1986), "En snabb och enkel randomiserad parallell algoritm för det maximala oberoende uppsättningsproblemet" ( PDF) , Journal of Algorithms , 7 (4): 567–583, doi : 10.1016/0196-6774(86)90019 -2
- Alon, Noga; Goldreich, Oded; Håstad, Johan; Peralta, René (1992), "Simple Constructions of Almost k-wise Independent Random Variables" (PDF) , Random Structures & Algorithms , 3 (3): 289–304, CiteSeerX 10.1.1.106.6442 , doi : 2/rsa.10. 3240030308
- Ben-Aroya, Avraham; Ta-Shma, Amnon (2009), "Constructing Small-Bias Sets from Algebraic-Geometric Codes" (PDF) , Proceedings of the 50th Annual Symposium on Foundations of Computer Science, FOCS 2009 : 191–197, CiteSeerX 10.1.97 . , doi : 10.1109/FOCS.2009.44 , ISBN 978-1-4244-5116-6
- Chor, Benny; Goldreich, Oded; Håstad, Johan; Freidmann, Joel; Rudich, Steven; Smolensky, Roman (1985), "The bit extraction problem or t-resilient functions", Proceedings of the 26th Annual Symposium on Foundations of Computer Science, FOCS 1985 : 396–407, CiteSeerX 10.1.1.39.6768 , doi : 9010 .1985.55 , ISBN 978-0-8186-0644-1 , S2CID 6968065
- Goldreich, Oded (2001), Föreläsning 7: Small bias sample spaces
- Joffe, Anatole (1974), "On a Set of Almost Deterministic k-Independent Random Variables", Annals of Probability , 2 (1): 161–162, doi : 10.1214/aop/1176996762
- Naor, Joseph; Naor, Moni (1990), " Small-bias Probability Spaces: efficient constructions and Applications" , Proceedings of the 22nd Annual ACM Symposium on Theory of Computing, STOC 1990 : 213–223, CiteSeerX 10.1.1.421,017 ,017 ,017 , 017 . 100216.100244 , ISBN 978-0897913614 , S2CID 14031194
- " Explicit, Almost Optimal, Epsilon-balanced Codes", Proceedings of the 49th Annual ACM SIGACT Symposium on Theory of Computing : 238–251, doi : 10.1145/3055340.375 5253409.375,455340.375 , 525 340.375 S2CID 5648543