Små-bias provutrymme

Inom teoretisk datavetenskap är ett sampelutrymme med liten bias (även känd som -biased sample space , -biased generator eller small-bias probability space ) en sannolikhetsfördelning som narrar paritetsfunktioner . Med andra ord kan ingen paritetsfunktion skilja mellan ett sampelutrymme med liten bias och den enhetliga fördelningen med hög sannolikhet, och följaktligen ger små bias sampelutrymmen naturligtvis upphov till pseudoslumpgeneratorer för paritetsfunktioner.

Den viktigaste användbara egenskapen hos sampelutrymmen med liten bias är att de behöver mycket färre verkligt slumpmässiga bitar än den enhetliga fördelningen för att lura pariteter. Effektiva konstruktioner av provutrymmen med liten bias har hittat många tillämpningar inom datavetenskap, av vilka några är derandomisering , felkorrigerande koder och sannolikhetskontrollerbara bevis . Sambandet med felkorrigerande koder är i själva verket mycket starkt eftersom -biased sample spaces motsvarar -balanserade felkorrigerande koder .

Definition

Partiskhet

Låt vara en sannolikhetsfördelning över . Biasen för på en uppsättning index } definieras som

där summan tas över , det finita fältet med två element. Med andra ord, summan är lika med om antalet ettor i provet vid positionerna definierade av är jämn, och annars är summan . För definieras den tomma summan till noll, och därför .

ϵ-förspänt sampelutrymme

En sannolikhetsfördelning över kallas ett -biased sample space if gäller för alla icke-tomma delmängder .

ϵ-förspänd uppsättning

Ett -biased sample space som genereras genom att välja ett enhetligt element från en multiset kallas -biased set . Storleken s för en -förspänd uppsättning är storleken på den multiset som genererar sampelutrymmet.

ϵ-förspänd generator

En -biased generator är en funktion som mappar strängar med längden till strängar med längden så att multiuppsättningen en -biased set. Generatorns frölängd är talet ℓ och är relaterad till storleken på -förspänd mängd via ekvationen .

Anslutning med epsilon-balanserade felkorrigeringskoder

Det finns ett nära samband mellan -biased sets och -balanserade linjära felkorrigerande koder . En linjär kod av meddelandelängd och blocklängd är -balanserad om Hamming-vikten för varje kodord som inte är noll är mellan och . Eftersom är en linjär kod är dess generatormatris en -matris över med .

Då gäller att en multimängd är -förspänd om och endast om den linjära koden , vars kolumner är exakt element av , är -balanserad.

Konstruktioner av små epsilon-biased set

Vanligtvis är målet att hitta -biased set som har en liten storlek i förhållande till parametrarna och . Detta beror på att en mindre storlek betyder att mängden slumpmässighet som behövs för att välja ett slumpmässigt element från mängden är mindre, och så kan mängden användas för att lura pariteter med några slumpmässiga bitar.

Teoretiska gränser

Den probabilistiska metoden ger en icke-explicit konstruktion som uppnår storlek . Konstruktionen är icke-explicit i den meningen att hitta den -biased uppsättningen kräver mycket sann slumpmässighet, vilket inte hjälper mot målet att minska den övergripande slumpen. Denna icke-explicita konstruktion är dock användbar eftersom den visar att dessa effektiva koder existerar. Å andra sidan är den mest kända nedre gränsen för storleken på -biased set det vill säga, för att en uppsättning ska vara -biased, måste den vara minst så stor.

Explicita konstruktioner

Det finns många explicita, dvs deterministiska konstruktioner av -förspända uppsättningar med olika parameterinställningar:

  • Naor & Naor (1990) uppnår . Konstruktionen använder sig av Justesen-koder (som är en sammanlänkning av Reed–Solomon-koder med Wozencraft-ensemblen ) såväl som expanderpromenadsampling .
  • Alon et al. (1992) uppnå . En av deras konstruktioner är sammanlänkningen av Reed–Solomon-koder med Hadamard-koden ; denna sammanlänkning visar sig vara en -balanserad kod, vilket ger upphov till ett -förspänt sampelutrymme via ovan nämnda koppling.
  • Att sammanfoga algebraiska geometriska koder med Hadamard-koden ger en -balanserad kod med .
  • Ben-Aroya & Ta-Shma (2009) uppnår .
  • Ta-Shma (2017) uppnår vilket är nästan optimalt på grund av den nedre gränsen.

Dessa gränser är ömsesidigt ojämförliga. I synnerhet ger ingen av dessa konstruktioner de minsta -förspända uppsättningarna för alla inställningar av och .

Användning: nästan k-mässigt oberoende

En viktig tillämpning av små-bias-uppsättningar ligger i konstruktionen av nästan k-mässigt oberoende sampelutrymmen.

k-mässigt oberoende utrymmen

En slumpvariabel över är ett k-mässigt oberoende mellanslag om, för alla indexuppsättningar av storleken , marginalfördelningen är exakt lika med den enhetliga fördelningen över . Det vill säga, för alla sådana och alla strängar uppfyller fördelningen .

Konstruktioner och gränser

k-mässigt oberoende utrymmen är ganska väl förstådda.

  • En enkel konstruktion av Joffe (1974) uppnår storlek .
  • Alon, Babai & Itai (1986) konstruerar ett k-mässigt oberoende utrymme vars storlek är .
  • Chor et al. (1985) bevisar att inget k-mässigt oberoende utrymme kan vara betydligt mindre än .

Joffes konstruktion

Joffe (1974) konstruerar ett -vis oberoende utrymme över det finita fältet med något primtal av element, dvs är en fördelning över . De initiala -marginalerna för fördelningen ritas oberoende och enhetligt slumpmässigt:

.

För varje med definieras då marginalfördelningen av

där beräkningen görs i . Joffe (1974) bevisar att fördelningen konstruerad på detta sätt är -vis oberoende som en fördelning över . Fördelningen bildar stödet för -vis oberoende uppsättning . Den innehåller alla strängar i som har utökats till strängar med längden med den deterministiska regeln ovan.

Nästan k-mässigt oberoende utrymmen

En slumpvariabel över är ett -nästan k-mässigt oberoende mellanslag om, för alla indexuppsättningar av storleken , den begränsade fördelningen och den enhetliga fördelningen är -close i 1-norm , dvs .

Konstruktioner

Naor & Naor (1990) ger ett allmänt ramverk för att kombinera små k-vis oberoende utrymmen med små -biased spaces för att erhålla -nästan k-vis oberoende utrymmen av ännu mindre storlek . Låt särskilt vara en linjär mappning som genererar ett k-vis oberoende utrymme och låt vara en generator av en -förspänd uppsättning över . Det vill säga, när den ges en likformigt slumpmässig ingång, är utsignalen från ett k-vis oberoende mellanslag, och utsignalen från är -partisk. Sedan med är en generator av en -nästan -vis oberoende utrymme, där .

Som nämnts ovan konstruerar Alon, Babai & Itai (1986) en generator med och Naor & Naor (1990) konstruerar en generator med . Följaktligen har sammanlänkningen av och frölängd . För att ska ge ett -nästan k-mässigt oberoende utrymme måste vi sätta , vilket leder till en frölängd på och ett sampelutrymme med total storlek .

Anteckningar