McDiarmids ojämlikhet

Inom sannolikhetsteori och teoretisk datavetenskap är McDiarmids ojämlikhet en koncentrationsojämlikhet som begränsar avvikelsen mellan det samplade värdet och det förväntade värdet för vissa funktioner när de utvärderas på oberoende slumpvariabler . McDiarmids ojämlikhet gäller funktioner som uppfyller en bounded differences- egenskap, vilket innebär att att ersätta ett enda argument till funktionen samtidigt som alla andra argument lämnas oförändrade inte kan orsaka en för stor förändring av funktionens värde.

Påstående

En funktion uppfyller egenskapen bounded differences om värdet av e koordinaten ändras värdet av med högst . Mer formellt, om det finns konstanter så att för alla , och alla ,

McDiarmid's Inequality Låt uppfyller egenskapen bounded differences med gränser .

Betrakta oberoende slumpvariabler där för alla . Sedan, för alla ,

och som en omedelbar konsekvens,

Tillägg

Obalanserade fördelningar

En starkare gräns kan ges när argumenten till funktionen samplas från obalanserade distributioner, så att omsampling av ett enstaka argument sällan orsakar en stor förändring av funktionsvärdet.

McDiarmid's Inequality (obalanserad) Låt tillfredsställa egenskapen bounded differences med gränser .

Betrakta oberoende slumpvariabler ritade från en fördelning där det finns ett särskilt värde som inträffar med sannolikheten . Sedan, för alla ,

Detta kan användas för att karakterisera till exempel värdet av en funktion på grafer när den utvärderas på glesa slumpmässiga grafer och hypergrafer , eftersom det i en gles slumpmässig graf är mycket mer sannolikt att någon speciell kant saknas än att den finns.

Skillnader avgränsade med hög sannolikhet

McDiarmids ojämlikhet kan utvidgas till det fall där funktionen som analyseras inte strikt uppfyller egenskapen bounded differences, men stora skillnader förblir mycket sällsynta.

McDiarmid's Inequality (Skillnader avgränsade med hög sannolikhet) Låt en funktion och vara en delmängd av dess domän och låt vara konstanter så att för alla par och ,

Betrakta oberoende slumpvariabler där för alla . Låt och låt . Sedan, för alla ,

och som en omedelbar konsekvens,

Det finns starkare förbättringar av denna analys i vissa distributionsberoende scenarier, som de som uppstår i inlärningsteori .

Sub-Gaussiska och subexponentiella normer

Låt e centrerade villkorliga versionen av en funktion vara

så att är en slumpmässig variabel beroende på slumpmässiga värden på .

McDiarmid's Inequality (Sub-Gaussian norm) Låt vara en funktion. Betrakta oberoende slumpvariabler där för alla .

Låt hänvisa till den e centrerade villkorliga versionen av . Låt beteckna den sub-Gaussiska normen för en slumpvariabel.

Sedan, för alla ,

McDiarmid's Inequality (Sub-exponentiell norm) Låt vara en funktion. Betrakta oberoende slumpvariabler där för alla .

Låt hänvisa till den e centrerade villkorliga versionen av . Låt beteckna den subexponentiella normen för en slumpvariabel.

Sedan, för alla ,

Bennett och Bernstein bildar

Förfiningar av McDiarmids ojämlikhet i stil med Bennetts ojämlikhet och Bernstein-ojämlikheter möjliggörs genom att definiera en variansterm för varje funktionsargument. Låta

McDiarmid's Inequality (Bennett-form) Låt tillfredsställa egenskapen bounded differences med gränser . Betrakta oberoende slumpvariabler där för alla . Låt och definieras som i början av detta avsnitt.

Sedan, för alla ,

McDiarmid's Inequality (Bernstein-form) Låt tillfredsställa egenskapen bounded differences med gränser . Låt och definieras som i början av detta avsnitt.

Sedan, för alla ,

Bevis

Följande bevis på McDiarmids ojämlikhet konstruerar Doob-martingalen som spårar det villkorliga förväntade värdet av funktionen när fler och fler av dess argument samplas och betingas, och sedan tillämpar en martingalkoncentrationsojämlikhet ( Azumas ojämlikhet) . Ett alternativt argument som undviker användningen av martingaler finns också, som drar fördel av funktionsargumentens oberoende för att tillhandahålla ett Chernoff-bundet -liknande argument.

För bättre läsbarhet kommer vi att introducera en notationsstenografi: kommer att beteckna för alla och heltal så att t.ex.

Välj valfri . Sedan, för alla genom triangelolikhet ,

och därmed är avgränsad.

Eftersom är avgränsad, definiera Doob-martingalen (varje är en slumpvariabel beroende på slumpen värden på som

för alla och , så att .

Definiera nu de slumpmässiga variablerna för varje

Eftersom är oberoende av varandra, påverkar inte villkoret på sannolikheter för de andra variablerna, så dessa är lika med uttrycken

Observera att . Dessutom,

Om vi ​​sedan tillämpar den allmänna formen av Azumas ojämlikhet har vi

Den ensidiga gränsen i den andra riktningen erhålls genom att tillämpa Azumas olikhet på och den tvåsidiga gränsen följer av en unionsbunden .

Se även