Ojämlikhet i informationsteori
I informationsteorin begränsar Bretagnolle–Huber-olikheten det totala variationsavståndet mellan två sannolikhetsfördelningar och av en konkav och begränsad funktion av Kullback-Leibler-divergensen . Bindningen kan ses som ett alternativ till den välkända Pinskers ojämlikhet : när är stor (större än 2 för instans.), Pinskers ojämlikhet är tom, medan Bretagnolle-Huber förblir begränsad och därmed icke-tom. Det används i statistik och maskininlärning för att bevisa informationsteoretiska nedre gränser baserat på hypotestestning
Formellt uttalande
Preliminära definitioner
Låt och vara två sannolikhetsfördelningar på ett mätbart utrymme . Kom ihåg att den totala variationen mellan och definieras av
Kullback -Leibler-divergensen definieras enligt följande:
I ovanstående står notationen för absolut kontinuitet av med avseende på , och står för Radon–Nikodym-derivatan av med avseende på .
Allmänt uttalande
Ojämlikheten mellan Bretagnolle och Huber säger:
Alternativ version
Följande version antyds direkt av bunden ovan men vissa författare föredrar att uttrycka det så här. Låt vara vilken händelse som helst. Sedan
där är komplementet till .
I själva verket, per definition av den totala variationen, för alla ,
Om vi arrangerar om får vi den påstådda nedre gränsen på .
Bevis
Vi bevisar huvudpåståendet efter idéerna i Tsybakovs bok (Lemma 2.6, sidan 89), som skiljer sig från originalbeviset (se C.Canonnes anteckning för en moderniserad omskrivning av deras argument).
Beviset är i två steg:
1. Bevisa med Cauchy–Schwarz att den totala variationen är relaterad till Bhattacharyya-koefficienten (höger sida av ojämlikheten):
2. Bevisa genom en smart tillämpning av Jensens ojämlikhet att
- Lägg först märke till att
- beteckna att så att . Sedan kan vi skriva om
- bort vi får båda identiteterna.
- Då
- eftersom
- Vi skriver och tillämpa Jensens olikhet :
- resultaten av steg 1 och 2 leder till den anspråkade gränsen för den totala varianten.
Exempel på applikationer
Exempel på komplexitet för partiska myntkast
Frågan är hur många myntkast behöver jag för att skilja ett rättvist mynt från ett partiskt?
Antag att du har 2 mynt, ett rättvist mynt ( Bernoulli fördelat med medelvärde ) och ett -förspänt mynt ( ). Sedan, för att identifiera det partiska myntet med sannolikhet minst (för vissa ), åtminstone
För att erhålla denna nedre gräns kräver vi att det totala variationsavståndet mellan två sekvenser av sampel är minst . Detta beror på att den totala variationen övre gränsen för sannolikheten för att under- eller överskatta myntens medel. Beteckna och de respektive gemensamma fördelningarna av de myntkasten för varje mynt, sedan
Vi har
Resultatet erhålls genom att ordna om termerna.
Informationsteoretisk nedre gräns för k -armade banditspel
I flerarmad bandit kan en nedre gräns för minimax-ångret för någon banditalgoritm bevisas med Bretagnolle-Huber och dess konsekvens på hypotestestning (se kapitel 15 i Bandit Algorithms ).
Historia
Resultatet bevisades första gången 1979 av Jean Bretagnolle och Catherine Huber, och publicerades i handlingarna av Strasbourg Probability Seminar. Alexandre Tsybakovs bok innehåller en tidig återpublicering av ojämlikheten och dess tillskrivning till Bretagnolle och Huber, som presenteras som en tidig och mindre allmän version av Assouads lemma (se not 2.8). En ständig förbättring av Bretagnolle–Huber bevisades 2014 som en konsekvens av en förlängning av Fanos Inequality .
Se även