Smidigt max

Inom matematik är ett jämnt maximum av en indexerad familj x 1 , ..., x n av tal en jämn approximation till den maximala funktionen betyder en parametrisk familj av funktioner så att för varje α är funktionen jämn, och familjen konvergerar till den maximala funktionen som . Begreppet jämnt minimum definieras på liknande sätt. I många fall approximerar en enda familj båda: maximum när parametern går till positiv oändlighet, minimum när parametern går till negativ oändlighet; i symboler, som och som . Termen kan också användas löst för en specifik smidig funktion som beter sig liknande till ett maximum, utan att nödvändigtvis vara en del av en parametriserad familj.

Exempel

Boltzmann-operatör

Smoothmax på (−x, x) kontra x för olika parametervärden. Mycket jämn för =0,5, och skarpare för =8.

För stora positiva värden på parametern är följande formulering en jämn, differentierbar approximation av den maximala funktionen. För negativa värden på parametern som är stora i absoluta värden, approximerar den minimum.

har följande egenskaper:

  1. som
  2. är det aritmetiska medelvärdet av dess indata
  3. som

Gradienten för är nära relaterad till softmax och ges av

Detta gör softmax-funktionen användbar för optimeringstekniker som använder gradientnedstigning .

Denna operatör kallas ibland Boltzmann-operatören, efter Boltzmann-distributionen .

LogSumExp

Ett annat smidigt maximum är LogSumExp :

Detta kan också normaliseras om alla är icke-negativa, vilket ger en funktion med domänen och range :

Termen korrigerar för det faktum att genom att ta bort alla exponentiala utom en noll och om alla är noll.

Mellowmax

Mellowmax-operatorn definieras enligt följande:

Det är en icke-expansiv operatör. Som fungerar det som ett maximum. Som fungerar det som ett aritmetiskt medelvärde. Som , fungerar det som ett minimum. Denna operator kan ses som en speciell instansiering av det kvasiaritmetiska medelvärdet . Den kan också härledas från informationsteoretiska principer som ett sätt att reglera policyer med en kostnadsfunktion definierad av KL-divergens. Operatören har tidigare använts inom andra områden, till exempel kraftteknik.

p-norm

Ett annat jämnt maximum är p-normen :

som konvergerar till som .

En fördel med p-normen är att den är en norm . Som sådan är den skalinvariant ( homogen ): , och den uppfyller triangelolikheten .

Smidig maximal enhet

Följande binära operator kallas Smooth Maximum Unit (SMU):

där är en parameter. Som , och därmed .

Se även

https://www.johndcook.com/soft_maximum.pdf

M. Lange, D. Zühlke, O. Holz och T. Villmann, "Tillämpningar av lp-normer och deras smidiga approximationer för gradientbaserad inlärningsvektorkvantisering," i Proc. ESANN , april 2014, s. 271-276. ( https://www.elen.ucl.ac.be/Proceedings/esann/esannpdf/es2014-153.pdf )