Trust region

I matematisk optimering är en förtroenderegion delmängden av regionen av målfunktionen som approximeras med hjälp av en modellfunktion (ofta en kvadratisk ). Om en adekvat modell av den objektiva funktionen hittas inom förtroenderegionen, så utökas regionen; omvänt, om approximationen är dålig, är regionen kontrakterad.

Passformen utvärderas genom att jämföra förhållandet mellan förväntad förbättring från modellapproximationen med den faktiska förbättring som observerats i objektivfunktionen. Enkel tröskelvärde för förhållandet används som kriterium för expansion och kontraktion – en modellfunktion är "betrodd" endast i den region där den ger en rimlig approximation.

Trust-region-metoder är i någon mening dubbla till linjesökningsmetoder : trust-region-metoder väljer först en stegstorlek (storleken på trustregionen) och sedan en stegriktning, medan linjesökningsmetoder först väljer en stegriktning och sedan en stegstorlek.

Den allmänna idén bakom metoder för förtroenderegioner är känd under många namn; den tidigaste användningen av termen verkar vara av Sorensen (1982). En populär lärobok av Fletcher (1980) kallar dessa algoritmer för begränsade stegmetoder . Dessutom hänvisar Goldfeld , Quandt och Trotter (1966 ) i ett tidigt grundarbete om metoden till den som kvadratisk bergsklättring .

Exempel

Begreppsmässigt, i Levenberg–Marquardt-algoritmen , approximeras objektivfunktionen iterativt av en kvadratisk yta , och sedan med hjälp av en linjär lösare uppdateras uppskattningen. Detta ensamt kanske inte konvergerar bra om den initiala gissningen är för långt från det optimala. Av denna anledning begränsar algoritmen istället varje steg, vilket förhindrar att det går "för långt". Den operationaliserar "för långt" enligt följande. Istället för att lösa för den ⁡ är diagonal matris med samma diagonal som A och λ är en parameter som styr storleken på förtroenderegionen. Geometriskt lägger detta till en paraboloid centrerad vid till den kvadratiska formen , vilket resulterar i ett mindre steg.

Tricket är att ändra storleken på förtroenderegionen (λ). Vid varje iteration förutsäger den dämpade kvadratiska passningen en viss minskning av kostnadsfunktionen, som vi skulle förvänta oss vara en mindre minskning än den verkliga minskningen. Givet , kan vi utvärdera

Genom att titta på förhållandet vi justera storleken på tillitsregionen. I allmänhet förväntar vi oss att är lite mindre än och så förhållandet skulle vara mellan, säg, 0,25 och 0,5. Om förhållandet är mer än 0,5 dämpar vi steget för mycket, så expandera förtroendeområdet (minska λ) och iterera. Om förhållandet är mindre än 0,25, så avviker den sanna funktionen "för mycket" från approximationen av förtroenderegionen, så krymp förtroenderegionen (öka λ) och försök igen.

externa länkar