Implicit metod med alternerande riktning
I numerisk linjär algebra är den alternerande riktningen implicita (ADI) metoden en iterativ metod som används för att lösa Sylvester matrisekvationer . Det är en populär metod för att lösa de stora matrisekvationerna som uppstår i systemteori och styrning , och kan formuleras för att konstruera lösningar i en minneseffektiv, faktoriserad form. Den används också för att numeriskt lösa paraboliska och elliptiska partiella differentialekvationer, och är en klassisk metod som används för att modellera värmeledning och lösa diffusionsekvationen i två eller flera dimensioner. Det är ett exempel på en metod för operatörsdelning .
ADI för matrisekvationer
Metoden
ADI-metoden är en iterationsprocess i två steg som växelvis uppdaterar kolumn- och radutrymmen för en ungefärlig lösning till . En ADI-iteration består av följande steg:
1. Lös för , där
2. Lös för , där .
Siffrorna kallas skiftparametrar, och konvergens beror starkt på valet av dessa parametrar. För att utföra iterationer av ADI, krävs en initial gissning såväl som skiftparametrar, .
När ska man använda ADI
Om och , då kan lösas direkt i med Bartels-Stewart-metoden . Det är därför bara fördelaktigt att använda ADI när matris-vektormultiplikation och linjära lösningar som involverar och kan tillämpas billigt.
Ekvationen har en unik lösning om och bara om , där är spektrumet för . ADI-metoden fungerar dock särskilt bra när och är väl åtskilda, och och är normala matriser . Dessa antaganden uppfylls till exempel av Lyapunovs ekvation när är positiv definitiv . Under dessa antaganden är nästan optimala skiftparametrar kända för flera val av och . Dessutom kan a priori felgränser beräknas, vilket eliminerar behovet av att övervaka restfelet vid implementering.
ADI-metoden kan fortfarande tillämpas när ovanstående antaganden inte är uppfyllda. Användningen av suboptimala skiftparametrar kan påverka konvergensen negativt, och konvergensen påverkas också av icke-normaliteten hos eller (ibland fördelaktigt). Krylov subrymdmetoder , såsom Rational Krylov Subspace Method, observeras vanligtvis konvergera snabbare än ADI i denna miljö, och detta har lett till utvecklingen av hybrida ADI-projektionsmetoder.
Val av skiftparameter och ADI-felekvationen
Problemet med att hitta bra växlingsparametrar är inte trivialt. Detta problem kan förstås genom att undersöka ADI-felekvationen. Efter iterationer ges felet av
Att välja resulterar i följande gräns för det relativa felet:
där är operatornormen . Den ideala uppsättningen av skiftparametrar definierar en rationell funktion som minimerar kvantiteten . Om och är normala matriser och har egenuppdelningar och sedan
.
Nästan optimala växlingsparametrar
Nästan optimala skiftparametrar är kända i vissa fall, som när och , där och är disjunkta intervall på den verkliga linjen. Lyapunovs ekvation till exempel, uppfyller dessa antaganden när är positiv definitiv . I det här fallet kan skiftparametrarna uttryckas i sluten form med elliptiska integraler och kan enkelt beräknas numeriskt.
Mer allmänt, om de är stängda, disjunkta uppsättningar och , där och är kända, löses det optimala skiftparametervalsproblemet ungefär genom att hitta en extremal rationell funktion som uppnår värdet
där infimum tas över alla rationella funktioner av grad . Detta approximationsproblem är relaterat till flera resultat i potentiell teori , och löstes av Zolotarev 1877 för = [a, b] och Lösningen är också känd när och är disjunkta skivor i det komplexa planet.
Heuristiska skiftparameterstrategier
När mindre är känt om och , eller när eller är icke -normala matriser, kanske det inte går att hitta nära optimala skiftparametrar. I den här inställningen kan en mängd olika strategier för att generera bra skiftparametrar användas. Dessa inkluderar strategier baserade på asymptotiska resultat i potentiell teori, med användning av Ritz-värdena för matriserna , B och för att formulera ett girigt tillvägagångssätt, och cykliska metoder, där samma lilla samling skiftparametrar återanvänds tills en konvergenstolerans uppfylls. När samma skiftparameter används vid varje iteration, är ADI ekvivalent med en algoritm som kallas Smiths metod.
Faktoriserad ADI
I många applikationer är och mycket stora, glesa matriser, och kan faktoriseras som , där , med . I en sådan inställning kanske det inte är möjligt att lagra den potentiellt täta matrisen explicit. En variant av ADI, kallad factored ADI, kan användas för att beräkna , där . Effektiviteten av faktoriserad ADI beror på om är väl approximerad av en matris med låg rangordning. Detta är känt för att vara sant under olika antaganden om och .
ADI för paraboliska ekvationer
Historiskt har ADI-metoden utvecklats för att lösa 2D-diffusionsekvationen på en kvadratisk domän med ändliga skillnader. Till skillnad från ADI för matrisekvationer kräver ADI för paraboliska ekvationer inte valet av skiftparametrar, eftersom skiftet som uppträder i varje iteration bestäms av parametrar som tidssteg, diffusionskoefficient och rutnätsavstånd. Kopplingen till ADI på matrisekvationer kan observeras när man beaktar verkan av ADI-iterationen på systemet vid steady state.
Exempel: 2D diffusionsekvation
Den traditionella metoden för att lösa värmeledningsekvationen numeriskt är Crank–Nicolson-metoden . Denna metod resulterar i en mycket komplicerad uppsättning ekvationer i flera dimensioner, som är kostsamma att lösa. Fördelen med ADI-metoden är att de ekvationer som ska lösas i varje steg har en enklare struktur och kan lösas effektivt med den tridiagonala matrisalgoritmen .
Betrakta den linjära diffusionsekvationen i två dimensioner,
Den implicita Crank–Nicolson-metoden producerar följande finita differensekvation:
var:
och är den centrala andra differensoperatorn för den p -:te koordinaten
med eller för respektive (och en stenografi för gitterpunkter .
Efter att ha utfört en stabilitetsanalys kan det visas att denna metod kommer att vara stabil för alla .
En nackdel med Crank–Nicolson-metoden är att matrisen i ovanstående ekvation är bandad med en bandbredd som i allmänhet är ganska stor. Detta gör direkt lösning av systemet med linjära ekvationer ganska kostsam (även om det finns effektiva ungefärliga lösningar, till exempel användning av den konjugerade gradientmetoden förutsatt med ofullständig Cholesky-faktorisering ).
Tanken bakom ADI-metoden är att dela upp de finita differensekvationerna i två, en med x -derivatan tagen implicit och nästa med y -derivatan tagen implicit,
Det involverade ekvationssystemet är symmetriskt och tridiagonalt (bandbredd 3) och löses vanligtvis med hjälp av tridiagonal matrisalgoritm .
Det kan visas att denna metod är ovillkorligt stabil och andra ordningen i tid och rum. Det finns mer förfinade ADI-metoder som Douglas metoder, eller f-faktormetoden som kan användas för tre eller flera dimensioner.
Generaliseringar
Användningen av ADI-metoden som ett operatörsdelningsschema kan generaliseras. Det vill säga, vi kan överväga allmänna evolutionsekvationer
där och är (möjligen olinjära) operatorer definierade på ett Banach-mellanslag. I diffusionsexemplet ovan har vi och .
Fundamental ADI (FADI)
Förenkling av ADI till FADI
Det är möjligt att förenkla den konventionella ADI-metoden till Fundamental ADI-metoden, som bara har liknande operatörer på vänster sida samtidigt som den är operatörsfri på höger sida. Detta kan betraktas som det grundläggande (grundläggande) schemat för ADI-metoden, utan fler operatorer (som ska reduceras) till höger, till skillnad från de flesta traditionella implicita metoder som vanligtvis består av operatorer på båda sidor av ekvationerna. FADI-metoden leder till enklare, mer koncisa och effektiva uppdateringsekvationer utan att försämra noggrannheten hos den konventionella ADI-metoden.
Relationer till andra implicita metoder
Många klassiska implicita metoder av Peaceman-Rachford, Douglas-Gunn, D'Yakonov, Beam-Warming, Crank-Nicolson, etc., kan förenklas till grundläggande implicita scheman med operatörsfria högersidor. I sina grundläggande former kan FADI-metoden för andra ordningens tids noggrannhet relateras nära till den grundläggande lokalt endimensionella (FLOD) metoden, som kan uppgraderas till andra ordningens tids noggrannhet, såsom för tredimensionella Maxwells ekvationer i beräkningselektromagnetik . För två- och tredimensionella värmelednings- och diffusionsekvationer kan både FADI- och FLOD-metoder implementeras på enklare, mer effektivt och stabilt sätt jämfört med deras konventionella metoder.