Styv ekvation

I matematik är en styv ekvation en differentialekvation för vilken vissa numeriska metoder för att lösa ekvationen är numeriskt instabila , om inte stegstorleken tas för att vara extremt liten. Det har visat sig svårt att formulera en exakt definition av styvhet, men huvudtanken är att ekvationen innehåller några termer som kan leda till snabb variation i lösningen.

När man integrerar en differentialekvation numeriskt skulle man förvänta sig att den erforderliga stegstorleken är relativt liten i ett område där lösningskurvan uppvisar mycket variation och vara relativt stor där lösningskurvan rätar ut för att närma sig en linje med lutning nästan noll. För vissa problem är detta inte fallet. För att en numerisk metod ska ge en tillförlitlig lösning på differentialsystemet krävs ibland att stegstorleken är på en oacceptabelt liten nivå i ett område där lösningskurvan är mycket jämn. Fenomenet är känt som stelhet . I vissa fall kan det finnas två olika problem med samma lösning, men det ena är inte stelt och det andra är det. Fenomenet kan därför inte vara en egenskap hos den exakta lösningen, eftersom denna är densamma för båda problemen, och måste vara en egenskap hos själva differentialsystemet. Sådana system kallas därför stela system .

Motiverande exempel

Explicita numeriska metoder som uppvisar instabilitet när en styv vanlig differentialekvation integreras

Tänk på problemet med initialvärde

 

 

 

 

()

Den exakta lösningen (visas i cyan) är

 

 

 

 

()

Vi söker en numerisk lösning som uppvisar samma beteende.

Figuren (höger) illustrerar de numeriska frågorna för olika numeriska integratörer som tillämpas på ekvationen.

  1. Eulers metod med stegstorleken oscillerar vilt och lämnar snabbt grafens intervall (visas i rött).
  2. Eulers metod med halva stegstorleken, ger en lösning inom grafens gränser, men svänger omkring noll (visas i grönt).
  3. Den trapetsformade metoden (det vill säga tvåstegs Adams–Moulton-metoden) ges av

     

     

     

     

    ()

    där . Att tillämpa denna metod istället för Eulers metod ger ett mycket bättre resultat (blått). De numeriska resultaten minskar monotont till noll, precis som den exakta lösningen gör.

Ett av de mest framträdande exemplen på de styva vanliga differentialekvationerna (ODEs) är ett system som beskriver Robertsons kemiska reaktion :

 

 

 

 

()

Om man behandlar detta system med ett kort intervall, till exempel, är det inga problem med numerisk integration. Men om intervallet är mycket stort (säg 10 11 ), så kan många standardkoder inte integrera det korrekt.

Ytterligare exempel är uppsättningarna av ODE som är ett resultat av den tidsmässiga integrationen av stora kemiska reaktionsmekanismer. Här uppstår stelheten från samexistensen av mycket långsamma och mycket snabba reaktioner. [ citat behövs ] För att lösa dem kan mjukvarupaketen KPP och Autochem användas.

Styvhetsförhållande

Betrakta den linjära konstantkoefficienten inhomogena systemet

 

 

 

 

()

där och är en konstant, diagonaliserbar, matris med egenvärden (antagna distinkta) och motsvarande egenvektorer . Den allmänna lösningen av ( 5 ) har formen

 

 

 

 

()

där är godtyckliga konstanter och är en speciell integral. Låt oss nu anta det

 

 

 

 

()

vilket innebär att var och en av termerna som , så att lösningen närmar sig asymptotiskt som ; termen kommer att förfalla monotont om är verklig och sinusformigt om är komplex.

Att tolka som tid (som det ofta är vid fysiska problem), kallas den transienta lösningen och den stabila- statlig lösning . Om är stor, då motsvarande term kommer att avta snabbt när ökar och kallas därför en snabb transient ; om är liten, motsvarande term sönderfaller långsamt och kallas en långsam transient . Låt definieras av

 

 

 

 

()

så att är den snabbaste transienten och . Vi definierar nu styvhetsförhållandet som

 

 

 

 

()

Karakterisering av stelhet

I det här avsnittet behandlar vi olika aspekter av fenomenet stelhet. "Fenomen" är förmodligen ett mer passande ord än "egenskap", eftersom det senare snarare antyder att styvhet kan definieras i exakta matematiska termer; det visar sig inte vara möjligt att göra detta på ett tillfredsställande sätt, även för den begränsade klassen av linjära konstantkoefficientsystem. Vi ska också se flera kvalitativa påståenden som kan göras (och mestadels har gjorts) i ett försök att kapsla in begreppet stelhet, och ange vad som förmodligen är det mest tillfredsställande av dessa som en "definition" av stelhet.

JD Lambert definierar styvhet enligt följande:

Om en numerisk metod med en ändlig region av absolut stabilitet , applicerad på ett system med några initiala villkor , tvingas använda i ett visst integrationsintervall en steglängd som är överdrivet liten i förhållande till jämnheten hos den exakta lösningen i det intervallet , då sägs systemet vara stelt i det intervallet.

Det finns andra egenskaper som uppvisas av många exempel på stelproblem, men för varje finns det motexempel, så dessa egenskaper gör inte bra definitioner av stelhet. Icke desto mindre är definitioner baserade på dessa egenskaper i vanligt bruk av vissa författare och är goda ledtrådar om förekomsten av stelhet. Lambert hänvisar till dessa som "uttalanden" snarare än definitioner, av ovannämnda skäl. Några av dessa är:

  1. Ett linjärt konstant koefficientsystem är styvt om alla dess egenvärden har negativ reell del och styvhetsförhållandet är stort.
  2. Styvhet uppstår när stabilitetskraven, snarare än de för noggrannhet, begränsar steglängden.
  3. Stelhet uppstår när vissa komponenter i lösningen sönderfaller mycket snabbare än andra.

Etymologi

Ursprunget till termen "styvhet" har inte klarlagts. Enligt Joseph Oakland Hirschfelder används termen "styv" eftersom sådana system motsvarar tät koppling mellan föraren och driven i servomekanismer . Enligt Richard. L. Burden och J. Douglas Faires,

Betydande svårigheter kan uppstå när vanliga numeriska tekniker tillämpas för att approximera lösningen av en differentialekvation när den exakta lösningen innehåller termer av formen där är ett komplext tal med negativ reell del.

. . .

Problem som involverar snabbt sönderfallande transienta lösningar förekommer naturligt i en mängd olika tillämpningar, inklusive studiet av fjäder- och dämpningssystem, analys av styrsystem och problem inom kemisk kinetik . Dessa är alla exempel på en klass av problem som kallas styva (matematisk styvhet) system av differentialekvationer, på grund av deras tillämpning vid analys av rörelsen hos fjäder- och masssystem som har stora fjäderkonstanter ( fysisk styvhet ) .

Till exempel initialvärdesproblemet

 

 

 

 

()

med , , , kan skrivas i formen ( 5 ) med och

 

 

 

 

()

och har egenvärden . Båda egenvärdena har negativ reell del och styvhetsförhållandet är

 

 

 

 

()

som är ganska stor. System ( 10 ) uppfyller då säkert påståendena 1 och 3. Här är fjäderkonstanten stor och dämpningskonstanten är ännu större. (medan "stor" inte är en tydligt definierad term, men ju större kvantiteterna ovan är, desto mer uttalad blir effekten av stelhet.) Den exakta lösningen på ( 10 ) är

 

 

 

 

()

Ekvation 13 beter sig ganska likt en enkel exponentiell , men närvaron av termen med en liten koefficient, är tillräckligt för att göra den numeriska beräkningen mycket känslig för stegstorlek. Stabil integration av ( 10 ) kräver en mycket liten stegstorlek tills långt in i den jämna delen av lösningskurvan, vilket resulterar i ett fel som är mycket mindre än vad som krävs för noggrannhet. Systemet uppfyller således även påstående 2 och Lamberts definition.

A-stabilitet

stela problem kan analyseras genom att tillämpa dessa metoder på testekvationen under förutsättning att initialvillkoret med . Lösningen av denna ekvation är . Denna lösning närmar sig noll som när Om den numeriska metoden också uppvisar detta beteende ( för en fast stegstorlek), sägs metoden vara A-stabil. En numerisk metod som är L-stabil (se nedan) har den starkare egenskapen att lösningen närmar sig noll i ett enda steg när stegstorleken går till oändlighet. A-stabila metoder uppvisar inte de instabilitetsproblem som beskrivs i det motiverande exemplet.

Runge–Kutta metoder

Runge–Kutta-metoder som tillämpas på testekvationen har formen , och, genom induktion, . Funktionen kallas stabilitetsfunktionen . Således är villkoret att som ekvivalent med . Detta motiverar definitionen av regionen med absolut stabilitet (ibland hänvisad till helt enkelt som stabilitetsregion ), som är mängden . Metoden är A-stabil om regionen med absolut stabilitet innehåller mängden , det vill säga det vänstra halvplanet.

Exempel: Eulermetoderna

Den rosa skivan visar stabilitetsområdet för Eulermetoden.

Tänk på Euler-metoderna ovan. Den explicita Euler-metoden som tillämpas på testekvationen är

Därför är ϕ . Området för absolut stabilitet för denna metod är således på höger. Eulermetoden är inte A-stabil.

Det motiverande exemplet hade . Värdet på z när man tar stegstorlek är som är utanför stabilitetsområdet. Faktum är att de numeriska resultaten inte konvergerar till noll. Men med stegstorlek har vi som är precis innanför stabilitetsområdet och det numeriska resultaten konvergerar till noll, om än ganska långsamt.

Exempel: trapetsformad metod

Det rosa området är stabilitetsområdet för den trapetsformade metoden.

Tänk på den trapetsformade metoden

när den tillämpas på testekvationen , är

Lösning för ger

Således är stabilitetsfunktionen

och regionen med absolut stabilitet är

Denna region innehåller det vänstra halvplanet, så den trapetsformade metoden är A-stabil. Faktum är att stabilitetsområdet är identiskt med det vänstra halvplanet, och därför konvergerar den numeriska lösningen av och bara om den exakta lösningen gör det. Ändå har den trapetsformade metoden inte perfekt beteende: den dämpar alla sönderfallande komponenter, men snabbt sönderfallande komponenter dämpas endast mycket milt, eftersom som . Detta ledde till konceptet L-stabilitet : en metod är L-stabil om den är A-stabil och som . Den trapetsformade metoden är A-stabil men inte L-stabil. Den implicita Euler-metoden är ett exempel på en L-stabil metod.

Allmän teori

Stabilitetsfunktionen för en Runge–Kutta-metod med koefficienterna och ges av

där anger vektorn med alla ettor. Detta är en rationell funktion (ett polynom dividerat med ett annat).

Explicita Runge–Kutta-metoder har en strikt lägre triangulär koefficientmatris och därför är deras stabilitetsfunktion ett polynom. Det följer att explicita Runge–Kutta-metoder inte kan vara A-stabila.

Stabilitetsfunktionen hos implicita Runge–Kutta-metoder analyseras ofta med hjälp av ordningsstjärnor. Ordningsstjärnan för en metod med stabilitetsfunktion definieras som mängden . En metod är A-stabil om och endast om dess stabilitetsfunktion inte har några poler i det vänstra planet och dess ordningsstjärna inte innehåller några rent imaginära tal.

Flerstegsmetoder

Linjära flerstegsmetoder har formen

Tillämpade på testekvationen blir de

vilket kan förenklas till

där . Detta är ett linjärt återkommande förhållande . Metoden är A-stabil om alla lösningar av återfallsrelationen konvergerar till noll när . Det karakteristiska polynomet är

Alla lösningar konvergerar till noll för ett givet värde på om alla lösningar av ligger i enheten cirkel.

Området för absolut stabilitet för en flerstegsmetod av ovanstående form är då mängden av alla för vilka alla så att uppfyller . Återigen, om denna uppsättning innehåller det vänstra halvplanet, sägs flerstegsmetoden vara A-stabil.

Exempel: Andra ordningens Adams–Bashforth-metoden

Den rosa regionen är stabilitetsregionen för andra ordningens Adams–Bashforth-metoden.

Låt oss bestämma området för absolut stabilitet för tvåstegs Adams–Bashforth-metoden

Det karakteristiska polynomet är

som har rötter

sålunda är regionen med absolut stabilitet

Denna region visas till höger. Den inkluderar inte hela det vänstra halvplanet (i själva verket inkluderar det bara den reella axeln mellan så Adams–Bashforth-metoden är inte A-stabil.

Allmän teori

Explicita flerstegsmetoder kan aldrig vara A-stabila, precis som explicita Runge–Kutta-metoder. Implicita flerstegsmetoder kan bara vara A-stabila om deras ordning är högst 2. Det senare resultatet är känt som den andra Dahlquist -barriären; det begränsar användbarheten av linjära flerstegsmetoder för stela ekvationer. Ett exempel på en andra ordningens A-stabil metod är trapetsregeln som nämns ovan, som också kan betraktas som en linjär flerstegsmetod.

Se även

Anteckningar

  1. ^ Robertson, HH (1966). "Lösningen av en uppsättning reaktionshastighetsekvationer". Numerisk analys: en introduktion . Akademisk press. s. 178–182.
  2. ^ Lambert (1992 , s. 216–217)
  3. ^ Lambert (1992 , s. 217–220)
  4. ^ Hirshfelder (1963)
  5. ^ Burden & Faires (1993 , s. 314)
  6. ^ Kreyszig (1972 , s. 62–68)
  7. ^ Denna definition beror på Dahlquist (1963) .
  8. ^ Definitionen av L-stabilitet beror på Ehle (1969) .
  9. ^ Definitionen beror på Wanner, Hairer & Nørsett (1978) ; se även Iserles & Nørsett (1991) .
  10. ^ Se Dahlquist (1963) .

externa länkar