Variationskalkyl

Variationskalkylen (eller Variationskalkylen) är ett fält för matematisk analys som använder variationer, som är små förändringar i funktioner och funktionaler , för att hitta maxima och minima för funktionaler: avbildningar från en uppsättning funktioner till de reella talen . Funktionaler uttrycks ofta som bestämda integraler som involverar funktioner och deras derivator . Funktioner som maximerar eller minimerar funktionaliteter kan hittas med Euler–Lagrange-ekvationen för variationskalkylen.

Ett enkelt exempel på ett sådant problem är att hitta kurvan med kortast längd som förbinder två punkter. Om det inte finns några begränsningar är lösningen en rät linje mellan punkterna. Men om kurvan är begränsad till att ligga på en yta i rymden, är lösningen mindre uppenbar, och det kan finnas många lösningar. Sådana lösningar är kända som geodetik . Ett relaterat problem utgörs av Fermats princip : ljus följer den kortaste optiska längden som förbinder två punkter, vilket beror på mediets material. Ett motsvarande begrepp inom mekanik är principen om minsta/stationära verkan .

Många viktiga problem involverar funktioner av flera variabler. Lösningar av gränsvärdesproblem för Laplace-ekvationen uppfyller Dirichlets princip . Plataus problem kräver att man hittar en yta med minimal yta som spänner över en given kontur i rymden: en lösning kan ofta hittas genom att doppa en ram i tvålvatten. Även om sådana experiment är relativt lätta att utföra, är deras matematiska formulering långt ifrån enkel: det kan finnas mer än en lokalt minimerande yta, och de kan ha icke-trivial topologi .

Historia

Variationskalkylen kan sägas börja med Newtons minimala resistansproblem 1687, följt av brachistochrone kurvproblem som togs upp av Johann Bernoulli (1696). Det upptog omedelbart Jakob Bernoullis och markisen de l'Hôpital uppmärksamhet , men Leonhard Euler utarbetade först ämnet, med början 1733. Lagrange påverkades av Eulers arbete för att bidra väsentligt till teorin. Efter att Euler såg 1755 års arbete av den 19-åriga Lagrange, släppte Euler sin egen delvis geometriska strategi till förmån för Lagranges rent analytiska tillvägagångssätt och döpte om ämnet till variationskalkylen i sin föreläsning från 1756 Elementa Calculi Variationum .

Legendre (1786) fastställde en metod, inte helt tillfredsställande, för att särskilja maxima och minima. Isaac Newton och Gottfried Leibniz uppmärksammade också ämnet tidigt. Till denna diskriminering Vincenzo Brunacci (1810), Carl Friedrich Gauss (1829), Siméon Poisson (1831), Mikhail Ostrogradsky (1834) och Carl Jacobi (1837) varit bland bidragsgivarna. Ett viktigt allmänt arbete är Sarrus (1842) som kondenserades och förbättrades av Cauchy (1844). Andra värdefulla avhandlingar och memoarer har skrivits av Strauch (1849), Jellett (1850), Otto Hesse (1857), Alfred Clebsch (1858) och Lewis Buffett Carll (1885), men århundradets kanske viktigaste verk är att av Weierstrass . Hans berömda kurs i teorin är epokgörande, och det kan hävdas att han var den förste att placera den på en fast och otvivelaktig grund. Det 20:e och det 23:e Hilbertproblemet som publicerades 1900 uppmuntrade vidare utveckling.

Under 1900-talet gjorde bland andra David Hilbert , Oskar Bolza , Gilbert Ames Bliss , Emmy Noether , Leonida Tonelli , Henri Lebesgue och Jacques Hadamard betydande insatser. Marston Morse tillämpade kalkyl av variationer i vad som nu kallas Morse teori . Lev Pontryagin , Ralph Rockafellar och FH Clarke utvecklade nya matematiska verktyg för beräkning av variationer i optimal kontrollteori . Richard Bellmans dynamiska programmering är ett alternativ till variationskalkylen.

Extrema

Variationskalkylen handlar om maxima eller minima (kollektivt kallade extrema ) för funktionaler. En funktionell mappar funktioner till skalärer , så funktionaler har beskrivits som "funktioner av funktioner." Funktionaler har extrema med avseende på elementen i ett givet funktionsutrymme definierat över en given domän . En funktionell sägs ha ett extremum vid funktionen om har samma tecken för alla i ett godtyckligt litet område av Funktionen kallas en extremalfunktion eller extremal. Extremumet kallas ett lokalt maximum om överallt i en godtyckligt liten omgivning av och en lokalt minimum om där. För ett funktionsutrymme av kontinuerliga funktioner kallas extrema av motsvarande funktional starka extrema eller svaga extrema , beroende på om de första derivatorna av de kontinuerliga funktionerna alla är kontinuerliga eller inte.

Både starka och svaga extrema av funktionaler är för ett rum med kontinuerliga funktioner, men starka extrema har det ytterligare kravet att de första derivatorna av funktionerna i rummet är kontinuerliga. Ett starkt extremum är alltså också ett svagt extremum, men det omvända kanske inte håller. Att hitta starka extrema är svårare än att hitta svaga extrema. Ett exempel på ett nödvändigt villkor som används för att hitta svaga extrema är Euler–Lagrange-ekvationen .

Euler–Lagrange ekvation

Att hitta extrema för funktionaler liknar att hitta maxima och minima för funktioner. Maxima och minima för en funktion kan lokaliseras genom att hitta punkterna där dess derivata försvinner (dvs. är lika med noll). Extrema av funktionaler kan erhållas genom att hitta funktioner för vilka den funktionella derivatan är lika med noll. Detta leder till att lösa den associerade Euler-Lagrange-ekvationen .

Tänk på det funktionella

var
  • är konstanter ,
  • är två gånger kontinuerligt differentierbar,
  • är två gånger kontinuerligt differentierbar med avseende på dess argument och

Om den funktionella uppnår ett lokalt minimum vid och en godtycklig funktion som har minst en derivata och försvinner vid ändpunkterna och sedan för valfritt tal nära 0,

Termen kallas variationen av funktionen och betecknas med

Genom att ersätta för i den funktionella är resultatet en funktion av

Eftersom den funktionella har ett minimum för funktionen ett minimum vid och därmed,

Med den totala derivatan av där och betraktas som funktioner av snarare än ger

och eftersom och

Därför,

där när och vi har använt integration av delar på den andra termen. Den andra termen på den andra raden försvinner eftersom vid och per definition. Som tidigare nämnt är den vänstra sidan av ekvationen också noll så att

Enligt det fundamentala lemmat för variationskalkyl är den del av integranden inom parentes noll, dvs.

som kallas Euler–Lagrange-ekvationen . Den vänstra sidan av denna ekvation kallas den funktionella derivatan av och betecknas

Generellt ger detta en andra ordningens ordinarie differentialekvation som kan lösas för att erhålla extremalfunktionen Euler–Lagrange-ekvationen är ett nödvändigt , men inte tillräckligt , villkor för ett extremum Ett tillräckligt villkor för ett minimum anges i avsnittet Variationer och tillräckligt villkor för ett minimum .

Exempel

För att illustrera denna process, överväg problemet med att hitta extremalfunktionen som är den kortaste kurvan som förbinder två punkter och Båglängden på kurvan ges av

med
Observera att om man antar att y är en funktion av x förlorar man generaliteten; helst borde båda vara en funktion av någon annan parameter. Detta tillvägagångssätt är bra endast för lärorikt syfte.

Euler–Lagrange-ekvationen kommer nu att användas för att hitta extremalfunktionen som minimerar den funktionella

med

Eftersom inte förekommer explicit i den första termen i Euler–Lagrange-ekvationen för alla och därmed,

Ersätter och tar derivatan,

Således

för någon konstant Sedan
var
Lösning får vi
vilket innebär det
är en konstant och därför den kortaste kurvan som förbinder två punkter och är
och vi har alltså hittat extremalfunktionen som minimerar den funktionella så att är ett minimum. Ekvationen för en rät linje är Med andra ord är det kortaste avståndet mellan två punkter en rät linje.

Beltramis identitet

I fysikproblem kan det vara så att vilket betyder att integranden är en funktion av och men visas inte separat. I så fall kan Euler-Lagrange-ekvationen förenklas till Beltrami-identiteten

där är en konstant. Den vänstra sidan är Legendre-transformationen av med avseende på

Intuitionen bakom detta resultat är att om variabeln innebär påståendet att Lagrangian är tidsoberoende. Enligt Noethers teorem finns det en associerad konserverad kvantitet. I det här fallet är denna kvantitet Hamiltonian, Legendre-transformationen av Lagrangian, som (ofta) sammanfaller med systemets energi. Detta är (minus) konstanten i Beltramis identitet.

Euler-Poissons ekvation

Om beror på högre derivator av det vill säga om

då måste uppfylla Euler- Poisson -ekvationen,

Du Bois-Reymonds teorem

Diskussionen hittills har antagit att extrema funktioner har två kontinuerliga derivator, även om existensen av integralen endast kräver första derivator av försöksfunktioner. Villkoret att den första variationen försvinner vid en extremal kan betraktas som en svag form av Euler-Lagrange-ekvationen. Du Bois-Reymonds teorem hävdar att denna svaga form innebär den starka formen. Om har kontinuerliga första- och andraderivator med avseende på alla dess argument, och om

då har två kontinuerliga derivator, och den uppfyller Euler–Lagrange-ekvationen.

Lavrentiev-fenomen

Hilbert var den första som gav goda förutsättningar för Euler–Lagrange-ekvationerna att ge en stationär lösning. Inom ett konvext område och en positiv tre gånger differentierbar Lagrangian består lösningarna av en räknebar samling sektioner som antingen går längs gränsen eller uppfyller Euler–Lagrange-ekvationerna i det inre.

Men Lavrentiev 1926 visade att det finns omständigheter där det inte finns någon optimal lösning men man kan närma sig godtyckligt nära genom att öka antalet sektioner. Lavrentiev-fenomenet identifierar en skillnad i infimum av ett minimeringsproblem mellan olika klasser av tillåtna funktioner. Till exempel följande problem, presenterat av Manià 1934:

Tydligen minimerar den funktionella, men vi hittar vilken funktion som helst ger ett värde avgränsat från infimumet.

Exempel (i endimensionell) manifesteras traditionellt över och men Ball och Mizel skaffade den första funktionaliteten som visade Lavrentievs fenomen över och för Det finns flera resultat som ger kriterier under vilka fenomenet inte uppstår - till exempel 'standardtillväxt', en lagrangian utan beroende av den andra variabeln eller en approximativ sekvens tillfredsställer Cesaris tillstånd (D) - men resultaten är ofta speciella och applicerbara på en liten klass av funktionaliteter.

Kopplad till Lavrentiev-fenomenet är repulsionsegenskapen: alla funktionella som visar Lavrentievs fenomen kommer att visa den svaga repulsionsegenskapen.

Funktioner av flera variabler

Till exempel, om anger förskjutningen av ett membran ovanför domänen i -planet då är dess potentiella energi proportionell mot dess yta:

Plataus problem består i att hitta en funktion som minimerar ytan samtidigt som man antar föreskrivna värden på gränsen för ; lösningarna kallas minimala ytor . Euler-Lagrange-ekvationen för detta problem är olinjär:
Se Courant (1950) för detaljer.

Dirichlets princip

Det räcker ofta att endast beakta små förskjutningar av membranet, vars energiskillnad från ingen förskjutning approximeras av

Den funktionella ska minimeras bland alla testfunktioner som antar föreskrivna värden på gränsen för Om är minimeringsfunktionen och är en godtycklig jämn funktion som försvinner på gränsen till så är den första varianten av måste försvinna:
Förutsatt att u har två derivator kan vi tillämpa divergenssatsen för att erhålla
där är gränsen för är båglängden längs och är normalderivatan av Eftersom försvinner på och den första varianten försvinner, är resultatet
för alla smidiga funktioner v som försvinner på gränsen till Beviset för fallet med endimensionella integraler kan anpassas till detta fall för att visa att
i

Svårigheten med detta resonemang är antagandet att minimeringsfunktionen u måste ha två derivator. Riemann hävdade att förekomsten av en smidig minimeringsfunktion säkerställdes av sambandet med det fysiska problemet: membran antar verkligen konfigurationer med minimal potentiell energi. Riemann kallade denna idé för Dirichlet-principen för att hedra sin lärare Peter Gustav Lejeune Dirichlet . Weierstrass gav dock ett exempel på ett variationsproblem utan lösning: minimera

bland alla funktioner som uppfyller och kan göras godtyckligt liten genom att välja bitvis linjära funktioner som gör en övergång mellan −1 och 1 i ett litet område av origo. Det finns dock ingen funktion som gör att Så småningom visades det att Dirichlets princip är giltig, men den kräver en sofistikerad tillämpning av regularitetsteorin för elliptiska partiella differentialekvationer ; se Jost och Li–Jost (1998).

Generalisering till andra gränsvärdesproblem

Ett mer allmänt uttryck för den potentiella energin hos ett membran är

Detta motsvarar en extern kraftdensitet i en extern kraft på gränsen och elastiska krafter med modul som verkar på Funktionen som minimerar den potentiella energin utan begränsning av dess gränsvärden kommer att betecknas med Förutsatt att och är kontinuerliga, innebär regularitetsteori att minimeringsfunktionen kommer att ha två derivator. När du tar den första varianten behöver inget gränsvillkor ställas på inkrementet Den första varianten av ges av
Om vi ​​tillämpar divergenssatsen blir resultatet
Om vi ​​först sätter försvinner gränsintegralen, och vi drar slutsatsen som tidigare att
i Om vi ​​sedan tillåter att anta godtyckliga gränsvärden, innebär detta att måste uppfylla gränsvillkoret
Detta gränsvillkor är en konsekvens av minimeringsegenskapen för : det är inte påtvingat i förväg. Sådana förhållanden kallas naturliga randvillkor .

Det föregående resonemanget är inte giltigt om försvinner identiskt på I ett sådant fall skulle vi kunna tillåta en testfunktion där är en konstant. För en sådan testfunktion,

Genom lämpligt val av anta vilket värde som helst såvida inte kvantiteten inom parentesen försvinner. Därför är variationsproblemet meningslöst om inte
Detta tillstånd innebär att externa nettokrafter på systemet är i jämvikt. Om dessa krafter är i jämvikt har variationsproblemet en lösning, men det är inte unikt, eftersom en godtycklig konstant kan läggas till. Ytterligare detaljer och exempel finns i Courant och Hilbert (1953).

Egenvärdesproblem

Både endimensionella och flerdimensionella egenvärdesproblem kan formuleras som variationsproblem.

Sturm–Liouville problem

Egenvärdesproblemet Sturm–Liouville involverar en allmän kvadratisk form

där är begränsad till funktioner som uppfyller gränsvillkoren
Låt vara en normaliseringsintegral
Funktionerna och måste vara positiva överallt och avgränsade från noll. Det primära variationsproblemet är att minimera förhållandet bland alla som uppfyller ändpunktsvillkoren. Det visas nedan att Euler–Lagrange-ekvationen för minimerings är
där är kvoten
Det kan visas (se Gelfand och Fomin 1963) att den minimerande har två derivator och uppfyller Euler–Lagrange-ekvationen. Den associerade kommer att betecknas med ; det är det lägsta egenvärdet för denna ekvation och randvillkor. Den tillhörande minimeringsfunktionen kommer att betecknas med Denna variationskaraktärisering av egenvärden leder till Rayleigh–Ritz-metoden : välj ett approximativt som en linjär kombination av basfunktioner (till exempel trigonometriska funktioner) och utför en finitdimensionell minimering bland sådana linjära kombinationer. Denna metod är ofta förvånansvärt korrekt.

Det näst minsta egenvärdet och egenfunktionen kan erhållas genom att minimera under den extra begränsningen

Denna procedur kan utökas för att erhålla den fullständiga sekvensen av egenvärden och egenfunktioner för problemet.

Variationsproblemet gäller även mer generella randvillkor. Istället för att kräva att försvinner vid ändpunkterna, får vi inte införa något villkor vid ändpunkterna och ställa in

där och är godtyckliga. Om vi ​​sätter är den första varianten för förhållandet
där λ ges av förhållandet som tidigare. Efter integrering av delar,
Om vi ​​först kräver att försvinner vid ändpunkterna, kommer den första varianten att försvinna för alla sådana endast om
Om uppfyller detta villkor, kommer den första varianten att försvinna för godtycklig endast om
Dessa senare villkor är de naturliga randvillkoren för detta problem, eftersom de inte åläggs försöksfunktioner för minimeringen, utan är istället en konsekvens av minimeringen.

Egenvärdesproblem i flera dimensioner

Egenvärdesproblem i högre dimensioner definieras i analogi med det endimensionella fallet. Till exempel, givet en domän med gräns i tre dimensioner kan vi definiera

och
Låt vara funktionen som minimerar kvoten utan något villkor föreskrivet på gränsen Euler–Lagrange-ekvationen uppfylld av är
var
Den minimerande måste också uppfylla det naturliga gränsvillkoret
på gränsen Detta resultat beror på regularitetsteorin för elliptiska partiella differentialekvationer; se Jost och Li–Jost (1998) för detaljer. Många förlängningar, inklusive fullständighetsresultat, asymptotiska egenskaper hos egenvärdena och resultat beträffande egenfunktionernas noder finns i Courant och Hilbert (1953).

Ansökningar

Optik

Fermats princip säger att ljus tar en väg som (lokalt) minimerar den optiska längden mellan dess ändpunkter. Om -koordinaten väljs som parameter längs banan, och längs banan, så ges den optiska längden av

där brytningsindex beror på materialet. Om vi ​​försöker så kommer den första varianten av (derivatan av med avseende på ε) är

Efter integration med delar av den första termen inom parentes får vi Euler–Lagrange-ekvationen

Ljusstrålarna kan bestämmas genom att integrera denna ekvation. Denna formalism används i samband med Lagrangian optik och Hamiltonian optik .

Snells lag

Det finns en diskontinuitet i brytningsindexet när ljus kommer in i eller lämnar en lins. Låta

där och är konstanter. Då gäller Euler–Lagrange-ekvationen som tidigare i området där eller och i själva verket är banan en rät linje där, eftersom brytningsindex är konstant. Vid vara kontinuerlig, men kan vara diskontinuerlig. Efter integration av delar i de separata regionerna och med Euler–Lagrange-ekvationerna, tar den första varianten formen

Faktorn som multiplicerar är sinus för vinkeln för den infallande strålen med -axeln, och faktorn multiplicerar är sinus för vinkeln för den brutna strålen med -axeln. Snells lag för brytning kräver att dessa termer är lika. Som denna beräkning visar är Snells lag ekvivalent med att den första variationen av den optiska väglängden försvinner.

Fermats princip i tre dimensioner

Det är lämpligt att använda vektornotation: låt låt vara en parameter, låt vara den parametriska representationen av en kurva och låt vara dess tangentvektor. Kurvans optiska längd ges av

Observera att denna integral är invariant med avseende på förändringar i den parametriska representationen av Euler–Lagrange-ekvationerna för en minimeringskurva har den symmetriska formen

var

Det följer av definitionen att uppfyller

Därför kan integralen också skrivas som

Denna form antyder att om vi kan hitta en funktion vars gradient ges av ges integralen vid ändpunkterna för integrationsintervallet. Således kan problemet med att studera kurvorna som gör integralen stationär relateras till studiet av de plana ytorna på För att hitta en sådan funktion vänder vi oss till vågekvationen, som styr ljusets utbredning. Denna formalism används i samband med Lagrangian optik och Hamiltonian optik .

Samband med vågekvationen

Vågekvationen för ett inhomogent medium är

där är hastigheten, som i allmänhet beror på Vågfronter för ljus är karakteristiska ytor för denna partiella differentialekvation: de uppfyller

Vi kan leta efter lösningar i formuläret

I så fall uppfyller

där Enligt teorin om första ordningens partiella differentialekvationer , om så uppfyller
längs ett system av kurvor ( ljusstrålarna ) som ges av

Dessa ekvationer för lösning av en första ordningens partiell differentialekvation är identiska med Euler–Lagrange ekvationerna om vi gör identifieringen

Vi drar slutsatsen att funktionen är värdet på minimeringsintegralen som en funktion av den övre slutpunkten. Det vill säga, när en familj av minimeringskurvor konstrueras, uppfyller värdena för den optiska längden den karakteristiska ekvationen som motsvarar vågekvationen. Att lösa den associerade partiella differentialekvationen av första ordningen är därför ekvivalent med att hitta familjer av lösningar på variationsproblemet. Detta är det väsentliga innehållet i Hamilton–Jacobi-teorin , som gäller mer generella variationsproblem.

Mekanik

I klassisk mekanik definieras handlingen, som tidsintegralen för lagrangian, Lagrangian är skillnaden mellan energier,

där är den kinetiska energin för ett mekaniskt system och dess potentiella energi . Hamiltons princip (eller handlingsprincipen) säger att rörelsen hos ett konservativt holonomiskt (integrerbara begränsningar) mekaniskt system är sådan att handlingsintegralen
är stationär med avseende på variationer i vägen Euler–Lagrange-ekvationerna för detta system är kända som Lagranges ekvationer:
och de är ekvivalenta med Newtons rörelseekvationer (för sådana system).

Det konjugerade momentet definieras av

Till exempel om
sedan
Hamiltonsk mekanik blir resultatet om det konjugerade momentan introduceras i stället för genom en Legendre-transformation av Lagrangian till Hamiltonian definierad av
Hamiltonian är den totala energin i systemet: Analogi med Fermats princip tyder på att lösningar av Lagranges ekvationer (partikelbanorna) kan beskrivas i termer av plana ytor med någon funktion av Denna funktion är en lösning av Hamilton–Jacobis ekvation :

Ytterligare applikationer

Ytterligare tillämpningar av variationskalkylen inkluderar följande:

Variationer och tillräckligt skick för ett minimum

Variationskalkyl handlar om variationer av funktionaler, som är små förändringar i funktionalens värde på grund av små förändringar i funktionen som är dess argument. Den första variationen definieras som den linjära delen av förändringen i den funktionella, och den andra variationen definieras som den kvadratiska delen.

Till exempel, om är en funktion med funktionen som argument, och det finns en liten förändring i dess argument från till där är en funktion i samma funktionsutrymme som då är motsvarande ändring i funktion

Den funktionella sägs vara differentierbar if

där är en linjär funktion, är normen för och som Den linjära funktionella är den första varianten av och betecknas med,

Den funktionella sägs vara dubbelt differentierbar om

där är en linjär funktion (den första varianten), är en kvadratisk funktionell, och som Den kvadratiska funktionella är den andra varianten av och betecknas med,

Den andra varianten sägs vara starkt positiv om

för alla och för någon konstant .

Med användning av ovanstående definitioner, särskilt definitionerna av första variant, andra variant och starkt positiv, kan följande tillräckliga villkor för ett minimum av en funktion anges.

Tillräckligt skick för ett minimum:

Den funktionella har ett minimum vid om dess första variant vid och dess andra variant är starkt positiv vid

Se även

Anteckningar

Vidare läsning

externa länkar