Ett enkelt exempel på ett sådant problem är att hitta kurvan med kortast längd som förbinder två punkter. Om det inte finns några begränsningar är lösningen en rät linje mellan punkterna. Men om kurvan är begränsad till att ligga på en yta i rymden, är lösningen mindre uppenbar, och det kan finnas många lösningar. Sådana lösningar är kända som geodetik . Ett relaterat problem utgörs av Fermats princip : ljus följer den kortaste optiska längden som förbinder två punkter, vilket beror på mediets material. Ett motsvarande begrepp inom mekanik är principen om minsta/stationära verkan .
Många viktiga problem involverar funktioner av flera variabler. Lösningar av gränsvärdesproblem för Laplace-ekvationen uppfyller Dirichlets princip . Plataus problem kräver att man hittar en yta med minimal yta som spänner över en given kontur i rymden: en lösning kan ofta hittas genom att doppa en ram i tvålvatten. Även om sådana experiment är relativt lätta att utföra, är deras matematiska formulering långt ifrån enkel: det kan finnas mer än en lokalt minimerande yta, och de kan ha icke-trivial topologi .
Variationskalkylen kan sägas börja med Newtons minimala resistansproblem 1687, följt av brachistochrone kurvproblem som togs upp av Johann Bernoulli (1696). Det upptog omedelbart Jakob Bernoullis och markisen de l'Hôpital uppmärksamhet , men Leonhard Euler utarbetade först ämnet, med början 1733. Lagrange påverkades av Eulers arbete för att bidra väsentligt till teorin. Efter att Euler såg 1755 års arbete av den 19-åriga Lagrange, släppte Euler sin egen delvis geometriska strategi till förmån för Lagranges rent analytiska tillvägagångssätt och döpte om ämnet till variationskalkylen i sin föreläsning från 1756 Elementa Calculi Variationum .
Variationskalkylen handlar om maxima eller minima (kollektivt kallade extrema ) för funktionaler. En funktionell mappar funktioner till skalärer , så funktionaler har beskrivits som "funktioner av funktioner." Funktionaler har extrema med avseende på elementen i ett givet funktionsutrymme definierat över en given domän . En funktionell sägs ha ett extremum vid funktionen om har samma tecken för alla i ett godtyckligt litet område av Funktionen kallas en extremalfunktion eller extremal. Extremumet kallas ett lokalt maximum om överallt i en godtyckligt liten omgivning av och en lokalt minimum om där. För ett funktionsutrymme av kontinuerliga funktioner kallas extrema av motsvarande funktional starka extrema eller svaga extrema , beroende på om de första derivatorna av de kontinuerliga funktionerna alla är kontinuerliga eller inte.
Både starka och svaga extrema av funktionaler är för ett rum med kontinuerliga funktioner, men starka extrema har det ytterligare kravet att de första derivatorna av funktionerna i rummet är kontinuerliga. Ett starkt extremum är alltså också ett svagt extremum, men det omvända kanske inte håller. Att hitta starka extrema är svårare än att hitta svaga extrema. Ett exempel på ett nödvändigt villkor som används för att hitta svaga extrema är Euler–Lagrange-ekvationen .
Att hitta extrema för funktionaler liknar att hitta maxima och minima för funktioner. Maxima och minima för en funktion kan lokaliseras genom att hitta punkterna där dess derivata försvinner (dvs. är lika med noll). Extrema av funktionaler kan erhållas genom att hitta funktioner för vilka den funktionella derivatan är lika med noll. Detta leder till att lösa den associerade Euler-Lagrange-ekvationen .
är två gånger kontinuerligt differentierbar med avseende på dess argument och
Om den funktionella uppnår ett lokalt minimum vid och en godtycklig funktion som har minst en derivata och försvinner vid ändpunkterna och sedan för valfritt tal nära 0,
Termen kallas variationen av funktionen och betecknas med
Genom att ersätta för i den funktionella är resultatet en funktion av
Eftersom den funktionella har ett minimum för funktionen ett minimum vid och därmed,
Med den totala derivatan av där och betraktas som funktioner av snarare än ger
och eftersom och
Därför,
där när och vi har använt integration av delar på den andra termen. Den andra termen på den andra raden försvinner eftersom vid och per definition. Som tidigare nämnt är den vänstra sidan av ekvationen också noll så att
För att illustrera denna process, överväg problemet med att hitta extremalfunktionen som är den kortaste kurvan som förbinder två punkter och Båglängden på kurvan ges av
med
Observera att om man antar att y är en funktion av x förlorar man generaliteten; helst borde båda vara en funktion av någon annan parameter. Detta tillvägagångssätt är bra endast för lärorikt syfte.
Euler–Lagrange-ekvationen kommer nu att användas för att hitta extremalfunktionen som minimerar den funktionella
med
Eftersom inte förekommer explicit i den första termen i Euler–Lagrange-ekvationen för alla och därmed,
Ersätter och tar derivatan,
Således
för någon konstant Sedan
var
Lösning får vi
vilket innebär det
är en konstant och därför den kortaste kurvan som förbinder två punkter och är
och vi har alltså hittat extremalfunktionen som minimerar den funktionella så att är ett minimum. Ekvationen för en rät linje är Med andra ord är det kortaste avståndet mellan två punkter en rät linje.
Beltramis identitet
I fysikproblem kan det vara så att vilket betyder att integranden är en funktion av och men visas inte separat. I så fall kan Euler-Lagrange-ekvationen förenklas till Beltrami-identiteten
Intuitionen bakom detta resultat är att om variabeln innebär påståendet att Lagrangian är tidsoberoende. Enligt Noethers teorem finns det en associerad konserverad kvantitet. I det här fallet är denna kvantitet Hamiltonian, Legendre-transformationen av Lagrangian, som (ofta) sammanfaller med systemets energi. Detta är (minus) konstanten i Beltramis identitet.
Diskussionen hittills har antagit att extrema funktioner har två kontinuerliga derivator, även om existensen av integralen endast kräver första derivator av försöksfunktioner. Villkoret att den första variationen försvinner vid en extremal kan betraktas som en svag form av Euler-Lagrange-ekvationen. Du Bois-Reymonds teorem hävdar att denna svaga form innebär den starka formen. Om har kontinuerliga första- och andraderivator med avseende på alla dess argument, och om
då har två kontinuerliga derivator, och den uppfyller Euler–Lagrange-ekvationen.
Lavrentiev-fenomen
Hilbert var den första som gav goda förutsättningar för Euler–Lagrange-ekvationerna att ge en stationär lösning. Inom ett konvext område och en positiv tre gånger differentierbar Lagrangian består lösningarna av en räknebar samling sektioner som antingen går längs gränsen eller uppfyller Euler–Lagrange-ekvationerna i det inre.
Men Lavrentiev 1926 visade att det finns omständigheter där det inte finns någon optimal lösning men man kan närma sig godtyckligt nära genom att öka antalet sektioner. Lavrentiev-fenomenet identifierar en skillnad i infimum av ett minimeringsproblem mellan olika klasser av tillåtna funktioner. Till exempel följande problem, presenterat av Manià 1934:
Tydligen minimerar den funktionella, men vi hittar vilken funktion som helst ger ett värde avgränsat från infimumet.
Exempel (i endimensionell) manifesteras traditionellt över och men Ball och Mizel skaffade den första funktionaliteten som visade Lavrentievs fenomen över och för Det finns flera resultat som ger kriterier under vilka fenomenet inte uppstår - till exempel 'standardtillväxt', en lagrangian utan beroende av den andra variabeln eller en approximativ sekvens tillfredsställer Cesaris tillstånd (D) - men resultaten är ofta speciella och applicerbara på en liten klass av funktionaliteter.
Kopplad till Lavrentiev-fenomenet är repulsionsegenskapen: alla funktionella som visar Lavrentievs fenomen kommer att visa den svaga repulsionsegenskapen.
Funktioner av flera variabler
Till exempel, om anger förskjutningen av ett membran ovanför domänen i -planet då är dess potentiella energi proportionell mot dess yta:
Plataus problem består i att hitta en funktion som minimerar ytan samtidigt som man antar föreskrivna värden på gränsen för ; lösningarna kallas minimala ytor . Euler-Lagrange-ekvationen för detta problem är olinjär:
Se Courant (1950) för detaljer.
Dirichlets princip
Det räcker ofta att endast beakta små förskjutningar av membranet, vars energiskillnad från ingen förskjutning approximeras av
Den funktionella ska minimeras bland alla testfunktioner som antar föreskrivna värden på gränsen för Om är minimeringsfunktionen och är en godtycklig jämn funktion som försvinner på gränsen till så är den första varianten av måste försvinna:
Förutsatt att u har två derivator kan vi tillämpa divergenssatsen för att erhålla
där är gränsen för är båglängden längs och är normalderivatan av på Eftersom försvinner på och den första varianten försvinner, är resultatet
för alla smidiga funktioner v som försvinner på gränsen till Beviset för fallet med endimensionella integraler kan anpassas till detta fall för att visa att
i
Svårigheten med detta resonemang är antagandet att minimeringsfunktionen u måste ha två derivator. Riemann hävdade att förekomsten av en smidig minimeringsfunktion säkerställdes av sambandet med det fysiska problemet: membran antar verkligen konfigurationer med minimal potentiell energi. Riemann kallade denna idé för Dirichlet-principen för att hedra sin lärare Peter Gustav Lejeune Dirichlet . Weierstrass gav dock ett exempel på ett variationsproblem utan lösning: minimera
bland alla funktioner som uppfyller och kan göras godtyckligt liten genom att välja bitvis linjära funktioner som gör en övergång mellan −1 och 1 i ett litet område av origo. Det finns dock ingen funktion som gör att Så småningom visades det att Dirichlets princip är giltig, men den kräver en sofistikerad tillämpning av regularitetsteorin för elliptiska partiella differentialekvationer ; se Jost och Li–Jost (1998).
Generalisering till andra gränsvärdesproblem
Ett mer allmänt uttryck för den potentiella energin hos ett membran är
Detta motsvarar en extern kraftdensitet i en extern kraft på gränsen och elastiska krafter med modul som verkar på Funktionen som minimerar den potentiella energin utan begränsning av dess gränsvärden kommer att betecknas med Förutsatt att och är kontinuerliga, innebär regularitetsteori att minimeringsfunktionen kommer att ha två derivator. När du tar den första varianten behöver inget gränsvillkor ställas på inkrementet Den första varianten av ges av
Om vi tillämpar divergenssatsen blir resultatet
Om vi först sätter på försvinner gränsintegralen, och vi drar slutsatsen som tidigare att
i Om vi sedan tillåter att anta godtyckliga gränsvärden, innebär detta att måste uppfylla gränsvillkoret
på Detta gränsvillkor är en konsekvens av minimeringsegenskapen för : det är inte påtvingat i förväg. Sådana förhållanden kallas naturliga randvillkor .
Det föregående resonemanget är inte giltigt om försvinner identiskt på I ett sådant fall skulle vi kunna tillåta en testfunktion där är en konstant. För en sådan testfunktion,
Genom lämpligt val av anta vilket värde som helst såvida inte kvantiteten inom parentesen försvinner. Därför är variationsproblemet meningslöst om inte
Detta tillstånd innebär att externa nettokrafter på systemet är i jämvikt. Om dessa krafter är i jämvikt har variationsproblemet en lösning, men det är inte unikt, eftersom en godtycklig konstant kan läggas till. Ytterligare detaljer och exempel finns i Courant och Hilbert (1953).
Egenvärdesproblem
Både endimensionella och flerdimensionella egenvärdesproblem kan formuleras som variationsproblem.
Egenvärdesproblemet Sturm–Liouville involverar en allmän kvadratisk form
där är begränsad till funktioner som uppfyller gränsvillkoren
Låt vara en normaliseringsintegral
Funktionerna och måste vara positiva överallt och avgränsade från noll. Det primära variationsproblemet är att minimera förhållandet bland alla som uppfyller ändpunktsvillkoren. Det visas nedan att Euler–Lagrange-ekvationen för minimerings är
där är kvoten
Det kan visas (se Gelfand och Fomin 1963) att den minimerande har två derivator och uppfyller Euler–Lagrange-ekvationen. Den associerade kommer att betecknas med ; det är det lägsta egenvärdet för denna ekvation och randvillkor. Den tillhörande minimeringsfunktionen kommer att betecknas med Denna variationskaraktärisering av egenvärden leder till Rayleigh–Ritz-metoden : välj ett approximativt som en linjär kombination av basfunktioner (till exempel trigonometriska funktioner) och utför en finitdimensionell minimering bland sådana linjära kombinationer. Denna metod är ofta förvånansvärt korrekt.
Det näst minsta egenvärdet och egenfunktionen kan erhållas genom att minimera under den extra begränsningen
Denna procedur kan utökas för att erhålla den fullständiga sekvensen av egenvärden och egenfunktioner för problemet.
Variationsproblemet gäller även mer generella randvillkor. Istället för att kräva att försvinner vid ändpunkterna, får vi inte införa något villkor vid ändpunkterna och ställa in
där och är godtyckliga. Om vi sätter är den första varianten för förhållandet
där λ ges av förhållandet som tidigare. Efter integrering av delar,
Om vi först kräver att försvinner vid ändpunkterna, kommer den första varianten att försvinna för alla sådana endast om
Om uppfyller detta villkor, kommer den första varianten att försvinna för godtycklig endast om
Dessa senare villkor är de naturliga randvillkoren för detta problem, eftersom de inte åläggs försöksfunktioner för minimeringen, utan är istället en konsekvens av minimeringen.
Egenvärdesproblem i flera dimensioner
Egenvärdesproblem i högre dimensioner definieras i analogi med det endimensionella fallet. Till exempel, givet en domän med gräns i tre dimensioner kan vi definiera
och
Låt vara funktionen som minimerar kvoten utan något villkor föreskrivet på gränsen Euler–Lagrange-ekvationen uppfylld av är
var
Den minimerande måste också uppfylla det naturliga gränsvillkoret
på gränsen Detta resultat beror på regularitetsteorin för elliptiska partiella differentialekvationer; se Jost och Li–Jost (1998) för detaljer. Många förlängningar, inklusive fullständighetsresultat, asymptotiska egenskaper hos egenvärdena och resultat beträffande egenfunktionernas noder finns i Courant och Hilbert (1953).
Ansökningar
Optik
Fermats princip säger att ljus tar en väg som (lokalt) minimerar den optiska längden mellan dess ändpunkter. Om -koordinaten väljs som parameter längs banan, och längs banan, så ges den optiska längden av
där brytningsindex beror på materialet. Om vi försöker så kommer den första varianten av (derivatan av med avseende på ε) är
Efter integration med delar av den första termen inom parentes får vi Euler–Lagrange-ekvationen
Det finns en diskontinuitet i brytningsindexet när ljus kommer in i eller lämnar en lins. Låta
där och är konstanter. Då gäller Euler–Lagrange-ekvationen som tidigare i området där eller och i själva verket är banan en rät linje där, eftersom brytningsindex är konstant. Vid vara kontinuerlig, men kan vara diskontinuerlig. Efter integration av delar i de separata regionerna och med Euler–Lagrange-ekvationerna, tar den första varianten formen
Faktorn som multiplicerar är sinus för vinkeln för den infallande strålen med -axeln, och faktorn multiplicerar är sinus för vinkeln för den brutna strålen med -axeln. Snells lag för brytning kräver att dessa termer är lika. Som denna beräkning visar är Snells lag ekvivalent med att den första variationen av den optiska väglängden försvinner.
Fermats princip i tre dimensioner
Det är lämpligt att använda vektornotation: låt låt vara en parameter, låt vara den parametriska representationen av en kurva och låt vara dess tangentvektor. Kurvans optiska längd ges av
Observera att denna integral är invariant med avseende på förändringar i den parametriska representationen av Euler–Lagrange-ekvationerna för en minimeringskurva har den symmetriska formen
var
Det följer av definitionen att uppfyller
Därför kan integralen också skrivas som
Denna form antyder att om vi kan hitta en funktion vars gradient ges av ges integralen vid ändpunkterna för integrationsintervallet. Således kan problemet med att studera kurvorna som gör integralen stationär relateras till studiet av de plana ytorna på För att hitta en sådan funktion vänder vi oss till vågekvationen, som styr ljusets utbredning. Denna formalism används i samband med Lagrangian optik och Hamiltonian optik .
längs ett system av kurvor ( ljusstrålarna ) som ges av
Dessa ekvationer för lösning av en första ordningens partiell differentialekvation är identiska med Euler–Lagrange ekvationerna om vi gör identifieringen
Vi drar slutsatsen att funktionen är värdet på minimeringsintegralen som en funktion av den övre slutpunkten. Det vill säga, när en familj av minimeringskurvor konstrueras, uppfyller värdena för den optiska längden den karakteristiska ekvationen som motsvarar vågekvationen. Att lösa den associerade partiella differentialekvationen av första ordningen är därför ekvivalent med att hitta familjer av lösningar på variationsproblemet. Detta är det väsentliga innehållet i Hamilton–Jacobi-teorin , som gäller mer generella variationsproblem.
I klassisk mekanik definieras handlingen, som tidsintegralen för lagrangian, Lagrangian är skillnaden mellan energier,
där är den kinetiska energin för ett mekaniskt system och dess potentiella energi . Hamiltons princip (eller handlingsprincipen) säger att rörelsen hos ett konservativt holonomiskt (integrerbara begränsningar) mekaniskt system är sådan att handlingsintegralen
är stationär med avseende på variationer i vägen Euler–Lagrange-ekvationerna för detta system är kända som Lagranges ekvationer:
och de är ekvivalenta med Newtons rörelseekvationer (för sådana system).
Det konjugerade momentet definieras av
Till exempel om
sedan
Hamiltonsk mekanik blir resultatet om det konjugerade momentan introduceras i stället för genom en Legendre-transformation av Lagrangian till Hamiltonian definierad av
Hamiltonian är den totala energin i systemet: Analogi med Fermats princip tyder på att lösningar av Lagranges ekvationer (partikelbanorna) kan beskrivas i termer av plana ytor med någon funktion av Denna funktion är en lösning av Hamilton–Jacobis ekvation :
Ytterligare applikationer
Ytterligare tillämpningar av variationskalkylen inkluderar följande:
Variationsmetod (kvantmekanik) , ett sätt att hitta approximationer till den lägsta energins egentillstånd eller grundtillstånd, och några exciterade tillstånd;
Variationella Bayesianska metoder , en familj av tekniker för att approximera svårlösta integraler som uppstår i Bayesiansk slutledning och maskininlärning;
Variationer och tillräckligt skick för ett minimum
Variationskalkyl handlar om variationer av funktionaler, som är små förändringar i funktionalens värde på grund av små förändringar i funktionen som är dess argument. Den första variationen definieras som den linjära delen av förändringen i den funktionella, och den andra variationen definieras som den kvadratiska delen.
Till exempel, om är en funktion med funktionen som argument, och det finns en liten förändring i dess argument från till där är en funktion i samma funktionsutrymme som då är motsvarande ändring i funktion
Den funktionella sägs vara differentierbar if
där är en linjär funktion, är normen för och som Den linjära funktionella är den första varianten av och betecknas med,
Den funktionella sägs vara dubbelt differentierbar om
där är en linjär funktion (den första varianten), är en kvadratisk funktionell, och som Den kvadratiska funktionella är den andra varianten av och betecknas med,
Den andra varianten sägs vara starkt positiv om
för alla och för någon konstant .
Med användning av ovanstående definitioner, särskilt definitionerna av första variant, andra variant och starkt positiv, kan följande tillräckliga villkor för ett minimum av en funktion anges.
Tillräckligt skick för ett minimum:
Den funktionella har ett minimum vid om dess första variant vid och dess andra variant är starkt positiv vid