Energiminimering
Inom området för beräkningskemi är energiminimering (även kallad energioptimering , geometriminimering eller geometrioptimering ) processen att hitta ett arrangemang i rymden av en samling atomer där , enligt någon beräkningsmodell av kemisk bindning, nettointern -atomkraften på varje atom är acceptabelt nära noll och positionen på den potentiella energiytan (PES) är en stationär punkt (beskrivs senare). Samlingen av atomer kan vara en enda molekyl , en jon , en kondenserad fas , ett övergångstillstånd eller till och med en samling av någon av dessa. Beräkningsmodellen för kemisk bindning kan till exempel vara kvantmekanik.
Som ett exempel, när man optimerar geometrin för en vattenmolekyl , strävar man efter att erhålla väte-syrebindningslängderna och väte-syre-vätebindningsvinkeln som minimerar de krafter som annars skulle dra ihop atomer eller trycka isär dem.
Motivationen för att utföra en geometrioptimering är den erhållna strukturens fysiska betydelse: optimerade strukturer motsvarar ofta ett ämne som det finns i naturen och geometrin för en sådan struktur kan användas i en mängd olika experimentella och teoretiska undersökningar inom fälten av kemisk struktur , termodynamik , kemisk kinetik , spektroskopi och andra.
Vanligtvis, men inte alltid, strävar processen efter att hitta geometrin för ett speciellt arrangemang av atomerna som representerar ett lokalt eller globalt energiminimum. Istället för att söka efter globalt energiminimum kan det vara önskvärt att optimera till ett övergångstillstånd , det vill säga en sadelpunkt på den potentiella energiytan. Dessutom kan vissa koordinater (såsom en kemisk bindningslängd) fixeras under optimeringen.
Molekylär geometri och matematisk tolkning
Geometrin för en uppsättning atomer kan beskrivas av en vektor av atomernas positioner. Detta kan vara uppsättningen av de kartesiska koordinaterna för atomerna eller, när man överväger molekyler, kan det vara så kallade interna koordinater bildade av en uppsättning bindningslängder, bindningsvinklar och dihedriska vinklar.
Givet en uppsättning atomer och en vektor, r , som beskriver atomernas positioner, kan man introducera begreppet energi som en funktion av positionerna, E ( r ) . Geometrioptimering är då ett matematiskt optimeringsproblem , där man önskar hitta värdet på r för vilket E ( r ) är på ett lokalt minimum , det vill säga derivatan av energin med avseende på atomernas position, ∂ E /∂ r , är nollvektorn och andraderivatans matris i systemet, som den hessiska matrisen , som beskriver krökningen av PES vid r , har alla positiva egenvärden (är positivt bestämd ).
Ett specialfall av en geometrioptimering är en sökning efter geometrin för ett övergångstillstånd ; detta diskuteras nedan.
Beräkningsmodellen som ger en ungefärlig E ( r ) kan baseras på kvantmekanik (med användning av antingen densitetsfunktionsteori eller semi-empiriska metoder ), kraftfält eller en kombination av de i fallet QM/MM . Med hjälp av denna beräkningsmodell och en första gissning (eller ansatz ) av den korrekta geometrin, följs en iterativ optimeringsprocedur, till exempel:
- beräkna kraften på varje atom (det vill säga -∂ E /∂ r )
- om kraften är mindre än någon tröskel, avsluta
- annars, flytta atomerna med något beräknat steg ∆ r som förutsägs minska kraften
- upprepa från början
Praktiska aspekter av optimering
Som beskrivits ovan kan någon metod som kvantmekanik användas för att beräkna energin, E ( r ) , gradienten för PES, det vill säga derivatan av energin med avseende på atomernas position, ∂ E /∂ r och den andra derivatmatrisen av systemet, ∂∂ E /∂ r i ∂ r j , även känd som den hessiska matrisen , som beskriver krökningen av PES vid r .
En optimeringsalgoritm kan använda några eller alla av E ( r ) , ∂ E /∂ r och ∂∂ E /∂ r i ∂ r j för att försöka minimera krafterna och detta kan i teorin vara vilken metod som helst som gradientnedstigning, konjugering gradient eller Newtons metod, men i praktiken visar sig algoritmer som använder kunskap om PES-kurvaturen, det vill säga den hessiska matrisen, vara överlägsna. För de flesta system av praktiskt intresse kan det dock vara oöverkomligt dyrt att beräkna den andra derivatans matris, och den uppskattas från successiva värden på gradienten, vilket är typiskt i en Quasi-Newton- optimering .
Valet av koordinatsystem kan vara avgörande för att genomföra en framgångsrik optimering. Kartesiska koordinater, till exempel , är överflödiga eftersom en icke-linjär molekyl med N -atomer har 3 N –6 vibrationsfrihetsgrader medan uppsättningen av kartesiska koordinater har 3 N dimensioner. Dessutom är kartesiska koordinater starkt korrelerade, det vill säga den hessiska matrisen har många icke-diagonala termer som inte är nära noll. Detta kan leda till numeriska problem i optimeringen, eftersom det till exempel är svårt att få en bra approximation till den hessiska matrisen och att beräkna den exakt är för beräkningsmässigt dyrt. Men om energin uttrycks med standardkraftfält, har beräkningseffektiva metoder utvecklats för att analytiskt härleda den hessiska matrisen i kartesiska koordinater samtidigt som en beräkningskomplexitet av samma ordning som gradientberäkningar bevaras. Interna koordinater tenderar att vara mindre korrelerade men är svårare att ställa in och det kan vara svårt att beskriva vissa system, till exempel sådana med symmetri eller stora kondenserade faser. Många moderna programvarupaket för beräkningskemi innehåller automatiska procedurer för automatisk generering av rimliga koordinatsystem för optimering.
Frihetsgradsbegränsning
Vissa frihetsgrader kan elimineras från en optimering, till exempel kan positioner för atomer eller bindningslängder och vinklar ges fasta värden. Ibland kallas dessa för frusna frihetsgrader.
Figur 1 visar en geometrioptimering av atomerna i ett kolnanorör i närvaro av ett externt elektrostatiskt fält. I denna optimering har atomerna till vänster sina positioner frusna. Deras interaktion med de andra atomerna i systemet beräknas fortfarande, men förändringar av atomernas position under optimeringen förhindras.
Optimering av övergångstillstånd
Övergångstillståndsstrukturer kan bestämmas genom att söka efter sadelpunkter på PES för den kemiska arten av intresse. En första ordningens sadelpunkt är en position på PES som motsvarar ett minimum i alla riktningar utom en; en andra ordningens sadelpunkt är ett minimum i alla riktningar utom två, och så vidare. Matematiskt definierad kännetecknas en n :e ordningen av följande: ∂ E /∂ r = 0 och den hessiska matrisen, ∂∂ E /∂ r i ∂ r j , har exakt n negativa egenvärden.
Algoritmer för att lokalisera övergångstillståndsgeometrier delas in i två huvudkategorier: lokala metoder och halvglobala metoder. Lokala metoder är lämpliga när utgångspunkten för optimeringen är mycket nära det verkliga övergångstillståndet ( mycket nära kommer att definieras inom kort) och halvglobala metoder finner tillämpning när man söker lokalisera övergångstillståndet med mycket liten a priori kunskap om dess geometri. Vissa metoder, som Dimer-metoden (se nedan), faller inom båda kategorierna.
Lokala sökningar
En så kallad lokal optimering kräver en första gissning av övergångstillståndet som är mycket nära det verkliga övergångstillståndet. Mycket nära betyder typiskt att den initiala gissningen måste ha en motsvarande hessisk matris med ett negativt egenvärde, eller så måste det negativa egenvärdet som motsvarar reaktionskoordinaten vara större i storlek än de andra negativa egenvärdena. Vidare måste egenvektorn med det mest negativa egenvärdet motsvara reaktionskoordinaten, det vill säga den måste representera den geometriska transformationen som hänför sig till processen vars övergångstillstånd eftersträvas.
Med de ovanstående förutsättningarna kan en lokal optimeringsalgoritm sedan röra sig "uppför" längs egenvektorn med det mest negativa egenvärdet och "nedför" längs alla andra frihetsgrader, med hjälp av något som liknar en kvasi-Newton-metod.
Dimer metod
Dimermetoden kan användas för att hitta möjliga övergångstillstånd utan kunskap om den slutliga strukturen eller för att förfina en bra gissning av en övergångsstruktur. "Dimeren" bildas av två bilder mycket nära varandra på PES. Metoden fungerar genom att dimeren flyttas uppför från startpositionen samtidigt som dimern roteras för att hitta riktningen för den lägsta krökningen (i slutändan negativ).
Activation Relaxation Technique (ART)
Activation Relaxation Technique (ART) är också en öppen metod för att hitta nya övergångstillstånd eller för att förfina kända sadelpunkter på PES. Metoden följer riktningen för den lägsta negativa krökningen (beräknad med hjälp av Lanczos-algoritmen ) på PES för att nå sadelpunkten och koppla av i det vinkelräta hyperplanet mellan varje "hopp" (aktivering) i denna riktning.
Kedje-av-stat metoder
Chain-of-state-metoder kan användas för att hitta den ungefärliga geometrin för övergångstillståndet baserat på geometrierna för reaktanten och produkten. Den genererade ungefärliga geometrin kan sedan tjäna som utgångspunkt för förfining via en lokal sökning, som beskrevs ovan.
Chain-of-state-metoder använder en serie vektorer, det vill säga punkter på PES, som förbinder reaktanten och produkten av reaktionen av intresse, r- reaktant och r -produkt , vilket diskretiserar reaktionsvägen. Mycket vanligt hänvisas dessa punkter till som pärlor på grund av en analogi av en uppsättning pärlor sammankopplade med strängar eller fjädrar, som förbinder reaktanten och produkterna. Serien av pärlor skapas ofta initialt genom att interpolera mellan r- reaktant och r -produkt , till exempel, för en serie av N + 1 pärlor, kan pärla i ges av
där i ∈ 0, 1, ..., N . Var och en av pärlorna r i har en energi, E ( r i ) , och krafter, -∂ E /∂ r i och dessa behandlas med en begränsad optimeringsprocess som försöker få en så exakt representation som möjligt av reaktionsvägen. För att detta ska uppnås måste avståndsbegränsningar tillämpas så att varje pärla ri inte bara blir optimerad för reaktanten och produktgeometrin.
Ofta uppnås denna begränsning genom att projicera ut komponenter av kraften på varje pärla ri , eller alternativt rörelsen av varje pärla under optimering, som är tangentiella till reaktionsvägen. Till exempel, om det för enkelhets skull definieras att gi = ∂ E /∂ r i , så ges energigradienten vid varje pärla minus komponenten av energigradienten som är tangentiell till reaktionsvägen av
där I är identitetsmatrisen och τi är en enhetsvektor som representerar reaktionsvägens tangent vid ri . Genom att projicera ut komponenter i energigradienten eller optimeringssteget som är parallella med reaktionsvägen, minskar en optimeringsalgoritm signifikant tendensen hos var och en av pärlorna att optimeras direkt till ett minimum.
Synkron transitering
Den enklaste chain-of-state-metoden är den linjära synkrona transitmetoden (LST). Den fungerar genom att ta interpolerade punkter mellan reaktanten och produktens geometrier och välja den med högst energi för efterföljande förfining via en lokal sökning. Metoden kvadratisk synkron transitering (QST) utökar LST genom att tillåta en parabolisk reaktionsväg, med optimering av den högsta energipunkten ortogonalt mot parabeln.
Knuffat elastiskt band
I Nudged elastic band (NEB)-metoden har pärlorna längs reaktionsvägen simulerade fjäderkrafter utöver de kemiska krafterna, -∂ E /∂ r i , för att få optimeraren att bibehålla avståndsbegränsningen. Specifikt fi är kraften på varje punkt i given av
var
) är fjäderkraften parallell med banan vid varje punkt ri ri ( k är en fjäderkonstant och τi , som tidigare, är en enhetsvektor som representerar reaktionsvägens tangent vid .
I en traditionell implementering används punkten med högst energi för efterföljande förfining i en lokal sökning. Det finns många variationer på NEB-metoden, inklusive klättringsbilden NEB, där punkten med högst energi trycks uppåt under optimeringsproceduren för att (förhoppningsvis) ge en geometri som är ännu närmare den för övergångstillståndet . Det har också gjorts utökningar till att inkludera Gaussisk processregression för att minska antalet utvärderingar. För system med icke-euklidisk (R^2) geometri, som magnetiska system, är metoden modifierad till den geodetiska nudged elastiska bandmetoden.
Strängmetod
Strängmetoden använder splines som förbinder punkterna, r i , för att mäta och framtvinga avståndsbegränsningar mellan punkterna och för att beräkna tangenten vid varje punkt. I varje steg i en optimeringsprocedur kan punkterna flyttas i enlighet med den kraft som verkar på dem vinkelrätt mot banan, och sedan, om ekvidistansbegränsningen mellan punkterna inte längre är uppfylld, kan punkterna omfördelas med hjälp av spline representation av sökvägen för att generera nya vektorer med det erforderliga avståndet.
Variationer på strängmetoden inkluderar odlingssträngmetoden, där gissningen av vägen odlas in från ändpunkterna (det vill säga reaktanten och produkterna) allt eftersom optimeringen fortskrider.
Jämförelse med andra tekniker
Geometrioptimering skiljer sig fundamentalt från en simulering av molekylär dynamik . Den senare simulerar molekylernas rörelse med avseende på tid, föremål för temperatur, kemiska krafter, initiala hastigheter, Brownsk rörelse hos ett lösningsmedel, och så vidare, via tillämpningen av Newtons rörelselagar . Detta betyder att banorna för de atomer som beräknas har någon fysisk betydelse. Geometrioptimering, däremot, producerar inte en "bana" med någon fysisk betydelse - den handlar om minimering av krafterna som verkar på varje atom i en samling atomer, och vägen via vilken den uppnår detta saknar mening. Olika optimeringsalgoritmer skulle kunna ge samma resultat för minimienergistrukturen, men komma fram till det via en annan väg.
Se även
- Begränsning sammansatt graf
- Grafsnitt i datorseende – apparat för att lösa datorseendeproblem som kan formuleras i termer av energiminimering
- Energiprinciper i konstruktionsmekanik
externa länkar
Ytterligare referenser
- Payne et al., "Iterativ minimeringsteknik för ab initio totalenergiberäkningar: Molecular dynamics and conjugate gradients", Reviews of Modern Physics 64 (4), s. 1045–1097. (1992) (abstrakt)
- Stich et al., " Conjugate gradient minimization of the energy functional: A new method for electronic structure calculation ", Physical Review B 39 (8), s. 4997–5004, (1989)
- Chadi, " Energiminimeringsmetod för halvledarytors atomgeometri ", Physical Review Letters 41 (15), s. 1062–1065 (1978)