Lösningsmedelsmodell
Inom beräkningskemi är en lösningsmedelsmodell en beräkningsmetod som redogör för beteendet hos solvatiserade kondenserade faser. Lösningsmedelsmodeller möjliggör simuleringar och termodynamiska beräkningar tillämpliga på reaktioner och processer som äger rum i lösning. Dessa inkluderar biologiska, kemiska och miljömässiga processer. Sådana beräkningar kan leda till nya förutsägelser om de fysiska processerna som sker genom förbättrad förståelse.
Lösningsmedelsmodeller har testats och granskats omfattande i den vetenskapliga litteraturen. De olika modellerna kan generellt delas in i två klasser, explicita och implicita modeller, som alla har sina fördelar och nackdelar. Implicita modeller är i allmänhet beräkningseffektiva och kan ge en rimlig beskrivning av lösningsmedlets beteende, men tar inte hänsyn till de lokala fluktuationerna i lösningsmedelsdensiteten runt en löst ämnesmolekyl. Densitetsfluktuationsbeteendet beror på lösningsmedelsordning runt ett löst ämne och är särskilt utbrett när man överväger vatten som lösningsmedel. Explicita modeller är ofta mindre beräkningsekonomiska, men kan ge en fysiskt rumsligt löst beskrivning av lösningsmedlet. Men många av dessa explicita modeller är beräkningskrävande och kan misslyckas med att reproducera vissa experimentella resultat, ofta på grund av vissa anpassningsmetoder och parametrisering. Hybridmetoder är ett annat alternativ. Dessa metoder inkluderar aspekter av implicit och explicit syfte att minimera beräkningskostnaden samtidigt som man behåller åtminstone en viss rumslig upplösning av lösningsmedlet. Dessa metoder kan kräva mer erfarenhet för att använda dem korrekt och innehåller ofta termer för korrigering efter beräkning.
Implicita modeller
Implicita lösningsmedel eller kontinuumlösningsmedel, är modeller där man accepterar antagandet att implicita lösningsmedelsmolekyler kan ersättas av ett homogent polariserbart medium så länge som detta medium, till en god approximation, ger likvärdiga egenskaper. Inga explicita lösningsmedelsmolekyler är närvarande och så explicita lösningsmedelskoordinater anges inte. Kontinuummodeller beaktar termiskt medelvärde och vanligtvis isotropa lösningsmedel, varför endast ett litet antal parametrar kan användas för att representera lösningsmedlet med rimlig noggrannhet i många situationer. Huvudparametern är dielektricitetskonstanten ( ε ), denna kompletteras ofta med ytterligare parametrar, till exempel lösningsmedels ytspänning. Dielektricitetskonstanten är det värde som är ansvarigt för att definiera graden av polariserbarhet hos lösningsmedlet. Generellt sett, för implicita lösningsmedel, fortskrider en beräkning genom att kapsla in ett löst ämne i en kaklad kavitet (se figuren nedan). Kaviteten som innehåller det lösta ämnet är inbäddat i homogent polariserbart kontinuum som beskriver lösningsmedlet. Det lösta ämnets laddningsfördelning möter det kontinuerliga dielektriska fältet vid kavitetens yta och polariserar det omgivande mediet, vilket orsakar en förändring i polarisationen på det lösta ämnet. Detta definierar reaktionspotentialen, ett svar på förändringen i polarisation. Denna rekursiva reaktionspotential itereras sedan till självkonsistens. Kontinuummodeller har utbredd användning, inklusive användning i kraftfältsmetoder och kvantkemiska situationer. Inom kvantkemin , där laddningsfördelningarna kommer från ab initio -metoder ( Hartree-Fock (HF), Post-HF och densitetsfunktionella teorin (DFT)), representerar de implicita lösningsmedelsmodellerna lösningsmedlet som en störning till den lösta Hamiltonian . I allmänhet, matematiskt, kan dessa tillvägagångssätt tänkas på följande sätt:
Observera här att lösningsmedlets implicita natur visas matematiskt i ekvationen ovan, eftersom ekvationen endast är beroende av lösta molekylers koordinater ( . Den andra högra termen är sammansatt av interaktionsoperatorer. Dessa interaktionsoperatörer beräknar systemets svar som ett resultat av att gå från ett gasformigt oändligt separerat system till ett i en kontinuumlösning. Om man därför modellerar en reaktion är denna process besläktad med modellering av reaktionen i gasfasen och ger en störning till Hamiltonian i denna reaktion.
Överst: Fyra interaktionsoperatörer som allmänt betraktas i kontinuumlösningsmodellerna. Nederst: Fem bidragande Gibbs energitermer från kontinuumlösningsmodeller.
Interaktionsoperatörerna har en tydlig innebörd och är fysiskt väl definierade. 1:a - skapande av hålrum; en term som står för den energi som spenderas för att bygga en kavitet i lösningsmedlet av lämplig storlek och form för att hysa det lösta ämnet. Fysiskt är detta energikostnaden för att komprimera lösningsmedelsstrukturen när ett tomrum skapas i lösningsmedlet. 2: a term - elektrostatisk energi; Denna term behandlar polariseringen av det lösta ämnet och lösningsmedlet. 3:e termen - en approximation för den kvantmekaniska utbytesrepulsionen; givet det implicita lösningsmedlet kan denna term endast approximeras mot teoretiska beräkningar på hög nivå. 4:e termen - kvantmekanisk spridningsenergi; kan approximeras med hjälp av ett medelvärdesförfarande för lösningsmedelsladdningsfördelningen.
Dessa modeller kan ge användbara bidrag när lösningsmedlet som modelleras kan modelleras av en enda funktion, dvs det skiljer sig inte nämnvärt från bulken. De kan också vara ett användbart sätt att inkludera ungefärliga lösningsmedelseffekter där lösningsmedlet inte är en aktiv beståndsdel i reaktionen eller processen. Dessutom, om datorresurserna är begränsade, kan avsevärda beräkningsresurser sparas genom att framkalla den implicita lösningsmedelsapproximationen istället för explicita lösningsmedelsmolekyler. Implicita lösningsmedelsmodeller har använts för att modellera lösningsmedlet i beräkningsundersökningar av reaktioner och för att förutsäga hydratisering Gibbs energi (Δ hyd G ). Det finns flera standardmodeller och har alla använts framgångsrikt i ett antal situationer. Den polariserbara kontinuummodellen (PCM) är en ofta använd implicit modell och har skapat flera varianter. Modellen är baserad på Poisson-Boltzmanns ekvation , som är en utökning av den ursprungliga Poissons ekvation . Solvationsmodeller (SMx) och Solvationsmodeller baserade på densitet (SMD) har också fått stor spridning. SMx-modeller (där x är en alfanumerisk etikett för att visa versionen) är baserade på den generaliserade Born- ekvationen. Detta är en approximation av Poissons ekvation lämplig för godtyckliga kavitetsformer. SMD-modellen löser Poisson-Boltzmann-ekvationen analogt med PCM, men gör det med en uppsättning specifikt parametriserade radier som konstruerar kaviteten. COSMO -lösningsmodellen är en annan populär implicit lösningsmodell. Denna modell använder det skalade ledargränsvillkoret, vilket är en snabb och robust approximation till de exakta dielektriska ekvationerna och minskar de yttre laddningsfelen jämfört med PCM. Approximationerna leder till en rotmedelkvadratavvikelse i storleksordningen 0,07 kcal/mol till de exakta lösningarna.
Explicita modeller
Explicita lösningsmedelsmodeller behandlar lösningsmedelsmolekylerna explicit (dvs. koordinaterna och vanligtvis åtminstone några av de molekylära frihetsgraderna ingår). Detta är en mer intuitivt realistisk bild där det finns direkta, specifika lösningsmedelsinteraktioner med ett löst ämne, i motsats till kontinuummodeller. Dessa modeller förekommer i allmänhet vid tillämpning av molekylär mekanik (MM) och dynamik (MD) eller Monte Carlo (MC) simuleringar, även om vissa kvantkemiska beräkningar använder lösningsmedelskluster. Molekylär dynamiksimuleringar tillåter forskare att studera tidsutvecklingen av ett kemiskt system i diskreta tidsintervall. Dessa simuleringar använder ofta molekylära mekaniska kraftfält som i allmänhet är empiriska, parametriserade funktioner som effektivt kan beräkna egenskaper och rörelser hos stora system. Parametrisering är ofta till en högre nivå av teori eller experimentella data. MC-simuleringar tillåter en att utforska den potentiella energiytan i ett system genom att störa systemet och beräkna energin efter störningen. Tidigare kriterier definieras för att hjälpa algoritmen att avgöra om det nyligen störda systemet ska accepteras eller inte.
Generellt är kraftfältmetoder baserade på liknande energiutvärderingsfunktioner som vanligtvis innehåller termer som representerar bindningssträckning, vinkelböjning, vridningar och termer för repulsion och dispersion, såsom Buckingham-potentialen eller Lennard- Jones - potentialen . Vanligt använda lösningsmedel, såsom vatten, har ofta idealiserade modeller genererade. Dessa idealiserade modeller gör det möjligt att minska de frihetsgrader som ska utvärderas i energiberäkningen utan en betydande förlust av den totala noggrannheten; även om detta kan leda till att vissa modeller blir användbara endast under specifika omständigheter. Modeller som TIPXP (där X är ett heltal som antyder antalet platser som används för energiutvärdering) och den enkla punktladdningsmodellen (SPC) för vatten har använts i stor utsträckning. En typisk modell av detta slag använder ett fast antal platser (ofta tre för vatten), på varje plats placeras en parametriserad punktladdning och repulsions- och spridningsparameter. Dessa modeller är vanligtvis geometriskt begränsade med aspekter av geometrin fixerade såsom bindningslängden eller vinklarna.
Några senaste [ när? ] framsteg inom explicit lösningsmedelsmodellering är den nya generationen polariserbara kraftfält, som för närvarande skapas. Dessa kraftfält kan förklara förändringar i den molekylära laddningsfördelningen. Ett antal av dessa kraftfält utvecklas för att utnyttja multipolmoment, i motsats till punktladdningar, givet att multipolmoment kan återspegla laddningsanisotropin hos molekylerna. En sådan metod är kraftfältet Atomic Multipole Optimized Energetics for Biomolecular Applications (AMOEBA). Denna metod har använts för att studera solvatiseringsdynamiken hos joner. Andra framväxande polariserbara kraftfält som har applicerats på kondenserade fassystem är; summan av interaktioner mellan fragment från början (SIBFA) och Quantum Chemical Topology Force Field (QCTFF). Polariserbara vattenmodeller tillverkas också. Den så kallade charge on spring (COS) modellen ger vattenmodeller med förmåga att polarisera på grund av att en av interaktionsplatserna är flexibel (på våren).
Hybridmodeller
Hybridmodeller, som namnet antyder, är mitt emellan explicita och implicita modeller. Hybridmodeller kan vanligtvis anses närmare en eller annan implicit eller explicit. Blandade kvantmekaniska och molekylära mekaniska modeller, ( QM/MM )-scheman, kan tänkas i detta sammanhang. QM/MM-metoder här är närmare explicita modeller. Man kan tänka sig att ha en QM-kärnbehandling som innehåller det lösta ämnet och kan vara ett litet antal explicita lösningsmedelsmolekyler. Det andra skiktet skulle då kunna innefatta MM-vattenmolekyler, med ett sista tredje skikt av implicit lösningsmedel som representerar bulken. Referensinteraktionsplatsmodellen (RISM) kan tänkas ligga närmare implicita lösningsmedelsrepresentationer. RISM tillåter lösningsmedeldensiteten att fluktuera i en lokal miljö, vilket ger en beskrivning av lösningsmedlets skalbeteende.
QM/MM -metoder gör det möjligt att beräkna en sektion av systemet med hjälp av kvantmekanik, till exempel det aktiva stället i en biologisk molekyl, medan resten av systemet modelleras med hjälp av MM-kraftfält. Genom att fortsätta till ett tredje skikt med ett implicit lösningsmedel kan bulkvatteneffekten modelleras billigare än att använda alla explicita lösningsmedelsmolekyler. Det finns många olika kombinationer som kan användas med QM/MM-tekniken. Alternativt kan några explicita lösningsmedelsmolekyler tillsättas till en QM-region och resten av lösningsmedlet behandlas implicit. Tidigare arbete har visat blandade resultat vid tillsats av explicita lösningsmedelsmolekyler till ett implicit lösningsmedel. Ett exempel lade till upp till tre explicita vattenmolekyler till en QM-beräkning med en implicit COSMO-vattenmodell. Resultaten tyder på att användning av antingen implicit eller explicit lösningsmedel enbart ger en bra approximation för experimentet, men de blandade modellerna hade blandade resultat och möjligen ett visst beroende av antalet tillsatta explicita lösningsmedelsmolekyler.
RISM, en klassisk statistisk mekanikmetodik, har sina rötter i integralekvationsteorin för vätskor (IET). Genom statistisk modellering av lösningsmedlet kan en uppskattning av systemets dynamik erhållas. Detta är mer användbart än en statisk modell eftersom lösningsmedlets dynamik kan vara viktig i vissa processer. Den statistiska modelleringen görs med hjälp av radiell distributionsfunktion (RDF). RDF är probabilistiska funktioner som kan representera sannolikheten för att lokalisera lösningsmedelsatomer/molekyler i ett specifikt område eller på ett specifikt avstånd från referenspunkten; allmänt taget som den lösta molekylen. Eftersom sannolikheten för att lokalisera lösningsmedelsatomer och molekyler från referenspunkten kan bestämmas i RISM-teorin, kan lösningsmedelsskalstrukturen härledas direkt.
Den molekylära Ornstein-Zernike-ekvationen (MOZ) är utgångspunkten för RISM-beräkningar. Inom MOZ-ekvationerna kan ett solvatiserat system definieras i 3D-rymden med tre rumsliga koordinater (r) och tre vinklar (Θ). Genom att använda relativa RDF:er kan MOZ-ekvationerna för det solvatiserade systemet definiera den totala korrelationsfunktionen h(r - r';ʘ - ʘ'). Ekvationerna har en hög dimensionalitet (6D).
- är den totala korrelationsfunktionen, är radiell fördelningsfunktion som står för de direkta effekterna av en molekyl på en annan separerad av r.
Det är en vanlig approximation att anta sfärisk symmetri, vilket gör att man kan ta bort de orienterande (vinkel) frihetsgraderna. MOZ-ekvationen delar upp den totala korrelationsfunktionen i två. Först den direkta korrelationsfunktionen c(r), som rör effekten av en partikel på en annan över avståndet r. Den andra, den indirekta korrelationsfunktionen, står för effekterna av en tredje partikel i ett system. Den indirekta korrelationsfunktionen ges som den direkta korrelationsfunktionen mellan den första och den tredje partikeln förutom den totala korrelationsfunktionen mellan den andra och tredje partiklar .
Ornstein-Zernikes ekvation med antagandet om sfärisk symmetri. ρ är vätskedensiteten, r är separeringsavståndet, h(r) är den totala korrelationsfunktionen, c(r) är den direkta korrelationsfunktionen.
h(r) och c(r) är lösningarna till MOZ-ekvationerna. För att lösa h(r) och c(r) måste en annan ekvation införas. Denna nya ekvation kallas en stängningsrelation. Den exakta stängningsrelationen är okänd, eftersom de så kallade bryggfunktionernas exakta form är oklar, måste vi därför införa approximationer. Det finns flera giltiga approximationer, den första var HyperNetted Chain (HNC), som sätter de okända termerna i stängningsrelationen till noll. Även om den verkar rå, har HNC i allmänhet använts ganska framgångsrikt, även om den visar långsam konvergens och divergerande beteende i vissa fall. En modern alternativ stängningsrelation har föreslagits, Partially Lineared HyperNetted Chain (PLHNC) eller Kovalenko Hirata-stängning. PLHNC linjärar delvis exponentialfunktionen om den överskrider dess cutoff-värde. Detta orsakar en mycket mer tillförlitlig konvergens av ekvationerna.
PLHNC-stängningen, där och är interaktionspotentialen, en typisk interaktionspotential visas nedan. T(r) är den indirekta korrelationsfunktionen, eftersom det är skillnaden mellan den totala och den direkta korrelationsfunktionen.
Det finns olika approximationer av RISM-ekvationerna. Två populära uppskattningar är 3D RISM och 1D RISM. Det finns kända brister i dessa ungefärliga RISM-modeller. 3D RISM gör en dålig uppskattning av termen för skapande av kavitet. 1D RISM har visat sig inte korrekt redogöra för de rumsliga korrelationerna för lösningsmedelstätheten runt det lösta ämnet. Båda metoderna är dock snabba att beräkna, 1D RISM kan beräknas på några sekunder på en modern dator, vilket gör det till en attraktiv modell för beräkning av hög genomströmning. Både 3D RISM och 1D RISM har föreslagit korrigeringsscheman som gör att förutsägelserna når en jämförbar nivå av noggrannhet med traditionella implicita och explicita modeller.
COSMO -RS- modellen är en annan hybridmodell som använder ytpolarisationsladdningstätheten härledd från kontinuum COSMO-beräkningar för att uppskatta interaktionsenergierna med närliggande molekyler. COSMO-RS kan stå för en stor del av omorientering och starka riktningsinteraktioner som vätebindning inom det första solvatiseringsskalet. Det ger termodynamiskt konsekvent blandningstermodynamik och används ofta utöver UNIFAC i kemitekniska tillämpningar.
Ansökningar till QSAR och QSPR
Kvantitativa struktur–aktivitetsrelationer ( QSAR )/kvantitativa struktur–egenskapsrelationer (QSPR), även om de inte direkt kan modellera den fysiska processen som sker i en kondenserad lösningsmedelsfas, kan ge användbara förutsägelser om lösningsmedels- och solvatiseringsegenskaper och aktiviteter; såsom lösligheten av ett löst ämne. Dessa metoder kommer på ett varierat sätt från enkla regressionsmodeller till sofistikerade maskininlärningsmetoder. I allmänhet kräver QSAR/QSPR-metoder deskriptorer; dessa finns i många olika former och används för att representera fysiska egenskaper och egenskaper hos ett system av intresse. Deskriptorer är i allmänhet enstaka numeriska värden som innehåller viss information om en fysisk egenskap. En regressionsmodell eller statistisk inlärningsmodell används sedan för att hitta en korrelation mellan deskriptorn(erna) och egenskapen av intresse. När de har tränats på några kända data kan dessa modeller tillämpas på liknande okända data för att göra förutsägelser. Typiskt kommer de kända data från experimentell mätning, även om det inte finns någon anledning till varför liknande metoder inte kan användas för att korrelera deskriptor(er) med teoretiska eller förutspådda värden. Det diskuteras för närvarande om om mer exakta experimentella data användes för att träna dessa modeller om förutsägelsen från sådana modeller skulle vara mer exakt.