Tillämpningsdomän

Tillämpningsdomänen (AD) (för både kemi och maskininlärning ) för en QSAR -modell är det fysikalisk-kemiska, strukturella eller biologiska utrymme, kunskap eller information som modellens träningsuppsättning har utvecklats för och för vilken den är tillämplig. att göra förutsägelser för nya föreningar.

Syftet med AD är att ange om modellens antaganden är uppfyllda och för vilka kemikalier modellen kan vara tillförlitligt tillämplig. I allmänhet är detta fallet för interpolation snarare än för extrapolering . Hittills finns det ingen enskild allmänt accepterad algoritm för att bestämma AD: en omfattande undersökning kan hittas i en rapport och rekommendationer från ECVAM Workshop 52. Det finns en ganska systematisk metod för att definiera interpolationsregioner. Processen involverar borttagning av extremvärden och en sannolikhetstäthetsfördelningsmetod med hjälp av kärnvägd sampling. Ett annat allmänt använt tillvägagångssätt för den strukturella AD för regressions-QSAR-modellerna är baserad på hävstångseffekten beräknad från diagonalvärdena för hattmatrisen för modelleringsmolekyldeskriptorerna. En nyligen rigorös benchmarkingstudie av flera AD-algoritmer identifierade standardavvikelse för modellförutsägelser som den mest tillförlitliga metoden. För att undersöka AD för en träningsuppsättning av kemikalier kan man direkt analysera egenskaperna hos det multivariata deskriptorutrymmet för träningsföreningarna eller mer indirekt via avstånds- (eller likhets-) mått. När man använder avståndsmått bör man vara försiktig med att använda ett ortogonalt och signifikant vektorrum. Detta kan uppnås genom olika sätt att välja funktion och successiv analys av huvudkomponenter .

Anteckningar

  1. ^ Netzeva T, Worth A, Aldenberg T, Benigni R, Cronin M, Gramatica P, Jaworska J, Kahn S, Klopman G, Marchant C, Myatt G, Nikolova-Jeliazkova N, Patlewicz G, Perkins R, Roberts D, Schultz T , Stanton D, van de Sandt J, Tong W, Veith G, Yang C: Aktuell status för metoder för att definiera tillämplighetsdomänen för (kvantitativa) struktur–aktivitetsrelationer. Altern Lab Anima 2005, 33: 1-19
  2. ^ Jaworska J, Nikolova-Jeliazkova N, Aldenberg T: Uppskattning av QSAR-tillämpningsdomän genom projektion av utbildningsuppsättningsbeskrivningsutrymmet: en recension. Altern Lab Anima 2005, 33(5):445-459
  3. ^ Atkinson AC, Plots, Transformations and Regression, Clarendon Press, Oxford, 1985, s.282
  4. ^ Tropsha A, Gramatica P, Gombar VK, Vikten av att vara allvar: Validering är det absolut nödvändiga för framgångsrik tillämpning och tolkning av QSPR-modeller. QSAR Comb.Sci. 2003, 22:69-77
  5. ^ Gramatica P, principer för QSAR-modellvalidering: intern och extern QSAR Comb.Sci. 2007, 26(5): 694-701
  6. ^ Tetko IV, Sushko I, Pandey AK, Zhu H, Tropsha A, Papa E, Oberg T, Todeschini R, Fourches D, Varnek A. Kritisk bedömning av QSAR-modeller av miljötoxicitet mot Tetrahymena pyriformis: fokuserar på tillämplighetsdomän och överanpassning av val av variabel. J Chem Inf Model. 2008 sep;48(9):1733-46.