Maskininlärningskontroll

Machine learning control ( MLC ) är ett underområde av maskininlärning , intelligent styrning och styrteori som löser optimala kontrollproblem med metoder för maskininlärning . Nyckelapplikationer är komplexa olinjära system för vilka för linjär styrningsteori inte är tillämpliga.

Typer av problem och uppgifter

Fyra typer av problem är vanliga.

  • Kontrollparameteridentifiering: MLC översätts till en parameteridentifiering om strukturen för kontrolllagen anges men parametrarna är okända. Ett exempel är den genetiska algoritmen för optimering av koefficienter för en PID-regulator eller tidsdiskret optimal styrning.
  • Styrdesign som regressionsproblem av det första slaget: MLC approximerar en allmän olinjär mappning från sensorsignaler till aktiveringskommandon, om sensorsignalerna och det optimala aktiveringskommandot är kända för varje tillstånd. Ett exempel är beräkningen av sensoråterkoppling från en känd fulltillståndsåterkoppling . Ett neuralt nätverk är en vanlig teknik för denna uppgift.
  • Styrdesign som regressionsproblem av det andra slaget: MLC kan också identifiera godtyckliga olinjära styrlagar som minimerar anläggningens kostnadsfunktion. I detta fall behöver varken en modell eller styrlagsstrukturen eller det optimerande manöverkommandot vara känt. Optimeringen baseras endast på styrprestanda (kostnadsfunktion) som uppmätts i anläggningen. Genetisk programmering är en kraftfull regressionsteknik för detta ändamål.
  • Styrning av förstärkningsinlärning: Kontrolllagen kan kontinuerligt uppdateras över uppmätta prestationsförändringar (belöningar) med hjälp av förstärkningsinlärning .

MLC omfattar till exempel neural nätverkskontroll, genetisk algoritmbaserad kontroll, genetisk programmeringskontroll, förstärkningsinlärningskontroll och har metodologiska överlappningar med annan datadriven kontroll, som artificiell intelligens och robotkontroll .

Ansökningar

MLC har framgångsrikt tillämpats på många icke-linjära kontrollproblem, och utforskat okända och ofta oväntade aktiveringsmekanismer. Exempel på applikationer inkluderar

  • Attitydkontroll av satelliter.
  • Byggnads termisk kontroll.
  • Återkopplingsturbulenskontroll.
  • Fjärrstyrd undervattensfordon.
  • Många fler tekniska MLC-applikationer sammanfattas i översiktsartikeln av PJ Fleming & RC Purshouse (2002).

Som för alla generella icke-linjära metoder kommer MLC utan garanterad konvergens, optimalitet eller robusthet för en rad driftsförhållanden.

Vidare läsning

  •   Dimitris C Dracopoulos (augusti 1997) "Evolutionära inlärningsalgoritmer för neural adaptiv kontroll", Springer. ISBN 978-3-540-76161-7 .
  •   Thomas Duriez, Steven L. Brunton & Bernd R. Noack (november 2016) "Machine Learning Control - Taming Nolinear Dynamics and Turbulence" , Springer. ISBN 978-3-319-40624-4 .