Datadrivet styrsystem
Datadrivna styrsystem är en bred familj av styrsystem , där identifieringen av processmodellen och/eller utformningen av styrenheten helt baseras på experimentella data som samlats in från anläggningen.
I många styrtillämpningar anses det vara en svår uppgift att försöka skriva en matematisk modell av anläggningen, som kräver ansträngningar och tid för process- och styringenjörer. Detta problem övervinns genom datadrivna metoder, som anpassar en systemmodell till den experimentella data som samlas in, och väljer den i en specifik modellklass. Styringenjören kan sedan utnyttja denna modell för att designa en korrekt styrenhet för systemet. Det är dock fortfarande svårt att hitta en enkel men tillförlitlig modell för ett fysiskt system, som endast inkluderar den dynamik i systemet som är av intresse för styrspecifikationerna. De direkta datadrivna metoderna gör det möjligt att ställa in en styrenhet, som tillhör en given klass, utan behov av en identifierad modell av systemet. På så sätt kan man också helt enkelt vikta processdynamik av intresse inuti kontrollkostnadsfunktionen och utesluta den dynamik som är ointressant.
Översikt
Standardmetoden för design av styrsystem är organiserad i två steg:
- Modellidentifiering syftar till att uppskatta en nominell modell av systemet , där är enhetsfördröjningsoperatorn (för representation av diskreta tidsöverföringsfunktioner) och är vektor av parametrar för identifierade på en uppsättning -data. Valideringen består sedan i att konstruera osäkerhetsmängden som innehåller det sanna systemet på en viss sannolikhetsnivå.
- Styrenhetens design syftar till att hitta en styrenhet som uppnår stabilitet i sluten slinga och uppfyller den erforderliga prestandan med .
Typiska syften med systemidentifiering är att ha så nära och att ha så liten som möjligt . Men ur ett identifieringsperspektiv för kontroll är det som verkligen spelar roll den prestanda som uppnås av regulatorn, inte modellens inneboende kvalitet.
Ett sätt att hantera osäkerhet är att designa en styrenhet som har en acceptabel prestanda med alla modeller i inklusive . Detta är huvudtanken bakom en robust kontrolldesignprocedur, som syftar till att skapa beskrivningar av osäkerhet i frekvensdomänen av processen. Men eftersom detta tillvägagångssätt är baserat på värsta tänkbara antaganden snarare än på idén att utjämna bullret i genomsnitt, leder detta tillvägagångssätt vanligtvis till konservativa osäkerhetsuppsättningar. Snarare hanterar datadrivna tekniker osäkerhet genom att arbeta med experimentella data och undvika överdriven konservativism.
I det följande presenteras huvudklassificeringarna av datadrivna styrsystem.
Indirekta och direkta metoder
Det finns många metoder tillgängliga för att styra systemen. Den grundläggande distinktionen är mellan indirekta och direkta kontrollmetoder. Den tidigare gruppen av tekniker behåller fortfarande standardmetoden i två steg, dvs först identifieras en modell, sedan ställs en styrenhet in baserat på en sådan modell. Huvudproblemet med att göra det är att styrenheten beräknas från den uppskattade modellen (enligt säkerhetsekvivalensprincipen) , men i praktiken . För att övervinna detta problem är tanken bakom den senare gruppen av tekniker att kartlägga experimentdata direkt på regulatorn, utan att någon modell ska identifieras däremellan.
Iterativa och noniterativa metoder
En annan viktig skillnad är mellan iterativa och icke- iterativa (eller engångsmetoder) metoder. I den förstnämnda gruppen behövs upprepade iterationer för att uppskatta kontrollerparametrarna, under vilka optimeringsproblemet utförs baserat på resultaten från den tidigare iterationen, och uppskattningen förväntas bli mer och mer exakt vid varje iteration. Detta tillvägagångssätt är också benäget att implementera online (se nedan). I den senare gruppen är den (optimala) kontrollerparametriseringen försedd med ett enda optimeringsproblem. Detta är särskilt viktigt för de system där iterationer eller upprepningar av datainsamlingsexperiment är begränsade eller till och med inte tillåtna (till exempel på grund av ekonomiska aspekter). I sådana fall bör man välja en designteknik som kan leverera en styrenhet på en enda datamängd. Detta tillvägagångssätt implementeras ofta offline (se nedan).
On-line och off-line metoder
Eftersom, i praktiska industriella tillämpningar, data med öppen eller sluten loop ofta är tillgänglig kontinuerligt, använder online- datadrivna tekniker dessa data för att förbättra kvaliteten på den identifierade modellen och/eller kontrollenhetens prestanda varje gång ny information samlas på anläggningen. Istället off-line tillvägagångssätt på batch av data, som bara kan samlas in en gång eller flera gånger med ett regelbundet (men ganska långt) tidsintervall.
Iterativ återkopplingsinställning
Metoden för iterativ återkopplingsinställning (IFT) introducerades 1994, med utgångspunkt från observationen att, för identifiering för kontroll, är varje iteration baserad på (fel) princip för säkerhetekvivalens.
IFT är en modellfri teknik för direkt iterativ optimering av parametrarna för en styrenhet med fast ordning; sådana parametrar kan successivt uppdateras med hjälp av information som kommer från standardsystemdrift (sluten slinga).
Låt vara en önskad utgång till referenssignalen ; felet mellan det uppnådda och önskade svaret är . Kontrolldesignmålet kan formuleras som minimering av målfunktionen:
Med tanke på den objektiva funktionen att minimera kan kvasi-Newton-metoden tillämpas, dvs en gradientbaserad minimering med en gradientsökning av typen:
Värdet är stegstorleken, är en lämplig positiv definitiv matris och är en approximation av gradienten; det sanna värdet av gradienten ges av följande:
Värdet på erhålls genom följande trestegsmetodik:
- Normalt experiment: Utför ett experiment på det slutna systemet med som styrenhet och som referens; samla N mätningar av utsignalen , betecknad som .
- Gradientexperiment: Utför ett experiment på det slutna systemet med som styrenhet och 0 som referens ; injicera signalen så att den summeras till styrvariabeln som utmatas av , går som indata i anläggningen. Samla utgången, betecknad som .
- Ta följande som gradientapproximation: .
En avgörande faktor för algoritmens konvergenshastighet är valet av ; när är liten, är ett bra val den approximation som ges av Gauss–Newton-riktningen:
Noniterativ korrelationsbaserad inställning
Noniterativ korrelationsbaserad inställning (nCbT) är en icke-iterativ metod för datadriven inställning av en styrenhet med fast struktur. Det tillhandahåller en engångsmetod för att direkt syntetisera en styrenhet baserat på en enda datamängd.
Antag att betecknar en okänd LTI-stabil SISO-anläggning, en användardefinierad referensmodell och en användardefinierad viktningsfunktion. En LTI-styrenhet med fast ordning indikeras som , där , och är en vektor av LTI-basfunktioner. Slutligen en idealisk LTI-kontroller av vilken struktur som helst, vilket garanterar en sluten slinga-funktion när den tillämpas på .
Målet är att minimera följande objektiva funktion:
är en konvex approximation av den objektiva funktionen som erhålls från ett modellreferensproblem, förutsatt att .
När är stabil och minsta fas, är det approximerade modellreferensproblemet ekvivalent med minimeringen av normen för i schemat i figuren.
Insignalen antas vara en ihållande spännande insignal och ska genereras av en stabil datagenereringsmekanism. De två signalerna är således okorrelerade i ett experiment med öppen loop; därför är det ideala felet okorrelerat med . Kontrollmålet består alltså i att hitta så att och är okorrelerade.
Vektorn för instrumentella variabler definieras som:
där är tillräckligt stor och , där är ett lämpligt filter.
Korrelationsfunktionen är:
och optimeringsproblemet blir:
Genom att beteckna med spektrumet av , kan det demonstreras att, under vissa antaganden, om väljs som:
då gäller följande:
Stabilitetsbegränsning
Det finns ingen garanti för att styrenheten som minimerar är stabil. Instabilitet kan uppstå i följande fall:
- Om är icke-minimum fas, kan leda till annulleringar i det högra halva komplexa planet.
- Om (även om stabilisering) inte kan uppnås, kanske inte stabiliserar.
- På grund av mätbrus, även om stabiliserar, beräknade data kanske inte är så.
Betrakta en stabiliserande styrenhet och överföringsfunktionen . Definiera:
- Styrenheten
- K stabiliserar planta if
- är stabil
- st
Villkor 1 tillämpas när:
- är stabil
- innehåller en integrator (den avbryts).
Modellreferensdesignen med stabilitetsbegränsning blir:
En konvex datadriven uppskattning av kan erhållas genom den diskreta Fouriertransformen .
Definiera följande:
För stabila minifasanläggningar ges följande konvexa datadrivna optimeringsproblem :
Inställning av virtuell referensfeedback
Virtual Reference Feedback Tuning (VRFT) är en icke-iterativ metod för datadriven inställning av en styrenhet med fast struktur. Det tillhandahåller en engångsmetod för att direkt syntetisera en styrenhet baserat på en enda datamängd.
VRFT föreslogs först i och utvidgades sedan till LPV-system. VRFT bygger också på idéer som ges som .
Huvudidén är att definiera en önskad modell med sluten slinga och att använda dess inversa dynamik för att erhålla en virtuell referens från den uppmätta utsignalen .
De virtuella signalerna är och
Den optimala styrenheten erhålls från brusfri data genom att lösa följande optimeringsproblem:
där optimeringsfunktionen ges enligt följande: