I kontrollteorin är en tillståndsobservatör eller tillståndsskattare ett system som ger en uppskattning av det interna tillståndet för ett givet verkligt system, från mätningar av det verkliga systemets input och output. Det är vanligtvis datorimplementerat och utgör grunden för många praktiska tillämpningar.
Att känna till systemtillståndet är nödvändigt för att lösa många kontrollteoretiska problem; till exempel stabilisering av ett system med hjälp av tillståndsåterkoppling . I de flesta praktiska fall kan systemets fysiska tillstånd inte bestämmas genom direkt observation. Istället observeras indirekta effekter av det interna tillståndet genom systemutgångarna. Ett enkelt exempel är det för fordon i en tunnel: hastigheten och hastigheterna med vilka fordon går in och lämnar tunneln kan observeras direkt, men det exakta tillståndet inuti tunneln kan bara uppskattas. Om ett system är observerbart är det möjligt att helt rekonstruera systemtillståndet från dess utdatamätningar med hjälp av tillståndsobservatören.
Typisk observatörsmodell
Blockschema över Luenberger Observer. Indata för observatörsförstärkning L är
.
Linjära, fördröjda, glidande läge, hög förstärkning, Tau, homogenitetsbaserade, utökade och kubiska observatörer är bland flera observatörsstrukturer som används för tillståndsuppskattning av linjära och olinjära system. En linjär observatörsstruktur beskrivs i följande avsnitt.
Tidsdiskret fall
Tillståndet för ett linjärt, tidsinvariant diskret tidssystem antas uppfylla
där, vid tidpunkten , är anläggningens tillstånd; är dess ingångar; och är dess utdata. Dessa ekvationer säger helt enkelt att anläggningens nuvarande utgångar och dess framtida tillstånd båda bestäms enbart av dess nuvarande tillstånd och de nuvarande ingångarna. (Även om dessa ekvationer uttrycks i termer av diskreta tidssteg, gäller mycket liknande ekvationer för kontinuerliga system). Om detta system är observerbart kan utsignalen från anläggningen, användas för att styra tillståndsobservatörens tillstånd.
Observatörsmodellen för det fysiska systemet härleds sedan typiskt från ovanstående ekvationer. Ytterligare termer kan inkluderas för att säkerställa att, vid mottagning av successiva mätvärden av anläggningens in- och utsignaler, modellens tillstånd konvergerar till anläggningens. Speciellt kan observatörens utdata subtraheras från utdata från anläggningen och sedan multipliceras med en matris ; detta läggs sedan till ekvationerna för observatörens tillstånd för att producera en så kallad Luenberger -observatör , definierad av ekvationerna nedan. Observera att variablerna för en tillståndsobservatör vanligtvis betecknas med en "hatt": och för att skilja dem från variablerna i ekvationerna som uppfylls av det fysiska systemet.
Observatören kallas asymptotiskt stabil om observatörsfelet konvergerar till noll när . För en Luenberger-observatör uppfyller observatörsfelet . Luenberger-observatören för detta diskreta tidssystem är därför asymptotiskt stabil när matrisen har alla egenvärden inuti enhetscirkeln.
För kontrolländamål matas utsignalen från observatörssystemet tillbaka till ingången från både observatören och anläggningen genom förstärkningsmatrisen .
Observatörsekvationerna blir då:
eller, enklare,
På grund av separationsprincipen vet vi att vi kan välja och oberoende utan att skada systemets övergripande stabilitet. Som en tumregel är polerna för observatören vanligtvis valda att konvergera 10 gånger snabbare än polerna i systemet .
Kontinuerlig tid fall
Det tidigare exemplet var för en observatör implementerad i ett tidsdiskret LTI-system. Processen är dock liknande för fallet med kontinuerlig tid; observatörsförstärkningarna väljs för att få den kontinuerliga tidsfeldynamiken att konvergera till noll asymptotiskt (dvs när är en Hurwitz-matris ).
För ett linjärt system med kontinuerlig tid
där , observatören ser ut som ett tidsdiskret fall som beskrivs ovan:
-
.
Observatörsfelet uppfyller ekvationen
-
.
Egenvärdena för matrisen kan väljas godtyckligt genom lämpligt val av observatörsförstärkningen när paret är observerbar, dvs observerbarhetsvillkoret gäller. I synnerhet kan det göras Hurwitz, så observatörsfelet när .
Peaking och andra observatörsmetoder
När observatörens förstärkning är hög, konvergerar den linjära Luenberger-observatören till systemtillstånden mycket snabbt. Hög observatörsförstärkning leder emellertid till ett toppfenomen där initialt estimatorfel kan vara oöverkomligt stort (dvs. opraktiskt eller osäkert att använda). Som en konsekvens är ickelinjära observatörsmetoder med hög förstärkning tillgängliga som konvergerar snabbt utan toppfenomenet. Till exempel glidlägeskontroll användas för att designa en observatör som bringar ett uppskattat tillstånds fel till noll i ändlig tid även i närvaro av mätfel; de andra staterna har fel som beter sig på samma sätt som felet hos en Luenberger-observatör efter att toppen har avtagit. Glidlägesobservatörer har också attraktiva brustålighetsegenskaper som liknar ett Kalman-filter . Ett annat tillvägagångssätt är att använda multiobservatör, som avsevärt förbättrar transienter och minskar observatörsöverskridande. Multiobservatör kan anpassas till alla system där högförstärkningsobservatörer kan användas.
Statliga observatörer för icke-linjära system
Hög förstärkning, glidläge och utökade observatörer är de vanligaste observatörerna för icke-linjära system. För att illustrera tillämpningen av glidande observatörer för icke-linjära system, överväg först det icke-linjära systemet utan ingång:
där . Antag också att det finns en mätbar utdata ges av
Det finns flera icke-ungefärliga tillvägagångssätt för att utforma en observatör. De två observatörerna nedan gäller även för det fall då systemet har en ingång. Det är,
Linjäriserbar feldynamik
Ett förslag från Krener och Isidori och Krener och Respondek kan tillämpas i en situation när det finns en linjäriseringstransformation (dvs en diffeomorfism , som den som används vid återkopplingslinjärisering ) z så att i nya variabler läser systemekvationerna
Luenberger-observatören är sedan utformad som
-
.
Observatörsfelet för den transformerade variabeln uppfyller samma ekvation som i klassiskt linjärt fall.
-
.
Som visas av Gauthier, Hammouri och Othman och Hammouri och Kinnaert, om det finns transformation så att systemet kan omvandlas till formen
då är observatören utformad som
-
,
där är en tidsvarierande observatörsförstärkning.
Ciccarella, Dalla Mora och Germani erhöll mer avancerade och generella resultat, tog bort behovet av en icke-linjär transformation och bevisade global asymptotisk konvergens av det uppskattade tillståndet till det sanna tillståndet med endast enkla antaganden om regelbundenhet.
Växlade observatörer: Sliding mode observer
Som diskuterats för det linjära fallet ovan, motiverar toppfenomenet som finns hos Luenberger-observatörer användningen av växlade observatörer. En omkopplad observatör omfattar ett relä eller binär omkopplare som verkar på att detektera små förändringar i den uppmätta utgången. Några vanliga typer av omkopplade observatörer inkluderar glidlägesobservatören, ickelinjär observatör med utökat tillstånd och förenande observatör. Glidlägesobservatören använder icke-linjär högförstärkningsåterkoppling för att driva uppskattade tillstånd till en hyperyta där det inte finns någon skillnad mellan den uppskattade uteffekten och den uppmätta uteffekten . Den icke-linjära förstärkningen som används i observatören är typiskt implementerad med en skalad växlingsfunktion, som tecknet ( dvs. sgn) för det uppskattade – uppmätta utgångsfelet. På grund av denna återkoppling med hög förstärkning har observatörens vektorfält en veckning i sig så att observatörsbanor glider längs en kurva där den uppskattade uteffekten exakt matchar den uppmätta uteffekten. Så om systemet är observerbart från dess utdata, kommer observatörstillstånden alla att drivas till de faktiska systemtillstånden. Dessutom, genom att använda tecknet på felet för att driva observatören i glidläge, blir observatörens banor okänsliga för många former av brus. Följaktligen har vissa observatörer av glidläge attraktiva egenskaper som liknar Kalman-filtret men med enklare implementering.
Som föreslagits av Drakunov kan en glidande observatör också utformas för en klass av icke-linjära system. En sådan observatör kan skrivas i termer av ursprunglig variabeluppskattning och har formen
var:
- Vektorn utökar den skalära signumfunktionen till dimensioner. Det vill säga
- för vektorn .
- Vektorn har komponenter som är utgångsfunktionen och dess upprepade Lie-derivator. I synnerhet
- L är den i: te Lie-derivatan av utdatafunktionen längs vektorfältet (dvs. längs -banor i det icke-linjära systemet). I det speciella fallet där systemet inte har någon ingång eller har en relativ grad av n , är en samling av utgången och dess derivator. Eftersom inversen av den jakobianska linjäriseringen av måste existera för att denna observatör ska vara väldefinierad, är transformationen garanterat en lokal diffeomorfism .
- Den diagonala matrisen för förstärkningar är sådan att
- varje , element och passande stor för att säkerställa att glidläget kan nås.
- Observatörsvektorn är sådan att
- här är den normala signumfunktionen definierad för skalärer, och betecknar en "ekvivalentvärdesoperator" för en diskontinuerlig funktion i glidläge .
Tanken kan kortfattat förklaras enligt följande. Enligt teorin om glidlägen, för att beskriva systemets beteende, när glidläget startar, funktionen bör ersättas med ekvivalenta värden (se ekvivalent kontroll i teorin om glidlägen ). I praktiken växlar den (chattrar) med hög frekvens med långsam komponent som är lika med motsvarande värde. Användning av lämpligt lågpassfilter för att bli av med högfrekvenskomponenten på kan erhålla värdet av den ekvivalenta kontrollen, som innehåller mer information om tillståndet för det uppskattade systemet. Observatören som beskrivs ovan använder denna metod flera gånger för att erhålla tillståndet för det olinjära systemet idealiskt i ändlig tid.
Det modifierade observationsfelet kan skrivas i de transformerade tillstånden . Särskilt,
och så
Så:
- Så länge som den första raden i feldynamiken, , kommer att uppfylla tillräckliga villkor för att gå in i glidläget
- Längs ytan , motsvarande med , och så . Alltså, så länge som den andra raden i feldynamiken, , kommer att gå in i glidläget
- ytan , motsvarande ekvivalent kontroll kommer att vara lika med . Alltså, så länge som \ e raden av feldynamiken, , kommer att gå in i glidläget i ändlig tid.
Så, för tillräckligt stora förstärkningar, når alla observatörs uppskattade tillstånd de faktiska tillstånden i ändlig tid. Faktum är att ökning av möjliggör konvergens i vilken önskad ändlig tid som helst så länge som varje kan avgränsas med säkerhet. Därför är kravet att kartan är en diffeomorfism (dvs. att dess jakobianska linearisering är inverterbar) hävdar att konvergens av den uppskattade produktionen innebär konvergens av det uppskattade tillståndet. Det vill säga kravet är ett observerbarhetsvillkor.
I fallet med glidlägesobservatören för systemet med ingången krävs ytterligare villkor för att observationsfelet ska vara oberoende av ingången. Till exempel det
beror inte på tid. Observatören är då
Multiobservatör
Multi-observatör utökar observatörsstrukturen med hög förstärkning från singel till multiobservatör, med många modeller som arbetar samtidigt. Detta har två skikt: det första består av flera observatörer med hög förstärkning med olika uppskattningstillstånd, och det andra bestämmer vikterna för de första skiktets observatörer. Algoritmen är enkel att implementera och innehåller inga riskabla operationer som differentiering. Idén med flera modeller tillämpades tidigare för att få information i adaptiv kontroll.
Om vi antar att antalet observatörer med hög förstärkning är lika med ,
där är observatörsindex. Det första lagrets observatörer består av samma förstärkning men de skiljer sig med initialtillståndet . I det andra lagret kombineras alla från erhålla enkeltillståndsvektoruppskattning
där är viktfaktorer. Dessa faktorer ändras för att ge uppskattningen i det andra lagret och för att förbättra observationsprocessen.
Låt anta det
och
där är någon vektor som beror på observatörsfel .
Viss transformation ger upphov till linjära regressionsproblem
Denna formel ger möjlighet att uppskatta . För att konstruera grenrör behöver vi mappning mellan och se till att är kan beräknas med hjälp av mätbara signaler. Det första är att eliminera parkeringsfenomen för från observatörsfel
-
.
Beräkna gånger derivatan av för att hitta mappningen m leder till definierad som
där är någon tidskonstant. Observera att reläer på både och dess integraler, därför är den lätt tillgänglig i kontrollsystemet. Ytterligare specificeras av skattningslagen; och därmed bevisar det att mångfalden är mätbar. I det andra lagret är för introduceras som uppskattningar av koefficienter. Mappningsfelet anges som
där . Om koefficienterna är lika med , då mappningsfel Nu är det möjligt att beräkna från ovanstående ekvation och därmed reduceras peaking-fenomenet tack vare egenskaperna hos grenrör. Den skapade kartläggningen ger mycket flexibilitet i uppskattningsprocessen. Till och med det är möjligt att uppskatta värdet av i det andra lagret och att beräkna tillståndet .
Avgränsande observatörer
Begränsande eller intervallobservatörer utgör en klass av observatörer som ger två uppskattningar av tillståndet samtidigt: en av uppskattningarna ger en övre gräns för tillståndets verkliga värde, medan den andra ger en nedre gräns. Det verkliga värdet av staten är då känt för att alltid ligga inom dessa två uppskattningar.
Dessa gränser är mycket viktiga i praktiska tillämpningar, eftersom de gör det möjligt att vid varje tillfälle veta exaktheten i uppskattningen.
Matematiskt kan två Luenberger-observatörer användas, om är korrekt vald, med till exempel positiva systemegenskaper : en för den övre gränsen (som säkerställer att konvergerar till noll från ovan när , i frånvaro av brus och osäkerhet ), och en nedre gräns (som säkerställer att konvergerar till noll underifrån). Det vill säga alltid
Se även
- In-line referenser
- Allmänna referenser
externa länkar