Volterra-serien
Volterra -serien är en modell för icke-linjärt beteende som liknar Taylor-serien . Den skiljer sig från Taylor-serien i sin förmåga att fånga "minneseffekter". Taylor-serien kan användas för att approximera svaret från ett icke-linjärt system på en given ingång om systemets utdata strikt beror på ingången vid den specifika tidpunkten. I Volterra-serien beror utsignalen från det olinjära systemet på ingången till systemet vid alla andra tillfällen. Detta ger möjligheten att fånga "minneseffekten" hos enheter som kondensatorer och induktorer .
Det har tillämpats inom medicin ( biomedicinsk ingenjörskonst ) och biologi, särskilt neurovetenskap . Det används också inom elektroteknik för att modellera intermodulationsdistorsion i många enheter, inklusive effektförstärkare och frekvensblandare . Dess främsta fördel ligger i dess generaliserbarhet: den kan representera ett brett spektrum av system. Därför anses det ibland vara en icke-parametrisk modell.
I matematik betecknar en Volterra-serie en funktionell expansion av en dynamisk, olinjär , tidsinvariant funktionell . Volterra-serien används ofta för systemidentifiering . Volterra-serien, som används för att bevisa Volterra-satsen, är en oändlig summa av flerdimensionella faltningsintegraler.
Historia
Volterra-serien är en moderniserad version av teorin om analytiska funktionaler från den italienske matematikern Vito Volterra , i hans arbete från 1887. Norbert Wiener blev intresserad av denna teori på 1920-talet på grund av sin kontakt med Volterras elev Paul Lévy . Wiener tillämpade sin teori om Brownsk rörelse för integrationen av Volterra analytiska funktionaler. Användningen av Volterra-serien för systemanalys härrörde från en begränsad krigstidsrapport från 1942 från Wiener, som då var professor i matematik vid MIT . Han använde serien för att göra en ungefärlig analys av effekten av radarbrus i en olinjär mottagarkrets. Rapporten blev offentlig efter kriget. Som en allmän metod för analys av icke-linjära system kom Volterra-serien i bruk efter omkring 1957 som ett resultat av en serie rapporter, först privat cirkulerade, från MIT och på andra håll. Själva namnet, " Volterra-serien ", kom i bruk några år senare.
Matematisk teori
Teorin för Volterra-serien kan ses ur två olika perspektiv:
- En operatormappning ) mellan två funktionsutrymmen (verkliga eller komplexa
- En reell eller komplex funktionell mappning från ett funktionsutrymme till reella eller komplexa tal
Det senare funktionella kartläggningsperspektivet används oftare på grund av systemets antagna tidsinvarians.
Kontinuerlig tid
Ett kontinuerligt tidsinvariant system med x ( t ) som ingång och y ( t ) som utgång kan utökas i Volterra-serien som
Här tas konstanttermen på höger sida vanligtvis till noll genom lämpligt val av utgångsnivå . Funktionen kallas Volterra - kärnan i n :e ordningen . Det kan betraktas som ett impulssvar av högre ordning i systemet. För att representationen ska vara unik måste kärnorna vara symmetriska i de n variablerna . Om den inte är symmetrisk kan den ersättas av en symmetrisk kärna, vilket är medelvärdet över n ! permutationer av dessa n variabler .
Om N är finit, sägs serien vara trunkerad . Om a , b och N är ändliga kallas serien för dubbelt ändlig .
Ibland delas termen av n -te ordningen med n !, en konvention som är bekväm när man tar utdata från ett Volterra-system som indata från ett annat ("cascading").
Kausalitetsvillkoret : Eftersom utdata i alla fysiskt realiserbara system endast kan bero på tidigare värden för indata, kärnorna kommer att vara noll om någon av variablerna är negativa. Integralerna kan sedan skrivas över halva området från noll till oändligt. Så om operatorn är kausal, .
Fréchets approximationssats : Användningen av Volterra-serien för att representera en tidsinvariant funktionell relation motiveras ofta genom att vädja till en teorem som beror på Fréchet . Denna sats säger att en tidsinvariant funktionell relation (som uppfyller vissa mycket allmänna villkor) kan approximeras enhetligt och till en godtycklig grad av precision av en tillräckligt hög ändlig ordningsvolterraserie. Bland andra villkor krävs att uppsättningen av tillåtna ingångsfunktioner för vilka approximationen kommer att vara kompakt . Det tas vanligtvis för att vara en likkontinuerlig , likformigt avgränsad uppsättning funktioner, som är kompakt av Arzelà–Ascolis sats . I många fysiska situationer är detta antagande om ingångsuppsättningen rimligt. Teoremet ger dock ingen indikation på hur många termer som behövs för en bra approximation, vilket är en väsentlig fråga i tillämpningar.
Diskret tid
Detta liknar fallet med kontinuerlig tid:
- kallas tidsdiskret Volterra kärnor.
Om P är finit sägs serieoperatorn vara trunkerad. Om a , b och P är finita kallas serieoperatorn för dubbel finita Volterra-serier. Om sägs operatorn vara kausal .
Vi kan alltid betrakta kärnan som symmetriska. Faktum är att för kommutativiteten av multiplikationen är det alltid möjligt att symmetrisera den genom att bilda en ny kärna tagen som medelvärdet av kärnorna för alla permutationer av variablerna τ 1 , … , .
För ett kausalsystem med symmetriska kärnor kan vi skriva om den n -te termen ungefär i triangulär form
Metoder för att uppskatta kärnkoefficienterna
Att uppskatta Volterra-koefficienterna individuellt är komplicerat, eftersom basfunktionerna för Volterra-serien är korrelerade. Detta leder till problemet att samtidigt lösa en uppsättning integralekvationer för koefficienterna. Följaktligen utförs uppskattning av Volterra-koefficienter i allmänhet genom att uppskatta koefficienterna för en ortogonaliserad serie, t.ex. Wiener-serien , och sedan räkna om koefficienterna för den ursprungliga Volterra-serien. Volterra-seriens huvudattraktion över den ortogonaliserade serien ligger i dess intuitiva, kanoniska struktur, dvs. alla interaktioner av ingången har en fast grad. De ortogonaliserade basfunktionerna kommer i allmänhet att vara ganska komplicerade.
En viktig aspekt, med avseende på vilken följande metoder skiljer sig åt, är om ortogonaliseringen av basfunktionerna ska utföras över den idealiserade specifikationen av insignalen (t.ex. gaussiskt, vitt brus) eller över den faktiska realiseringen av ingången ( dvs. den pseudo-slumpmässiga, avgränsade, nästan vita versionen av gaussiskt vitt brus eller någon annan stimulans). De senare metoderna har, trots sin brist på matematisk elegans, visat sig vara mer flexibla (eftersom godtyckliga ingångar lätt kan tillgodoses) och exakta (på grund av effekten att den idealiserade versionen av insignalen inte alltid är realiserbar).
Korskorrelationsmetod
Denna metod, utvecklad av Lee och Schetzen, ortogonaliserar med avseende på den faktiska matematiska beskrivningen av signalen, dvs. projektionen på de nya basfunktionerna är baserad på kunskapen om momenten för slumpsignalen.
Vi kan skriva Volterra-serien i termer av homogena operatorer, som
var
För att möjliggöra identifieringsortogonalisering måste Volterra-serien omarrangeras i termer av ortogonala icke-homogena G- operatorer ( Wiener-serien ):
G- operatorerna kan definieras av följande:
närhelst är godtyckligt homogen Volterra, är x ( n ) något stationärt vitt brus (SWN) med noll medelvärde och varians A .
Påminner om att varje Volterra-funktion är ortogonal mot alla Wiener-funktioner av högre ordning, och med tanke på följande Volterra-funktion:
vi kan skriva
Om x är SWN, och genom att låta , vi har
Så om vi exkluderar de diagonala elementen, det
Om vi vill överväga de diagonala elementen, är den lösning som föreslagits av Lee och Schetzen
Den största nackdelen med denna teknik är att uppskattningsfelen, som görs på alla element i kärnor av lägre ordning, kommer att påverka varje diagonalelement av ordningen p med hjälp av summeringen tänkt som lösningen för uppskattningen av själva diagonala elementen. Det finns effektiva formler för att undvika denna nackdel och referenser för uppskattning av diagonala kärnelement
När Wiener-kärnorna väl har identifierats kan Volterra-kärnor erhållas genom att använda Wiener-till-Volterra-formler, i följande rapporter för en femte ordningens Volterra-serie:
Multipelvariansmetod
I den traditionella ortogonala algoritmen har användning av indata med hög fördelen att stimulera hög ordnings icke-linjäritet, för att uppnå mer exakt identifiering av hög ordningskärna. Som en nackdel orsakar användningen av höga -värden höga identifieringsfel i kärnor av lägre ordning, främst på grund av att inmatnings- och trunkeringsfelen inte är idealiska.
Tvärtom kan användningen av lägre i identifieringsprocessen leda till en bättre uppskattning av lägre ordningens kärna, men kan vara otillräcklig för att stimulera hög ordningens olinjäritet.
Detta fenomen, som kan kallas lokalitet för trunkerade Volterra-serier, kan avslöjas genom att beräkna utgångsfelet för en serie som en funktion av olika indatavarianser. Detta test kan upprepas med serier identifierade med olika ingångsvarianser, vilket ger olika kurvor, var och en med ett minimum i överensstämmelse med variansen som används i identifieringen.
För att övervinna denna begränsning bör ett lågt värde användas för kärnan av lägre ordning och gradvis ökas för kärnor av högre ordning. Detta är inte ett teoretiskt problem i Wiener-kärnidentifiering, eftersom Wiener-funktionerna är ortogonala mot varandra, men en lämplig normalisering behövs i Wiener-till-Volterra-omvandlingsformler för att ta hänsyn till användningen av olika varianser. Dessutom behövs nya konverteringsformler från Wiener till Volterra.
Den traditionella Wiener-kärnidentifikationen bör ändras enligt följande:
I formlerna ovan introduceras impulsfunktionerna för identifiering av diagonala kärnpunkter. Om Wiener-kärnorna extraheras med de nya formlerna, behövs följande Wiener-till-Volterra-formler (expliciterade i femte ordningen):
Som kan ses är nackdelen med den tidigare formeln att för identifieringen av kärnan av n :e ordningen måste alla lägre kärnor identifieras igen med den högre variansen. En enastående förbättring av utgående MSE kommer dock att erhållas om Wiener- och Volterra-kärnorna erhålls med de nya formlerna.
Feedforward nätverk
Denna metod utvecklades av Wray och Green (1994) och utnyttjar det faktum att ett enkelt 2-helt anslutet neuralt nätverk (dvs. en flerskiktsperceptron ) är beräkningsmässigt ekvivalent med Volterra-serien och därför innehåller kärnorna gömda i dess arkitektur. Efter att ett sådant nätverk har tränats för att framgångsrikt förutsäga utdata baserat på systemets aktuella tillstånd och minne, kan kärnorna sedan beräknas från det nätverkets vikter och förspänningar.
Den allmänna notationen för Volterra-kärnan i n -te ordningen ges av
där är ordningen, vikterna till den linjära utgångsnoden, koefficienterna för polynomexpansionen av utgångsfunktionen av de dolda noderna, och är vikterna från indatalagret till det icke-linjära dolda lagret. Det är viktigt att notera att denna metod tillåter kärnextraktion fram till antalet inmatningsfördröjningar i nätverkets arkitektur. Dessutom är det viktigt att noggrant konstruera storleken på nätverksinmatningsskiktet så att det representerar systemets effektiva minne.
Exakt ortogonal algoritm
Denna metod och dess mer effektiva version (snabb ortogonal algoritm) uppfanns av Korenberg. I denna metod utförs ortogonaliseringen empiriskt över den faktiska inmatningen. Det har visat sig fungera mer exakt än korskorrelationsmetoden. En annan fördel är att godtyckliga ingångar kan användas för ortogonaliseringen och att färre datapunkter räcker för att nå en önskad nivå av noggrannhet. Dessutom kan uppskattning utföras stegvis tills något kriterium är uppfyllt.
Linjär regression
Linjär regression är ett standardverktyg från linjär analys. En av dess främsta fördelar är därför den utbredda förekomsten av standardverktyg för att effektivt lösa linjära regressioner. Det har ett visst pedagogiskt värde, eftersom det lyfter fram den grundläggande egenskapen hos Volterra-serien: linjär kombination av icke-linjära basfunktioner. För uppskattning bör ordningen på originalet vara känd, eftersom Volterra-basfunktionerna inte är ortogonala, och därför kan uppskattningen inte utföras inkrementellt.
Kärnmetoden
Denna metod uppfanns av Franz och Schölkopf och bygger på statistisk inlärningsteori . Följaktligen är detta tillvägagångssätt också baserat på att minimera det empiriska felet (ofta kallat empirisk riskminimering) . Franz och Schölkopf föreslog att kärnmetoden i huvudsak skulle kunna ersätta representationen av Volterra-serien, även om de noterade att den senare är mer intuitiv.
Differentiell provtagning
Denna metod utvecklades av van Hemmen och medarbetare och använder Dirac deltafunktioner för att ta prov på Volterra-koefficienterna.
Se även
Vidare läsning
- Barrett JF: Bibliography of Volterra-serien, Hermite funktionella expansioner och relaterade ämnen . Avd. elektr. Engrg, Univ.Tech. Eindhoven, NL 1977, TH-rapport 77-E-71. (Kronologisk lista över tidiga artiklar till 1977) URL: http://alexandria.tue.nl/extra1/erap/publichtml/7704263.pdf
- Bussgang, JJ; Ehrman, L.; Graham, JW: Analys av olinjära system med flera ingångar, Proc. IEEE, vol. 62, nr. 8, s. 1088–1119, augusti 1974
- Giannakis GB & Serpendin E: En bibliografi om icke-linjär systemidentifiering. Signalbehandling, 81 2001 533–580. (Alfabetisk lista till 2001) www.elsevier.nl/locate/sigpro
- Korenberg MJ Hunter IW: Identifieringen av icke-linjära biologiska system: Volterra Kernel Approaches , Annals Biomedical Engineering (1996), Volym 24, nummer 2.
- Kuo YL: Frekvensdomänanalys av svagt olinjära nätverk , IEEE Trans. Circuits & Systems, vol. CS-11(4) Aug 1977; vol.CS-11(5) okt 1977 2–6.
- Rugh WJ: Icke-linjär systemteori: Volterra–Wiener-metoden. Baltimore 1981 (Johns Hopkins Univ Press) http://rfic.eecs.berkeley.edu/~niknejad/ee242/pdf/volterra_book.pdf
- Schetzen M: The Volterra and Wiener Theories of Nolinar Systems , New York: Wiley, 1980.