Multifidelity simulering

Multifidelity simuleringsmetoder
Mutlifid.jpg
Multifidelity simuleringsmetoder för transport
Klass
Datastruktur Låg- och högfientlig data
Prestanda i värsta fall Inte definierad
Värsta tänkbara utrymmeskomplexitet Inte definierad

Multifidelity-metoder utnyttjar både låg- och high-fidelity-data för att maximera noggrannheten i modelluppskattningar, samtidigt som kostnaden förknippad med parametrisering minimeras . De har framgångsrikt använts i impedanskardiografi , optimering av vingdesign , robotinlärning och har på senare tid utvidgats till system för människor i slingan, såsom flyg och transport . De inkluderar båda modellbaserade metoder, där en generativ modell är tillgänglig eller kan läras ut , förutom modellfria metoder, som inkluderar regressionsbaserade tillvägagångssätt, såsom stacked-regression. En mer allmän klass av regressionsbaserade multi-fidelity-metoder är Bayesianska metoder, t.ex. Bayesisk linjär regression , Gaussiska blandningsmodeller , Gaussiska processer , autoregressiva Gaussiska processer eller Bayesiska polynomkaosexpansioner .

Tillvägagångssättet som används beror på domänen och egenskaperna hos tillgängliga data, och liknar konceptet metasyntes , som föreslås av Judea Pearl .

Datafidelitetsspektrum

Figure showing data-fidelity spectrum
Exempel på datafidelitetsspektrum med fördelar och begränsningar.

Datatillförlitligheten kan variera längs ett spektrum mellan låg- och högfidelitet . Nästa avsnitt ger exempel på data över hela trohetsspektrat, samtidigt som fördelarna och begränsningarna för varje typ av data definieras.

Low fidelity data (LoFi)

Low-fidelity-data (LoFi) inkluderar all data som producerats av en person eller Stokastisk Process som avviker från det verkliga systemet av intresse. Till exempel kan LoFi-data produceras av modeller av ett fysiskt system som använder approximationer för att simulera systemet, snarare än att modellera systemet på ett uttömmande sätt.

Dessutom, i situationer med människor i slingan (HITL) kan målet vara att förutsäga teknikens inverkan på expertbeteende i verkliga operativa sammanhang . Maskininlärning kan användas för att träna statistiska modeller som förutsäger expertbeteende, förutsatt att en adekvat mängd högtrohetsdata (dvs verkliga data) är tillgänglig eller kan produceras.

LoFi fördelar och begränsningar

I situationer när det inte finns en tillräcklig mängd högfientlig data tillgänglig för att träna modellen, kan lågfientlig data ibland användas. Till exempel kan low-fidelity-data erhållas genom att använda en distribuerad simuleringsplattform , såsom X-Plane , och kräva att nybörjare ska verka i scenarier som är approximationer av den verkliga kontexten. Fördelen med att använda low-fidelity-data är att de är relativt billiga att skaffa, så det är möjligt att få fram större mängder data. Begränsningen är dock att low-fidelity-data kanske inte är användbara för att förutsäga verkliga expertprestanda (dvs. high-fidelity-prestanda) på grund av skillnader mellan low-fidelity-simuleringsplattformen och verklighetens kontext, eller mellan nybörjare och expertprestationer (t.ex. på grund av träning).

High-fidelity-data (HiFi)

High-fidelity-data (HiFi) inkluderar data som producerats av en person eller Stokastisk Process som nära matchar det operativa sammanhanget av intresse. Till exempel, vid optimering av vingdesign , använder högfientlighetsdata fysiska modeller i simulering som ger resultat som nära matchar vingen i en liknande verklig miljö. I HITL-situationer skulle HiFi-data produceras från en operativ expert som agerar i det tekniska och situationella sammanhanget av intresse.

HiFi fördelar och begränsningar

En uppenbar fördel med att använda högfientlig data är att uppskattningarna som produceras av modellen bör generaliseras väl till det verkliga sammanhanget. Dessa data är dock dyra både vad gäller tid och pengar, vilket begränsar mängden data som kan erhållas. Den begränsade mängden tillgänglig data kan avsevärt försämra modellens förmåga att producera giltiga uppskattningar.

Multifidelity-metoder (MfM)

Multifidelity-metoder försöker utnyttja styrkorna hos varje datakälla, samtidigt som de övervinner begränsningarna. Även om små till medelstora skillnader mellan low- och high-fidelity-data ibland kan övervinnas med multifidelity-modeller, kan stora skillnader (t.ex. i KL-divergens mellan nybörjar- och expertfördelningar ) vara problematiska och leda till minskad prediktiv prestanda jämfört med modeller som uteslutande förlitade sig på högfientlig data.

Multifidelity-modeller gör det möjligt att samla in lågfientlighetsdata om olika teknikkoncept för att utvärdera risken förknippad med varje koncept innan systemet faktiskt implementeras .

Bayesianska autoregressiva Gaussiska processer

I en autoregressiv modell av Gaussiska processer (GP), varje nivå av utdatatrohet, , där ett högre anger en högre trohet, är modellerad som en GP, , vilket kan uttryckas i termer av föregående nivås GP, , en proportionalitetskonstant och en "difference-GP" som följer:

Skalkonstanten som kvantifierar korrelationen mellan nivåerna och , och kan generellt bero på .

Under antagandet, att all information om en nivå finns i data som motsvarar samma pivotpunkt på nivå såväl som , semi -analytiska första och andra moment är genomförbara. Detta antagande är formellt

Dvs givet en data vid på nivå , finns det ingen ytterligare information om nivå att extrahera från datan på nivå .