Stegdetektering

Exempel på signaler som kan innehålla steg skadade av brus. (a) DNA-kopietalsförhållanden från mikroarraydata , (b) kosmisk strålningsintensitet från en neutronmonitor , (c) rotationshastighet mot tiden för R. Sphaeroides flagellmotor och (d) röd pixelintensitet från en enda skanningslinje av en digital bild.

Inom statistik och signalbehandling är stegdetektering (även känd som stegutjämning , stegfiltrering , skiftdetektering , hoppdetektering eller kantdetektering ) processen att hitta abrupta förändringar (steg, hopp, skift) i medelnivån för en tidsserie eller signal. Det betraktas vanligtvis som ett specialfall av den statistiska metoden som kallas förändringsdetektering eller förändringspunktsdetektering. Ofta är steget litet och tidsserien är skadad av något slags brus , vilket gör problemet utmanande eftersom steget kan döljas av bruset. Därför krävs ofta statistiska och/eller signalbehandlingsalgoritmer.

Stegdetekteringsproblemet uppstår i flera vetenskapliga och tekniska sammanhang, till exempel i statistisk processkontroll ( kontrolldiagrammet är den mest direkt relaterade metoden), inom utforskningsgeofysik ( där problemet är att segmentera en brunnsloggregistrering i stratigrafiska zoner ), i genetik (problemet med att separera mikroarraydata i liknande kopienummerregimer ) och i biofysik (upptäcka tillståndsövergångar i en molekylär maskin som registrerats i tidspositionsspår). För 2D-signaler har det relaterade problemet med kantdetektering studerats intensivt för bildbehandling .

Algoritmer

När stegdetekteringen måste utföras när och när data anländer, används vanligtvis onlinealgoritmer , och det blir ett specialfall av sekventiell analys . Sådana algoritmer inkluderar den klassiska CUSUM -metoden som tillämpas på förändringar i medelvärde.

Däremot tillämpas offlinealgoritmer på data potentiellt långt efter att de har tagits emot . De flesta offlinealgoritmer för stegdetektering i digital data kan kategoriseras som metoder uppifrån och ned , nedifrån och upp , glidande fönster eller globala metoder.

Uppifrån och ner

Dessa algoritmer börjar med antagandet att det inte finns några steg och introducerar möjliga kandidatsteg ett i taget, och testar varje kandidat för att hitta den som minimerar vissa kriterier (som minsta kvadraters anpassning av den uppskattade, underliggande bitvis konstanta signalen). Ett exempel är den stegvisa hoppplaceringsalgoritmen , som först studerades i geofysiska problem, som har funnit nya användningsområden inom modern biofysik.

Botten upp

Bottom-up-algoritmer tar det "motsatta" tillvägagångssättet till top-down-metoder, och antar först att det finns ett steg mellan varje sampel i den digitala signalen, och sedan successivt sammanslagning av steg baserat på några kriterier som testats för varje kandidatsammanslagning.

Glidande fönster

Genom att betrakta ett litet "fönster" av signalen letar dessa algoritmer efter bevis på att ett steg inträffar i fönstret. Fönstret "glider" över tidsserien, ett tidssteg i taget. Bevisen för ett steg testas med statistiska procedurer, till exempel genom att använda två-provet Students t-test . Alternativt appliceras ett olinjärt filter såsom medianfiltret på signalen. Filter som dessa försöker ta bort bruset samtidigt som de plötsliga stegen bevaras.

Global

Globala algoritmer överväger hela signalen på en gång och försöker hitta stegen i signalen genom någon form av optimeringsprocedur. Algoritmer inkluderar wavelet- metoder och total variation denoising som använder metoder från konvex optimering . Där stegen kan modelleras som en Markov-kedja , används också ofta Hidden Markov-modeller (ett populärt tillvägagångssätt inom biofysikgemenskapen). När det bara finns ett fåtal unika värden på medelvärdet, k-medelklustring också användas.

Linjära kontra olinjära signalbehandlingsmetoder för stegdetektering

Eftersom steg och (oberoende) brus har teoretiskt oändlig bandbredd och sålunda överlappar i Fourier-basen , använder signalbehandlingsmetoder för stegdetektering i allmänhet inte klassiska utjämningstekniker såsom lågpassfiltret . Istället är de flesta algoritmer uttryckligen olinjära eller tidsvarierande.

Stegdetektering och styckvis konstanta signaler

Eftersom syftet med stegdetektering är att hitta en serie momentana hopp i medelvärdet av en signal, är den önskade, underliggande medelsignalen konstant konstant . Av denna anledning kan stegdetektering lönsamt ses som problemet med att återställa en bitvis konstant signal som skadats av brus. Det finns två kompletterande modeller för styckvis konstanta signaler: som 0-graders splines med några få knop, eller som nivåuppsättningar med några unika nivåer. Många algoritmer för stegdetektering förstås därför bäst som antingen 0-graders splinepassning, eller nivåuppsättningsåterställningsmetoder.

Stegdetektering som återhämtning av nivåuppsättning

När det bara finns ett fåtal unika värden på medelvärdet, är klustringstekniker som k-medelvärden klustring eller medelförskjutning lämpliga. Dessa tekniker förstås bäst som metoder för att hitta en nivåuppsättningsbeskrivning av den underliggande bitvis konstanta signalen.

Stegdetektering som 0-graders splinepassning

Många algoritmer anpassar explicit 0-graders splines till den brusiga signalen för att detektera steg (inklusive stegvisa hoppplaceringsmetoder), men det finns andra populära algoritmer som också kan ses vara splineanpassningsmetoder efter viss transformation, till exempel total variationsnedsättning .

Generaliserad stegdetektering genom styckvis konstant nedtoning

Alla ovan nämnda algoritmer har vissa fördelar och nackdelar under speciella omständigheter, men ändå är ett förvånansvärt stort antal av dessa stegdetekteringsalgoritmer specialfall av en mer allmän algoritm. Denna algoritm innebär minimering av en global funktion:

H[m]=\summa _ {i=1}^{N}\summa _{j=1}^{N}\Lambda (x_{i}-m_{j},m_{i}-m_{j},x_{i}-x_ {j},ij)

()

Här är _xi för i = 1, ...., _N är den tidsdiskreta insignalen med längden N och mi är utsignalen från algoritmen. Målet är att minimera H [ m ] med avseende på utsignalen m . Formen av funktionen $\scriptstyle \Lambda$ bestämmer den specifika algoritmen. Välj till exempel:

\Lambda ={\frac {1}{2}}\left|x_{i}-m_{j}\right|^{2}I(ij=0)+ \gamma \left|m_{i}-m_{j}\right|I(ij=1)

där I ( S ) = 0 om villkoret S är falskt, och en annars, erhåller den totala variationsavblödningsalgoritmen med regulariseringsparameter $\gamma$ . Liknande:

\Lambda =\min \left\{{\frac {1}{2}}\left|m_{i}-m_{j}\right|^{2},W\right\ }

leder till medelförskjutningsalgoritmen , när man använder en Euler-integrator med adaptiv stegstorlek initierad med insignalen x . Här W > 0 en parameter som bestämmer stödet för medelskiftkärnan. Ett annat exempel är:

\Lambda ={\frac {1-\exp(-\beta |m_{i}-m_{j}|^{2}/2)}{\beta }}\cdot I(|ij|\leq W)

leder till det bilaterala filtret , där $\scriptstyle \beta >0$ är den tonala kärnparametern och W är det rumsliga kärnstödet. Ytterligare ett specialfall är:

\Lambda ={\frac {1}{2}}\left|x_{i}-m_{j}\right|^{2}I(ij=0)+ \gamma \left|m_{i}-m_{j}\right|^{0}I(ij=1)

specificerar en grupp algoritmer som girigt försöker passa 0-graders splines till signalen. Här, $\scriptstyle \left|x\right|^{0}$ definieras som noll om x = 0, och en annars.

Många av funktionalerna i ekvation ( 1 ) som definieras av det särskilda valet av $\scriptstyle \Lambda$ är konvexa : de kan minimeras med metoder från konvex optimering . Ytterligare andra är icke-konvexa men en rad algoritmer för att minimera dessa funktioner har utarbetats.

Stegdetektering med hjälp av Potts-modellen

En klassisk variationsmetod för stegdetektering är Potts-modellen. Det ges av det icke-konvexa optimeringsproblemet

u^{*}=\arg \min _{u\in \mathbb {R} ^{N} }\gamma \|\nabla u\|_{0}+\|ux\|_{p}^{p}

Termen $\|\nabla u\|_{0}=\#\{i:u_{i}\neq u_{i+ 1}\}$ straffar antalet hopp och termen ${\displaystyle \|ux\|_{p}^{p}=\sum _{i=1}^{N}|u_{i}-x_{i}|^{p}} mäter$ datatrohet x . Parametern γ > 0 styr avvägningen mellan regularitet och datatillförlitlighet . Eftersom minimizern $u^{*}$ är styckvis konstant ges stegen av placeringarna som inte är noll för gradienten $\nabla u^{*}$ . För $p=2$ och $p=1$ finns det snabba algoritmer som ger en exakt lösning på Potts-problemet i $O(N^{2 })$ .

Se även

Tidsseriesegmentering

externa länkar