Faskorrelation

Faskorrelation är ett tillvägagångssätt för att uppskatta den relativa translativa förskjutningen mellan två liknande bilder ( digital bildkorrelation) eller andra datamängder. Det används ofta i bildregistrering och bygger på en frekvensdomänrepresentation av data, vanligtvis beräknad genom snabba Fourier-transformeringar . Termen tillämpas särskilt på en delmängd av korskorrelationstekniker som isolerar fasinformationen från Fourier-rymdsrepresentationen av korskorrelogrammet .

Exempel

Följande bild visar användningen av faskorrelation för att bestämma relativ translativ rörelse mellan två bilder som skadats av oberoende Gaussiskt brus. Bilden översattes med (30,33) pixlar. Följaktligen kan man tydligt se en topp i faskorrelationsrepresentationen vid ungefär (30,33).

Phase correlation.png

Metod

Givet två indatabilder och :

Använd en fönsterfunktion (t.ex. ett Hamming-fönster ) på båda bilderna för att minska kanteffekter (detta kan vara valfritt beroende på bildens egenskaper). Beräkna sedan den diskreta 2D Fourier-transformen av båda bilderna.

Beräkna korseffektspektrumet genom att ta det komplexa konjugatet av det andra resultatet, multiplicera Fouriertransformerna elementvis och normalisera denna produkt elementvis.

Där är Hadamard-produkten (ingångsmässig produkt) och de absoluta värdena tas även ingångsmässigt. Skrivs ut inmatningsvis för elementindex :

Erhåll den normaliserade korskorrelationen genom att tillämpa den inversa Fouriertransformen.

Bestäm platsen för toppen i .

Vanligtvis används interpolationsmetoder för att uppskatta toppläget i korskorrelogrammet till icke- heltalsvärden , trots det faktum att data är diskreta, och denna procedur kallas ofta för "subpixelregistrering". En stor mängd subpixelinterpolationsmetoder ges i den tekniska litteraturen. Vanliga toppinterpolationsmetoder som parabolisk interpolation har använts, och OpenCV datorvisionspaketet använder en tyngdpunktsbaserad metod, även om dessa generellt har sämre noggrannhet jämfört med mer sofistikerade metoder.

Eftersom Fourierrepresentationen av datan redan har beräknats är det särskilt bekvämt att använda Fourierskiftsatsen med reella -värderade (subheltals) skift för detta ändamål, som i huvudsak interpolerar med hjälp av Fouriertransformens sinusformade basfunktioner . En särskilt populär FT-baserad estimator ges av Foroosh et al. I den här metoden approximeras subpixelns toppposition med en enkel formel som involverar topppixelvärdet och värdena för dess närmaste grannar, där är toppvärdet och är närmaste granne i x-riktningen (förutsatt, som i de flesta tillvägagångssätt, att heltalsförskjutningen redan har hittats och att jämförelsebilderna endast skiljer sig med ett subpixelskifte) .

[ förtydligande behövs ]

Foroosh et al. Metoden är ganska snabb jämfört med de flesta metoder, även om den inte alltid är den mest exakta. Vissa metoder förskjuter toppen i Fourierrymden och tillämpar icke-linjär optimering för att maximera korrelogramtoppen, men dessa tenderar att vara mycket långsamma eftersom de måste tillämpa en invers Fouriertransform eller dess motsvarighet i objektivfunktionen.

Det är också möjligt att sluta sig till toppläget från fasegenskaper i Fourierrymden utan den omvända transformationen, som noterats av Stone. Dessa metoder använder vanligtvis en linjär minsta kvadraters (LLS) passning av fasvinklarna till en plan modell. Den långa latensen för fasvinkelberäkningen i dessa metoder är en nackdel, men hastigheten kan ibland vara jämförbar med Foroosh et al. metod beroende på bildstorleken. De jämför ofta fördelaktigt i hastighet med de multipla iterationerna av extremt långsamma objektiva funktioner i iterativa icke-linjära metoder.

Eftersom alla beräkningsmetoder för subpixelskifte i grunden är interpolativa, beror prestandan för en viss metod på hur väl den underliggande datan överensstämmer med antagandena i interpolatorn. Detta faktum kan också begränsa användbarheten av hög numerisk noggrannhet i en algoritm, eftersom osäkerheten på grund av valet av interpolationsmetod kan vara större än något numeriskt eller approximativt fel i den specifika metoden.

Subpixelmetoder är också särskilt känsliga för brus i bilderna, och användbarheten av en viss algoritm kännetecknas inte bara av dess hastighet och noggrannhet utan dess motståndskraft mot de speciella typerna av brus i applikationen.

Logisk grund

Metoden bygger på Fourierskiftesatsen .

Låt de två bilderna och vara cirkulärt förskjutna versioner av varandra:

(där bilderna är i storlek).

Sedan kommer de diskreta Fourier-transformerna av bilderna att förskjutas relativt i fas :

Man kan sedan beräkna det normaliserade korseffektspektrumet för att faktorisera fasskillnaden:

eftersom storleken på en imaginär exponential alltid är ett, och fasen för alltid är noll .

Den inversa Fouriertransformen av en komplex exponential är ett Kroneckerdelta , dvs en enda topp:

Detta resultat kunde ha erhållits genom att beräkna korskorrelationen direkt . Fördelen med denna metod är att den diskreta Fouriertransformen och dess invers kan utföras med den snabba Fouriertransformen, som är mycket snabbare än korrelation för stora bilder.

Fördelar

Till skillnad från många rumsliga domänalgoritmer är faskorrelationsmetoden motståndskraftig mot brus, ocklusioner och andra defekter som är typiska för medicinska bilder eller satellitbilder.

Metoden kan utökas för att bestämma rotations- och skalningsskillnader mellan två bilder genom att först konvertera bilderna till log-polära koordinater . På grund av Fouriertransformens egenskaper kan rotations- och skalningsparametrarna bestämmas på ett sätt som är invariant i förhållande till translation.

Begränsningar

I praktiken är det mer troligt att kommer att vara ett enkelt linjärt skift av snarare än ett cirkulärt skift som krävs enligt förklaringen ovan. I sådana fall inte att vara en enkel deltafunktion, vilket kommer att minska metodens prestanda. I sådana fall bör en fönsterfunktion (som ett Gauss- eller Tukey-fönster) användas under Fourier-transformeringen för att reducera kanteffekter, eller så bör bilderna vara nollutfyllda så att kanteffekterna kan ignoreras. Om bilderna består av en platt bakgrund, med alla detaljer placerade bort från kanterna, kommer en linjär förskjutning att vara ekvivalent med en cirkulär förskjutning, och ovanstående härledning kommer att hålla exakt. Toppen kan skärpas genom att använda kant- eller vektorkorrelation.

För periodiska bilder (som ett schackbräde eller staket) kan faskorrelation ge tvetydiga resultat med flera toppar i resultatet.

Ansökningar

Faskorrelation är den föredragna metoden för konvertering av tv-standarder , eftersom den lämnar minsta möjliga artefakter.

Se även

Allmän

Tv

  1. ^ H. Foroosh (Shekarforoush), JB Zerubia och M. Berthod, "Utvidgning av faskorrelation till subpixelregistrering," IEEE Transactions on Image Processing, V. 11, nr 3, mars 2002, s. 188-200.
  2. ^ EgM Sjödahl och LR Benckert, "Elektronisk fläckfotografering: analys av en algoritm som ger förskjutningen med subpixelnoggrannhet," Appl Opt. 1993 maj 1;32(13):2278-84. doi : 10.1364/AO.32.002278
  3. ^ Harold S. Stone, "A Fast Direct Fourier-Based Algorithm for Subpixel Registration of Images", IEEE Transactions on Geoscience and Remote Sensing, V. 39, No. 10, Oct. 2001, pp.2235-2242
  4. ^ S. Nithyanadam, S. Amaresan och N. Mohamed Haris "En innovativ normaliseringsprocess genom faskorrelationsmetod av irisbilder för blockstorleken 32*32"
  5. ^ E. De Castro och C. Morandi "Registrering av översatta och roterade bilder med ändliga Fourier-transformers", IEEE-transaktioner på mönsteranalys och maskinintelligens, sept. 1987
  6. ^ B. S Reddy och BN Chatterji, "En FFT-baserad teknik för översättning, rotation och skalinvariant bildregistrering", IEEE Transactions on Image Processing 5, nr. 8 (1996): 1266-1271.
  7. ^   Sarvaiya, Jignesh Natvarlal; Patnaik, Suprava; Kothari, Kajal (2012). "Bildregistrering med hjälp av log polär transformation och faskorrelation för att återställa högre skala". JPRR . 7 (1): 90–105. CiteSeerX 10.1.1.730.9105 . doi : 10.13176/11.355 .

externa länkar