Census transform
Census transform (CT) är en bildoperator som till varje pixel i en gråskalebild associerar en binär sträng som kodar om pixeln har mindre intensitet än var och en av dess grannar, en för varje bit. Det är en icke-parametrisk transformation som endast beror på relativ ordning av intensiteter och inte på de faktiska intensitetsvärdena , vilket gör den oföränderlig med avseende på monotona belysningsvariationer, och den beter sig bra i närvaro av multimodala intensitetsfördelningar, t.ex. objekts gränser. Den har applikationer inom datorseende , och den används ofta i visuella korrespondensproblem som optisk flödesberäkning och disparitetsuppskattning .
Censustransformen är relaterad till rangtransformeringen , som associerar till varje pixel antalet angränsande pixlar med högre intensitet än själva pixeln, och introducerades i samma tidning.
Algoritm
Den vanligaste versionen av folkräkningstransformeringen använder ett 3x3-fönster, som jämför varje pixel med alla dess 8-anslutna grannar med en funktion definierad som
Resultaten av dessa jämförelser är sammanlänkade och värdet på transformationen är ett 8-bitars värde, som enkelt kan kodas i en byte .
Likhet mellan bilder bestäms genom att jämföra värdena för folkräkningstransformeringen för motsvarande pixlar med Hamming-avståndet . Det finns flera varianter av algoritmen, med olika storlek på fönstret, ordning på grannarna i mönstret (radvis, medurs, moturs), jämförelseoperator (större, större eller lika, mindre, mindre eller lika).
En förlängning av algoritmen använder en trevägsjämförelse som gör det möjligt att representera liknande pixlar, vars intensitetsskillnad är mindre än en toleransparameter , definierad som
vars resultat kan kodas med två bitar för varje granne, vilket därmed fördubblar storleken på mönstret för varje pixel.
Se även
- Hafner, David; Demetz, Oliver; Weickert, Joachim (2013). "Varför är folkräkningsomvandlingen bra för robust optisk flödesberäkning?" (PDF) . Internationell konferens om skalutrymme och variationsmetoder i datorseende . s. 210–221.
- Stein, Fridtjof (2004). "Effektiv beräkning av optiskt flöde med hjälp av folkräkningstransformeringen" . Gemensamt symposium för mönsterigenkänning . s. 79–86.
- Zabih, Ramin; Woodfill, John (1994). "Icke-parametriska lokala transformationer för beräkning av visuell korrespondens" ( PDF) . Europeisk konferens om datorseende . s. 151–158.