Summan av absoluta skillnader

Vid digital bildbehandling är summan av absoluta skillnader ( SAD ) ett mått på likheten mellan bildblock . Den beräknas genom att ta den absoluta skillnaden mellan varje pixel i originalblocket och motsvarande pixel i blocket som används för jämförelse. Dessa skillnader summeras för att skapa ett enkelt mått på blocklikhet, L 1 -normen för skillnadsbilden eller Manhattan-avståndet mellan två bildblock.

Summan av absoluta skillnader kan användas för en mängd olika syften, såsom objektigenkänning , generering av disparitetskartor för stereobilder och rörelseuppskattning för videokomprimering .

Exempel

Det här exemplet använder summan av absoluta skillnader för att identifiera vilken del av en sökbild som är mest lik en mallbild. I det här exemplet är mallbilden 3 gånger 3 pixlar stor, medan sökbilden är 3 gånger 5 pixlar stor. Varje pixel representeras av ett enda heltal från 0 till 9.

Sök mall bild 2 5 5 2 7 5 8 6 4 0 7 1 7 4 2 7 7 5 9 8 4 6 8 5

Det finns exakt tre unika platser i sökbilden där mallen kan passa: bildens vänstra sida, bildens mitt och höger sida av bilden. För att beräkna SAD-värdena används det absoluta värdet av skillnaden mellan varje motsvarande par av pixlar: skillnaden mellan 2 och 2 är 0, 4 och 1 är 3, 7 och 8 är 1, och så vidare.

Att beräkna värdena för de absoluta skillnaderna för varje pixel, för de tre möjliga mallplatserna, ger följande:

Vänster Mitten Höger 0 2 0 5 0 3 3 3 1 3 7 3 3 4 5 0 2 0 1 1 3 3 1 1 1 3 4

För var och en av dessa tre bildlappar adderas de 9 absoluta skillnaderna, vilket ger SAD-värden på 20, 25 respektive 17. Från dessa SAD-värden kan det hävdas att den högra sidan av sökbilden är mest lik mallbilden, eftersom den har den lägsta summan av absoluta skillnader jämfört med de andra två platserna.

Jämförelse med andra mätvärden

Objektigenkänning

Summan av absoluta skillnader ger ett enkelt sätt att automatisera sökningen efter objekt inuti en bild, men kan vara opålitlig på grund av effekterna av kontextuella faktorer som förändringar i ljus, färg, visningsriktning, storlek eller form. SAD kan användas tillsammans med andra objektigenkänningsmetoder, såsom kantdetektering , för att förbättra resultatens tillförlitlighet.

Videokomprimering

SAD är ett extremt snabbt mått på grund av dess enkelhet; det är faktiskt det enklaste möjliga måttet som tar hänsyn till varje pixel i ett block. Därför är det mycket effektivt för en bred rörelsesökning av många olika block. SAD är också lätt parallelliserbart eftersom det analyserar varje pixel separat, vilket gör det enkelt att implementera med sådana instruktioner som ARM NEON eller x86 SSE2 . Till exempel har SSE packat summan av absoluta skillnader (PSADBW) specifikt för detta ändamål. När kandidatblock har hittats, görs den slutliga förfiningen av rörelseuppskattningsprocessen ofta med andra långsammare men mer exakta mätvärden, som bättre tar hänsyn till mänsklig perception . Dessa inkluderar summan av absoluta transformerade skillnader (SATD), summan av kvadrerade skillnader (SSD) och optimering av hastighetsförvrängning .

Se även

  • EG Richardson, Iain (2003). H.264 och MPEG-4 videokomprimering: videokodning för nästa generations multimedia . Chichester: John Wiley & Sons Ltd.