Sobel operatör

En färgbild av en motor

Sobel-operatören tillämpade den bilden

Sobel -operatören , ibland kallad Sobel-Feldman-operatören eller Sobel-filtret , används i bildbehandling och datorseende , särskilt inom kantdetekteringsalgoritmer där den skapar en bild som framhäver kanter. Den är uppkallad efter Irwin Sobel och Gary Feldman , kollegor vid Stanford Artificial Intelligence Laboratory (SAIL). Sobel och Feldman presenterade idén om en " Isotropic 3 × 3 Image Gradient Operator" vid ett föredrag på SAIL 1968. Tekniskt sett är det en diskret differentieringsoperator som beräknar en approximation av gradienten för bildintensitetsfunktionen. Vid varje punkt i bilden är resultatet av Sobel-Feldman-operatorn antingen motsvarande gradientvektor eller normen för denna vektor. Sobel–Feldman-operatorn bygger på att konvolvera bilden med ett litet, separerbart och heltalsvärde filter i horisontella och vertikala riktningar och är därför relativt billig i termer av beräkningar. Å andra sidan är den gradientapproximation som den producerar relativt grov, särskilt för högfrekventa variationer i bilden.

Formulering

Operatören använder två 3×3-kärnor som viks ihop med originalbilden för att beräkna approximationer av derivatorna – en för horisontella förändringar och en för vertikala. Om vi definierar A som källbilden, och G _x och G _y är två bilder som vid varje punkt innehåller de horisontella respektive vertikala derivata approximationerna, är beräkningarna följande:

\mathbf {G} _{x }={\begin{bmatrix}+1&0&-1\\+2&0&-2\\+1&0&-1\end{bmatrix}}*\mathbf {A} \quad {\mbox{and}}\quad \mathbf { G} _{y}={\begin{bmatrix}+1&+2&+1\\0&0&0\\-1&-2&-1\end{bmatrix}}*\mathbf {A}

där $*$ här betecknar den 2-dimensionella signalbearbetningsoperationen .

Eftersom Sobel-kärnorna kan brytas ner som produkter av en medelvärdes- och en differentieringskärna, beräknar de gradienten med utjämning. Till exempel $\mathbf {G} _{x}$ skrivas som

\mathbf {G} _{x }={\begin{bmatrix}1\\2\\1\end{bmatrix}}*\left({\begin{bmatrix}+1&0&-1\end{bmatrix}}*\mathbf {A} \right) \quad {\mbox{and}}\quad \mathbf {G} _{y}={\begin{bmatrix}+1\\0\\-1\end{bmatrix}}*\left({\begin{ bmatrix}1&2&1\end{bmatrix}}*\mathbf {A} \right)

X - koordinaten definieras här som ökande i "höger"-riktningen, och y -koordinaten definieras som ökande i "nedåt"-riktningen. Vid varje punkt i bilden kan de resulterande gradientuppskattningarna kombineras för att ge gradientens storlek, med hjälp av:

\mathbf {G} ={\sqrt {{\mathbf {G} _{x}}^{2}+{\mathbf {G} _{y}}^ {2}}}

Med hjälp av denna information kan vi också beräkna gradientens riktning:

\mathbf {\Theta } =\operatörsnamn {atan2} (\mathbf {G} _{y},\mathbf {G} _{x})

där till exempel $\mathbf {\Theta }$ är 0 för en vertikal kant som är ljusare på höger sida (för $\operatorname {atan2}$ se atan2 ).

Mer formellt

Eftersom intensitetsfunktionen för en digital bild endast är känd vid diskreta punkter, kan derivator av denna funktion inte definieras om vi inte antar att det finns en underliggande differentierbar intensitetsfunktion som har samplas vid bildpunkterna. Med några ytterligare antaganden kan derivatan av den kontinuerliga intensitetsfunktionen beräknas som en funktion på den samplade intensitetsfunktionen, dvs den digitala bilden. Det visar sig att derivatorna vid någon speciell punkt är funktioner av intensitetsvärdena vid praktiskt taget alla bildpunkter. Emellertid kan approximationer av dessa derivata funktioner definieras med mindre eller större grader av noggrannhet.

Sobel-Feldman-operatören representerar en ganska inexakt approximation av bildgradienten, men är fortfarande av tillräcklig kvalitet för att vara praktiskt användbar i många applikationer. Närmare bestämt använder den intensitetsvärden endast i ett 3×3-område runt varje bildpunkt för att approximera motsvarande bildgradient, och den använder endast heltalsvärden för de koefficienter som viktar bildintensiteterna för att producera gradientapproximationen.

Förlängning till andra dimensioner

Sobel–Feldman-operatören består av två separerbara operationer:

Utjämning vinkelrätt mot derivatans riktning med ett triangelfilter: $h(-1)=1,h(0)=2,h (1)=1$
Enkel central skillnad i derivatans riktning: $h'(-1)=1,h'(0)=0 ,h'(1)=-1$

Sobel–Feldman filtrerar för bildderivator i olika dimensioner med $x,y,z,t\in \left\{0,-1,1\right \}$ :

ID: $h_{x}'(x)=h'(x);$

2D: $h_{x}'(x,y)=h'(x)h(y)$

2D: $h_{y}'(x,y)=h(x)h'(y)$

3D: $h_{y}'(x,y,z)=h(x)h'(y )h(z)$

3D: $h_{z}'(x,y,z)=h(x)h(y) h'(z)$

4D: $h_{x}'(x,y,z,t)= h'(x)h(y)h(z)h(t)$

Så som ett exempel 3D Sobel–Feldman kärnan i z -riktning:

h_{z}'(:,:,-1)={\begin{bmatrix}+1& +2&+1\\+2&+4&+2\\+1&+2&+1\end{bmatrix}}\quad h_{z}'(:,:,0)={\begin{bmatrix}0&0&0\\ 0&0&0\\0&0&0\end{bmatrix}}\quad h_{z}'(:,:,1)={\begin{bmatrix}-1&-2&-1\\-2&-4&-2\\-1&- 2&-1\end{bmatrix}}

Tekniska detaljer

Som en konsekvens av dess definition kan Sobel-operatören implementeras med enkla medel i både hårdvara och mjukvara: endast åtta bildpunkter runt en punkt behövs för att beräkna motsvarande resultat och endast heltalsaritmetik behövs för att beräkna gradientvektorapproximationen. Dessutom är de två diskreta filtren som beskrivs ovan båda separerbara:

{\begin{bmatrix }1&0&-1\\2&0&-2\\1&0&-1\end{bmatrix}}={\begin{bmatrix}1\\2\\1\end{bmatrix}}{\begin{bmatrix}1&0&-1\ end{bmatrix}}={\begin{bmatrix}1\\1\end{bmatrix}}*{\begin{bmatrix}1\\1\end{bmatrix}}{\begin{bmatrix}1&-1\end {bmatrix}}*{\begin{bmatrix}1&1\end{bmatrix}}

{\begin{bmatrix}\ \ 1&\ \ 2&\ \ 1\\\ \ 0&\ \ 0&\ \ 0\\-1&-2&-1\end {bmatrix}}={\begin{bmatrix}\ \ 1\\\ \ 0\\-1\end{bmatrix}}{\begin{bmatrix}1&2&1\end{bmatrix}}={\begin{bmatrix}1 \\1\end{bmatrix}}*{\begin{bmatrix}\ \ 1\\-1\end{bmatrix}}{\begin{bmatrix}1&1\end{bmatrix}}*{\begin{bmatrix}1&1 \end{bmatrix}}

och de två derivatorna G _x och G _y kan därför beräknas som

\mathbf {G} _{x}= {\begin{bmatrix}1\\2\\1\end{bmatrix}}*\left({\begin{bmatrix}1&0&-1\end{bmatrix}}*\mathbf {A} \right)\quad { \mbox{and}}\quad \mathbf {G} _{y}={\begin{bmatrix}\ \ 1\\\ \ 0\\-1\end{bmatrix}}*\left({\begin{ bmatrix}1&2&1\end{bmatrix}}*\mathbf {A} \right)

I vissa implementeringar kan denna separerbara beräkning vara fördelaktig eftersom den innebär färre aritmetiska beräkningar för varje bildpunkt.

Att tillämpa faltning K på pixelgrupp P kan representeras i pseudokod som:

N(x,y) = Summan av { K(i,j).P(xi,yj)}, för i,j som går från -1 till 1.

N(x,y) representerar den nya matrisen som erhålls efter applicering av faltningen K till P , där P är pixelmatris.

Exempel

Resultatet av Sobel-Feldman-operatorn är en 2-dimensionell karta över gradienten vid varje punkt. Den kan bearbetas och ses som om den i sig själv är en bild, med områdena med hög gradient (de troliga kanterna) synliga som vita linjer. Följande bilder illustrerar detta genom att visa beräkningen av Sobel-Feldman-operatören på en enkel bild.

Testbild i gråskala av tegelvägg och cykelställ	Normaliserad gradientstorlek från Sobel–Feldman-operatör
Normaliserad x -gradient från Sobel–Feldman operatör	Normaliserad y -gradient från Sobel–Feldman-operatör

Bilderna nedan illustrerar förändringen i gradientens riktning på en gråskalecirkel. När tecknet för $\mathbf {G_{x}}$ och $\mathbf {G_{y}}$ är samma är gradientens vinkel positiv och negativ när den är olika. I exemplet nedan indikerar de röda och gula färgerna på kanten av cirkeln positiva vinklar, och de blå och cyanfärgerna indikerar negativa vinklar. De vertikala kanterna på cirkelns vänstra och högra sida har en vinkel på 0 eftersom det inte finns någon lokal förändring i $\mathbf {G_{y}}$ . De horisontella kanterna på cirkelns övre och nedre sidor har vinklarna − $π$ / 2 respektive $π$ / 2 eftersom det inte finns någon lokal förändring i $\mathbf {G_{x}}$ . Den negativa vinkeln för överkanten betyder att övergången är från ett ljust till mörkt område, och den positiva vinkeln för den nedre kanten betyder en övergång från ett mörkt till ljust område. Alla andra pixlar är markerade som svarta på grund av ingen lokal förändring i antingen $\mathbf {G_{x}}$ eller ${\displaystyle \mathbf {G_{y}} } ,$ och därför är vinkeln inte definierad. Eftersom vinkeln är en funktion av förhållandet mellan $\mathbf {G_{y}}$ till $\mathbf {G_{x}}$ kan pixlar med små förändringshastigheter fortfarande ha en stor vinkelsvar. Som ett resultat kan brus ha en stor vinkelrespons, vilket vanligtvis är oönskat. När du använder gradientvinkelinformation för bildbehandlingstillämpningar bör ansträngningar göras för att ta bort bildbrus för att minska detta falska svar.

Gråskalebild av en svart cirkel med vit bakgrund.

Riktningen för Sobeloperatörens lutning.

Alternativa operatörer

Sobel-Feldman-operatören, samtidigt som den minskar artefakter som är förknippade med en ren central skillnadsoperator, uppvisar inte en bra rotationssymmetri (ca 1° fel). Scharr undersökte att optimera denna egenskap genom att producera kärnor optimerade för specifik given numerisk precision (heltal, flytande ...) och dimensionaliteter (1D, 2D, 3D). Optimerade 3D-filterkärnor upp till en storlek på 5 x 5 x 5 har presenterats där, men de mest använda, med ett fel på cirka 0,2° är:

h_ {x}'(:,:)={\begin{bmatrix}+3&0&-3\\+10&0&-10\\+3&0&-3\end{bmatrix}}\ \ \ \ \ \ \ \ \ h_{y }'(:,:)={\begin{bmatrix}+3&+10&+3\\0&0&0\\-3&-10&-3\end{bmatrix}}

Detta påverkar på liknande sätt:

${\begin{bmatrix}3&10&3\end{bmatrix}}={\begin{bmatrix}3&1\end{bmatrix}}*{\begin{ bmatrix}1&3\end{bmatrix}}$

Scharr-operatorer är resultatet av en optimering som minimerar viktat medelkvadratvinkelfel i Fourier-domänen . Denna optimering görs under förutsättning att resulterande filter är numeriskt konsekventa. Därför är de verkligen härledda kärnor snarare än att bara hålla symmetribegränsningar. Det optimala 8-bitars heltalsvärderade 3x3-filtret som härrör från Scharrs teori är

{\}displaystyle h:

En liknande optimeringsstrategi och resulterande filter presenterades också av Farid och Simoncelli. De undersöker också högre ordningens derivatsystem. I motsats till Scharrs arbete tvingas dessa filter inte att vara numeriskt konsekventa.

Problemet med derivatfilterdesign har återupptagits av t.ex. Kroon.

Derivatfilter baserade på godtyckliga kubiska splines presenterades av Hast. Han visade hur första och andra ordningens derivator kan beräknas korrekt med kubiska eller trigonometriska splines genom en dubbelfiltreringsmetod som ger filter med längden 7.

En annan liknande operatör som ursprungligen genererades från Sobel-operatören är Kayyali-operatören, ett perfekt rotationssymmetribaserat faltningsfilter 3x3.

Orienteringsoptimala derivatkärnor minskar drastiskt systematiska uppskattningsfel vid optisk flödesuppskattning . Större scheman med ännu högre noggrannhet och optimerade filterfamiljer för utökad optisk flödesuppskattning har presenterats i efterföljande arbete av Scharr. Andra ordningens derivata filteruppsättningar har undersökts för transparent rörelseuppskattning . Det har observerats att ju större de resulterande kärnorna är, desto bättre approximerar de derivat-av-Gaussiska filter.

Exempel på jämförelser

Här används fyra olika gradientoperatorer för att uppskatta storleken på testbildens gradient.

Testbild i gråskala av tegelvägg och cykelställ	Gradientstorlek från Sobel–Feldman-operatör	Gradientstorlek från Scharr-operatör
Gradientstorlek från Roberts Cross -operatör	Gradientstorlek från Prewitt-operatör

MATLAB implementering


 
 

  
  
  










   
   0   0   0 
     0 0 0   

   
   
  

  

 
     
	       
	       

	             
    


   
   
    0
 clc  clear  all  stäng  alla  test_img  =  imread  (  'gantrycrane.png' )  ;  gray_img  =  rgb2gray  (  test_img  );  sobel_img  =  sobel  (  grå_img  );  figur  imshow(test_img)  figur  imshow  (  grå_img  )  figur  imshow  (  sobel_img  )  function  output_image  =  sobel  (  A  )  Gx  =  [  -  1  1  ;  -  2  2  ;  -  1  1  ]  Gy  =  [  -  1  -  2  -  1  ;  ;  1  2  1]  rader  =  storlek  (  A  ,  1  )  kolumner  =  storlek  (  A  ,  2  )  mag  =  nollor  (  storlek  (  A  ));  A  =  dubbel  (  A  );  för  i  =  1  :  rader  -  2  för  j  =  1  :  kolumner  -  2  S1  =  summa  (  summa  (  Gx  .*  A  (  i  :  i  +  2  ,  j  :  j  +  2  )));  S2  =  summa  (  summa  (  Gy  .*  A  (  i  :  i  +  2  ,  j  :  j  +  2  )));  mag  (  i  +  1  ,  j  +  1  )  =  sqrt  (  S1  .^  2  +  S2  .^  2  );  slutet  tröskelvärde  =  70  % varierar för applikation [0–255]  output_image  =  max  (  mag  ,  tröskel  )  ;  output_image  (  output_image  ==  rund  (  tröskel  ))  =  ;  slutet

Ovanstående MATLAB- kod kommer att använda en bild som är förpackad med MATLAB själv ('gantrycrane.png') för att demonstrera Sobel-filtret. Det kommer att finnas utdata med originalbild, gråskaleversion av originalbild och utdata från Sobel-filtret.

Se även

^ Irwin Sobel, 2014, historia och definition av Sobel-operatören
^ Funktionsdetektorer – Sobel Edge Detector
^ K. Engel (2006). Volymgrafik i realtid . s. 112–114.
^ Scharr, Hanno, 2000, avhandling (på tyska), Optimala operatörer i digital bildbehandling .
^ B. Jähne, H. Scharr och S. Körkel. Principer för filterdesign. I Handbook of Computer Vision and Applications. Academic Press, 1999.
^ H. Farid och EP Simoncelli, Optimally Rotation-Equivariant Directional Derivative Kernels , Int'l Conf Computer Analysis of Images and Patterns, s. 207–214, september 1997.
^ H. Farid och EP Simoncelli, Differentiering av diskreta flerdimensionella signaler , IEEE Trans Image Processing, vol.13(4), s. 496–508, april 2004.
^ D. Kroon, 2009, Short Paper University Twente, numerisk optimering av kärn-baserade bildderivat .
^ A. Hast., "Enkel filterdesign för första och andra ordningens derivator genom ett dubbelfiltrerande tillvägagångssätt", Pattern Recognition Letters, Vol. 42, nr 1 juni, s. 65–71. 2014.
^ Dim, Jules R.; Takamura, Tamio (2013-12-11). "Alternativ tillvägagångssätt för Satellite Cloud Classification: Edge Gradient Application" . Framsteg inom meteorologi . 2013 : 1–8. doi : 10.1155/2013/584816 . ISSN 1687-9309 .
^ Scharr, Hanno (2007). "Optimala filter för utökat optiskt flöde". Komplex rörelse . Föreläsningsanteckningar i datavetenskap. Vol. 3417. Berlin, Heidelberg: Springer Berlin Heidelberg. s. 14–29. doi : 10.1007/978-3-540-69866-1_2 . ISBN 978-3-540-69864-7 .
^ Scharr, Hanno, OPTIMALA ANDRA ORDENS DERIVATFILTERFAMILJER FÖR TRANSPARENT RÖRELSESKATNING 15:e europeiska signalbehandlingskonferensen (EUSIPCO 2007), Poznan, Polen, 3–7 september 2007.

externa länkar

Sobel kantdetektering i OpenCV
Sobel Filter , i SciPy Python Library
Bibliografiska citat för Irwin Sobel i DBLP
Exempel på Sobel-kantdetektering med datoralgoritmer

[1] Irwin Sobel, 2014, historia och definition av Sobel-operatören

[2] Funktionsdetektorer – Sobel Edge Detector

[3] K. Engel (2006). Volymgrafik i realtid . s. 112–114.

[4] Scharr, Hanno, 2000, avhandling (på tyska), Optimala operatörer i digital bildbehandling .

[5] B. Jähne, H. Scharr och S. Körkel. Principer för filterdesign. I Handbook of Computer Vision and Applications. Academic Press, 1999.

[6] H. Farid och EP Simoncelli, Optimally Rotation-Equivariant Directional Derivative Kernels , Int'l Conf Computer Analysis of Images and Patterns, s. 207–214, september 1997.

[7] H. Farid och EP Simoncelli, Differentiering av diskreta flerdimensionella signaler , IEEE Trans Image Processing, vol.13(4), s. 496–508, april 2004.

[8] D. Kroon, 2009, Short Paper University Twente, numerisk optimering av kärn-baserade bildderivat .

[9] A. Hast., "Enkel filterdesign för första och andra ordningens derivator genom ett dubbelfiltrerande tillvägagångssätt", Pattern Recognition Letters, Vol. 42, nr 1 juni, s. 65–71. 2014.

[10] Dim, Jules R.; Takamura, Tamio (2013-12-11). "Alternativ tillvägagångssätt för Satellite Cloud Classification: Edge Gradient Application" . Framsteg inom meteorologi . 2013 : 1–8. doi : 10.1155/2013/584816 . ISSN 1687-9309 .

[Scharr_pp._14–29-11] Scharr, Hanno (2007). "Optimala filter för utökat optiskt flöde". Komplex rörelse . Föreläsningsanteckningar i datavetenskap. Vol. 3417. Berlin, Heidelberg: Springer Berlin Heidelberg. s. 14–29. doi : 10.1007/978-3-540-69866-1_2 . ISBN 978-3-540-69864-7 .

[12] Scharr, Hanno, OPTIMALA ANDRA ORDENS DERIVATFILTERFAMILJER FÖR TRANSPARENT RÖRELSESKATNING 15:e europeiska signalbehandlingskonferensen (EUSIPCO 2007), Poznan, Polen, 3–7 september 2007.