Teknomo–Fernandez algoritm

TF-algoritmen producerar bakgrundsbilden från en video av en gata med många fotgängare som korsar.

Teknomo –Fernandez-algoritmen (TF-algoritmen) är en effektiv algoritm för att generera bakgrundsbilden för en given videosekvens.

Genom att anta att bakgrundsbilden visas i större delen av videon kan algoritmen generera en bra bakgrundsbild av en video i -tid med endast ett litet antal binära operationer och Boolean Bit-operationer, som kräver en liten mängd minne och har inbyggda operatorer som finns i många programmeringsspråk som C , C++ och Java .

Historia

TF-algoritmen genererar den färgade bakgrundsbilden och använder den för bakgrundssubtraktion.

Människor som spårar från videor involverar vanligtvis någon form av bakgrundssubtraktion för att segmentera förgrunden från bakgrunden. När förgrundsbilder har extraherats kan önskade algoritmer (som de för rörelsespårning , objektspårning och ansiktsigenkänning ) exekveras med dessa bilder.

Bakgrundssubtraktion kräver dock att bakgrundsbilden redan är tillgänglig och tyvärr är det inte alltid så. Traditionellt söks bakgrundsbilden manuellt eller automatiskt från videobilderna när det inte finns några objekt. På senare tid har automatisk bakgrundsgenerering genom objektdetektering , mediall filtrering, medoidfiltrering, approximerad medianfiltrering, linjärt prediktivt filter, icke-parametrisk modell , Kalman-filter och adaptiv utjämning föreslagits; de flesta av dessa metoder har dock hög beräkningskomplexitet och är resurskrävande.

Teknomo–Fernandez-algoritmen är också en automatisk bakgrundsgenereringsalgoritm. Dess fördel är emellertid dess beräkningshastighet på endast -tid, beroende på upplösningen för en bild och dess noggrannhet som uppnås inom ett hanterbart antal bildrutor. Endast minst tre bildrutor från en video behövs för att producera bakgrundsbilden, förutsatt att för varje pixelposition förekommer bakgrunden i majoriteten av videorna. Dessutom kan den utföras för både gråskala och färgade videor.

Antaganden

  • Kameran är stillastående.
  • Omgivningens ljus förändras bara långsamt i förhållande till rörelserna hos personerna i scenen.
  • Antalet personer upptar inte scenen för det mesta av tiden på samma plats.

Generellt sett kommer dock algoritmen säkert att fungera närhelst följande viktiga antagande gäller:

För varje pixelposition innehåller majoriteten av pixelvärdena i hela videon pixelvärdet för den faktiska bakgrundsbilden (vid den positionen).

Så länge varje del av bakgrunden visas i större delen av videon, behöver inte hela bakgrundsbilden visas i någon av dess ramar. Algoritmen förväntas fungera korrekt.

Generering av bakgrundsbild

Ekvationer


  1.       För tre bildrutor av bildsekvens , och är bakgrundsbilden erhålls med

  2.       Den booleska funktionen i tabellen inträffar när antalet 1 poster är större än hälften av antalet bilder så att
  3. För tre bilder kan bakgrundsbilden tas som värde

Algoritm för bakgrundsgenerering

På den första nivån väljs tre ramar slumpmässigt från bildsekvensen för att skapa en bakgrundsbild genom att kombinera dem med den första ekvationen. Detta ger en bättre bakgrundsbild på den andra nivån. Proceduren upprepas tills önskad nivå .

Teoretisk noggrannhet

På nivå sannolikheten att den modala biten som förutspås är den faktiska modalbiten representeras av ekvationen . Tabellen nedan visar de beräknade sannolikhetsvärdena över flera nivåer med hjälp av några specifika initiala sannolikheter. Det kan observeras att även om den modala biten vid den betraktade positionen är vid låga 60 % av ramarna, är sannolikheten för noggrann modal bitbestämning redan mer än 99 % vid 6 nivåer.

Computed probabilities table
Den här tabellen ger de beräknade sannolikhetsvärdena över flera nivåer med hjälp av några specifika initiala sannolikheter. Det kan observeras att även om den modala biten vid den betraktade positionen är vid låga 60 % av ramarna, är sannolikheten för noggrann modal bitbestämning redan mer än 99 % på sex nivåer.

Rymdkomplexitet

Utrymmeskravet för Teknomo–Fernandez-algoritmen ges av funktionen beroende på upplösningen för bild, antalet bildrutor i videon och det önskade antalet nivåer. Det faktum att troligen inte kommer att överstiga 6 reducerar dock rymdkomplexiteten till .

Tidskomplexitet

Hela algoritmen körs i -tid, endast beroende på bildens upplösning. Beräkning av den modala biten för varje bit kan göras i -tid medan beräkningen av den resulterande bilden från de tre givna bilderna kan göras i -tid. Antalet bilder som ska bearbetas i -nivåer är . Men eftersom så är detta faktiskt , alltså körs algoritmen i .

Varianter

En variant av Teknomo–Fernandez-algoritmen som innehåller Monte-Carlo-metoden med namnet CRF har utvecklats. Två olika konfigurationer av CRF implementerades: CRF9,2 och CRF81,1. Experiment på några färgade videosekvenser visade att CRF-konfigurationerna överträffar TF-algoritmen när det gäller noggrannhet. Emellertid förblir TF-algoritmen mer effektiv när det gäller behandlingstid.

Ansökningar

Vidare läsning

  • Chu, Varian Sherwin B. (2013). Bakgrundsbildrekonstruktion med slumpmässig ramsampling och logiska bitoperationer ( avhandling). Ateneo de Manila University.
  • Abu, Patricia Angela R. (2015). Förbättring av Teknomo-Fernandez Bakgrundsbildsmodelleringsalgoritm för förgrundssegmentering ( avhandling). Ateneo de Manila University.

externa länkar