Teknomo–Fernandez algoritm
Teknomo –Fernandez-algoritmen (TF-algoritmen) är en effektiv algoritm för att generera bakgrundsbilden för en given videosekvens.
Genom att anta att bakgrundsbilden visas i större delen av videon kan algoritmen generera en bra bakgrundsbild av en video i -tid med endast ett litet antal binära operationer och Boolean Bit-operationer, som kräver en liten mängd minne och har inbyggda operatorer som finns i många programmeringsspråk som C , C++ och Java .
Historia
Människor som spårar från videor involverar vanligtvis någon form av bakgrundssubtraktion för att segmentera förgrunden från bakgrunden. När förgrundsbilder har extraherats kan önskade algoritmer (som de för rörelsespårning , objektspårning och ansiktsigenkänning ) exekveras med dessa bilder.
Bakgrundssubtraktion kräver dock att bakgrundsbilden redan är tillgänglig och tyvärr är det inte alltid så. Traditionellt söks bakgrundsbilden manuellt eller automatiskt från videobilderna när det inte finns några objekt. På senare tid har automatisk bakgrundsgenerering genom objektdetektering , mediall filtrering, medoidfiltrering, approximerad medianfiltrering, linjärt prediktivt filter, icke-parametrisk modell , Kalman-filter och adaptiv utjämning föreslagits; de flesta av dessa metoder har dock hög beräkningskomplexitet och är resurskrävande.
Teknomo–Fernandez-algoritmen är också en automatisk bakgrundsgenereringsalgoritm. Dess fördel är emellertid dess beräkningshastighet på endast -tid, beroende på upplösningen för en bild och dess noggrannhet som uppnås inom ett hanterbart antal bildrutor. Endast minst tre bildrutor från en video behövs för att producera bakgrundsbilden, förutsatt att för varje pixelposition förekommer bakgrunden i majoriteten av videorna. Dessutom kan den utföras för både gråskala och färgade videor.
Antaganden
- Kameran är stillastående.
- Omgivningens ljus förändras bara långsamt i förhållande till rörelserna hos personerna i scenen.
- Antalet personer upptar inte scenen för det mesta av tiden på samma plats.
Generellt sett kommer dock algoritmen säkert att fungera närhelst följande viktiga antagande gäller:
För varje pixelposition innehåller majoriteten av pixelvärdena i hela videon pixelvärdet för den faktiska bakgrundsbilden (vid den positionen).
Så länge varje del av bakgrunden visas i större delen av videon, behöver inte hela bakgrundsbilden visas i någon av dess ramar. Algoritmen förväntas fungera korrekt.
Generering av bakgrundsbild
Ekvationer
-
För tre bildrutor av bildsekvens , och är bakgrundsbilden erhålls med -
Den booleska funktionen i tabellen inträffar när antalet 1 poster är större än hälften av antalet bilder så att - För tre bilder kan bakgrundsbilden tas som värde
Algoritm för bakgrundsgenerering
På den första nivån väljs tre ramar slumpmässigt från bildsekvensen för att skapa en bakgrundsbild genom att kombinera dem med den första ekvationen. Detta ger en bättre bakgrundsbild på den andra nivån. Proceduren upprepas tills önskad nivå .
Teoretisk noggrannhet
På nivå sannolikheten att den modala biten som förutspås är den faktiska modalbiten representeras av ekvationen . Tabellen nedan visar de beräknade sannolikhetsvärdena över flera nivåer med hjälp av några specifika initiala sannolikheter. Det kan observeras att även om den modala biten vid den betraktade positionen är vid låga 60 % av ramarna, är sannolikheten för noggrann modal bitbestämning redan mer än 99 % vid 6 nivåer.
Rymdkomplexitet
Utrymmeskravet för Teknomo–Fernandez-algoritmen ges av funktionen beroende på upplösningen för bild, antalet bildrutor i videon och det önskade antalet nivåer. Det faktum att troligen inte kommer att överstiga 6 reducerar dock rymdkomplexiteten till .
Tidskomplexitet
Hela algoritmen körs i -tid, endast beroende på bildens upplösning. Beräkning av den modala biten för varje bit kan göras i -tid medan beräkningen av den resulterande bilden från de tre givna bilderna kan göras i -tid. Antalet bilder som ska bearbetas i -nivåer är . Men eftersom så är detta faktiskt , alltså körs algoritmen i .
Varianter
En variant av Teknomo–Fernandez-algoritmen som innehåller Monte-Carlo-metoden med namnet CRF har utvecklats. Två olika konfigurationer av CRF implementerades: CRF9,2 och CRF81,1. Experiment på några färgade videosekvenser visade att CRF-konfigurationerna överträffar TF-algoritmen när det gäller noggrannhet. Emellertid förblir TF-algoritmen mer effektiv när det gäller behandlingstid.
Ansökningar
- Objektdetektering
- Ansiktsigenkänning
- Ansiktsigenkänning
- Detektering av fotgängare
- Videoövervakning
- Motion capture
- Människa-datorinteraktion
- Innehållsbaserad videokodning
- Trafikövervakning
- Gesterigenkänning i realtid
Vidare läsning
- Chu, Varian Sherwin B. (2013). Bakgrundsbildrekonstruktion med slumpmässig ramsampling och logiska bitoperationer ( avhandling). Ateneo de Manila University.
- Abu, Patricia Angela R. (2015). Förbättring av Teknomo-Fernandez Bakgrundsbildsmodelleringsalgoritm för förgrundssegmentering ( avhandling). Ateneo de Manila University.
externa länkar
- Bakgrundsbildsgenerering med booleska operationer – beskriver TF-algoritmen, dess antaganden, processer, noggrannhet, tid och rumskomplexitet och exempelresultat.
- En Monte-Carlo-baserad algoritm för bakgrundsgenerering – en variant av Teknomo–Fernandez-algoritmen som innehåller Monte-Carlo-metoden utvecklades i denna studie.