Rörelseanalys

Rörelseanalys används i datorseende , bildbehandling , höghastighetsfotografering och maskinseende som studerar metoder och tillämpningar där två eller flera på varandra följande bilder från en bildsekvens, t.ex. producerade av en videokamera eller höghastighetskamera , bearbetas att producera information baserad på den uppenbara rörelsen i bilderna. I vissa applikationer är kameran fixerad i förhållande till scenen och objekt rör sig runt i scenen, i vissa applikationer är scenen mer eller mindre fixerad och kameran rör sig, och i vissa fall rör sig både kameran och scenen.

Rörelseanalysbearbetningen kan i enklaste fall vara att detektera rörelse, dvs hitta de punkter i bilden där något rör sig. Mer komplexa typer av bearbetning kan vara att spåra ett specifikt objekt i bilden över tid, att gruppera punkter som tillhör samma stela objekt som rör sig i scenen, eller att bestämma storleken och riktningen på rörelsen för varje punkt i bilden. bild. Informationen som produceras är ofta relaterad till en specifik bild i sekvensen, motsvarande en specifik tidpunkt, men beror då också på närliggande bilder. Detta innebär att rörelseanalys kan producera tidsberoende information om rörelse.

Tillämpningar av rörelseanalys kan hittas inom ganska olika områden, såsom övervakning, medicin, filmindustri, bilkrocksäkerhet, studier av ballistiska skjutvapen, biologisk vetenskap, flamspridning och navigering av autonoma fordon för att nämna några exempel.

Bakgrund

Principen för en pinhole-kamera. Ljusstrålar från ett föremål passerar genom ett litet hål för att bilda en bild.
Rörelsefältet som motsvarar den relativa rörelsen för någon 3D-punkt.

En videokamera kan ses som en approximation av en pinhole-kamera , vilket innebär att varje punkt i bilden belyses av någon (normalt en) punkt i scenen framför kameran, vanligtvis med hjälp av ljus som scenpunkten reflekterar från en ljuskälla. Varje synlig punkt i scenen projiceras längs en rak linje som passerar genom kamerans bländare och skär bildplanet. Det betyder att varje punkt i bilden vid en specifik tidpunkt hänvisar till en specifik punkt i scenen. Denna scenpunkt har en position i förhållande till kameran, och om denna relativa position ändras motsvarar den en relativ rörelse i 3D . Det är en relativ rörelse eftersom det inte spelar någon roll om det är scenpunkten, kameran eller båda som rör sig. Det är först när det sker en förändring i den relativa positionen som kameran kan upptäcka att någon rörelse har skett. Genom att projicera den relativa 3D-rörelsen för alla synliga punkter tillbaka in i bilden, blir resultatet rörelsefältet , som beskriver den skenbara rörelsen för varje bildpunkt i termer av storleken och hastighetsriktningen för den punkten i bildplanet. En konsekvens av denna observation är att om den relativa 3D-rörelsen för vissa scenpunkter är längs deras projektionslinjer, är den motsvarande skenbara rörelsen noll.

Kameran mäter ljusets intensitet vid varje bildpunkt, ett ljusfält. I praktiken mäter en digitalkamera detta ljusfält vid diskreta punkter, pixlar , men givet att pixlarna är tillräckligt täta kan pixelintensiteterna användas för att representera de flesta egenskaperna hos ljusfältet som faller på bildplanet. Ett vanligt antagande för rörelseanalys är att ljuset som reflekteras från scenpunkterna inte varierar över tiden. Som en konsekvens, om en intensitet I har observerats någon gång i bilden, vid någon tidpunkt, kommer samma intensitet I att observeras vid en position som är förskjuten i förhållande till den första som en konsekvens av den skenbara rörelsen. Ett annat vanligt antagande är att det finns en hel del variation i den detekterade intensiteten över pixlarna i en bild. En konsekvens av detta antagande är att om scenpunkten som motsvarar en viss pixel i bilden har en relativ 3D-rörelse, så kommer pixelintensiteten sannolikt att förändras över tiden.

Metoder

Rörelsedetektor

En av de enklaste typerna av rörelseanalys är att detektera bildpunkter som refererar till rörliga punkter i scenen. Det typiska resultatet av denna bearbetning är en binär bild där alla bildpunkter (pixlar) som relaterar till rörliga punkter i scenen sätts till 1 och alla andra punkter sätts till 0. Denna binära bild bearbetas sedan ytterligare, t.ex. för att ta bort brus, gruppera angränsande pixlar och etikettobjekt. Rörelsedetektering kan göras med flera metoder; de två huvudgrupperna är differentiella metoder och metoder baserade på bakgrundssegmentering.

Ansökningar

Mänsklig rörelseanalys

Inom områdena medicin , sport, videoövervakning, sjukgymnastik och kinesiologi har mänsklig rörelseanalys blivit ett undersökande och diagnostiskt verktyg. Se avsnittet om motion capture för mer information om teknologierna. Mänsklig rörelseanalys kan delas in i tre kategorier: identifiering av mänsklig aktivitet , spårning av mänsklig rörelse och analys av kropps- och kroppsdelars rörelser.

Mänsklig aktivitetsigenkänning används oftast för videoövervakning , speciellt automatisk rörelseövervakning av säkerhetsskäl. De flesta ansträngningar inom detta område förlitar sig på tillvägagångssätt till rymd, där sekvenser av statiska ställningar analyseras statistiskt och jämförs med modellerade rörelser. Mallmatchning är en alternativ metod där statiska formmönster jämförs med redan existerande prototyper.

Mänsklig rörelsespårning kan utföras i två eller tre dimensioner. Beroende på analysens komplexitet sträcker sig representationer av människokroppen från grundläggande stickfigurer till volymetriska modeller. Spårning bygger på överensstämmelsen mellan bildegenskaper mellan på varandra följande videorutor, med hänsyn till information som position, färg, form och textur. Kantdetektering kan utföras genom att jämföra färgen och/eller kontrasten hos intilliggande pixlar, och leta specifikt efter diskontinuiteter eller snabba förändringar. Tredimensionell spårning är i grunden identisk med tvådimensionell spårning, med den extra faktorn rumslig kalibrering.

Rörelseanalys av kroppsdelar är avgörande inom det medicinska området. Vid postural och gånganalys används ledvinklar för att spåra kroppsdelarnas placering och orientering. Gånganalys används också inom sport för att optimera atletisk prestation eller för att identifiera rörelser som kan orsaka skada eller belastning. Spårningsprogram som inte kräver användning av optiska markörer är särskilt viktigt inom dessa områden, där användningen av markörer kan hindra naturliga rörelser.

Rörelseanalys inom tillverkning

Rörelseanalys är också användbar i tillverkningsprocessen . Med hjälp av höghastighetsvideokameror och programvara för rörelseanalys kan man övervaka och analysera monteringslinjer och produktionsmaskiner för att upptäcka ineffektivitet eller funktionsfel. Tillverkare av sportutrustning, som basebollträn och hockeyklubbor, använder också höghastighetsvideoanalys för att studera effekten av projektiler. En experimentell uppställning för den här typen av studier använder vanligtvis en triggningsenhet, externa sensorer (t.ex. accelerometrar , töjningsmätare), datainsamlingsmoduler, en höghastighetskamera och en dator för att lagra synkroniserad video och data. Mjukvara för rörelseanalys beräknar parametrar som avstånd, hastighet, acceleration och deformationsvinklar som funktioner av tid. Dessa data används sedan för att designa utrustning för optimal prestanda.

Ytterligare applikationer för rörelseanalys

Objekt- och funktionsdetekteringsförmågan hos programvara för rörelseanalys kan användas för att räkna och spåra partiklar, såsom bakterier, virus, "joniska polymer-metallkompositer", mikronstora polystyrenpärlor, bladlöss och projektiler.

Se även