Perceptuell hashing

Perceptuell hash är användningen av en fingeravtrycksalgoritm som producerar ett utdrag, hash eller fingeravtryck av olika former av multimedia . En perceptuell hash är en typ av lokalitetskänslig hash , som är analog om funktionerna i multimedia är liknande. Detta ska inte förväxlas med kryptografisk hashing , som förlitar sig på lavineffekten av en liten förändring i ingångsvärde som skapar en drastisk förändring av utdatavärde. Perceptuella hash-funktioner används i stor utsträckning för att hitta fall av upphovsrättsintrång online såväl som i digital forensics på grund av möjligheten att ha en korrelation mellan hash så att liknande data kan hittas (till exempel med en annan vattenstämpel ).

Utveckling

Marrs och Hildreths arbete från 1980 är en framstående tidning inom detta område.

Christoph Zauners avhandling från juli 2010 är en välskriven introduktion till ämnet.

I juni 2016 publicerade Azadeh Amir Asgari arbete om robust bildhash-spoofing. Asgari noterar att perceptuell hashfunktion som vilken annan algoritm som helst är benägen att göra fel.

Forskare påpekade i december 2017 att Googles bildsökning är baserad på en perceptuell hash.

I forskning publicerad i november 2021 fokuserade utredarna på en manipulerad bild av Stacey Abrams som publicerades på internet innan hennes förlust i guvernörsvalet i Georgia 2018 . De fann att pHash-algoritmen var sårbar för skändliga aktörer.

Egenskaper

Forskning som rapporterades i januari 2019 vid Northumbria University har visat att det för video kan användas för att samtidigt identifiera liknande innehåll för videokopiering och upptäcka skadliga manipulationer för videoautentisering. Det föreslagna systemet fungerar bättre än nuvarande videohashningstekniker när det gäller både identifiering och autentisering.

Forskning som rapporterades i maj 2020 av University of Houston i djupinlärningsbaserad perceptuell hashning för ljud har visat bättre prestanda än traditionella metoder för ljudfingeravtryck för detektering av liknande/kopierat ljud som är föremål för transformationer.

Utöver dess användning inom digital kriminalteknik har forskning av en rysk grupp som rapporterades 2019 visat att perceptuell hash kan tillämpas på en mängd olika situationer. I likhet med att jämföra bilder för upphovsrättsintrång, fann gruppen att det kunde användas för att jämföra och matcha bilder i en databas. Deras föreslagna algoritm visade sig inte bara vara effektiv utan mer effektiv än standardmetoden för bildsökning i databaser.

Ett kinesiskt team rapporterade i juli 2019 att de hade upptäckt en perceptuell hash för talkryptering som visade sig vara effektiv. De kunde skapa ett system där krypteringen inte bara var mer exakt utan också mer kompakt.

Apple Inc rapporterade redan i augusti 2021 ett system för sexuellt övergrepp mot barn (CSAM) som de känner till som NeuralHash. Ett tekniskt sammanfattningsdokument, som på ett bra sätt förklarar systemet med rikliga diagram och exempelfotografier, erbjuder att "Istället för att skanna bilder [på företags] iCloud [servrar], utför systemet matchning på enheten med hjälp av en databas med kända CSAM-bildhashar tillhandahållna av [ National Center for Missing and Exploited Children ] (NCMEC) och andra barnskyddsorganisationer. Apple omvandlar ytterligare denna databas till en oläslig uppsättning hash-hashar, som lagras säkert på användarnas enheter."

I en uppsats med titeln "The Problem With Perceptual Hashes" producerar Oliver Kuederle en häpnadsväckande kollision genererad av en kommersiell mjukvara för neurala nät , av typen NeuralHash. Ett fotografiskt porträtt av en riktig kvinna (Adobe Stock #221271979) reduceras genom testalgoritmen till samma hash som fotografiet av ett abstrakt konstverk (från databasen "insättningsbilder"). Båda exempelbilderna finns i kommersiella databaser. Kuederle är bekymrad över kollisioner som denna. "Dessa fall kommer att granskas manuellt. Det vill säga, enligt Apple kommer en Apple-anställd sedan att titta på dina (flaggade) bilder... Perceptuella hash är rörigt. När sådana algoritmer används för att upptäcka kriminella aktiviteter, särskilt i Apple-skala, många oskyldiga människor kan potentiellt möta allvarliga problem... Det behöver inte sägas att jag är ganska orolig över detta."

Forskare har fortsatt att publicera en omfattande analys med titeln "Learning to Break Deep Perceptual Hashing: The Use Case NeuralHash", där de undersöker sårbarheten hos NeuralHash som en representant för djupa perceptuella hashalgoritmer för olika attacker. Deras resultat visar att hashkollisioner mellan olika bilder kan uppnås med mindre ändringar som tillämpas på bilderna. Enligt författarna visar dessa resultat den verkliga chansen för sådana attacker och möjliggör flaggning och eventuell lagföring av oskyldiga användare. De anger också att upptäckten av olagligt material lätt kan undvikas, och systemet kan överlistas av enkla bildtransformationer, som till exempel tillhandahålls av fria att använda bildredigerare. Författarna antar att deras resultat även gäller andra djupa perceptuella hashalgoritmer, och ifrågasätter deras övergripande effektivitet och funktionalitet i applikationer som skanning på klientsidan och chattkontroller.

Galleri

Se även

externa länkar