Bayesiansk förgiftning

Bayesiansk förgiftning är en teknik som används av e-postspammare för att försöka försämra effektiviteten hos spamfilter som är beroende av Bayesiansk skräppostfiltrering . Bayesiansk filtrering förlitar sig på Bayesisk sannolikhet för att avgöra om ett inkommande e-postmeddelande är skräppost eller inte är skräppost. Spammaren hoppas att tillägg av slumpmässiga (eller till och med noggrant utvalda) ord som sannolikt inte kommer att förekomma i ett skräppostmeddelande kommer att få skräppostfiltret att tro att meddelandet är legitimt – ett statistiskt typ II- fel .

Spammare hoppas också få spamfiltret att få en högre falsk positiv frekvens genom att förvandla tidigare oskyldiga ord till spammiga ord i den Bayesianska databasen (statistiska typ I-fel) eftersom en användare som tränar sitt spamfilter på ett förgiftat meddelande kommer att indikera till filter att orden som lagts till av spammaren är en bra indikation på spam.

Empiriska resultat

Graham-Cumming

Vid spamkonferensen som hölls vid MIT 2004 presenterade John Graham-Cumming två möjliga attacker mot POPFiles Bayesianska motor. Den ena misslyckades och den andra fungerade, men var opraktisk. Genom att göra detta identifierade de två typer av förgiftningsattack: passiv (där ord läggs till utan någon feedback till spammaren) och aktiv (där spammaren får feedback efter att skräpposten har tagits emot).

Den passiva metoden att lägga till slumpmässiga ord i en liten skräppost var ineffektiv som attackmetod: endast 0,04 % av de modifierade skräppostmeddelandena levererades. Den aktiva attacken involverade att lägga till slumpmässiga ord i en liten skräppost och använda en webbbug för att avgöra om skräpposten togs emot. Om det var det, tränades ett annat bayesiskt system med samma giftord. Efter att ha skickat 10 000 skräppost till en enda användare bestämde han sig för en liten uppsättning ord som kunde användas för att få igenom en skräppost.

Den enkla motåtgärden att inaktivera fjärrbilder ( webbuggar ) i e-postmeddelanden eliminerar detta problem.

Wittel och Wu

Vid konferensen om e-post och anti-spam 2004 presenterade Wittel och Wu en artikel där de visade att passivt tillägg av slumpmässiga ord till skräppost var ineffektivt mot CRM114, men effektivt mot SpamBayes med 100 ord tillagda per spam.

De visade också att en smartare passiv attack, med att lägga till vanliga engelska ord, fortfarande var ineffektiv mot CRM114, men var ännu mer effektiv mot SpamBayes. De behövde bara lägga till 50 ord till en spam för att få den förbi SpamBayes.

Wittel och Wus testning har dock kritiserats på grund av den minimala rubrikinformation som fanns i e-postmeddelandena de använde; de flesta Bayesianska skräppostfilter använder i stor utsträckning rubrikinformation och annan meddelandemetadata för att avgöra sannolikheten för att ett meddelande är skräppost. En diskussion om SpamBayes-resultaten och några motbevis finns i SpamBayes e-postlistarkiv.

Alla dessa attacker är typ II-attacker: attacker som försöker få skräppost levererad. En attack av typ I försöker orsaka falska positiva resultat genom att förvandla tidigare oskyldiga ord till spammiga ord i den Bayesianska databasen.

Stern, Mason och Shepherd

Även 2004 skrev Stern, Mason och Shepherd en teknisk rapport vid Dalhousie University , där de beskrev en passiv typ II-attack. De lade till vanliga engelska ord i skräppostmeddelanden som användes för att träna och testa ett spamfilter.

I två tester visade de att dessa vanliga ord minskade spamfiltrets precision (andelen meddelanden som klassificeras som spam som verkligen är spam) från 84 % till 67 % och från 94 % till 84 %. Att undersöka deras data visar att det förgiftade filtret var partiskt mot att tro att meddelanden var mer benägna att vara spam än "skinka" (bra e-post), vilket ökade antalet falska positiva.

De föreslog två motåtgärder: att ignorera vanliga ord när de utför klassificering och utjämna sannolikheter baserat på ett ords tillförlitlighet. Ett ord har en pålitlig sannolikhet om en angripare sannolikt inte kan gissa om det är en del av en individs ordförråd. Således är vanliga ord opålitliga och deras sannolikhet skulle jämnas ut till 0,5 (gör dem neutrala).

Lowd och ödmjuk

Vid 2005 års konferens om e-post och anti-spam presenterade Lowd och Meek ett dokument där de visade att passiva attacker som lägger till slumpmässiga eller vanliga ord till spam var ineffektiva mot ett naivt Bayesian-filter. (Faktum är att de visade, som John Graham-Cumming demonstrerade redan 2004, att lägga till slumpmässiga ord förbättrar spamfiltreringens noggrannhet.)

De visade att att lägga till hammy-ord - ord som är mer benägna att förekomma i skinka (icke-spam-e-postinnehåll) än spam - var effektivt mot ett naivt Bayesian-filter, och gjorde det möjligt för spam att glida igenom. De fortsatte med att beskriva två aktiva attacker (attacker som kräver feedback till spammaren) som var mycket effektiva mot spamfiltren. Att förhindra all feedback till spammare (såsom rapporter om utebliven leverans, SMTP-nivåfel eller webbuggar) motverkar naturligtvis en aktiv attack trivialt.

De visade också att omträning av filtret var effektivt för att förhindra alla attacktyper, även när omskolningsdatan hade förgiftats.

Den publicerade forskningen visar att det är ineffektivt att lägga till slumpmässiga ord i skräppostmeddelanden som en form av attack, men att aktiva attacker är mycket effektiva och att lägga till noggrant utvalda ord kan fungera i vissa fall. För att försvara sig mot dessa attacker är det viktigt att ingen feedback tas emot av spammare och att statistiska filter tränas om regelbundet.

Forskningen visar också att det lönar sig att fortsätta undersöka attacker mot statistiska filter. Fungerande attacker har påvisats och motåtgärder krävs för att säkerställa att statistiska filter förblir korrekta.

Se även

externa länkar