Anonymisering av data

Dataanonymisering är en typ av informationssanering vars syfte är integritetsskydd . Det är processen att ta bort personligt identifierbar information från datamängder , så att personerna som uppgifterna beskriver förblir anonyma .

Översikt

Dataanonymisering har definierats som en "process genom vilken personuppgifter ändras på ett sådant sätt att en registrerad person inte längre kan identifieras direkt eller indirekt, varken av den personuppgiftsansvarige ensam eller i samarbete med någon annan part." Dataanonymisering kan möjliggöra överföring av information över en gräns, till exempel mellan två avdelningar inom en byrå eller mellan två byråer, samtidigt som risken för oavsiktlig avslöjande minskar, och i vissa miljöer på ett sätt som möjliggör utvärdering och analys efter anonymisering.

I samband med medicinska uppgifter avser anonymiserade uppgifter uppgifter från vilka patienten inte kan identifieras av mottagaren av informationen. Namn, adress och fullständiga postnummer måste tas bort, tillsammans med all annan information som, i kombination med andra uppgifter som innehas av eller lämnas ut till mottagaren, kan identifiera patienten.

Det kommer alltid att finnas en risk att anonymiserad data inte förblir anonym över tid. Att para ihop den anonymiserade datamängden med annan data, smarta tekniker och rå kraft är några av sätten som tidigare anonyma datamängder har blivit avanonymiserade; De registrerade är inte längre anonyma.

Avanonymisering är den omvända processen där anonym data korsreferens med andra datakällor för att omidentifiera den anonyma datakällan. Generalisering och störning är de två populära anonymiseringsmetoderna för relationsdata. Processen att dölja data med möjligheten att omidentifiera den senare kallas också pseudonymisering och är envägsföretag kan lagra data på ett sätt som är HIPAA -kompatibelt.

Enligt ARTIKEL 29 DATASKYDD ARBETSPARTI hänvisar direktiv 95/46/EG till anonymisering i skäl 26 "betyder att för att anonymisera uppgifter måste uppgifterna tas bort från tillräckliga element så att den registrerade inte längre kan identifieras. Närmare bestämt måste uppgifterna behandlas på ett sådant sätt att de inte längre kan användas för att identifiera en fysisk person genom att använda "alla medel som rimligen kan användas" av antingen den registeransvarige eller en tredje part. En viktig faktor är att behandlingen måste vara oåterkallelig. Direktivet klargör inte hur en sådan avidentifieringsprocess ska eller skulle kunna utföras. Fokus ligger på resultatet: att uppgifterna ska vara sådana att de inte tillåter att den registrerade kan identifieras via "alla" "sannolikt" och "rimligt" betyder. Hänvisning görs till uppförandekoder som ett verktyg för att fastställa möjliga anonymiseringsmekanismer samt lagring i en form där identifiering av den registrerade "inte längre är möjlig".

Det finns fem typer av dataanonymiseringsoperationer: generalisering, undertryckning, anatomisering, permutation och störning.

GDPR-krav

Europeiska unionens nya allmänna dataskyddsförordning (GDPR) kräver att lagrad data om människor i EU genomgår antingen anonymisering eller en pseudonymiseringsprocess . GDPR skäl (26) fastställer en mycket hög gräns för vad som utgör anonyma uppgifter, och undantar därmed uppgifterna från kraven i GDPR, nämligen "...information som inte avser en identifierad eller identifierbar fysisk person eller till personuppgifter som gjorts anonyma i sådana ett sätt att den registrerade inte är eller inte längre kan identifieras.” European Data Protection Supervisor (EDPS) och den spanska Agencia Española de Protección de Datos (AEPD) har utfärdat gemensamma vägledningar relaterade till krav på anonymitet och undantag från GDPR-krav. Enligt datatillsynsmannen och AEPD ska ingen, inklusive den personuppgiftsansvarige, kunna omidentifiera registrerade personer i en korrekt anonymiserad datauppsättning. Forskning av datavetare vid Imperial College i London och UCLouvain i Belgien, samt en dom av domare Michal Agmon-Gonen vid Tel Avivs distriktsdomstol, belyser bristerna med "Anonymisering" i dagens big data- värld. Anonymisering återspeglar ett föråldrat tillvägagångssätt för dataskydd som utvecklades när behandlingen av data begränsades till isolerade (siloförsedda) applikationer före populariteten för "big data"-behandling som involverade utbredd delning och kombination av data.

Se även

Vidare läsning

Raghunathan, Balaji (juni 2013). The Complete Book of Data Anonymization: From Planning to Implementation . CRC Tryck. ISBN 9781482218565 .
Khaled El Emam , Luk Arbuckle (augusti 2014). Anonymisera hälsodata: Fallstudier och metoder för att komma igång . O'Reilly Media. ISBN 978-1-4493-6307-9 .
Rolf H. Weber, Ulrike I. Heinrich (2012). Anonymisering: SpringerBriefs in Cybersecurity . Springer. ISBN 9781447140665 .
Aris Gkoulalas-Divanis, Grigorios Loukides (2012). Anonymisering av elektroniska journaler för att stödja klinisk analys (SpringerBriefs in Electrical and Computer Engineering) . Springer. ISBN 9781461456674 .
Pete Warden. "Varför du inte riktigt kan anonymisera dina uppgifter" . O'Reilly Media, Inc. Arkiverad från originalet den 9 januari 2014 . Hämtad 17 januari 2014 .

externa länkar

om anonymisering av internettrafik: läslista för datadelning och anonymisering