Fem kassaskåp
De fem kassaskåpen är ett ramverk för att hjälpa till att fatta beslut om att effektivt använda data som är konfidentiell eller känslig. Det används huvudsakligen för att beskriva eller designa forskningsåtkomst till statistisk data som innehas av statliga myndigheter och av dataarkiv såsom UK Data Service .
Två av de fem kassaskåpen hänvisar till kontroll av statistisk avslöjande , och därför används de fem kassaskåpen vanligtvis för att kontrastera statistiska och icke-statistiska kontroller när man jämför datahanteringsalternativ.
Begrepp
The Five Safes föreslår att datahanteringsbeslut ska betraktas som att lösa problem i fem "dimensioner": projekt, människor, inställningar, data och utdata. Kombinationen av kontrollerna leder till "säker användning". Dessa uttrycks oftast som frågor, till exempel:
Säkra projekt | Är denna användning av uppgifterna lämplig? |
Trygga människor | Kan användarna lita på att de använder det på ett lämpligt sätt? |
Säkra inställningar | Begränsar åtkomstmöjligheten obehörig användning? |
Säker data | Finns det en risk för avslöjande i själva uppgifterna? |
Säkra utgångar | Är de statistiska resultaten icke-avslöjande? |
Dessa dimensioner är skalor, inte gränser. Det vill säga lösningar kan ha en blandning av fler eller färre kontroller i varje dimension, men det övergripande syftet med "säker användning" oberoende av den specifika mixen. Till exempel kan en fil för allmänt bruk som är tillgänglig för öppen nedladdning inte styra vem som använder den, var eller för vilket ändamål, och därför måste all kontroll (skydd) finnas i själva data. Däremot kan en fil som endast nås via en säker miljö med certifierade användare innehålla mycket känslig information: de icke-statistiska kontrollerna gör att uppgifterna är "osäkra". En akademiker liknade processen vid en grafisk equalizer, där bas och diskant kan kombineras oberoende för att producera ett ljud som lyssnaren gillar.
Det finns ingen "ordning" på de fem kassaskåpen, eftersom det ena nödvändigtvis är viktigare än de andra. Ritchie hävdade dock att de "ledningsmässiga" kontrollerna (projekt, människor, miljö) borde behandlas före de "statistiska" kontrollerna (data, output).
Five Safes-konceptet är förknippat med andra ämnen som utvecklats från samma program på ONS, även om dessa inte nödvändigtvis implementeras. Säkra människor förknippas med "aktiv forskarledning", medan säkra resultat är kopplat till principbaserad kontroll av utdatastatistisk avslöjande.
De fem kassaskåpen är ett positivt ramverk som beskriver vad som är och inte är. EDRU ('evidensbaserad, standardöppen, riskhanterad, användarcentrerad') attitydmodell används ibland för att ge ett normativt sammanhang
"Dataåtkomstspektrumet"
Från 2003 representerades de fem kassaskåpen också i en enklare form som ett "Data Access Spectrum". De icke-datakontroller (projekt, människor, miljö, utdata) tenderar att fungera tillsammans, eftersom organisationer ofta ser dessa som en kompletterande uppsättning av åtkomstbegränsningar. Dessa kan sedan jämföras med val om dataanonymisering för att presentera en linjär representation av dataåtkomstalternativ. Denna presentation överensstämmer med idén om "data som en rest", såväl som dåtidens dataskyddslagar som ofta karakteriserade data som helt enkelt anonyma eller inte anonyma.
En liknande idé hade redan utvecklats självständigt 2001 av Chuck Humphrey från det kanadensiska RDC-nätverket, "continuum of access". På senare tid har The Open Data Institute utvecklat en "Data Spectrum Toolkit" som innehåller branschspecifika exempel.
Historia och terminologi
De fem kassaskåpen togs fram vintern 2002/2003 av Felix Ritchie vid UK Office for National Statistics ( ONS) för att beskriva dess säkra fjärråtkomst Virtual Microdata Laboratory (VML). Den beskrevs vid denna tidpunkt som "VML-säkerhetsmodellen". Detta antogs av NORC- dataenklaven, och mer allmänt i USA, som "portföljmodellen" (även om denna nu också används för att hänvisa till en något annorlunda juridisk/statistisk/utbildningsuppdelning). Under 2012 hänvisades ramverket fortfarande till som "VML-säkerhetsmodellen", men dess ökande användning bland icke-brittiska organisationer ledde till antagandet av den mer allmänna och informativa frasen "Fem kassaskåp".
Det ursprungliga ramverket hade bara fyra kassaskåp (projekt, människor, inställningar och utgångar): ramverket användes för att beskriva mycket detaljerad dataåtkomst genom en säker miljö, och därför var dimensionen "data" irrelevant. Från 2007 och framåt inkluderades "säkra data" eftersom ramverket användes för att beskriva ett bredare utbud av ONS-aktiviteter. Eftersom den amerikanska versionen baserades på 2005 års specifikationer, har vissa amerikanska iterationer de ursprungliga fyra dimensionerna (t.ex.).
Vissa diskussioner, som OECD, använder termen "säker" istället för "säker". Användningen av båda dessa termer kan dock orsaka presentationsproblem: mindre kontroll i en viss dimension kan till exempel antyda "osäkra användare" eller "osäkra inställningar", vilket distraherar från huvudbudskapet. Därför använder den australiensiska regeringen termen "fem principer för datadelning".
"Anonymiseringsramverket för beslutsfattande" använder ett ramverk baserat på de fem kassaskåpen men ommärker "projekt", "människor" och "inställningar" som "styrning", "byrå" respektive "infrastruktur". "Output" utelämnas och "säker användning" blir "funktionell anonymisering". Det finns ingen hänvisning till de fem kassaskåpen eller någon tillhörande litteratur. Den australiska versionen var tvungen att inkludera referenser till de fem kassaskåpen och presenterade den som ett alternativ utan kommentarer.
Ansökan
Ramverket har haft tre användningsområden: pedagogiskt, beskrivande och design. Det senare är en relativt ny utveckling.
Pedagogik
Den första betydande användningen av ramverket, förutom intern administrativ användning, var att strukturera forskarutbildningskurser vid UK Office for National Statistics från 2003. UK Data Archive, Administrative Data Research Network, Eurostat , Statistics New Zealand , the Mexican National Institute of Statistics and Geography , NORC , Statistics Canada och Australian Bureau of Statistics , bland andra, har också använt detta ramverk. De flesta av dessa kurser är för forskare som använder faciliteter med begränsad tillgång; Eurostat-kurserna är ovanliga eftersom de är utformade för alla användare av känsliga uppgifter.
Beskrivning
Ramverket används ofta för att beskriva befintliga dataåtkomstlösningar (t.ex. UK HMRC Data Lab, UK Data Service, Statistics New Zealand) eller planerade/konceptualiserade (t.ex. Eurostat 2011). En tidig användning var att hjälpa till att identifiera områden där ONS fortfarande hade "oreducerbara risker" i sin tillhandahållande av säker fjärråtkomst.
Ramverket används mest för konfidentiell samhällsvetenskaplig data. Hittills verkar det ha haft liten inverkan på planering av medicinsk forskning, även om det nu ingår i de reviderade riktlinjerna för implementering av HIPAA- regler i USA och av Cancer Research UK och Health Foundation i Storbritannien. Den har också använts för att beskriva en säkerhetsmodell för Scottish Health Informatics Programme.
Design
Generellt har de fem kassaskåpen använts för att beskriva lösningar i efterhand och för att förklara/motivera gjorda val, men ett ökande antal organisationer har använt ramverket för att designa lösningar för dataåtkomst. Till exempel utvecklade Hellenic Statistical Agency en datastrategi byggd kring de fem kassaskåpen 2016; UK Health Foundation använde Five Safes för att utforma sina datahanterings- och utbildningsprogram. Användning inom den privata sektorn är mindre vanlig men vissa organisationer har införlivat de fem kassaskåpen i konsulttjänster.
Den största designanvändningen finns i Australien: både Australian Bureau of Statistics och Australian Department of Social Service använde de fem kassaskåpen som ett ex ante-designverktyg. Under 2017 rekommenderade Australian Productivity Commission att anta en version av ramverket för att stödja delning och återanvändning av data över gränserna. Detta pågår för närvarande samråd med lagförslag som förväntas 2020.
Under 2015 anordnade UK Data Service en workshop för att uppmuntra dataanvändare från den akademiska och privata sektorn att tänka på hur man hanterar konfidentiell forskningsdata, genom att använda de fem kassaskåpen för att visa alternativa alternativ och bästa praxis.
Två lagar har införlivat Fives Safes: uttryckligen i South Australian Public Sector (Data Sharing) Act 2016, underförstått i forskningsbestämmelserna i Digital Economy Act .
Offentligt engagemang
UK Data Service har producerat en blogg och en video för allmänheten om användningen av Five Safes vid återanvändning av administrativ data. Nya Zeelands statistik tog fram en icke-teknisk beskrivning, liksom ONS för Data Privacy Day 2017. Den australiensiska federala regeringen har producerat flera videor om datadelning, inklusive datadelningsprinciperna.
externa länkar
- fivesafes.org - originalkonceptwebbplats
- aihw.gov.au/.../the-five-safes-framework - exempel implementerat av Australian Institute of Health and Welfare
- ukdataservice.ac.uk/.../what-is-the-five-safes-framework - exempel implementerat av UK Data Service