Dataklassificering (datahantering)
Inom området datahantering kan dataklassificering som en del av Information Lifecycle Management (ILM)-processen definieras som ett verktyg för kategorisering av data för att göra det möjligt för/hjälpa organisationer att effektivt svara på följande frågor :
- Vilka datatyper finns tillgängliga?
- Var finns vissa uppgifter?
- Vilka åtkomstnivåer är implementerade?
- Vilken skyddsnivå är implementerad och följer den efterlevnadsbestämmelserna ?
När det implementeras ger det en brygga mellan IT-proffs och process- eller applikationsägare. IT-personalen är informerad om datavärdet och ledningen (oftast applikationsägare) förstår bättre vilken del av datacentret som behöver investeras i för att verksamheten ska fungera effektivt. Detta kan vara av särskild vikt vid riskhantering, juridisk upptäckt och efterlevnad av myndighetsföreskrifter. Dataklassificering är vanligtvis en manuell process; Det finns dock många verktyg från olika leverantörer som kan hjälpa till att samla in information om data.
Dataklassificering måste ta hänsyn till följande:
- Tillsynskrav
- Strategiskt eller proprietärt värde
- Organisationsspecifika policyer
- Etiska och integritetshänsyn
- Avtalsavtal
Hur startar man processen för dataklassificering?
Observera att denna klassificeringsstruktur är skriven ur ett Data Management-perspektiv och därför har fokus på text- och textkonverterbara binära datakällor. Bilder, videor och ljudfiler är mycket strukturerade format byggda för industristandard API:er och passar inte lätt inom klassificeringsschemat som beskrivs nedan.
Utvärdering och en uppdelning av de olika dataapplikationerna och data i deras respektive kategorier behövs för att starta dataklassificeringsprocessen. Till exempel kan processen se ut så här:
- Relationsdata eller tabelldata (cirka 15 % av icke ljud-/videodata)
- Beskriver i allmänhet proprietära data som endast kan nås via applikations- eller applikationsprogrammeringsgränssnitt (API).
- Tillämpningar som producerar strukturerad data är vanligtvis databasapplikationer.
- Denna typ av data medför vanligtvis komplexa procedurer för datautvärdering och migrering mellan lagringsnivåerna.
- För att säkerställa adekvata kvalitetsstandarder måste klassificeringsprocessen övervakas av ämnesexperter.
- Halvstrukturerad eller polystrukturerad data (all annan icke-ljud-/videodata som inte överensstämmer med en system- eller plattformsdefinierad relations- eller tabellform).
- Beskriver generellt datafiler som har en dynamisk eller icke-relationell semantisk struktur (t.ex. dokument, XML, JSON, enhets- eller systemloggutgång, sensorutgång, etc.).
- Relativt enkel process för dataklassificering är kriterietilldelning.
- Enkel process för datamigrering mellan tilldelade segment av fördefinierade lagringsnivåer.
Det finns olika typer av dataklassificering som används. Observera att denna beteckning är helt ortogonal mot den applikationscentrerade beteckningen som beskrivs ovan. Oavsett struktur som ärvts från applikationen kan data vara av en viss typ, till exempel:
1. Geografiskt
2. Kronologisk
3. Kvalitativ
4. Kvantitativ
Det bör också utvärderas över tre dimensioner:
- Identifierbarhet: hur lätt kan dessa uppgifter användas för att identifiera en individ?
- Känslighet: hur mycket skada skulle kunna göras om denna data nådde fel händer?
- Knapphet: hur lättillgänglig är denna information?
Grundläggande kriterier för semistrukturerad eller polystrukturerad dataklassificering
- Tidskriterier är de enklaste och mest använda, där olika typer av data utvärderas efter tidpunkt för skapande, åtkomsttid, uppdateringstid, etc.
- Metadatakriterier som typ, namn, ägare, plats och så vidare kan användas för att skapa mer avancerad klassificeringspolicy.
- Innehållskriterier som involverar användning av avancerade innehållsklassificeringsalgoritmer är de mest avancerade formerna av ostrukturerad dataklassificering .
Observera att något av dessa kriterier också kan gälla för tabell- eller relationsdata som "grundläggande kriterier". Dessa kriterier är tillämpningsspecifika snarare än inneboende aspekter av den form i vilken data presenteras. .
Grundläggande kriterier för relations- eller tabelldataklassificering
Dessa kriterier initieras vanligtvis av ansökningskrav som:
- Regler för katastrofåterställning och affärskontinuitet
- Optimering och konsolidering av datacenterresurser
- Begränsningar av hårdvarans prestanda och möjliga förbättringar genom omorganisation
Observera att något av dessa kriterier också kan gälla semi/polystrukturerad data som "Grundläggande kriterier". Dessa kriterier är tillämpningsspecifika snarare än inneboende aspekter av den form i vilken data presenteras.
Fördelar med dataklassificering
Fördelarna med effektiv implementering av lämplig dataklassificering kan avsevärt förbättra ILM-processen och spara datacenterlagringsresurser. Om det implementeras systemiskt kan det generera förbättringar i datacenterprestanda och användning. Dataklassificering kan också minska kostnader och administrationskostnader. Dataklassificeringen "tillräckligt bra" kan ge följande resultat:
- Dataefterlevnad och enklare riskhantering . Data finns där de förväntas på fördefinierad lagringsnivå och "tidpunkt"
- Förenkling av datakryptering eftersom all data inte behöver krypteras. Detta sparar värdefulla processorcykler och all relaterad konsekutivitet.
- Dataindexering för att förbättra användaråtkomsttider
- Dataskyddet omdefinieras där RTO ( Recovery Time Objective ) förbättras.
Strategier för klassificering av företagsdata
Det finns tre olika tillvägagångssätt för dataklassificering inom en affärsmiljö, var och en av dessa tekniker – pappersbaserad klassificering, automatiserad klassificering och användardriven (eller användartillämpad) klassificering – har sina egna fördelar och fallgropar.
Pappersbaserad klassificeringspolicy
En företagsdataklassificeringspolicy kommer att beskriva hur anställda måste behandla de olika typerna av data de hanterar, i linje med organisationens övergripande datasäkerhetspolicy och strategi. En välskriven policy kommer att göra det möjligt för användare att fatta snabba och intuitiva beslut om värdet av en informationsbit, och vilka lämpliga hanteringsregler som är till exempel vem som kan komma åt data och om en rättighetshanteringsmall skulle åberopas. Utmaningen, utan någon stödjande teknik, är att se till att alla är medvetna om policyn och implementerar den korrekt.
Automatiserad klassificeringspolicy
Denna teknik kringgår användarnas engagemang, och upprätthåller en klassificeringspolicy som ska tillämpas konsekvent över alla kontaktpunkter, utan behov av större kommunikations- och utbildningsprogram.
Klassificeringar tillämpas av lösningar som använder mjukvarualgoritmer baserade på nyckelord eller fraser i innehållet för att analysera och klassificera det. Detta tillvägagångssätt kommer till sin rätt där vissa typer av data skapas utan användarinblandning – till exempel rapporter genererade av ERP-system eller där data innehåller specifik personlig information som lätt kan identifieras såsom kreditkortsuppgifter.
Automatiserade lösningar förstår dock inte sammanhanget och är därför mottagliga för felaktigheter, vilket ger falska positiva resultat som kan frustrera användare och försvåra affärsprocesser, samt falska negativa fel som utsätter organisationer för känslig dataförlust.
Användardriven klassificeringspolicy
Dataklassificeringsprocessen kan vara helt automatiserad, men den är mest effektiv när användaren placeras i förarsätet.
Den användardrivna klassificeringstekniken gör medarbetarna själva ansvariga för att bestämma vilken etikett som är lämplig och att fästa den med hjälp av ett mjukvaruverktyg vid tillfället för att skapa, redigera, skicka eller spara. Fördelen med att involvera användaren i processen är att deras insikt i sammanhanget, affärsvärdet och känsligheten hos en databit gör det möjligt för dem att fatta välgrundade och korrekta beslut om vilken märkning som ska tillämpas. Användardriven klassificering är ett extra säkerhetslager som ofta används för att komplettera automatiserad klassificering.
Att involvera användare i klassificeringen leder också till andra organisatoriska fördelar, inklusive ökad säkerhetsmedvetenhet, en förbättrad kultur och förmågan att övervaka användarbeteende, vilket underlättar rapporteringen och ger möjlighet att visa efterlevnad. Dessutom kan chefer använda dessa beteendedata för att identifiera ett möjligt insiderhot och ta itu med eventuella problem genom att ge ytterligare vägledning till användarna vid behov, till exempel genom ytterligare utbildning eller genom att skärpa policyn.
Se även
- ^ Riddare, Michelle (2021-08-26). "Vad är dataförordningar?" . DATAVERSITET . Hämtad 2022-10-26 .
- ^ "Få reda på dataklassificering och GDPR innan du är för sent - LightsOnData" . LightsOnData . 2018-05-23 . Hämtad 2018-05-23 .
- ^ Khatibloo, Fatemeh (maj 2017). "Hur smutsiga är dina data? Strategisk plan: The Customer Trust and Privacy Playbook" . The Customer Trust and Privacy Playbook för 2018 .
- ^ "Vad är dataklassificering och vad kan den göra för mitt företag? | Boldon James" . www.boldonjames.com . Hämtad 2019-03-05 .
- Josh Judd och Dan Kruger (2005), Principles of SAN Design. Infinity Publishing
- Stephen J. Bigelown (november 2005), SearchStorage.com, http://searchstorage.techtarget.com/news/article/0,289142,sid5_gci1139240,00.html