24 juni 2021 11:36

Anonimisering van gegevens

Wat is gegevensanonimisering?

Anonimisering van gegevens is bedoeld om privé- of gevoelige gegevens te beschermen door persoonlijk identificeerbare informatie uit een database te verwijderen of te versleutelen. Anonimisering van gegevens wordt gedaan om de privéactiviteiten van een persoon of bedrijf te beschermen, terwijl de integriteit van de verzamelde en gedeelde gegevens behouden blijft.

Anonimisering van gegevens wordt ook wel “gegevensversluiering”, “gegevensmaskering” of “gegevensontsplitsing” genoemd. Het staat in contrast met de-anonimisering, technieken die bij datamining worden gebruikt en die proberen versleutelde of verduisterde informatie opnieuw te identificeren.

Belangrijkste leerpunten

  • Anonimisering van gegevens verwijst naar het verwijderen of versleutelen van persoonlijke of identificerende informatie uit gevoelige gegevens.
  • Aangezien bedrijven, overheden, gezondheidszorgsystemen en andere organisaties in toenemende mate informatie van individuen opslaan op lokale of cloudservers, is anonimisering van gegevens cruciaal om de gegevensintegriteit te behouden en beveiligingsinbreuken te voorkomen.
  • In de zeer gevoelige gezondheidszorg en de financiële sector moeten patiënt- of klantgegevens op een zodanige manier worden verdoezeld om te voldoen aan wettelijke vereisten.

Inzicht in gegevensanonimisering

Bedrijven genereren, bewaren en verwerken enorme hoeveelheden gevoelige gegevens tijdens de normale bedrijfsvoering. De technologische vooruitgang bloeide dankzij relevante informatie die werd gevonden in gegevens die zijn gegenereerd en gedeeld tussen verschillende sectoren en landen. Financiële innovatie in technologie ( fintech ) heeft grenzeloze vooruitgang geboekt in de manier waarop financiële diensten worden aangepast aan klanten, dankzij gegevens die zijn gedeeld vanuit sectoren als sociale media en e-commerce-instellingen.

Gegevens die worden gedeeld tussen digitale media en e-commercebedrijven hebben beide sectoren geholpen om producten op hun sites beter te adverteren voor een specifieke gebruiker of consument. Om gedeelde gegevens echter bruikbaar te maken zonder de identiteit van clients die in de database zijn gecompileerd in gevaar te brengen, moet anonimisering worden gebruikt.

Gegevensanonimisering in de praktijk

Anonimisering van gegevens wordt uitgevoerd door de meeste bedrijfstakken die te maken hebben met gevoelige informatie, zoals de gezondheidszorg, de financiële sector en de digitale media, terwijl de integriteit van het delen van gegevens wordt bevorderd. Anonimisering van gegevens vermindert het risico van onbedoelde openbaarmaking bij het delen van gegevens tussen landen, bedrijfstakken en zelfs afdelingen binnen hetzelfde bedrijf. Het vermindert ook de kans op identiteitsdiefstal.

Een ziekenhuis dat bijvoorbeeld vertrouwelijke gegevens over zijn patiënten deelt met een medisch onderzoekslaboratorium of een farmaceutisch bedrijf, zou dit ethisch kunnen doen als het zijn patiënten anoniem houdt. Dit kan worden gedaan door de namen, burgerservicenummers, geboortedata en adressen van de patiënten van de gedeelde lijst te verwijderen, terwijl de belangrijke componenten die nodig zijn voor medisch onderzoek, zoals leeftijd, aandoeningen, lengte, gewicht, geslacht, ras, enz.

Technieken voor gegevensanonimisering

Anonimisering van gegevens gebeurt op verschillende manieren, waaronder verwijdering, codering, generalisatie en tal van andere. Een bedrijf kan persoonlijk identificeerbare informatie (PII) verwijderen uit de verzamelde gegevens of deze informatie versleutelen met een sterke wachtwoordzin. Een bedrijf kan ook besluiten om de informatie die in zijn database is verzameld, te generaliseren. Een tabel bevat bijvoorbeeld het exacte bruto-inkomen dat vijf CEO’s in de detailhandel hebben verdiend. Laten we aannemen dat de geregistreerde inkomsten $ 520.000, $ 230.000, $ 109.000, $ 875.000 en $ 124.000 zijn. Deze informatie kan worden gegeneraliseerd in categorieën als “<$ 500.000" en "≥ $ 500.000". Hoewel de gegevens versluierd zijn, zullen ze nog steeds nuttig zijn voor de gebruiker.

Redenering van gegevensanonimisering

Anonimisering van gegevens is waarbij gerubriceerde informatie wordt opgeschoond en gemaskeerd op een zodanige manier dat als er een inbreuk plaatsvindt, de verkregen gegevens nutteloos zijn voor de daders. De noodzaak om gegevens te beschermen moet in elke organisatie hoge prioriteit krijgen, aangezien gerubriceerde informatie die in verkeerde handen valt, opzettelijk of onopzettelijk kan worden misbruikt. Gebrek aan gevoeligheid bij het omgaan met gevoelige klantinformatie kan grote kosten met zich meebrengen voor bedrijven omdat regelgevende instanties grove nalatigheid hard aanpakken. Wettelijke en compliancevereisten zoals PCI DSS (Payment Card Industry Data Security Standard) leggen hoge boetes op aan financiële instellingen in het geval van een creditcardinbreuk.1  PIPEDA, een Canadese wet, regelt de openbaarmaking en het gebruik van persoonlijke informatie door bedrijven.  Er zijn meerdere andere regelgevende instanties die zijn opgericht om het gebruik of misbruik van privégegevens door een organisatie te controleren.

Het decoderen van geanonimiseerde gegevens is mogelijk via een proces dat bekend staat als De-anonimisering (of “heridentificatie”). Vanwege het feit dat geanonimiseerde gegevens kunnen worden gedecodeerd en ontrafeld, zijn critici van mening dat anonimisering een vals gevoel van veiligheid geeft.