De-anonimisering - KamilTaylan.blog
24 juni 2021 11:40

De-anonimisering

Wat is de-anonimisering?

De-anonimisering is een techniek die bij datamining wordt gebruikt en die probeert om versleutelde of verduisterde informatie opnieuw te identificeren. De-anonimisering, ook wel gegevensheridentificatie genoemd, verwijst naar anonieme informatie met andere beschikbare gegevens om een ​​persoon, groep of transactie te identificeren. 

Belangrijkste leerpunten

  • De-anonimisering is de praktijk waarbij de privé-informatie die is opgeslagen in gecodeerde of anderszins onleesbare gegevens opnieuw wordt samengesteld.
  • Geanonimiseerde gegevens worden alom gebruikt bij online en financiële transacties, evenals op sociale media en andere vormen van elektronische berichtenuitwisseling en communicatie.
  • Het opnieuw identificeren van geanonimiseerde gegevens kan de persoonlijke identiteit en financiële veiligheid voor illegale doeleinden in gevaar brengen en het vertrouwen van de consument ondermijnen.

Inzicht in de-anonimisering

Het technologisch onderlegde tijdperk verstoort snel de traditionele manier om dingen te doen in verschillende sectoren van de economie. In de afgelopen jaren zijn er in de financiële sector veel digitale producten door fintech bedrijven in zijn sector geïntroduceerd. Deze innovatieve producten hebben financiële inclusie bevorderd, waardoor meer consumenten toegang hebben tot financiële producten en diensten tegen lagere kosten dan traditionele financiële instellingen toestaan. De toename van de implementatie van technologie heeft geleid tot een toename van het verzamelen, opslaan en gebruiken van gegevens.

Technologietools zoals sociale mediaplatforms, digitale betalingsplatforms en smartphonetechnologie hebben een heleboel gegevens onthuld die door verschillende bedrijven worden gebruikt om hun interactie met consumenten te verbeteren. Deze massa gegevens wordt big data genoemd en is een bron van zorg bij individuen en regelgevende instanties die pleiten voor meer wetten die de identiteit en privacy van gebruikers beschermen.

Hoe de-anonimisering werkt

In het tijdperk van big data, waarin gevoelige informatie over de onlineactiviteiten van een gebruiker onmiddellijk wordt gedeeld via cloud computing, zijn gegevensanonimiseringstools gebruikt om de identiteit van gebruikers te beschermen. Anonimisering maskeert de persoonlijk identificeerbare informatie (PII) van gebruikers die transacties uitvoeren op verschillende gebieden, zoals gezondheidsdiensten, sociale mediaplatforms, e-commerce, enz. PII omvat informatie zoals geboortedatum, burgerservicenummer (SSN), postcode en IP adres. De noodzaak om de digitale sporen die door online activiteiten zijn achtergelaten te maskeren, heeft geleid tot de implementatie van anonimiseringsstrategieën zoals codering, verwijdering, generalisatie en verstoring. Hoewel datawetenschappers deze strategieën gebruiken om gevoelige informatie van de gedeelde gegevens te scheiden, behouden ze nog steeds de oorspronkelijke informatie, waardoor deuren worden geopend voor de mogelijkheid van heridentificatie.

De-anonimisering keert het proces van anonimisering om door gedeelde maar beperkte datasets te matchen met datasets die gemakkelijk online toegankelijk zijn. Dataminers kunnen vervolgens wat informatie uit elke beschikbare dataset halen om de identiteit of transactie van een persoon samen te stellen. Een dataminer kan bijvoorbeeld een dataset ophalen die wordt gedeeld door een telecommunicatiebedrijf, een sociale-mediasite, een e-commerceplatform en een openbaar beschikbaar censusresultaat om de naam en frequente activiteiten van een gebruiker te bepalen.

Hoe de-anonimisering wordt gebruikt

Heridentificatie kan succesvol zijn wanneer nieuwe informatie wordt vrijgegeven of wanneer de geïmplementeerde anonimiseringsstrategie niet correct wordt uitgevoerd. Met een enorme hoeveelheid gegevens en een beperkte hoeveelheid beschikbare tijd per dag, implementeren data-analisten en mijnwerkers snelkoppelingen die bekend staan ​​als heuristieken bij het nemen van beslissingen. Hoewel heuristiek kostbare tijd en middelen bespaart bij het doorzoeken van een gegevensset, kan het ook hiaten creëren die kunnen worden benut als de verkeerde heuristische tool wordt geïmplementeerd. Deze hiaten kunnen worden vastgesteld door datamijnwerkers die een dataset willen de-anonimiseren voor legale of illegale doeleinden.

Persoonlijk identificeerbare informatie die illegaal is verkregen door middel van anonimiseringstechnieken kan worden verkocht op ondergrondse marktplaatsen, die ook een vorm van anonimiseringsplatforms zijn. Informatie die in verkeerde handen valt, kan worden gebruikt voor dwang, afpersing en intimidatie, wat leidt tot bezorgdheid over de privacy en enorme kosten voor bedrijven die het slachtoffer worden.

De-anonimisering kan ook legaal worden gebruikt. De Silk Road website, een ondergrondse marktplaats voor illegale drugs, werd bijvoorbeeld gehost door een geanonimiseerd netwerk genaamd Tor, dat een ui-strategie gebruikt om de IP-adressen van zijn gebruikers te verdoezelen. Het Tor-netwerk herbergt ook een aantal andere illegale markten die handelen in wapens, gestolen creditcards en gevoelige bedrijfsinformatie. Met het gebruik van complexe hulpmiddelen voor de-anonimisering heeft de FBI met succes Silk Road en sites die zich bezighouden met kinderpornografie gekraakt en gesloten.

Succes bij heridentificatieprocessen heeft bewezen dat anonimiteit niet gegarandeerd is. Zelfs als er vandaag baanbrekende anonimiseringshulpmiddelen zouden worden geïmplementeerd om gegevens te maskeren, zouden de gegevens binnen een paar jaar opnieuw kunnen worden geïdentificeerd als nieuwe technologie en nieuwe gegevenssets beschikbaar komen.