< Terug naar vorige pagina

Project

Het in praktijk brengen van dataset anonimisatie

Gegevensverzameling en -verwerking zijn in veel bedrijven een deel geworden van de kernactiviteit. Er worden voortdurend meer strategische beslissingen genomen gebaseerd op verzamelde data. Veel bedrijven kunnen voordeel halen uit het verrijken van hun modellen met gegevens van andere providers (academisch, overheid, derde partijen …). De GDPR regelgeving, van kracht sinds mei 2018 faciliteert het uitwisselen van data tussen belanghebbenden, op voorwaarde dat de gegevens geanonimiseerd zijn. Veel papers beschrijven privacy metrieken zoals K-anonimity en L-diversity. Deze beschouwen enkel de huidige dataset die wordt geanonimiseerd om de privacy van een dataset te beschrijven. In de echte wereld kan achtergrond kennis samengevoegd worden met geanonimiseerde data om meer informatie te verkrijgen dan verwacht. Achtergrond kennis moet niet altijd een andere dataset zijn (burgergegevens, andere datasets van commerciële partners), een andere versie van dezelfde geanonimiseerde dataset of een eerdere revisie van deze dataset is ook mogelijk. Enkele anekdotische privacy incidenten worden beschreven in academische onderzoek (Netflix, kredietkaartgegevens en New York taxi data), maar manieren om deze te voorkomen worden zelden besproken. Het doel van dit doctoraat is het in praktijk brengen van de echte privacy van (geanonimiseerde) datasets. De impact van verschillende deanonimisatie technieken op de privacy eigenschappen van geanonimiseerde datasets wordt bestudeerd en verder uitgebreid. Aanvallen worden gedemonstreerd op echte datasets. In een verder deel van het doctoraat worden de verzamelde inzichten, verkregen door het uitvoeren van deanonimisatie aanvallen, toegepast om de bestaande anonimisatie technieken te verbeteren.

Datum:16 dec 2020 →  Heden
Trefwoorden:Privacy, Anonymization, Anonymity, GDPR, Datasets
Disciplines:Cryptografie, privacy en beveiliging
Project type:PhD project