Anonymiser des données multidimensionnelles à l'aide du coclustering - IMT - Institut Mines-Télécom Accéder directement au contenu
Communication Dans Un Congrès Année : 2017

Anonymiser des données multidimensionnelles à l'aide du coclustering

Résumé

Dans cet article, nous proposons une méthodologie pour anonymiser une table de données multidimensionnelles contenant des données individuelles (soit n individus décrits par m variables). L'objectif est de publier une table ano- nyme construite à partir d'une table initiale qui protège contre le risque de ré- identification. En d'autres termes, on ne doit pas pouvoir retrouver dans les don- nées publiées un individu présent dans la table originale. La solution proposée consite à agréger les données à l'aide d'une technique de coclustering, puis à uti- liser le modèle produit pour générer une table de données synthétiques du même format que les données initiales. Les données synthétiques, qui contiennent des individus fictifs, peuvent maintenant être publiées. Les données produites sont évaluées en termes d'utilité pour différentes tâches de fouille (analyse explora- toire, classification) et de niveau de protection.
Fichier non déposé

Dates et versions

hal-01819080 , version 1 (19-06-2018)

Identifiants

  • HAL Id : hal-01819080 , version 1

Citer

Françoise Fessant, Tarek Benkhelif, Fabrice Clérot. Anonymiser des données multidimensionnelles à l'aide du coclustering. Extraction et Gestion de Connaissances (EGC 2017), Jan 2017, Grenoble, France. pp.153-164. ⟨hal-01819080⟩
171 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More