韩建民
最后更新时间:--
中文主页 - 科学研究 - 论文成果

论文成果

基于聚类的高效k-匿名化算法

点击次数:

发布时间:2018-12-18

第一作者:于娟

发表时间:2009-01-01

发表刊物:计算机研究与发展

所属单位:数理与信息工程学院

文献类型:期刊

期号:第z2期

ISSN号:1000-1239

关键字:k-匿名;KACA算法;c-modes算法;信息损失;k-anonymity;KACA;algorithm;c-modes;algorithm;information;loss

摘要:KACA算法是一种较好的基于局部重编码的k-匿名化算法,它产生的匿名化微数据的信息损失少,数据可用性高.但该算法的效率低,不适合匿名化规模很大的微数据.为解决该问题,将高效的聚类算法--c-modes算法--与KACA算法结合,提出了c-modes-KACA算法.该算法首先采用C-modes算法将整个数据集划分为较大的类,然后采用KACA算法来分别k-匿名化这些类中元组数大于2k-1的类.实验表明,c-modes-KACA算法产生的信息损失量与KACA算法相近,效率却比KACA算法高得多.

是否译文:否

推荐本文