Hits :
First Author : 徐晓丹
Date of Publication : 2018-01-01
Journal : 浙江师范大学学报(自然科学版)
Affiliation of Author(s) : 数理与信息工程学院
Document Type : 期刊
Issue : 第2期
Page Number : 46-52
ISSN : 1001-5051
Key Words : 异常点挖掘;高维数据;k近邻;数据挖掘
Abstract : 为了分析当前高维数据中各类异常点检测算法的性能,采用8个典型数据集,对10种代表性算法在这些数据集上进行了详细的实验分析,给出了不同算法在算法精度、ROC曲线面积及运行时间上的分析比较.实验结果表明:受到数据集分布及属性相关性的影响,同一算法在不同数据集上的效果有很大差异性,基于近邻排序的算法在各个数据集中的结果相对稳定,但其结果受k值的影响较大;和其他算法相比,基于集成的算法效果较好,但用于集成的有效算法选择较为困难.
Translation or Not : no