第 卷 第 期 年 月 科 学 技 术 与 工 程 . .
— —— ⑥ ...
基于加权距 离的局部离群点检 测算法
尹成祥 张宏军 张 睿 綦 秀利 王 彬
解放军理 工大学 ,南京
摘 要 针对 不同属性对数据 点之 间距 离贡献 的不 同,提 出了一种 用于距 离度 量 的属性加权 策 略。标称 属性 通过属 性取值
的信 息熵进行加权 ,数值 属性通过 属性取值 的标 准差进行加权 ,混合 属性根 据标称 属性和 数值属性 综合加权 ,加 权策 略可 以
放大离群 点与正常数据之 间的差别 。仿真实验 区分不 同的属性 类型对所 提加权策 略进行 了验证 ,实验 结果证 明 了策 略的有
效 性 。
关键词 属性加权 信息熵 标准差 局部 离群 点因子,算法
中图法分类号 .; 文献标志码
离群点是一个数据对象 ,它显著不 同于其他数 离群点就是不遵循分布模型 的点 ;非参数方法对数
据对象 ,好像它是被不 同的机制产生 的一样⋯ 。离 据作较少的假设 ,常见的有使用直方图的方法和基
群点主要包括全局离群点 、情境离群点和集体离群 于核密 度 估 计 的方 法 。统 计 学 方 法 的 检 测 结 果
点 等 。离 群 点 的 检 测 是 数 据 挖 掘 的 一 个 重 要 研 在 统计 上是无 可 非议 的 ,但 检 测 的结 果 往往 难 以理
究课题 ,也 是数 据 质 量评 估 的重 要 手段 之 一 。离 群 解 ,而且 即使是非参数方法也需要用户提供参数 ,例
点检测已经应用在 网络人侵检测 、电信和信用卡欺 如用直方图进行离群点检测时 ,箱 的宽度的选择对
骗检测、气象预报 、客户分类等众多的领域。早期 的 检 测 的结果将 产 生很大 的影 响 。
离群点检测研究主要集 中于全局离群点 的
基于加权距离的局部离群点检测算法 来自淘豆网www.taodocs.com转载请标明出处.