()华北电力大学计算机学院河北保定071003提出一种基于引力的孤立点检测算法。通过综合考虑数据对象周围的密度及数据对象之间的距离等因素对孤立点定义摘要的影响来挖掘出数据集中隐含的孤立点。给出了与该算法相关的概念与技术,详细介绍了该算法,并用实际数据进行了实验。实验表明:该算法对数据集的维度具有很好的扩展性,能有效地识别孤立点,同时能反映出数据对象在数据集中的孤立程度。关键词孤立点检测孤立点引力ALGORITHMOFGRAVITY2BASEDOUTLIERSDETECTIONMengJianliangYaoLiangChengWeixiang()puter,NorthChinaElectricPowerUniversity,Baoding071003,Hebei,China()’sdefinition,prehensivelyconsideringthesetwoparts,,’=d-ijxx?ikjk0引言k=1其中m为数据对象的维数,x表示第i个对象第j个属性的值。ij[2]孤立点检测用来发现数据集中小部分对象,这些对象与对于其它变量类型的对象距离的度量都有其相应的计算方[7]数据中的一般行为或数据模型有着明显的不同。孤立点检测在法。其中一种方法是,将属性值转换为实数值,这样,对象间国内外已有广泛的研究,并被应用到诸多的领域中,包括信用卡的距离计算又变成了上述讨论的区间标度变量类型数据对象的诈骗检测、网络入侵检测、电子贸易、医药研究、数据清洗等,甚距离计算。至在NBA和NHL等比赛中,孤立点分析也有其应用。,已经开发了大量的孤立点检测算法,可以分为三类:基于模型的技术、基于临近度的技术和基于密度的技术。本文为了消除数
基于引力的孤立点检测算法 来自淘豆网www.taodocs.com转载请标明出处.