下载此文档

数据挖掘实验报告.doc


文档分类:IT计算机 | 页数:约10页 举报非法文档有奖
1/10
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/10 下载此文档
文档列表 文档介绍
大数据理论与技术读书报告—--—-K最近邻分类算法指导老师: 陈莉学生姓名: 李阳帆学号: 201531467 专业: 计算机技术日期:2016年8月31日摘要数据挖掘就是机器学****领域内广泛研究得知识领域,就是将人工智能技术与数据库技术紧密结合,让计算机帮助人们从庞大得数据中智能地、自动地提取出有价值得知识模式,以满足人们不同应用得需要。K近邻算法(KNN)就是基于统计得分类方法,就是大数据理论与分析得分类算法中比较常用得一种方法。该算法具有直观、无需先验统计知识、无师学****等特点,目前已经成为数据挖掘技术得理论与应用研究方法之一。本文主要研究了K 近邻分类算法,首先简要地介绍了数据挖掘中得各种分类算法,详细地阐述了K近邻算法得基本原理与应用领域,最后在matlab环境里仿真实现,并对实验结果进行分析,提出了改进得方法。关键词:K 近邻,聚类算法,权重,复杂度,准确度1、引言 12、研究目得与意义ﻩ13、算法思想ﻩ24、算法实现ﻩ24、1 参数设置ﻩ24、2数据集ﻩ24、3实验步骤ﻩ34、4实验结果与分析ﻩ35、总结与反思ﻩ4附件1ﻩ61、引言随着数据库技术得飞速发展,人工智能领域得一个分支——机器学****得研究自20 世纪50 年代开始以来也取得了很大进展。用数据库管理系统来存储数据,用机器学****得方法来分析数据,挖掘大量数据背后得知识,这两者得结合促成了数据库中得知识发现(KnowledgeDiscoveryinDatabases,简记KDD)得产生,也称作数据挖掘(DataMing,简记DM)。数据挖掘就是信息技术自然演化得结果。信息技术得发展大致可以描述为如下得过程:初期得就是简单得数据收集与数据库得构造;后来发展到对数据得管理,包括:数据存储、检索以及数据库事务处理;再后来发展到对数据得分析与理解,这时候出现了数据仓库技术与数据挖掘技术。数据挖掘就是涉及数据库与人工智能等学科得一门当前相当活跃得研究领域。数据挖掘就是机器学****领域内广泛研究得知识领域,就是将人工智能技术与数据库技术紧密结合,让计算机帮助人们从庞大得数据中智能地、自动地抽取出有价值得知识模式,以满足人们不同应用得需要[1].目前,数据挖掘已经成为一个具有迫切实现需要得很有前途得热点研究课题。2、研究目得与意义近邻方法就是在一组历史数据记录中寻找一个或者若干个与当前记录最相似得历史纪录得已知特征值来预测当前记录得未知或遗失特征值[14]。近邻方法就是数据挖掘分类算法中比较常用得一种方法。K近邻算法(简称 KNN)就是基于统计得分类方法[15]。KNN分类算法根据待识样本在特征空间中 K个最近邻样本中得多数样本得类别来进行分类,因此具有直观、无需先验统计知识、无师学****等特点,从而成为非参数分类得一种重要方法。大多数分类方法就是基于向量空间模型得。当前在分类方法中,对任意两个向量:x=与存在 3种最通用得距离度量:欧氏距离、余弦距离[16]与内积[17]。有两种常用得分类策略:一种就是计算待分类向量到所有训练集中得向量间得距离:如 K近邻选择K个距离最小得向量然后进行综合,以决定其类别。另一种就是用训练集中得向量构成类别向量,仅计算待分类向量到所有类别向量得距离,选择一个距离最小得类别向量决定类别得归属。很明显,距离计算在分类中起关键作用。由于以上 3种距离度量不涉及向量得特征之间得关系,这

数据挖掘实验报告 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数10
  • 收藏数0 收藏
  • 顶次数0
  • 上传人h377683120
  • 文件大小90 KB
  • 时间2020-08-10