下载此文档

基于ID3决策树的数据分析毕业设计开题报告.doc


文档分类:IT计算机 | 页数:约10页 举报非法文档有奖
1/10
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/10 下载此文档
文档列表 文档介绍
毕业设计(论文)开题报告
计算机科学与工程学院
计算机科学与技术专业
设计(论文)题目 基于ID3决策树的数据分析
学 生 姓 名 学号
指 导 教 师
顾 问 教 师
教研室 主任
教学院长(教学系主任)

2014年 3月19日
论文题目
基于ID3决策树的数据分析
一、选题背景和意义:
近年来,信息社会中丰富的数据带来了对强有力的数据分析工具的需求,快速增长的海量数据集存放在大型的数据库中,激增的数据背后隐藏着许多重要的信息,而目前的数据库技术虽然可以高效地实现数据的查询、统计等功能,但却无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展 趋势。以至于出现了“数据丰富,但信息贫乏”的现象。在这种需求下,数据挖掘技术应运而生。
数据挖掘就是从数据库中挖掘出数据间潜在的模式,再根据这些模式找出相应的规律。它是解决信息技术在发展中一方面拥有大量数据 而另一方面有用信息却很贫乏这种不正常现象的综合解决方案。数据挖掘技术 通过使用计算机来对数据库中大量数据进行快速、有效的分析和处理,从中提 取有用信息和知识,并以一种形式化、可以理解的方式表达,以便用于决策。
目前对数据挖掘的研究主要集中在关联规则挖掘、聚类、分类、序列模式 发现、异常和趋势发现等方面,也就是说数据挖掘可以产生五种基本类型的信息:关联信息、聚类信息、分类信息、偏差信息、预测信息。其中由于分类挖 掘在商业等领域中的广泛应用使它成为数据挖掘中最活跃的研究方向。分类的目的是提出一个分类函数或分类模型(分类器),该模型能把数据库中的数据映射到给定类别中的某一个。由于分类技术能够对各个行业提供良好的决策支持, 在这些不同的行业有着多种不同领域方法的分类算法,例如决策树方法、神经网络方法、统计学方法等。在这些算法中,决策树方法最容易理解,应用领域也特别广泛。
决策树学****是一种逼近离散值目标函数的方法,这种方法将从一组训练数据中学****到的函数表示为一棵决策树,它是一种常用于预测模型的算法,通过将大量数据有目的的分类,从中找到一些具有价值的、潜在的信息。决策树方法以其速度快、精度高、生成的模式简单等优点,在数据挖掘中受到许多研究者和软件公司的关注。而分类技术对整个市场的控制、公司的运营和个人的投资都有着良好的决策辅助作用,所以基于决策树分类算法的研究有着 很高的应用价值。一般情况下,决策树分类器具有良好的准确率。决策树归纳 算法已经成功地应用于许多应用领域的分类,如医疗诊断、天气预报、金融分析,顾客分类、身份识别等。
课题关键问题及难点:

由于ID3算法是根据离散属性值来计算各个属性的信息熵,所以在处理属性取值为连续值的属性时,往往需要将连续属性做离散化处理,即通过将属性值的定义域划分为非重叠区域,来处理具有连续属性值的样本数据。最常见的划分方法为等宽间距法和等频区间法。假设实

基于ID3决策树的数据分析毕业设计开题报告 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数10
  • 收藏数0 收藏
  • 顶次数0
  • 上传人ogthpsa
  • 文件大小397 KB
  • 时间2021-01-19