下载此文档

数据模型与决策论文数据模型与决策 论文.doc


文档分类:IT计算机 | 页数:约8页 举报非法文档有奖
1/8
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/8 下载此文档
文档列表 文档介绍
数据模型与决策论文数据模型与决策论文
ID3算法创建的数据模型的存储结构探讨
摘要:利用ID3算法创建的模型是一个不规则的多叉树,这棵树可以用来预测某一事物的发展,从而为决策者提供数据支持。为了能够使用计算机根据模型进行决策,需要设计合理的数据结构来存储树中的各个结点,为算法设计提供支持。该文根据训练集的数据样本创建了数据模型,并根据模型的特点和查找要求,探讨了多叉树的存储方法,以保证算法的运行效率。
关键词:ID3算法;信息增益;决策树;数据结构;结点
The ID3 Algorithm Create Storage Structure of the Data Model are Discussed
YANG Long-ping
(Liuzhou Railway Vocational Technical College, Liuzhou 545007, China)
Abstract: ID3 algorithm is used to create the model is a more irregular tree, the tree can be used to predict the development of certain things, so as to provide data to support decision-makers. To be able to make decisions based on the model using puter requires a data structure designed to store all nodes in the tree, the algorithm is designed to provide support. Based on the training set of data samples to create a data model, and find the model characteristics and requirements of the multi-tree storage method, in order to ensure the efficiency of the algorithm.
Key words: ID3 algorithm; information gain; decision tree; data structure; node
对于同一个问题,可能会有多个算法可以解决,但是,执行时间短的算法效率高,而算法的效率与存储量的需求有很大的关系。数据在计算机中的存储方式,是影响算法的执行效率重要因素。
1 ID3算法创建模型的基本思路
ID3是基于信息熵的决策树分类算法,算法核心是在决策树中各级结点上选择属性,用信息增益作为属性选择标准[1],使得在每一个非叶子结点进行测试时,能够获得关于被测试例子最大的类别信息,利用该属性将例子分成子集后,系统的熵值最小。期望该非叶子结点到达各后代叶结点的平均路径最短,生成的决策树平均深度较小,从而能够提高分类速度和准确率。
ID3算法计算每一个属性的信息增益,并选取具有最高增益的属性作为给定集合的测试属性[2]。对被选取的测试属性创建一个结点,并以

数据模型与决策论文数据模型与决策 论文 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数8
  • 收藏数0 收藏
  • 顶次数0
  • 上传人1136365664
  • 文件大小55 KB
  • 时间2018-04-27