下载此文档

数据模型与决策论文数据模型与决策论文.docx


文档分类:IT计算机 | 页数:约8页 举报非法文档有奖
1/8
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/8 下载此文档
文档列表 文档介绍
数据模型与决策论文数据模型与决策论文.docx数据模型与决策论文数据模型与决策论文ID3算法创建的数据模型的存储结构探讨摘要:利用ID3算法创建的模型是-个不规则的多叉树,这棵树可以用来预测某一事物的发展,从而为决策者提供数据支持。为了能够使用计算机根据模型进行决策,需要设计合理的数据结构来存储树中的各个结点,为算法设计提供支持。该文根据训练集的数据样本创建了数据模型,并根据模型的特点和查找要求,探讨了多叉树的存储方法,以保证算法的运行效率。关键词:ID3算法;信息增益;决策树;数据结构;结点TheID3AlgorithmCreateStorageStructureoftheDataModelareDiscussedYANGLong-ping(LiuzhouRailwayVocationalTechnicalCollege,Liuzhou545007,China)Abstract:ID3algorithmisusedtocreatethemodelisamoreirregulartree,thetreecanbeusedtopredictthedevelopmentofcertainthings,soastoprovidedatatosupportdecision-makers・puterrequiresadatastructuredesignedtostoreallnodesinthetree,thealgorithmisdesignedtoprovidesupport・Basedonthetrainingsetofdatasamplestocreateadatamodel,andfindthemodelcharacteristicsandrequirementsofthemulti-treestoragemethod,:ID3algorithm;informationgain;decisiontree;datastructure:node对于同一个问题,可能会有多个算法可以解决,但是,执行时间短的算法效率高,而算法的效率与存储量的需求有很大的关系。数据在计算机中的存储方式,是影响算法的执行效率重要因素。1ID3算法创建模型的基本思路ID3是基于信息矯的决策树分类算法,算法核心是在决策树中各级结点上选择属性,用信息增益作为属性选择标准[1],使得在每一个非叶子结点进行测试时,能够获得关于被测试例子最大的类别信息,利用该属性将例子分成子集后,系统的爛值最小。期望该非叶子结点到达各后代叶结点的平均路径最短,生成的决策树平均深度较小,从而能够提高分类速度和准确率。ID3算法计算每…个属性的信息增益,并选取具有最高增益的属性作为给定集合的测试属性[2]。对被选取的测试属性创建一个结点,并以属性标记,对该属性的每个值创建一个分支,依次类推。创建决策树的方法主要由儿个公式构成,分别是计算样本分类的期望信息、计算子集的矯、计算子集的期望信息和计算信息增益。,假定类标号属性具有n个不同的值,定义n个不同的类Ci(i=l,2,3,•••,n)o设si是类Ci中的样本数,则对一个给定的样本分类所需的期望信息,可以由公式[3]计算出来。其中pi是任意样本属于Ci的概率,一般可用si/s

数据模型与决策论文数据模型与决策论文 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数8
  • 收藏数0 收藏
  • 顶次数0
  • 上传人pppccc8
  • 文件大小58 KB
  • 时间2019-05-19