下载此文档

决策树分类算法的时间和性能测试.docx


文档分类:IT计算机 | 页数:约21页 举报非法文档有奖
1/21
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/21 下载此文档
文档列表 文档介绍
决策树分类算法的时间和性能测试.docx决策树分类算法的时间和性能测试姓名:学号:Is目录一、 项目要求 3二、 基本思想 3三、 样本处理 4四、 实验及其分析 91•总时间 12五、 结论及不足 13附录 14一、项目要求设计并实现决策树分类算法(可参考网上很多版本的决策树算法及代码,但算法的基本思想应为以上所给内容)。使用UCI的基准测试数据集,测试所实现的决策树分类算法。评价指标包括:总吋间、分类准确性等]使用UCIIrisDataSet进行测试。二、基本思想决策树是一个类似于流程图的树结构,其中每个内部节点表示在一个属性变量上的测试,每个分支代表一个测试输出,而每个叶了节点代表类或分布,树的最顶层节点是根节点。、当'需要预测一个耒知样本的分类值时,基于决策树,沿着该树模型向下追溯,在树的每个节点将该样本的变量值和该节点变量的阈值进行比较,然后选取合适的分支,从而完成分类。决策树能够很容易地转换成分类规则,成为业务规则归纳系统的基础。决策树算法是非常常用的分类算法,是逼近离散目标函数的方法,学****得到的函数以决策树的形式表示。其基本思路是不断选取产生信息增益最人的属性来划分样例集和,构造决策树。信息增益定义为结点与其子结点的信息嫡之差。信息爛是香农提出的,用于描述信息不纯度(不稳定性),其计算公式是Entropy(S)=7=1Pi为了集合中不同性(而二元分类即止样例和负样例)的样例的比例。这样信息收益可以定义为样本按照某属性划分吋造成爛减少的期望,可以区分训练样本中正负样本的能力,其计算公式是Gaiii(S,A)=Entropy(S)-ET^Entr°py(^)veV(A)IS|・XA)是属性A的值域・S是样本集介•S、・是SA在屈件A11值等J*的样本集介三、样本处理以UCI提供的IrisPlantsDatabase为测试样本,IrisPlants共冇sepal-length,sepal-width,petal-length,petal-width四种属性,根据属性的不同分为三种:class:--IrisSetosa一一IrisVersicolour一一IrisVirginica为方便实现,只取IrisSetosa和IrisVersicolour这两种植物的样例进行测试。实现该算法的样例集合如下:1,,,,Iris-setosa9,,,,Iris-setosa7,,,,Tris-setosa6,,,,Iris-setosa0,,,,Iris-setosa4,,,,Iris-setosa6,,,,Iris-setosa0,,,,Tris-setosa4,,,,Iris-setosa9,,,,Iris-setosa4,,,,Iris-setosa8,,,,Iris-setosa&,,,Tris-setosa3,,,,Iris-setosa&,,,Iris-setosa7,,,,Iris-setosa4,,,,Iris-setosa1,,,,Iris-setosa7,,,,Iris-setosa1,,,,Iris-setosa4,,,,Iris-setosa1,,,,Iris-setosa6,,,,Iris-setosa1,,,,Iris-setosa&,,,Iris-setosa0,,,,Iris-setosa0,,,,Iris-setosa2,,,,Iris-setosa2,,,,Iris-setosa7,,,,Iris-setosa8,,,,Iris-setosa4,,,,Iris-setosa2,,,,Tris-setosa5,,,,Iris-setosa9,,,,Iris-setosa0,,,,Iris-setosa5,,,,Tris-setoss9,,,,Tris-setosa4,,,,Iris-setosa1,,,,Iris-setosa0,,,,Iris-setosa5,,,,Iris-s

决策树分类算法的时间和性能测试 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数21
  • 收藏数0 收藏
  • 顶次数0
  • 上传人sssmppp
  • 文件大小79 KB
  • 时间2020-01-03