下载此文档

数据挖掘与生物医学应用作业 杨帆.doc


文档分类:IT计算机 | 页数:约10页 举报非法文档有奖
1/10
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/10 下载此文档
文档列表 文档介绍
《数据挖掘与生物医学应用》作业姓名:杨帆学号:B11090314请用分箱方法对向量[3,6,7,15,11,40,33,20,30]进行清除噪声处理。要求是分别使用等深度和等宽度分割,然后再分别使用均值、中值和边界平滑。答:等深度分割:分类一:367分类二:111520分类三:303340均值平滑:555151515343434中值平滑:666151515333333边界平滑:3771**********等宽度分割:分类一:36711[3,14]分类二:1520[15,26]分类三:303340[27,40]均值平滑:77771818343434中值平滑:77771818333333边界平滑:333141515272740用直方图表示价格向量[1,1,5,5,5,6,6,8,8,10,10,10,12,13,13,14,15,16,17,17,17,17,18,18,18,18,18,18,18,18,20,20,22,22,23,23,25,26,26,26,27,27,27,27,27,27,27,30,30,30]。答:请用表一所示数据作为训练数据,给出构建分类预测模型的步骤。用表二所示数据作为测试数据,给出预测每个人是否为终身教授(Tenured)的步骤。表一表二答:分为两步:一,构建基于训练数据的模型;在测试样本数据时,我们以样本的Years和Rank两个属相值为评判标准,来获得训练模型。在上述的实验中,我们对表一进行训练,得出模型的训练标准为Rank属性为Professor或者Years属性值大于6时,我们判断该目标的Tenured为Yes,否则,为No二,使用构建模型预测目标的类型或特征值。将表二中的数据带入训练模型,通过判断其Rank和Years属性是否符合判断标准,断定其Tenured属性。则结果:TomRank属性不是Professor且Years属性为2,故其Tenured属性为No;MerlisaRank属性不是Professor但Years属性为7,故其Tenured属性为Yes;eRank属性是Professor故其Tenured属性为Yes;JosephRank属性不是Professor但Years属性为7,故其Tenured属性为Yes;请用年龄、是否为学生以及信用等级为属性构建一棵决策树,用于判断能否批准客户的信用卡申请。答:决策树(DecisionTree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在本题中,我们对一个目标的年龄、是否为学生以及信用等级来作为判断标准进行评判。在这三个属性中,很明显年龄属性可以包含其余两个属性,因此我们将其作为决策树的根节点。对于大部分人小于30岁的一般为学生或者刚毕业,要对其进行是否学生的评判。30到40岁的人一般都有工作,默认其有能力申请信用卡。而大于40岁的人一般都已经建立了自己的信用等级,可以根据这个判断能否申请信用卡。具体的决策树如下:年龄? >40<30 30-40信用等级?学生?是否 是 优良 一般否否否否请查阅相关文献后给出决策树发展历史上有哪些重要的决策树算法?并简要描述其基本原理,并给出相关文

数据挖掘与生物医学应用作业 杨帆 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数10
  • 收藏数0 收藏
  • 顶次数0
  • 上传人changjinlai
  • 文件大小420 KB
  • 时间2020-01-17