该【第24章 SPSS Clementine典型案例分析 】是由【孔乙己】上传分享,文档一共【24】页,该文档可以免费在线阅读,需要了解更多关于【第24章 SPSS Clementine典型案例分析 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。第24章SPSS_Clementine典型案例分析
对字段设置完毕之后,下一步就是选择挖掘所需要的模型,在这里我们会选择使用三种不同的模型来挖掘该数据集。
1.“Apriori”模型节点
3.“网络”节点
过程如下:
Step1:添加一个“变项文件”节点。
Step2:加入一个“导出”节点。
Step3:对“导出”节点进行设置。
Step4:加入“Healthfood”字段之后,在“导出”节点后再加入一个“类型”节点,用来选择哪些字段用来进行数据挖掘。根据挖掘的目标,可以设置个人信息为“输入”,“Healthfood”设置为“输出”
Step5:加入“”节点。
Step6:点选“执行(E)”
Step7:从“查看器”中查看该结果
输出类型除了选用“决策树”之外,还可以选择“规则集”来显示结果。用“规则集”表示的结果很多时候比“决策树”更加直观、易懂。。
一般生成的决策树都是经过剪枝的。下面看看剪枝程度的高低对挖掘结果的影响。选中“模式”中的“专家”,把“修剪严重性”的值改为“0”,这意味着在挖掘过程中,进行的剪枝程度将很小。模型名称改为“nocut”。
选择“执行(E)”。在右面管理器窗口中选中“模型(S)”,在“nocut”上右击,选择“浏览(B)”,查看生成模型结果。
利用剪枝程度较高的决策树、剪枝程度低的决策树、规则集生成的结果,可以通过Clementine系统提供的很多模型来进行精度测试。
在这儿选用“分析”节点。%。同样的原理,测试“nocut”。%。
背景是关于农业发展贷款的申请。使用虚构的数据来说明如何使用神经网络来检测偏离常态的行为,重点为标识那些异常和需要更深一步调查的记录。要解决的问题是找出那些就农场类型和大小来说申请贷款过多的农场主。
使用一个“变项文件”。在“变项文件”节点之后增加一个“类型”节点到数据流中。
在建模之前,需要了解数据集中都有哪些字段,这些字段如何分布,它们之间是否隐含着某种相关性等信息。只有了解这些信息后才能决定使用哪些字段,应用何种挖掘算法和算法参数。这个过程就是一个理解数据的过程。
第24章 SPSS Clementine典型案例分析 来自淘豆网www.taodocs.com转载请标明出处.