下载此文档

数据挖掘实验报告.docx


文档分类:IT计算机 | 页数:约12页 举报非法文档有奖
1/12
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/12 下载此文档
文档列表 文档介绍
数据挖掘实验报告一、实验名称:有线电视服务销售( C&R 树) 二、实验目的 1 、学****和了解数据挖掘的基础知识,学会使用 SPSS Clementine 软件进行数据挖掘分析。 2、掌握数据挖掘过程的一般流程。三、实验数据分类和回归树节点(C&R 树)是一种基于树的分类和预测方法,此方法使用递归分区将训练记录分割为多个具有相似输出字段值的段。本示例将 C&R 树应用于某市场研究,其中的目标字段为有意预订有线电视交互服务。预测变量字段包括年龄、性别、教育、收入类别、每天看电视的时间和子女数(按有序集合编码,因为值 8表示 8个或更多)。此示例使用名为 的流,该流引用名为 的数据文件。这些文件可在任何 Clementine Client 安装程序的 Demos 目录中找到。此目录可通过 Windows “开始”菜单的 Clementine 程序组进行访问。文件 位于 Base_Module 目录下。四、实验过程 文件夹中添加指向 的SPSS 文件源节点,为流添加类型节点。 “类型”选项卡中,单击读取值以将字段实例化。选择 NEWSCHAN 并将其类型设置为标志,将其方向设置为输出。其他所有字段用作预测变量(输入)。单击确定。 &R 树节点连接到类型节点。在“模型”选项卡上,选择启动交互会话作为构建选项。这样,在执行节点时将启动“交互树”窗口,通过该窗口可以在生成模型之前生成并编辑树。 “专家”选项卡上选择专家模式并选择修剪树和使用标准误规则。将最小杂质改变值设置为 。增加此值可避免进行改进意义十分微小的分割, 从而倾向于生成较简单的树。 ,可在“专家”选项卡上单击停止。在“停止标准”对话框中选择使用绝对值。将最小绝对临界值更改为 25 和10,然后单击确定。 。此时将出现交互树窗口,在其中可以生成并编辑树。最初, 仅显示根节点。统计指出训练数据中有 442 条记录。由于树已展开,所有记录将落入此节点。在整个示例中,有 215 个记录对预订的响应为是,其总响应率接近49% 。使用树模型, 我们可以尝试是否能够通过找到最有可能作出积极响应的子组来提高此匹配率。 “查看器”选项卡中, 选择根节点(如果尚未选中),然后从菜单中选择: 树生成树和修剪 。(要查看整个树,可单击减小缩放按钮或单击工具栏右侧的树映射窗口按钮。)如果尚未选中修剪选项,则树可能会复杂得多。修剪操作基于成本复杂性算法,此算法可根据终端节点数调整风险评估。 ,可以看到第一个节点是按年龄进行分割的,第二个节点是按收入进行分割的。查看节点 2,可以看到只要将样本限制在年龄超过 岁的用户,就可以将响应率增加到近 68% 。 , 响应率较之非常低,但在此响应率较低的树分支的节点 4 之下, 显示出即使对于此组,也可以将其分割成若干个响应率提高了 35% (年龄低于 40 岁的用户的总响应率)的子组。例如, 节点13的匹配率为60% 。 11. 下一步,我们将检查此树的收益表。从收益指数百分比可看出每个节点上给定目标类别的比例与总体比例间的差异有多大。单击交互树窗口底部的收益选项卡检查收益。选择 1作为目标类别以查看响应是的收益。与预期的一样,节点 2和13显示具有最高的指数(%) 值。指数值大于 100% 的节点表示,通过从这些节点中选择记录而不是从整个样本中随机选择记录,能够有更多的机会找到愿意接受预订的用户。查看此示例中的指数值可看到, 节点 2在整个示例中具有最高可能的指数值接近 140% 。这表示,从这些记录中获得积极响应的可能性几乎是随机选择的 倍。要查看提升图表,可单击工具栏上的分位数按钮并确保从下拉列表中选中十分位数。此操作可进一步在工具栏中激活“图表”按钮(因为只有在分位数视图中才可查看图表)。单击图表按钮并从相邻的下拉列表中选择提升以查看提升图表。提升图表对表中指数(%) 列中的值进行了绘制。此图表将每个增量中具有积极响应的记录的百分比与训练数据集中具有积极响应的记录的总百分比作了比较。 12. 使用决策树时,共有几个选项可用于生成或导出会话结果。其中两个常用的选项为根据当前树生成模型或根据当前树生成选择节点。这些选项会在下面各节中进行说明。根据当前树生成模型可使用此流生成模型,该模型可根据分配到节点的记录的积极响应率对这些记录进行评分。在交互树窗口的“查看器”选项卡上,从“生成”菜单中选择生成模型。 13. 此时将出现“生成新模型”对话框。在“生成新模型”

数据挖掘实验报告 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数12
  • 收藏数0 收藏
  • 顶次数0
  • 上传人1322891254
  • 文件大小345 KB
  • 时间2017-04-23