下载此文档

sas_em数据挖掘.doc

文档分类：IT计算机 | 页数：约9页举报非法文档有奖

1/9

下载提示

1.该资料是网友上传的，本站提供全文预览，预览什么样，下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档，不会出现我们的网址水印。

同意并开始全文预览

(约 1-6 秒)

1/9 下载此文档

文档列表 文档介绍

SAS EM 数据挖掘----- 预测模型 1问题定义目标:建立模型预测贷款申请的信用状态,选择最优的模型来预测和减少损失。数据集: 数据集大小: 1000 变量数目: 21( 20 个输入变量, 1 个目标变量) 变量描述训练数据集: 60% 验证数据集: 40% 定制损失矩阵建立的模型是用来决定将接受哪些客户。因此,我们应该关注 Accept 。为了更加容易地解释模型的结果,可以将上述决策矩阵转换为如下, 实际损失矩阵该损失矩阵将产生和第一个损失矩阵相似的决策,但是第二个矩阵产生的统计描述更加容易理解。先验概率在训练数据集中, 假设实际分布新的申请者未预测数据: 数据集大小: 75 (没有 GOOD_BAD 变量) 2 创建数据挖掘工程 3 定义输入数据集 4 设置目标变量选择变量选项卡,右击 GOOD_BAD 的模型角色,设置变量角色为 target 。 5为 GOOD_BAD 变量定义目标 Profile 目标资料主要定义三种信息(1) 分类变量的目标级别(2) 决策矩阵(3) 先验概率在变量选项卡中右击 GOOD_BAD 目标变量,编辑目标信息设置目标事件级别为 GOOD_BAD 变量定义决策矩阵选择评估信息选项卡,显示四个预定义的矩阵建立新的损失矩阵右击 default loss ,选择 copy 点击 edit decision 编辑决策矩阵定义损失矩阵定义正确的先验概率添加先验向量 6 查看区间变量和类别变量的统计信息可以发现没有缺失值,但是 AMOUT 变量倾斜度过高 7 创建训练数据集和验证数据集 8 创建变量变换创建新的输入变量,使其规范化。右击 AMOUNT 变量,选择 transform , maximize normality 。创建顺序分组变量 9 创建变量选择选择目标关联选项卡,设置变量选择方法为卡方。运行节点,查看结果。在 21 个变量中, 9 个是 rejected ,包括分组变量 AGE_GA2Y ,将其设置为 input 10 创建逐步回归逻辑模型 11 创建决策树模型 12 评估

sas_em数据挖掘来自淘豆网www.taodocs.com转载请标明出处.

sas_em数据挖掘.doc

应用SAS_EM进行数据挖掘

应用SAS_EM进行数据挖掘