SAS判别分析
SAS判别分析
SAS判别分析
课程: SAS判别分析
部门: 创新业务部 - 徐宝莲
时间: 2015/1/16
内容概要:
1、 判别分析的简单介绍
2、 一般判别分析—— PROC DISCRIM
3、 典型判别分析—— PROC CANDISC
4、 逐步判别分析—— PROC STEPDISC
1、判别分析的简单介绍
判别分析是一种应用性很强的统计方法。 它通常是根据已有的数据资料, 来建立一种判
别方法,然后再来判断一个新的样品归属哪一类。
判别分析的 SAS过程所处理的数据集要求具有一个分类变量和若干个数值型变量。 SAS
中进行判别分析的具体目标可以分为以下三条:
建立判别函数,以便用来判别某一新的观测值的所属类别;
寻找一组数值型变量的线性组合,使得其能够很好地反映各类别之间的差别;
筛选出某些能反映类别间差别的变量。
2、一般判别分析—— PROC DISCRIM
距离判别法
距离判别法是通过计算距离函数来进行判别, 即样品与哪个总体之间的距离最近, 则判
断它属于哪个总体。如何衡量样品与总体间的这种抽象的距离我们一般利用马氏距离来描
述。
对于两总体的情形,设 和 是两个 P 维总体,样品 X 到 的距离为 , 样品 X
到 的距离为 ,则我们按照下面的准则对样本 X 进行判别归类:
SAS判别分析
SAS判别分析
SAS判别分析
1)
若
, 则判定 X属于
;
2)
若
, 则判定 X属于
;
3)
若
,则 X 有待于进一步判定。
判别法
Bayes 判别法是基于 Bayes 统计的思想,即假定事先对所研究的对象有一定的了解,并
通过先验概率分布来进行描述, 当抽取样本后, 用样本来修正先验概率分布, 并得到后验概
率分布,然后根据后验概率分布进行各种统计推断。
Bayes 判别法首先计算给定样品属于各个总体的条件概率,然后比较这些概率值的大
小,将样品判归于条件概率最大的总体。
PROC DISCRIM DATA=数据集名 <选项 >;
CLASS变量名列表;
PRIORS概率值;
BY 分组变量名;
RUN;
语句说明: 1) PROC DISCRIM语句用来调用 DISCRIM 过程。
DATA:此选项用于指定输入的“训练数据集”, 即已知类别的若干样品所组成的数据集,
一般的数据集和特殊类型的数据集均可以 ;
TESTDATA:指定用于进行判别分析的检验数据集。
METHOD:指 定 判 别 分 析 方 法 , 可 以 设 置 为 “method=normal” ( 参 数 法 ) 或 者
“method=npar”(非参数法) 。
POOL:说明按各个总
SAS判别分析 来自淘豆网www.taodocs.com转载请标明出处.