下载此文档

SAS系统和数据分析全随机设计Kruskal-Wallis秩和检验.doc


文档分类:高等教育 | 页数:约13页 举报非法文档有奖
1/13
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/13 下载此文档
文档列表 文档介绍
完全随机设计Kruskal-Wallis秩和检验
完全随机设计的Kruskal-Wallis秩和检验
方差分析过程关注三个或更多总体的均值是否相等的问题,数据是被假设成具有正态分布和相等的方差,此时F检验才能奏效。但有时采集的数据常常不能完全满足这些条件。在两两样本比较时,我们不妨尝试将数据转换成秩统计量,因为秩统计量的分布与总体分布无关,可以摆脱总体分布的束缚。在比较两个以上的总体时,广泛使用非参数的Kruskal-Wallis秩和检验,它是对两个以上的秩样本进行比较,本质上它是两样本时的Wilcoxon秩和检验方法在多于两个样本时的推广。
Kruskal-Wallis秩和检验,首先要求从总体中抽取的样本必须是独立的,然后将所有样本的值混合在一起看成是单一样本,再把这个单一的混合样本中的值从小到大排序,序列值替换成秩值,最小的值给予秩值1,有结值时平分秩值。将数据样本转换成秩样本后,再对这个秩样本进行方差分布,但此时我们构造的统计量KW不是组间平均平方和除以组内平均平方和,而是组间平方和除以全体样本秩方差。这个KW统计量是我们判定各组之间是否存在差异的有力依据。
设有组样本,是第组样本中的观察数,是所有样本中的观察总数,是第组样本中的秩和,是第组样本中的第个观察值的秩值。需要检验的原假设为各组之间不存在差异,或者说各组的样本来自的总体具有相同的中心或均值或中位数。在原假设为真时,各组样本的秩平均应该与全体样本的秩平均比较接近。所以组间平方和为
组间平方和
()
恰好是刻画这种接近程度的一个统计量,除以全体样本秩方差,可以消除量纲的影响。样本方差的自由度为。所以,全体样本的秩方差为
全体样本的秩方差=
=
=
()
=
=
因此,Kruskal-Wallis秩和统计量KW为:
()
如果样本中存在结值,需要调整公式()中的KW统计量,校正系数C为:
()
其中,第j个结值的个数。调整后的KWc统计量为:
()
如果每组样本中的观察数目至少有5个,那么样本统计量KWc非常接近自由度为的卡方分布。因此,我们将用卡方分布来决定KWc统计量的检验。
。最近,公司的人事部门已经收集信息并考核了年度工作成绩。从三个大学来的雇员中随机地抽取了三个独立样本,、4、6列所示。制造商想知道来自这三个不同的大学的雇员在管理岗位上的表现是否有所不同。
来自三个不同大学的雇员得分及统一秩值
雇员
大学A
统一编秩
大学B
统一编秩
大学C
统一编秩
1
25
3
60
9
50
7
2
70
12
20
2
70
12
3
60
9
30
4
60
9
4
85
17
15
1
80

5
95
20
40
6
90

6
90

35
5
70
12
7
80

75
14
秩和
组A秩和
95
组B秩和
27
组C秩和
88
为了计算KW统计量,我们首先必须将来自三个大学的20名雇员统一按考核成绩编排秩值,、5、7列所示。本例中,7,6,7,20,95,
27,88,3,三个总体的考核成绩分布是相同的。我们用()式计算KW统计量为:
用()式计算校正系数C,,相等成绩值和相等的个数分别为60分3个,70分3个,80分2个,90分2个。所以:
调整后的KWc为:
查表可知道,自由度为的卡方分布,在显著水平下,,>,因此拒绝原假设。所以,秩和最低的B组至少与秩和最高的A组是不同的。
freq频数过程
Freq频数过程可以生成单向和n向的频率表和交叉表。对于双向表(二维表),该过程计算检验统计量和关联度。对于n向表,该过程进行分层分析,计算每一层和交叉层的统计量。这些频数也能够输出到SAS数据集里。
freq过程说明
proc freq过程一般由下列语句控制:
proc freq data=数据集 <选项>;
by 变量列表 ;
tables 交叉表的表达式 </选项>;
weight 变量;
output <out=输出数据集> <输出统计量列表>;
run ;
该过程proc freq语句是必需的。其余语句是供选择的。另外,该过程只能使用一个output语句。
proc fre

SAS系统和数据分析全随机设计Kruskal-Wallis秩和检验 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数13
  • 收藏数0 收藏
  • 顶次数0
  • 上传人mkjafow
  • 文件大小352 KB
  • 时间2021-01-17