下载此文档

SAS系统和数据分析Wilcoxon秩和检验.doc


文档分类:高等教育 | 页数:约15页 举报非法文档有奖
1/15
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/15 下载此文档
文档列表 文档介绍
Wilcoxon秩和检验
两样本的Wilcoxon秩和检验
两样本的Wilcoxon秩和检验是由Mann,Whitney和Wilcoxon三人共同设计的一种检验,有时也称为Wilcoxon秩和检验,用来决定两个独立样本是否来自相同的或相等的总体。如果这两个独立样本来自正态分布和具有相同方差时,我们可以采用t检验比较均值。但当这两个条件都不能确定时,我们常替换t检验法为Wilcoxon秩和检验。
Wilcoxon秩和检验是基于样本数据秩和。先将两样本看成是单一样本(混合样本)然后由小到大排列观察值统一编秩。如果原假设两个独立样本来自相同的总体为真,那么秩将大约均匀分布在两个样本中,即小的、中等的、大的秩值应该大约被均匀分在两个样本中。如果备选假设两个独立样本来自不相同的总体为真,那么其中一个样本将会有更多的小秩值,这样就会得到一个较小的秩和;另一个样本将会有更多的大秩值,因此就会得到一个较大的秩和。
设两个独立样本为:第一个的样本容量为,第二个样本容量为,在容量为的混合样本(第一个和第二个)中,样本的秩和为,样本的秩和为,且有:
()
我们定义:
()
()
以样本为例,若它们在混合样本中享有最小的个秩,于是,也是可能取的最小值;同样可能取的最小值为。那么,的最大取值等于混合样本的总秩和减去的最小值,即;同样,的最大取值等于。所以,式()和式()中的和均为取值在0与
的变量。当原假设为真时,所有的和相当于从同一总体中抽得的独立随机样本,和构成可分辨的排列情况,可看成一排个球随机地指定个为球,另个为球,共有种可能,而且它们是等可能的。基于这样的分析,在原假设为真的条件下不难求出和的概率分布,显然它们的分布还是相同的,这个分布称为样本大小为和的Mann-Whitney-Wilcoxon分布。
一个具有实际价值的方法是,对于每个样本中的观察数大于等于8的大样本来说,我们可以采用标准正态分布来近似检验。由于的中心点为,根据式(),中心点为:
()
的方差从数学上可推导出:
()
如果样本中存在结值,将影响到公式()中的方差,按结值调整方差的公式为:
()
其中,为第j个结值的个数。结值的存在将使原方差变小,这是一个显然正确的事实。标准化后为:
()
其中,,,。
,他特别有兴趣想知道,是否从亚特兰大起飞的飞机比从芝加哥起飞的飞机有更多的放弃预订
座位的旅客。获得一个从亚特兰大起飞的9次航班和从芝加哥起飞的8次航班上放弃预订座位的旅客人数样本,。
放弃预订座位的旅客人数及统一秩值
航班
次数
亚特兰大(组)
芝加哥(组)
放弃人数
统一编秩
放弃人数
统一编秩
1
11

13
7
2
15
9
14
8
3
10

10

4
18
12
8
1
5
11

16
10
6
20
13
9
2
7
24
16
17
11
8
22
15
21
14
9
25
17
秩和


如果假定放弃预订座位旅客人数的总体是正态分布且有相等的方差,我们可以采用两样本比较的t检验。但航空公司的CEO认为这两个假设条件不能满足,因此采用非参数的Wilcoxon秩和检验。将组与组看成是单一样本进行编秩,。最小值是8,秩值为1,最大值是25,秩值为17,有两个结值10和11,,。如果两组放弃预订座位的旅客人数是相同的,那么我们期望的两组秩和和大约是相同的;如果两组放弃预订座位的旅客人数是不相同的,那么我们期望的两组秩和和也是非常不相同的。
注意到9,8,=,=,两组放弃预订座位旅客人数的分布是相同的。标准正态分布值的计算结果为
,,,下临界值为-,<,所以不能拒绝原假设。
在使用Wilcoxon秩和检验时,也可以采用第二个样本的秩和来计算标准正态分布值,但要注意公式中和的对换。值的计算结果为:
由于->-,因此得到的

SAS系统和数据分析Wilcoxon秩和检验 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数15
  • 收藏数0 收藏
  • 顶次数0
  • 上传人mkjafow
  • 文件大小413 KB
  • 时间2021-01-17