第 10 章 皮尔逊 χ 2 检验
§ 皮尔逊 χ 2 统计量
统计检验中有时会遇到这样一类问题:样本资料被整理成频数分布形式,要检验实际
频数与理论频数是否较为接近。为解决这类检验问题,统计学家卡尔·皮尔逊()
1900 年提出如下检验统计量
(实际频数 − 理论频数)2
χ 2 = ∑ ()
(n) 理论频数
2
并证明它近似服从自由度为ν =组格数-估计参数个数-1 的 χ − 分布。式中, n 是样本量,
理论频数是由样本量乘以由理论分布确定的组格概率计算的。求和项数为组格数目。
2 2
皮尔逊 χ − 统计量的直观意义十分显然: χ (n) 是各组格的实际观测频数与理论期望频数
2
的相对平方偏差的总和,若 χ (n) 值充分大,则应认为样本提供了理论分布与统计分布不同的
显著证据,即假设的总体分布与总体的实际分布不符,从而应否定所假定的理论分布。所以,
2
应当在 χ − 分布密度曲线图的右尾部建立拒绝域。
2
应用皮尔逊 χ − 统计量时要注意下列问题:
2 2 2
n 充分大时, χ ()n 近似服从 χ − 分布,因此,皮尔逊 χ ()n 统计量要在大样本的情形下
应用。
。一般,每一组格的理论频数都不应小于 4,否则应将小
于 4 的组并入其他组。但是,具体应用时这一限制可以放宽:(1)若自由度不小于 60,则
可以不加限制;(2)若自由度不小于 6,则个别理论频数不得小于 即可;(3)若自由度
等于 2,则各理论频数不应小于 2;(4)若自由度等于 1,则各理论频数不应小于 4。
统计学 第10章 皮尔逊χ 2检验 来自淘豆网www.taodocs.com转载请标明出处.