第五章比估计与回归估计
第一节比估计的一般形式
第二节分层比估计
第三节回归估计的一般形式
第四节分层回归估计
第一节比估计的一般形式
一、比估计综述
比估计是依据调查变量与辅助变量间的比率来对总体有关参数进行估计和推断。通常简称比估计。
同简单估计相比,比估计具有以下特点:
(1)在比估计中,除调查变量外,还需要了解与调查变量有关的辅助变量,并且要求辅助变量的总体均值或总体总和必须事先已知。充分利用辅助变量带来的信息估计总体参数,比单纯用调查变量资料会有更好的效果。
(2)比估计方法,对抽样调查单元是有条件的,通常是用组成总体的最基层单位为调查单元。
(3)比估计只适用于有限总体,因为只有有限总体才可能计算出为比估计所需要的辅助变量的总体总和与总体均值。
(4)当每个单元的调查变量与辅助变量的比例(一般要求为正比例)十分稳定,且变异很小时,比估计就具有十分精确的估计效果,只要抽取少量的样本单元,就可得到满意的结论。
(5)在比估计时,出于估计精度方面的要求,选择辅助变量时,须与调查变量的关系愈密切愈好,至少要求相关系数在1/2以上。
比估计中,辅助变量可以是上次普查或调查时与调查变量相应的数据(即调查变量的前期或历史资料);也可以是对调查变量的粗略估计;或者是表示单元规模的某个量。
为了充分发挥比估计的优越性,在应用比估计时应考虑两条:
一是选与调查变量有较密切的正相关关系的变量作为辅助变量。因为如果辅助变量与调查变量的关系不密切,各自独立变化,则对比估计起不了应有的辅助作用。
二是样本容量要比较大。因为比估计是有偏倚的,只有当样本容量n比较大时,其偏倚才能比较小,比估计才更加有效。
比率估计是有偏的,但当样本量n增大时,偏倚逐渐趋于零。
三、总体均值和总和的比估计
当调查变量和辅助变量具有正相关关系时,为了利用辅助变量的信息,可以
构造总体均值或总和的比估计量。在简单随机抽样中,总体均值和总体总和
的比估计量分别为
结论为:利用比估计提高抽样效果的条件是ρ>1/2。
五、样本容量的确定
第二节分层比估计
分层随机抽样中的比估计量有两种形式:先构造各层比估计,再加权平均——各层分别比估计;先加权平均,再构造比估计——联合比估计。
一、各层分别比估计
各层分别比估计是先对各层分别进行比估计,然后按层权加权平均,以得出总体参数的估计,即:
抽样调查5 来自淘豆网www.taodocs.com转载请标明出处.