样本量的确定样本量的确定
沈浩
北京广播学院新闻传播学院
调查统计研究所
二零零一年五月
本讲主要内容
如何计算简单随机抽样的样本量确定
如何实现分层抽样中各层样本单位数的分配
SSI 第2页
样本容量的确定
样本量=费用+精度 (函数)
确定样本容量,需要处理好预定的精度与现有经
费,同时也要考虑资源和时间等限制条件,最终的样
本量确定是在上述因素之间的权衡关系。
SSI 第3页
分层抽样分配样本的标准
1. 总的样本容量事先确定
2. 估计值要求达到的精度预先给定
SSI 第4页
影响调查样本容量的因素
调查估计值所希望达到的精度
调查估计值所能允许的误差。
估计量的抽样方差较小,估计值是精确的
估计值的精度越高,所需的样本容量就越大
影响精度的因素也同样影响着样本容量的大小
所研究指标在总体中的变异程度
总体的大小
样本设计和所使用的估计量
无回答率
SSI 第5页
除了估计值的精度以外,调查实际操作的限制条件
也许是影响样本容量的最大因素。
客户提供的经费能支持多大容量的样本
整个调查持续的时间有多长
调查需要多少访员
能招聘到的访员有多少
SSI 第6页
1.给定精度水平下样本容量的确定
样本容量的大小与调查估计值所要求的精度紧密相关
数据是通过抽样而不是普查收集的,就会产生抽样误差。
精度是由抽样方差来测量的。
随着样本容量的增加,调查估计值的精度也会不断提高。
SSI 第7页
抽样方差的几种计量方法
标准误差
误差界限
变异系数
抽样调查中样本容量的确定,也经常会使
用一种或多种这样的计量方法来对精度进行说
明。
SSI 第8页
非抽样误差
非抽样误差会对调查估计值的精度产生显著的影响
非抽样误差的大小与样本容量的大小却没有很大的关系
确定样本容量,就不必将这些误差作为影响因素加以考虑
为确保调查结果的准确性,应该消除非抽样误差,至少应尽
可能使之最小化
SSI 第9页
置信区间
由于我们将在某一给定误差界限下,阐述样本容
量确定的过程,所以有必要复****一下置信区间的概念。
对于具有正态分布的估计量来说,95%的置信区
间意味着在同样的条件下,反复抽样100次所得的100
个样本中,有95个样本的估计值所确定的区间包含总
体真值,这个区间以样本的估计值为中心,半径为
。
SSI 第10页
样本量的确定 来自淘豆网www.taodocs.com转载请标明出处.