下载此文档

抽样误差与参数估计.ppt


文档分类:高等教育 | 页数:约26页 举报非法文档有奖
1/26
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/26 下载此文档
文档列表 文档介绍
抽样误差与参数估计
二、t分布
(一)t分布的概念
1、应用方便,常将正态变量进行变换,即,
可将一般的正态分布变换为标准正态分布。
2、对正态变量 进行u变换( )后,也可将正态抽样误差与参数估计
二、t分布
(一)t分布的概念
1、应用方便,常将正态变量进行变换,即,
可将一般的正态分布变换为标准正态分布。
2、对正态变量 进行u变换( )后,也可将正态分布 变换为标准正态分布 。
3、由于实际工作中, 往往是未知的,常用s作为 的估计值,此时不再是统计量u,而是统计量t,统计量t的分布为t分布。
(二)t分布的图形和特征为:
1、以0为中心,左右对称的单峰分布。
2、t分布曲线是一簇曲线,其形态变化与自由度的大小有关。自由度越小,t值越分散,曲线越低平;自由度逐渐增大时,则t分布逐渐逼近正态分布(标准正态分布)。当 时,t分布即为u分布。
(3)t分布曲线下面积的分布规律
由于t分布曲线是一组曲线故t分布曲线下面积为95%和99%界值不是一个常量,随着自由度的变化,95%或99%面积的界值发生变化,当 时,95%和99%面积对应的界值趋近于u值。
t界值表:横标目为自由度,纵标目为概率,一侧尾部面积称为单尾概率,两侧尾部面积之和称双尾概率。其中与单尾概率相对应的t界值用 表示,与双尾概率相对应的t界值用 表示。
2、举例
例如,单侧 ,表示 时,
的概率或 ,
记作: 或 。
其通式:
单侧: 或
双侧:
图中阴影部分面积的概率为:
30
3、从t值表及t分布曲线可得
(1)在相同自由度时,概率P越小,t绝对值越大。
(2)在相同t值时,双尾概率是单尾概率的两倍。
(3)相同概率时的t界值,自由度越小,t的绝对值
越大。
第二节 总体均数的估计
一、可信区间的概念(Confidence Interval)



区间估计:指按预先给定的概率,计算出一个区间,
使它能够包含未知的总体均数。事先给定的概率
称为可信度,通常取 。
参数估计
点估计:不考虑抽样误差,如
区间估计:考虑抽样误差
二、可信区间的计算
(一) 已知
一般情况
其中 为标准正态分布的双侧界值。
可信区间:
标准正态分布
(二) 未知
通常未知,这时可以用其估计量S 代替,但
已不再服从标准正态分布,而是服从著名的 t 分布。
图4-2 不同自由度的 t 分布图
可信区间的计算:
计算可信区间的原理与前完全相同,仅仅是两侧概率的界值有些差别。即
可信区间:
需要注意:在小样本情况下,应用这一公式的条件是原始变量服从正态分布。在大样本情况下(如n>100),也可以用 替换 近似计算。
例2 g/L, g/L,试计算该种病人血浆纤维蛋白原含量总体均数的95%可信区间。
下限:
上限:
例3 试计算例1中该地成年男子红细胞总体均数的95%可信区间。
本例属于大样本,可采用正态近似的方法计算可信区间。因为 ,则95%可信区间为:
下限:
上限:
模拟实验
模拟抽样成年男子红细胞数。设定:
产生100个随机样本,分别计算其95%的可信区间,结果用图示的方法表示。从图可以看出:绝大多数可信区间包含总体参数 ,只有6个可信区间没有包含总体参数(用星号标记)。
图4-2 模拟抽样成年男子红细胞数100次的95%可信区间示意图
*
*
*
*
*
*
三、可信区间与可信限的区别
标准差和标准误的区

抽样误差与参数估计 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数26
  • 收藏数0 收藏
  • 顶次数0
  • 上传人核辐射
  • 文件大小1.72 MB
  • 时间2022-06-27