第十二讲
统计分析的基本概念与方法(2)
一、描述性统计分析
二、样本分布
三、推断性统计的基本概念
四、假设检验
五、相关分析
六、回归分析
四、假设检验(Hypothesis Testing)
(一)假设检验的目的和原理
◆抽样研究的目的是用样本信息来推断总体特征。
◆假设检验的目的:检验在样本中所观察到的差异或在样本中存在的变量关系在总体中是否也同样存在。
◆假设检验又叫显著性检验(test of significance),是统计学中一个很重要的内容。显著性检验的方法很多,常用的有t检验、F检验和2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。
例::该差别在总体中是否也存在?
四、假设检验(Hypothesis Testing)
随机抽测10位女性和10位男性每周看TV小时数,资料如下:
女性:11,11,9,12,10,13,13,8,10,13
男性:8,11,12,10,9,8,8,9,10,7
经计算,得女性每周看TV平均数=11,标准差S1=;男性平均数=,标准差S2=。
能否仅凭这两个平均数的差值=,立即得出女性和10位男性每周看TV时间不同的结论呢?
2
1
-
x
x
四、假设检验(Hypothesis Testing)
◆统计学认为,这样得出的结论是不可靠的。这是因为如果我们再分别随机抽测10位女性和10位男性,又可得到两个样本资料。由于抽样误差的随机性,,。
造成这种差异可能有两种原因:
1)性别造成的差异,即是女性和男性的性别特征不同所致;
2)试验误差(或抽样误差)造成的差异。
◆对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质特征不同引起的。
◆如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。
◆两个总体间的差异如何比较?
方法1:研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。
这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。
因此,不得不采用另一种方法,即
方法2:研究样本,通过样本研究其所代表的总体。
例如,设女性看TV的总体平均数为μ1 ,男性的总体平均数为μ2 ,试验研究的目的,就是要给μ1 和μ2是否相同做出推断。由于总体平均数μ1 和μ2未知,在进行显著性检验时只能以样本平均数作为检验对象。
更确切地说,是以( )作为检验对象。
2
1
-
x
x
2
1
、
x
x
◆为什么以样本平均数作为检验对象呢?这是因为样本平均数具有下述特征:
1、离均差的平方和∑( )2最小。说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。
2、根据中心极限定理,样本平均数服从或逼近正态分布。
所以,以样本平均数作为检验对象,由两个样本平均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。
-
x
x
x
◆由上所述,一方面我们有依据由样本平均数的差异来推断总体平均数μ1 和μ2相同与否,另一方面又不能仅据样本平均数表面上的差异直接作出结论,其根本原因在于试验误差(或抽样误差)的不可避免性。若对样本观测值的数据结构作一简单剖析,就可更清楚地看到这一点。
2
1
、
x
x
◆通过试验测定得到的每个观测值,它既由被测个体所属总体的特征决定,又受个体差异和诸多无法控制的随机因素的影响。所以观测值由两部分组成,即
总体平均数反映了总体特征, 表示误差。若样本含量为n,则可得到n个观测值:
=
+
2
1
,
x
x
,
x
n
…
◆于是样本平均数
说明样本平均数并非总体平均数,它还包含试验误差的成分。
=
=
+
=
◆对于接受不同处理的两个样本来说,则有:
这说明两个样本平均数之差( )也包括了两部分:
一部分是两个总体平均数的差(μ1 -μ2 ),叫做试验的处理效应(treatment effect);
另一部分是试验误差( )。
=
+
+
=
-
-
清华大学公共管理学院社会科学研究方法讲义(12) 来自淘豆网www.taodocs.com转载请标明出处.