下载此文档

第四章基本统计分析.ppt


文档分类:高等教育 | 页数:约51页 举报非法文档有奖
1/51
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/51 下载此文档
文档列表 文档介绍
第四章基本统计分析
频数分析
频数分析中的其他分析
分位数的应用
从一个侧面比较两组样本数据的集中趋势
例:( QL=50,QU=80) 和 (QL=70,QU=75) 的比较
在排除极端值影响的条件下,通过计算分位数差,比较两变量)
分析的主要步骤
产生交叉列联表
分析列联表中变量间的关系
产生交叉列联表
什么是列联表
多个变量在不同取值下的数据分布频数表
列变量
行变量
工商管理
控制变量
频数
性别
成绩





产生交叉列联表
基本操作步骤
(1)菜单选项: analyze->descriptive statistics-> crosstabs
(2)选择一个变量作为行变量到row框.
(3)选择一个变量作为列变量到column框.
(4)可选一个或多个变量作为控制变量到layer框.
(5)是否显示各分组的条图(display clustered bar charts )
产生交叉列联表
scale数据可做适当分组后再产生列联表
仅利用频数,信息利用不充分
进一步计算
cells选项:选择在频数分析表中输出各种百分比.
row:行百分比(Row pct);
column:列百分比(Col pct);
total:总百分比(Tot pct);
分析列联表中变量间的关系
目的:
通过列联表分析,检验行列变量之间是否独立。
方法:
卡方检验:对品质数据的相关性进行度量(这里两变量均为定类数据或定序数据)
分析列联表中变量间的关系
卡方检验基本步骤
(1)H0:行列变量之间无关联或相互独立
(2)构造卡方统计量
统计量服从(r-1)*(c-1)个自由度的卡方分布
count:观察(实际)频数
expected count:期望频数
(期望频数反映的是H0成立情况下的数据分布特征)
分析列联表中变量间的关系
卡方检验基本步骤
(3)计算卡方统计量的值,并得到该统计量值的概率P值
(4)决策。概率P与显著性水平比较,小于等于则拒绝H0,否则不能拒绝
实现步骤
statistics选项
Pearson Chi-Square:常用于行列变量独立性检验
Likelihood Ratio:可用于对数线性模型检验
Fisher‘s Exact Test:N<40,或Fe<5
Linear-by-Linear Association:线性相关卡方检验
卡方检验的要求:
一般要求列联表中期望频数小于5的格子数不超过20%,否则会夸大卡方值,容易得出拒绝结论,可以采用精确检验。
N>=40, T>=5, Pearson卡方检验,若P≈α,改用确切概率法检验
N<40,或T<5, 确切概率法检验
分析列联表中变量间的关系
行列变量相关性的其他测度指标
Nominal:
phi系数:在2×2列联表中 ,通常[-1,1],负号无实际意义
列联C系数(contingency coefficient), 通常为[0,1)
V系数 [0,1]
值越大表示行列变量的相关性越大
分析列联表中变量间的关系
Ordinal
反映定序变量一致性指标
行变量等级越高,列变量等级也越高或越低——一致性高
行变量等级越高,列变量等级不定——不一致
指标绝对值越大越相关,越接近0越无关
定序变量一致性检验
年龄与工资收入交叉列联表
低 中 高
青 400 0 0
中 0 500 0
老 0 0 600
低 中 高
青 0 0 500
中 0 600 0
老 400 0 0
一致
一致
应用举例
受教育程度越高通信支出越高吗?
受教育程度越高通信支出比例越高吗?
多选项分析
什么是多选项问题?
(1)即:在回答某些问题时,答案在两个以上
例如:请问您平时主要的休闲娱乐方式是:
、听广播

第四章基本统计分析 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数51
  • 收藏数0 收藏
  • 顶次数0
  • 上传人放射辐射
  • 文件大小920 KB
  • 时间2022-07-10