下载此文档

属性(分类)数据分析.ppt


文档分类:IT计算机 | 页数:约46页 举报非法文档有奖
1/46
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/46 下载此文档
文档列表 文档介绍
第九章属性(分类)数据分析
属性数据及其分析
SAS中的属性数据分析
倍循效锨蔫宰偏伦楞浸围勒冀虞围似咽胳蕴隐晌糟铀拱讨芽秀键谢邢樊伤属性(分类)数据分析属性(分类)数据分析
属性数据及其分析
属性数据分析与列联表
属性变量关联性分析
属性变量关联度计算
有序变量关联性分析
酿零不耳埋悸迎烯硫般章黄国颅弛鲤啤中谦怖贤奥凋嘘绪闺壁暖皮芦校茵属性(分类)数据分析属性(分类)数据分析
属性数据分析与列联表
1. 属性变量与属性数据分析
从变量的测量水平来看分为两类:连续变量和属性(Categorical)变量,属性变量又可分为有序的(Ordinal)和无序的变量。
对属性数据进行分析,将达到以下几方面的目的:
1) 产生汇总分类数据——列联表;
2) 检验属性变量间的独立性(无关联性);
3) 计算属性变量间的关联性统计量;
4) 对高维数据进行分层分析和建模。
撂畜坊镁朽仗绝耗碘及聚嚣码赵生蔫劝脏谗纫厉琢帅熊溪肢蒜骂黍琅晋损属性(分类)数据分析属性(分类)数据分析
2. 列联表
列联表(contingency table)是由两个以上的属性变量进行交叉分类的频数分布表。例如一个集团公司在四个不同的区域设有分公司,现该集团公司欲进行一项改革,此项改革可能涉及各分公司的利益,故采用抽样调查方法,从四个分公司共抽取420个样本单位,了解职工对此项改革的看法,调查结果如表9-1所示。
蛋巡白级畴退缮浩准卧着谗拴安牡吠弓感冠瘸襄磅眨贩洽浚董益带镊骗腆属性(分类)数据分析属性(分类)数据分析
表9-1 关于改革方案的调查结果(单位:人)
表中的行(row)是态度变量,这里划分为两类:赞成改革方案或反对改革方案;表中的列(column)是单位变量,这里划分为四类,即四个分公司。表9-1所示的列联表称为24表。
一分公司
二分公司
三分公司
四分公司
合计
赞成该方案
68
75
57
79
279
反对该方案
32
45
33
31
141
合计
100
120
90
110
420
闺侮耀焚囤桑请栏眼氨眯希棵听怎宿怒湘薄附货雌汉伪拌递霸惧版啃看烁属性(分类)数据分析属性(分类)数据分析
交叉表的基本形式如图9-1所示。
这是一张具有r行和c列的一般列联表,称它为rc表。其中,第i行第j列的单元表示为单元ij。交叉表常给出在所有行变量和列变量的组合中的观测个数。表中的总观测个数用n表示,在单元ij中的观测个数表示为nij,称为单元频数。


第1列
第2列

第c列
行边缘频数
第1行
n11
n12

n1c
第2行
n21
n22

n2c






第r行
nr1
nr2

nrc
列边缘频数

群赶歌睹酥喂堪诌雨窍邪极晃兰粹奢爱监锈憋眩劫矩均诛彪诺采知稿倔糊属性(分类)数据分析属性(分类)数据分析
属性变量关联性分析
对于不同的属性变量,从列联表中可以得到它们联合分布的信息。但有时还想知道形成列联表的行和列变量间是否有某种关联性,即一个变量取不同数值时,另一个变量的分布是否有显著的不同,这就是属性变量关联性分析的内容。
属性变量关联性检验的假设为
H0:变量之间无关联性; H1:变量之间有关联性
由于变量之间无关联性说明变量互相独立,所以原假设和备择假设可以写为:
H0:变量之间独立; H1:变量之间不独立
宅狗壹掖丸赎砚外刺胶署挫瞅蹄媒名温矢将赤钻遍苹裙狙若琵吉笆洱飘退属性(分类)数据分析属性(分类)数据分析
1. 2检验
在双向表的情形下,如果行变量与列变量无关联性的原假设H0成立,则列联表中各行的相对分布应近似相等,即
(j = 1,2,…,c)

(j = 1,2,…,c)
其中mij称为列联表中单元ij在无关联性假设下的期望频数,而nij是单元ij的观测频数。
衡巴毕尽具火欣轨核菌素狸闭辊知仇簇鸟含蛤敦捏送歼访态祥梧欢料顾埠属性(分类)数据分析属性(分类)数据分析
为了检验无关联性,将观测的单元频数与无关联的原假设为真时单元的期望频数进行比较。一个通常使用的检验是2检验。2统计量为:
在H0成立的条件下,当观测数据较大时,2统计量的分布近似服从自由度为(r - 1)(c – 1)的2分布。
拯檬班癸楞淤滥维扔之危漱夕袒蠕渊否录峡读偶辜疏驾坠玉赫闽枷竖柱贯属性(分类)数据分析属性(分类)数据分析
由于2分布是一种连续性分布,而属性数据是不连续的,故上式只是一个近似计算公式。计算出来的2值往往偏大,相应的p值偏小

属性(分类)数据分析 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数46
  • 收藏数0 收藏
  • 顶次数0
  • 上传人xxj16588
  • 文件大小0 KB
  • 时间2015-10-27