下载此文档

多元统计分析期末考试考点整理.docx


文档分类:高等教育 | 页数:约6页 举报非法文档有奖
1/6
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/6 下载此文档
文档列表 文档介绍
1
二名词解释
1、多元统计分析:多元统计分析是运用数理统计的方法来研究多变量(多指标)问题的理论和方法,是一元统计学的推广
2、聚类分析:是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。将个体或对象分类,使的归为其他类。直到把所有的样品(或指标)聚合完毕
3、多元统计分析的内容和方法
答:1、简化数据结构,将具有错综复杂关系的多个变量综合成数量较少且互不相关的变量,使研究问题得到简化但损失的信息又不太多。(1)主成分分析(2)因子分析(3)对应分析等
2、分类与判别,对所考察的变量按相似程度进行分类。(1)聚类分析:根据分析样本的各研究变量,将性质相似的样本归为一类的方法。(2)判别分析:判别样本应属何种类型的统计方法。
5
4、系统聚类法基本原理和步骤
1)先计算n个样本两两间的距离
2)构造n个类,每个类只包含一个样本
3)合并距离最近的两类为一新类
4)计算新类与当前各类的距离
5)类的个数是否等于1,如果不等于回到3在做
6)画出聚类图
7)决定分类个数和类
5、聚类分析的类型有:
答:
(1)对样本分类,称为Q型聚类分析
(2)对变量分类,称为R型聚类分析#Q型聚类是对样本进行聚类,它使具有相似性特征的样本聚集在一起,使差异性大的样本分离开来°#R型聚类是对变量进行聚类,它使具有相似性的变量聚集在一起,差异性大的变量分离开来,可在相似变量中选择少数具有代表性的变量参与其他分析,实现减少变量个数,达到变量降维的目的。
6、简述欧氏距离与马氏距离的区别和联系。
°
答:设p樂空间及中的两点和*\\A\-Yp;o则欧氏距离为莒风-丫孑,欧氏距离的局尿有①在多元数据分析中,其度壘不合理.②会受到实际间题中量纲的影响.
,协方差为王的总体G中的p维样本°则马氏距离齿
D区Y)=X—Y'Z_1X-Y_当王一'】即单位阵时“区Y)=X—Y'X—丫=口為—Y=莒內-£卩即欧氏距离°
因此,在一定程度上,欧氏距离是马氏距离的特殊情况,马氐距离是欧氏距團的推广°
7、试述系统聚类的基本思想。
答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。
8对样品和变量进行聚类分析时所构造的统计量分别是什么?简要说明为什么这样构
造?
答:对样品进行聚类分析时,用距离来测定样品之间的相似程度。因为我们把n个样本看作p维空间的n个点。点之间的距离即可代表样品间的相似度。常用的距离为
(-)閒化距离:电2)_丄帆,一兀J严
Jfc-1
<1取不同1自,分问P
(1)绝时涉离3「)打話〔1j_工|A■次一舌詳|JIE
3欧氏距离〔心)佥⑵=|V口诉_兀』严—1
6
(3)肌値丈即离(*=")叭W)-打肚|心一*代^1二|兀_兀」
(-)竺氐距离%⑴二人X」兀*
i=i二氏距离碍3)=g—X^JX'g-XjJ
刈变虽的相俭性,我们更宰地要了解变虽的变化垣势或变化£向,因此用相关性址行衡虽“特变垦巷什P维空间的句垦,一股用
〔一〕头用嶺弦VXX
L①一J1
COS&—II—
IJ[pJ?—
{学疋:学忑加

多元统计分析期末考试考点整理 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
最近更新