下载此文档

多元统计分析期末考试考点整理.docx


文档分类:高等教育 | 页数:约6页 举报非法文档有奖
1/6
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/6 下载此文档
文档列表 文档介绍
该【多元统计分析期末考试考点整理 】是由【碎碎念的折木】上传分享,文档一共【6】页,该文档可以免费在线阅读,需要了解更多关于【多元统计分析期末考试考点整理 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。二名词解释
1、多元统计分析:多元统计分析是运用数理统计的方法来争论多变量〔多指标〕问题的理论和方法,是一元统计学的推广
2、聚类分析:是依据“物以类聚”的道理,对样品或指标进展分类的一种多元统计分析方法。将个体或对象分类,使得同一类中的对象之间的相像性比与其他类的对象的相像性更强。使类内对象的同质性最大化和类间对象的异质性最大化
3、随机变量:是指变量的值无法预先确定仅以肯定的可能性(概率)取值的量。它是由于随机而获得的非确定值,是概率中的一个根本概念。即每个重量都是随机变量的向量为随机向量。类似地,全部元素都是随机变量的矩阵称为随机矩阵。
4、统计量:多元统计争论的是多指标问题,为了了解总体的特征,通过对总体抽样得到代表总体的样本,但由于信息是分散在每个样本上的,就需要对样本进展加工,把样本的信息浓缩到不包含未知量的样本函数中,这个函数称为统计量
三、计算题
解:
1
答:
答:
2
题型三解答题
1、简述多元统计分析中协差阵检验的步骤答:
第一,提出待检验的假设和H1;
其次,给出检验的统计量及其听从的分布;
第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否认域;
第四,依据样本观测值计算出统计量的值,看是否落入否认域中,以便对待判假设做出决策
〔拒绝或承受〕。
2、简述一下聚类分析的思想
答:聚类分析的根本思想,是依据一批样品的多个观测指标,具体地找出一些能够度量样品或指标之间相像程度的统计量,然后利用统计量将样品或指标进展归类。把相像的样品或指标归为一类,把不相像的归为其他类。直到把全部的样品〔或指标〕聚合完毕.
3、多元统计分析的内容和方法
答:1、简化数据构造,将具有错综简单关系的多个变量综合成数量较少且互不相关的变量,使争论问题得到简化但损失的信息又不太多。〔1〕主成分分析〔2〕因子分析〔3〕对应分析等
2、分类与判别,对所考察的变量按相像程度进展分类。〔1〕聚类分析:依据分析样本的各争论变量,将性质相像的样本归为一类的方法。〔2〕判别分析:判别样本应属何种类型的统计方法。
3
4、系统聚类法根本原理和步骤
答:
先计算n个样本两两间的距离
构造n个类,每个类只包含一个样本
合并距离最近的两类为一类
计算类与当前各类的距离
类的个数是否等于1,假设不等于回到3在做
画出聚类图
打算分类个数和类
5、聚类分析的类型有:答:
对样本分类,称为Q型聚类分析
对变量分类,称为R型聚类分析#Q型聚类是对样本进展聚类,它使具有相像性特征的样本聚拢在一起,使差异性大的样本分别开来。#R型聚类是对变量进展聚类,它使具有相像性的变量聚拢在一起,差异性大的变量分别开来,可在相像变量中选择少数具有代表性的变量参与其他分析,实现削减变量个数,到达变量降维的目的。
6、简述欧氏距离与马氏距离的区分和联系。
7、 试述系统聚类的根本思想。
答:系统聚类的根本思想是:距离相近的样品〔或变量〕先聚成类,距离相远的后聚成类,过程始终进展下去,每个样品〔或变量〕总能聚到适宜的类中。
8对样品和变量进展聚类分析时所构造的统计量分别是什么?简要说明为什么这样构造?
答:对样品进展聚类分析时,用距离来测定样品之间的相像程度。由于我们把n个样本看作p维空间的n个点。点之间的距离即可代表样品间的相像度。常用的距离为
4
9、在进展系统聚类时,选择距离公式应遵循哪些原则?
答:〔1〕要考虑所选择的距离公式在实际应用中有明确的意义。如欧氏距离就有格外明确的空间距离概念。马氏距离有消退量纲影响的作用。
要综合考虑对样本观测数据的预处理和将要承受的聚类分析方法。如在进展聚类分析之前已经对变量作了标准化处理,则通常就可承受欧氏距离。
要考虑争论对象的特点和计算量的大小。样品间距离公式的选择是一个比较简单且带有肯定主观性的问题,我们应依据争论对象的特点不同做出具体分折。实际中,聚类分析前不妨摸干脆地多项选择择几个距离公式分别进展聚类,然后对聚类分析的结果进展比照分析,以确定最适宜的距离测度方法。
10、欧式距离的优点缺点
优点:几何意义明确,简洁,简洁把握,由于中学数学就已初步接触,数学学问不多的人也可以把握它的根本含义。
缺点:从统计学的角度看,使用欧式距离要求一个向量的n个重量不相关,且具有相当的方差,或者说各个坐标对欧式距离的奉献同等且变差大小一样,此时使用欧式距离才适宜,且效果良好,否则就不能照实反映状况且简洁导致错误的结论。因此需要对坐标加权,化为统计距离
5
11、模糊聚类分析的实质和根本原理
答:模糊聚类分析的实质就是依据争论对象本身的属性而构造模糊矩阵,在此根底上依据肯定的隶属度来确定其分类关系
根本原理:假设水平满足,则按水平分出的每一类必是按水平分出的每一类的子类。〔p62页〕
12、模糊聚类分析计算步骤:答:
(1)对原始数据进展变换。变换方法通常有标准化变换、极差变换、对数变换等。(2)计算模糊相像矩阵
(3)建立模糊等价矩阵(4)进展聚类
6

多元统计分析期末考试考点整理 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息