下载此文档

统计分析方法学习总结.docx


文档分类:高等教育 | 页数:约4页 举报非法文档有奖
1/4
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/4 下载此文档
文档列表 文档介绍
统计分析方法学****总结S陈丹妮统计的描述一般采用以下几种图形描述数据:直方图:表示几个变量的数据,使人们能够看出这些数目的大体分布或“形状”;盒形图:比直方图简单一些的是盒形图(boxplot,又称箱图、箱线图、盒子图);茎叶图:既展示了数据的分布形状又有原始数据。它象一片带有茎的叶子。茎为较大位数的数字,叶为较小位数的数字;散点图:描述的数据有两对连续变量;定型变量的图:定性变量(或属性变量,分类变量)不能点出直方图、散点图或茎叶图,但可以描绘出它们各类的比例,如:饼图、条形图。汇总统计量表示位置的汇总统计量:均值(mean):样本值的算术平均值;中位数(median):中间大小的数(一半样本点小于中位数);(第一或第三)(下、上)四分位数(点)(firstquantile,thirdquantile)(分别有1/4或3/4的数目小于它们);k-百分位数(k-percentile);a分位数(acentile):k-百分位数=k%分位数:有k%的数目小于它;众数(mode):样本中出现最多的数。表示尺度的汇总统计量:极差(range):极端值之差;四分位间距(四分位极差)(interquantilerange)四分位数之差;标准差(standarddeviation)方差平方根;方差(variance)各点到均值距离平方的平均。相关的分布相关的分布包括:离散分布、连续分布、抽样分布:我们能够利用样本统计量中的(描述样本的)信息,比如样本均值和样本标准差中的信息,来对(描述总体的)总体参数(比如总体均值和总体标准差)进行推断(估计、检验等)。大数定律:阐述大量随机变量的平均结果具有稳定性的一系列定律的总称。其中又分为独立同分布大数定律(提供了用样本平均数估计总体平均数的理论依据)和贝努力大数定律(提供了频率代替概率的理论依据)。中心极限定理:阐述大量随机变量之和的极限分布是正态分布的一系列定理的总称。独立同分布中心极限定理(不论总体服从何种分布,只要它的数学期望和方差存在,从中抽取容量为n的样本,当n充分大时,则这个样本的总和或平均数是服从正态分布的随机变量)和德莫佛-拉普拉斯中心极限定理(提供了用正态分布近似计算二项分布概率的方法)。均值的假设检验包括对于正态总体均值的检验、对于比例的检验各种分析方法列联表分析列联表变量中每个都有两个或更多的可能取值,称为水平,比如收入有三个水平,观点有两个水平,性别有两个水平等。列联表的中间各个变量不同水平的交汇处,就是这种水平组合出现的频数或计数(count)。二维的列联表又称为交叉表(crosstable)。列联表可以有很多维。维数多的叫做高维列联表。注意前面这个列联表的变量都是定性变量;但列联表也会带有定量变量作为协变量。方差分析方差分析(analysisofvariance,ANOVA)是分析各个自变量对因变量影响的一种方法。这里的自变量就是定性变量的因子及可能出现的称为协变量(covariate)的定量变量。分析结果是由一个方差分析表表示的。原理为:把因变量的值随着自变量的不同取值而得到的变化进行分解,使得每一个自变量都有一份贡献,最后剩下无法用已知的原因解释的则看成随机误差的贡献。然后用各自变量的贡献和随机误差的贡献进行比较(F检验),以判断该自变量的不同水平是否对因变量的变化有显著贡献。输出就是F-值

统计分析方法学习总结 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数4
  • 收藏数0 收藏
  • 顶次数0
  • 上传人rdwiirh
  • 文件大小17 KB
  • 时间2020-08-30