下载此文档

第八章数据处理.ppt


文档分类:建筑/环境 | 页数:约46页 举报非法文档有奖
1/46
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/46 下载此文档
文档列表 文档介绍
第八章数据处理
第1页,共46页,编辑于2022年,星期三
§ 数据处理及前期准备
一、数据处理的概念
三、数据处理的前期准备
二、数据处理的意义
第2页,共46页,编辑于2022年,星期三
数据处理及前期准、逻辑上不合理或极端的数值。如一般备选答案1~5,9为缺失值,若出现8则错。
缺失值检查---是存在明显错误、不合理数据、漏填数据项。
处理方式:均值代替、 估计值代替、问卷删除、
结对删除。
注:不同处理方式分析结果将有所不同。
第13页,共46页,编辑于2022年,星期三

是否需要给数据库加入新的变量。
数据库文档通常储存在磁盘等储存介质上,另外再用一张磁盘或其他储存介质作为备份以保证安全 。
第14页,共46页,编辑于2022年,星期三
第9章 数据分析方法
§ 统计分析方法Ⅰ—描述统计
§ 统计分析方法Ⅱ—推断统计
第15页,共46页,编辑于2022年,星期三
§ 统计分析方法Ⅰ—描述统计
一、频数分布表和统计图法
三、多变量描述统计
二、单变量描述统计
第16页,共46页,编辑于2022年,星期三
统计分析方法的选择:
1、调研问题的性质
描述性问题----如对某电视广告接触状况的反应;对某产品性能的评价;不同人对某品牌偏好差异等。采用频数分析和描述统计。
关系性问题----如相关关系和因果关系。采用相关分析、回归分析、方差分析等。
2、数据资料的性质
品质变量----如性别、职业等。采用列联分析、非参数检验等。
数量变量----如年龄、收入、销售量、知名度等,即等距、等比量表,或次序量表进行数学转换后。可采用各种方法。
第17页,共46页,编辑于2022年,星期三
一、频数分布和统计图表

指把总体按某一标志分组,并按一定顺序列出每个组的单位数,所形成的总体单位在各组间的分布;也称为次数分布或分布数列。

把总体中各个类别及其相应的频数、频率及累计频率等指标用汇总表格的形式展示出来所形成表格。

找出数据的变动范围;
确定组数和组距;
确定组限(上限、下限)和组中值;
计算调查数据落入各组的频数和频率。
第18页,共46页,编辑于2022年,星期三

是一种以点、线条、面积等方法描述和显示数据的形式,具有直观、醒目、易于理解等特点,一般由坐标系、图形和图例三部分组成。

条形图、直方图、饼图、折线图、趋势图、态度对比图、轮廓形象图等。
一、频数分布和统计图表
第19页,共46页,编辑于2022年,星期三
编制频数分布表及绘制统计图时应注意的问题
编制频数分布表和绘制统计图只是对调查数据进行处理的初级阶段;
编制频数分布表时,需要注意组数、组距及组限的确定问题;
不同的统计图一般都有其特定的适用范围,在实际应用时,应根据数据性质及所反映问题的需要选择适宜的统计图。
第20页,共46页,编辑于2022年,星期三

二、单变量描述统计
指调查数据的频数分布从两边向中间集中的趋势,也称作趋中性 。

指调查数据远离其分布中心值的程度。
集中趋势指标反映调查数据的共性和集中性,离散趋势指标反映调查数据的个性和分散性。调查数据的离散程度越高,用于描述数据集中趋势指标的代表性越差,使用这些代表性指标进行统计分析的效果越差。
第21页,共46页,编辑于2022年,星期三
简单算术平均数——根据原始数据计算

平均数 又称均值,主要有算术平均数、调和平均数和几何平均数等计算方法,其中以算术平均数最为常用。
加权算术平均数——根据分组数据计算
二、单变量描述统计
第22页,共46页,编辑于2022年,星期三

中位数 指把一组数据按照从小到大的顺序排列后,位置居中的变量值,记为 。
计算原始数据的中位数:
计算分组数据的众数:
众数 指数据中出现次数最多的变量值,记为 。
当 为奇数时:
当 为偶数时:
为众数所在组的下限 , 为众数所在组组距, 和 分别为众数所在组变量值的次数与下一组和上一组变量值的次数之差。
二、单变量描述统计
第23页,共46页,编辑于2022年,星期三
标准差 指调查数据中各变量值与其算术平均数离差平方的算术平均数的平方根,记为 。

方差 指标准差的平方,记为

第八章数据处理 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数46
  • 收藏数0 收藏
  • 顶次数0
  • 上传人卓小妹
  • 文件大小3.47 MB
  • 时间2022-04-29