. -
- -可修编.
课程名称
数据分析方法
课程编号
实验地点
系统建模与仿真实验室SL110
实验时间
校外指导教师
无
校内指导教师
实验名称
实验3 距离判别与贝叶斯判别分析
评阅人签字
成绩
实验数据与内容
我国山区某大型化工厂,在厂区及邻近地区挑选有代表性的15个大气取样点,每日4次同时抽取大气样品,测定其中含有的6种气体的浓度,前后共4天,每个取样点每种气体实测16次,计算每个取样点每种气体的平均浓度,数据见表4-8。气体数据对应的污染地区分类见表4-8中最后一列。现有两个取自该地区的4个气体样本,气体指标见表4-8中后4行,试解决以下问题:
1.判别两类总体的协方差矩阵是否相等,然后用马氏距离差别这4个未知气体样本的污染类别,并计算回代误判率与交叉误判率;若两类总体服从正态分布,第一类与第二类的先验概率分别为7/15、8/15,利用贝叶斯判别样本的污染分类。
2.先验概率为多少时,距离判别与贝时斯判别相同?调整先验概率对判别结果的影响是什么?
3.对第一类与第二类的先验概率分别为7/15、8/15,计算误判概率。
. -
- -可修编.
一、实验目的
1.熟练掌握MATLAB软件进行距离判别与贝叶斯判别的方法与步骤。
2.掌握判别分析的回代误判率与交叉误判率的编程。
3.掌握贝叶斯判别的误判率的计算。
二、实验原理
1)在MATLAB中,进行数据的判别分析命令为classify,其调用格式为:
class=classify(sample,training,group’type’)
将sample数据的每一行指定到训练集training的一个类中。Sample和training必须具有相同的列数。group向量包含从1到组数的正整数,它指明训练营集中的每一行属于哪一类。group和training必须具有相同的行数。’type’是可选项,选’linear’表示总体为多元正态总体,选’quadratic’与’mahalanobis’。该函数返回class,它是一个与sample具有相同行数的向量。Class的每一个元素指定sample中对应元素的分类。通过计算sample和training中每一行的马氏距离,classify函数决定sample中的每一行属于哪一个分类。
2)贝叶斯判别方法步骤
第1步,验证两个总体服从二元正态分布;第2步,检验两个总体的协方差矩阵相等;估计两个总体的先验概率p1、p2;利用MATLAB软件计算。
3)回代误判率
设G
数据分析实验报告三 来自淘豆网www.taodocs.com转载请标明出处.