课前思考
机器自动识别分类,能不能避免错分类 ?
怎样才能减少错误?
不同错误造成的损失一样吗?
先验概率,后验概率,概率密度函数?
什么是贝叶斯公式?
正态分布?期望值、方差?
正态分布为什么是最重要的分布之一?
学****指南
理解本章的关键
要正确理解先验概率,类概率密度函数,后验概率这三种概率
对这三种概率的定义,相互关系要搞得清清楚楚
Bayes公式正是体现这三者关系的式子,要透彻掌握。
统计决策理论
是模式分类问题的基本理论之一
贝叶斯决策理论
是统计决策理论中的一个基本方法
物理对象的描述
在特征空间中讨论分类问题
假设一个待识别的物理对象用其d个属性观察值描述,称之为d个特征,记为x = [x1, x2, …, xd]T
这组成一个d维的特征向量,而这d维待征所有可能的取值范围则组成了一个d维的特征空间。
贝叶斯决策理论方法讨论的问题
讨论的问题
总共有c类物体
已知各类在这d维特征空间的统计分布,
各类别ωi=1,2,…,c的先验概率P(ωi)
类条件概率密度函数p(x|ωi)
问题: 如何对某一样本按其特征向量分类
已知d维特征空间的统计分布,如何对某一样本分类最合理
基于最小错误率的贝叶斯决策
基于最小风险的贝叶斯决策
在限定一类错误率条件下使另一类错误率为最小的两类别决策
最小最大决策
序贯分类方法
§ 几种常用的决策规则
分类识别中为什么会有错分类?
当某一特征向量值X只为某一类物体所特有,即
对其作出决策是容易的,也不会出什么差错
问题在于出现模棱两可的情况
任何决策都存在判错的可能性。
基于最小错误率的贝叶斯决策
基本思想
使错误率为最小的分类规则
称之为基于最小错误率的贝叶斯决策
条件概率
P(*|#)是条件概率的通用符号
即在某条件#下出现某个事件*的概率
P(ωK|X):X出现条件下,样本为ωK类的概率
P(*|#)与P(*)不同
例:*表示中国人,#表示在中国大陆的人
则P(*|#)与P(*)不同含义不同
关于贝叶斯决策理论 来自淘豆网www.taodocs.com转载请标明出处.