下载此文档

朴素贝叶斯方法在健康大数据中的应用.pdf


文档分类:IT计算机 | 页数:约6页 举报非法文档有奖
1/6
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/6 下载此文档
文档列表 文档介绍
朴素贝叶斯方法在健康大数据中的应用
朱鸣宸
摘 要:朴素贝叶斯为什么朴素?顾名思义,说明这种方法应用起来简单、方便。
朴素贝叶方法是一种概率计算的数学模型,通过假设实现
人工智能目标的中重要理论基础。而在机器学****的众多算法中,朴素贝叶斯方法
在分类方面表现卓越,因其算法的简单与良好的效果在多个领域有着广泛的应用。
原理
朴素贝叶斯方法是以贝叶斯原理为基础,在其基础上进行了相应的简化,并
假定了给定的目标属性相互独立。将数据的一系列特征 X 作为输入,输出其最
大后延概率 Y。训练集中的数据是一组(X,Y)的数据,即给定标签的数据。通过
训练样本数据确定 Y 的先验概率 P(Y),再通过训练样本数据确定 P(X|Y),P(X),
则我们可以通过贝叶斯公式求出当给定一个新的 X,P(Y|X)=P(X|Y)×P(Y)/P(X) 。
[4]
,朴素贝叶斯方法在健康大数据中应用并不广泛,主要原因可能是在大
部分情况下,人们并不需要在健康大数据中应用朴素贝叶斯方法;或是人们对朴
素贝叶斯方法的陌生及不熟悉。但是对于不少老年人和慢性病患者来说,需要经
常测量血压、心率等数据,这种方法可能会给他们的生活带来便利。
数据案例如下(见表 1),以下面的数据举个例子:通过下表中的数据,假
设一个人患有高血压、糖尿病、关节炎,但不患有心脏病,那么这个人是男的可
能性大还是女的可能性大呢?
表 1 患高血压、心脏病、 糖尿病、关节炎患者的性别分布
我们可以用朴素贝叶斯方法来解决这个问题:
如果将男女作为类型,男 C1,女 C2;
属性条件:高血压 A1,心脏病 A2,糖尿病 A3,关节炎 A4;
我们使用下列条件概率表示 A1、A2、A3、A4 属性下 Cx 的概率:
P(Cx|A1A2A3A4)。
根据贝叶斯公式,我们可以知道:
P(Cx|A1A2A3A4)=P(A1A2A3A4|Cx)P(Cx)/P(A1A2A3A4)因为有两个类别,所以只要求得 P(C1|A1A2A3A4)和 P(C2|A1A2A3A4)的
概率,然后比较哪个概率大即可。
则假设 A1A2A3A4 之间是相互之间没有联系的,那么:
P(A1A2A3A4|Cx)=P(A1|Cx)P(A2|Cx)P(A3|Cx)P(A4|Cx);
P(A1|C1)=1/3,P(A2|C1)=2/3,P(A3|C1)=2/3,P(A4|C1)

朴素贝叶斯方法在健康大数据中的应用 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息