下载此文档

朴素贝叶斯方法在健康大数据中的应用.docx


文档分类:IT计算机 | 页数:约6页 举报非法文档有奖
1/6
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/6 下载此文档
文档列表 文档介绍
朴素贝叶斯方法在健康大数据中的应用
朱鸣宸
摘要:朴素贝叶斯为什么朴素?顾名思义,说明这种方法应用起来简单、方便。朴素贝叶方法是一种概率计算的数学模型,通过假设条件之间相互独立,简化了贝叶斯的应用限制条件,使其计算起来更为简便。在现实生,对日常生活做出有帮助的指导。这样可以说是充分利用了大数据的优势,将日常的健康数据及时传到平台里,形成自己的健康大数据库,人们就可以对自己的健康情况有着更好的了解与掌握。
朴素贝叶斯方法

、数理统计学家和哲学家,概率论理论创始人,贝叶斯统计的创立者。贝叶斯在解决“逆概率”的问题时发表的论文改变了人们对某一概率问题的认知,“从装有若干白球和黑球的袋中取出白球[3]
的概率”,在今天,学过概率知识的应该知道该概率的大小与黑球与白球在袋中的分布相关,也就是说与袋中球总数与和白球个数相关,这都要归功于贝叶斯。因为在这之前,人们认为答案不是1就是0,即取得白球和未取得白球。贝叶斯对于概率的研究形成了贝叶斯派的统计理论,对某一事件的发生概率,加入前提条件,从而获取事件发生的后验概率,即人们根据以往的历史经验对事件A发生的概率做出估计即为先验概率,而后根据实际得到的样本信息B,对先验概率进行修正,从而得到事件A发生的后验概率,由此而发展的统计理论在很多的科学与实践都发挥了重大作用。后来人工智能进入发展热潮,以提供表现出人类智能的机器为目标,这一概念对人类未来的生活影响重大,而机器学****就是实现人工智能目标的中重要理论基础。而在机器学****的众多算法中,朴素贝叶斯方法在分类方面表现卓越,因其算法的简单与良好的效果在多个领域有着广泛的应用
原理
朴素贝叶斯方法是以贝叶斯原理为基础,在其基础上进行了相应的简化,并假定了给定的目标属性相互独立。将数据的一系列特征X作为输入,输出其最大后延概率Y。训练集中的数据是一组(X,Y)的数据,即给定标签的数据。通过训练样本数据确定Y的先验概率P(Y),再通过训练样本数据确定P(X|Y),P(X),则我们可以通过贝叶斯公式求出当给定一个新的X,P(Y|X)=P(X|Y)xP(Y)/P(X)o
朴素贝叶斯方法在健康大数据中的应用
目前,朴素贝叶斯方法在健康大数据中应用并不广泛,主要原因可能是在大部分情况下,人们并不需要在健康大数据中应用朴素贝叶斯方法;或是人们对朴
素贝叶斯方法的陌生及不熟悉。但是对于不少老年人和慢性病患者来说,需要经常测量血压、心率等数据,这种方法可能会给他们的生活带来便利。
数据案例如下(见表1),以下面的数据举个例子:通过下表中的数据,假设一个人患有高血压、糖尿病、关节炎,但不患有心脏病,那么这个人是男的可能性大还是女的可能性大呢?
表1患高血压、心脏病、糖尿病、关节炎患者的性别分布
我们可以用朴素贝叶斯方法来解决这个问题:
如果将男女作为类型,男C1,女C2;
属性条件:高血压A1,心脏病A2,糖尿病A3,关节炎A4;
我们使用下列条件概率表示A1、A2、A3、A4属性下Cx的概率:
P(Cx|A1A2A3A4)。
根据贝叶斯公式,我们可以知道:
P(Cx|A1A2A3A4)=P(A1A2A3A4|Cx)P(Cx)/P(A1A2A3A4)
因为有两个类别,所以只要求得P(C1|A1A2A3A4

朴素贝叶斯方法在健康大数据中的应用 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息