医疗大数据解决方案.docx


文档分类:办公文档 | 页数:约133页 举报非法文档有奖
1/133
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/133
文档列表 文档介绍
文件编码(TTU-UITID-GGBKT-POIU-WUUI-0089)
医疗大数据解决方案
医疗大数据解决方案
与信息系统的耦合度为零的数据才是合格的大数据
目 录
识别,然而如果把关系数据库中的数据放到大数据环境中,那么这些数据就成了不可识别的数据。在大数据时代,需要通过数据的独立性、数据的完整性而确保每一个数据都是可识别的。
在医疗大数据中,各个医疗数据分别由各家医疗机构所产生、拥有。
事物分类:事物分类是由发明专利技术“医学信息的结构化存贮方法”所提出的概念。大数据时代以前的信息系统的最终用户是通过应用程序而看到各种数据,最终用户并不直接与数据库中的数据打交道,数据库中的数据需要通过应用程序解读后最终用户才能读懂。在大数据时代,大数据中包含成千上万家机构的数据,因此,大数据中的每一个数据库是由哪家机构所产生,数据库中各表中所存贮的数据是什么等等都是非常重要的信息,只有搞清楚这些信息,才能正常解读各数据的真实含义。在“万能数据结构表”中,“信息系统的名称、数据库的名称、表名”是以“事物分类”的形式存贮在表中,其目的是让数据具体独立性、完整性,以此确保各数据在大数据中具有可识别性。
医疗大数据面临的挑战
本章内容提要:大数据并不是小数据之和,大数据与小数据有本质的差异。关系数据库只适合于处理小数据而不适合处理大数据。用关系数据库来处理大数据时会遇到很多难以克服的困难。五年之内(2020年前)大数据难以取得根本性突破,大数据之梦十年之后才能梦想成真。维基百科关于大数据的定义也明确指出当前的主流软件工具不能高效地处理大数据,要高效处理大数据必须开发新的软件工具。目前的大多数信息系统所产生的数据都存贮在关系数据库系统中。关系数据库中的数据的一大特点(或者说一大问题)就是“数据严重依赖于数据库系统及应用程序”,当关系数据库系统中的数据脱离了相应的数据库系统及应用程序后,这些数据基本上就成了难以阅读的无用数据。
医疗大数据与医院信息系统之间的具有本质的差异
如果把全国各家医院所产生的数据全部集中上传到国家医疗大数据中心,这些数据的数据量一定会非常庞大,这些数据能不能称为国家医疗大数据?按维基百科对大数据的定义:“大数据是指所涉及的数据量规模巨大到无法通过目前主流软件工具,在合理时间内达到获取、处理的数据。”这些数据可以称为国家医疗大数据。
维基百科的定义也明确地说明了把全国各家医院全部集中起来的“数据量规模巨大到无法通过目前主流软件工具,在合理时间内达到获取、处理”。为什么不能处理呢?
例如,患者就医时,医生非常关心患者的病史。医生能否从国家医疗大数据中心获得患者在全国任意一家医院就医时的所有病历呢?假设全国各家医院的所有信息系统所产生的数据都已全部集中在国家医疗大数据中心,而且医生具有获得这些数据的权限。
截至2014年3月底,,其中:,,,。
,一家医院按4个信息系统计算,全国共有10万个医院信息系统,这些信息系统所产生的数据存贮在数千万张表中。
医疗大数据应该说是永久有用的,可用来研究人类疾病的历史变化情况。因此,国家医疗大数据应是整个国家数年内、数十年内所产生的全部数据的总和,甚至需要存贮数百年、数千年。国家医疗大数据所涉及的信息量是一般的医院信息系统的数据量的数万倍、数十万倍以上。
医生要想获得患者以往的病史数据,就必须从数据千万张表中查询患者的病史数据。了解关系数据库理论者都知道,如果说仅有表中的数据,没有相应的软件工具,那么,从数千万张表中查询数据,即使最优秀的程序员,在目前的技术条件下,一周的时间内肯定查不出来患者的所有病史数据。因为程序员在查询数据前,首先要搞清楚如下问题:
这些数据分别是哪家医院所产生的?
这些数据分别是什么样的数据库系统产生的?
这些数据分别存贮在哪些表中?
各张表的结构是什么?
表中会含有大量的代码,各个代码的含义是什么?
同一数据库中会有多张表,这些表之间的关系是什么?
各张表中所存贮的是什么数据数据的类型是什么
国家医疗大数据文件中含有数千万张表,一张表详细情况说明基本上要用一页复印的信息量来描述,共需数千万页复印纸才能描述清楚全部表的基本情况。
,2万多家有一定规模的医院,数万个医院信息系统,数千万张表,程序员在一周的时间内肯定搞不清楚上述问题。
从理论上而言,只要有数据,程序员可以查询到任何需要信息,然而由于国家医疗大数据的数据量太大,数据关系太复杂,数据结构太多、数据类型太多、不标准的数据太多,结果

医疗大数据解决方案 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数133
  • 收藏数0 收藏
  • 顶次数0
  • 上传人Celeste_18
  • 文件大小196 KB
  • 时间2022-07-28