下载此文档

知识萃取与创新管理.docx


文档分类:医学/心理学 | 页数:约6页 举报非法文档有奖
1/6
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/6 下载此文档
文档列表 文档介绍
Updated by Jack on December 25,2020 at 10:00 am
知识萃取与创新管理
第5章知识萃取与创新管理
知识发掘的流程
知识萃取的目标就是要从现有的数据、信息甚至知识库中创造新的知识。许多技术可以协助知识萃取工作的进行,如数据采矿、文字采矿、可视化技术等,能自动从数据或文字间关系找出范型得到新知识;可视化技术可以将数据以人类熟悉的图像方式展现,方便人们从数据得遂行决策的制订。
有哪些「可视化」技术方法能协助人们从大量数据中发掘知识
可视化技术包含以下六种,每一种都可以用二维或三维方式呈现:
图解:以传统的图形结构来表达数据。(柱形图、横条图、折线图、饼图)
几何图:几何图技术包含盒须图及XY图。
图像法:只采用画像、颜色或其它图示来强化结果的展现效果。
图素法:将每个资料数值以其特有颜***素表达。
阶层式:将资料数值阶层地归类成为几块分别显示在屏幕不同的区域里。
混合式:将前述五种技术混用结合在一个展示画面中。
数据库知识发掘流程(KDD)从数据处理系统中,大量已格式化的数据来萃取有用的知识,这种知识萃取的流程称之为「数据库知识发掘流程」。
的五大步骤:如下图所示
评估
回馈

资料仓储




存在数据库中的原始数据
前处理后的数据(可产生详细报表)
经筛选的资料
厘清应用领域及了解需求
本步骤最明显的工作就是依据需求与项目范围去执行数据选取作业,自现有的数据库原始数据产生筛选的目标数据集;本步骤包含了界定问题、数据选择与取得数据三个细项步骤。
数据处理
即在数据转换及采矿前进行数据的前处理与数据清理工作;数据清理与前处理的方式有三:治标;从数据输入端根除;重起炉灶。
资料转化与简化
本步骤大致有两个细项作业要执行,就是数据转换及数据汇整。
数据转换是为了让数据在一致的基础上进行运算处理,转换方式有:数据型态转换;显示格式转换;字段译解。
数据汇整,主要是合并不同来源数据,并配合适当运算让数据能更为有用,这其中包含下列三样工作:不同数据来源的数据整合;产生衍生数据;合计表格产生。
资料采矿
这步骤包括去决定采矿方式、选择适当算法、建立训练数据集、将模型建立、在数据中采用包括了分类规则、决策树、统计回归、群聚方法、线性分析等算法去寻找有用或有兴趣的范型,以一个特别的形式呈现,并决定模式和参数是否适当。
知识呈现
把发掘出来的范型或知识,用一些报告方法或图形工具,转换成让人可轻易了解的文件或简报,以提供决策支持之用,进而创造价值。
此步骤除展示成果外,亦包含了对数据采矿模型的评估评估方式可采用「错差矩阵」来了解模型的效率。

请概要说明数据采矿五大技术的方法分类分析
群集分析
关联分析
序列范型分析
时间序列分析
分类分析
即从已知类别的对象集合中,依据其属性建立一个分类模型来描述对象属性与类别之关系,再根据分类模型,对其他未经分类或是新的数据作预测分类技术有ID3、、CN2、AQ家族、倒传递类神经网络BNP等。

群集分析
群集化就是将一群异质的群体区隔为同构型较高的群体或是子群的行为,这通常是

知识萃取与创新管理 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数6
  • 收藏数0 收藏
  • 顶次数0
  • 上传人WRQ
  • 文件大小3.70 MB
  • 时间2021-07-20