下载此文档

知识图谱概述及应用.docx


文档分类:医学/心理学 | 页数:约18页 举报非法文档有奖
1/18
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/18 下载此文档
文档列表 文档介绍
导读:知识图谱(KnowledgeGraph)是当前的研究热点。自从2012年
Google推出自己第一版知识图谱以来,它在学术界和工业界掀起了一股热潮。各大互联网企业在之后的短短一年内纷纷推出了自己的知识图谱产品以作为回应。比如在国内,的实体是张三和李四,关系是父亲"(is_father_of)。当然,张三和李四也可
能会跟其他人存在着某种类型的关系(暂时不考虑)。当我们把电话号码也作为节点加入到知识图谱以后(电话号码也是实体),人和电话之间也可以定义
一种关系叫has_phone,就是说某个电话号码是属于某个人。下面的图就展示了这两种不同的关系。
另外,我们可以把时间作为属性(Property)添加到has_phone关系里来
表示开通电话号码的时间。这种属性不仅可以加到关系里,还可以加到实体当中,当我们把所有这些信息作为关系或者实体的属性添加后,所得到的图谱称
之为属性图(PropertyGraph)。属性图和传统的RDF格式都可以作为知识图
谱的表示和存储方式,但二者还是有区别的,这将在后面章节做简单说明。
.知识图谱的存储
知识图谱是基于图的数据结构,它的存储方式主要有两种形式:RDF存储
格式和图数据库(GraphDatabase)0至于它们有哪些区别,请参考【1】。下面
的曲线表示各种数据存储类型在最近几年的发展情况。从这里我们可以明显地看到基于图的存储方式在整个数据库存储领域的飞速发展。这幅曲线图来源于
http://db-//43
•CtoCuLrantiT&fwi
RDFlioru
400
100
♦CGfui™Stortz
+Key-vilwestores
♦Saarch«vgjr!<i
♦KilxXML0£MS
•ObjeciwantedDSMS+MdUiJu-DBMS♦《钓星$D£xis
c
」M2013
:DG-tngi1nHewh
下面的列表表示的是目前比较流行的基于图存储的数据库排名。从这个排
,而且在RDF领
域里Jena还是目前为止最为流行的存储框架。这部分数据来源于
http://db-
Ranking
DBMS
21
Neo4j(图)
32
MarkLogic(XML)
42
Than(图)
46
OrientDB(凰文档)
61
Virtuoso(RDF,关系等)
00
Jena(RDF)
B8
Sesame(RDF)
90
ArangoDB(图)
120
AilegtcGrspii(HDfJ
当然,如果需要设计的知识图谱非常简单,而且查询也不会涉及到1度以
上的关联查询,我们也可以选择用关系型数据存储格式来保存知识图谱。但对那些稍微复杂的关系网络(现实生活中的实体和关系普遍都比较复杂),知识图谱的优点还是非常明显的。首先,在关联查询的效率上会比传统的存储方式
有显著的提高。当我们涉及到2,3度的关联查询,基于知识图谱的查询效率会
高出几千倍甚至几百万倍。其次,基于图的存储在设计上会非常灵活,一般只需要局部的改动即可。比如我们有一个新的数据源,我们只需要在已有的图谱
上插入就可以。于此相反,关系型存储方式灵活性方面比较差,它所有的Schema
都是提前定义好的,如果后续要改变,它的代价是非常高的。最后,把实体和关系存储在图数据结构是一种符合整个故事逻辑的最好的方式。
.应用
在本文中,我们主要讨论知识图谱在互联网金融行业中的应用。当然,很多应用场景和想法都可以延伸到其他的各行各业。这里提到的应用场景只是冰山一角,在很多其他的应用上,知识图谱仍然可以发挥它潜在的价值,我们
在后续的文章中会继续讨论。
反欺诈
反欺诈是风控中非常重要的一道环节。基于大数据的反欺诈的难点在于如何把不同来源的数据(结构化,非结构)整合在一起,并构建反欺诈引擎,从而有效地识别出欺诈案件(比如身份造假,团体欺诈,代办包装等)。而且不少欺诈案件会涉及到复杂的关系网络,这也给欺诈审核带来了新的挑战。知识图谱,作为关系的直接表示方式,可以很好地解决这两个问题。首先,知识图
谱提供非常便捷的方式来添加新的数据源,这一点在前面提到过。其次,知识图谱本身就是用来表示关系的,这种直观的表示方法可以帮助我们更有效地分析复杂关系中存在的特定的潜在风险。
反欺诈的核心是人,首先需要把与借款人相关的所有的数据源打通,并构建包含多数据源的知识图谱,从而整合成为一台机器可以理解的结构化的知识。在这里,我们不仅可以整合借款人的基本信息(比如申请时填写的信息)

知识图谱概述及应用 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数18
  • 收藏数0 收藏
  • 顶次数0
  • 上传人yusuyuan
  • 文件大小497 KB
  • 时间2022-06-14