下载此文档

异构本体映射中的关键方法研究.pdf


文档分类:IT计算机 | 页数:约110页 举报非法文档有奖
1/110
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/110 下载此文档
文档列表 文档介绍
提 要
随着科技的不断发展,人类已经进入信息社会,万维网成为人们获取信息的重要途
径,其规模以惊人的速度增长着。大部分信息是以人类可理解的格式来表示的,而作为
智能程序的软件代理无法理解和处理这些信息,为了解决这个问题,发明万维网的
T.Berners-Lee 提出了语义网的概念,语义网是现有万维网的扩展和延伸,而本体是语
义网的基础,但本体的构建没有统一的规范来约束,因而产生了本体异构问题。本体映
射作为解决本体异构问题的关键,已成为一个重要的的研究课题。
本文对本体映射问题进行了深入细致的研究,提出了三种本体映射方法。通过在常
用数据集上进行实验评估,表明这三种方法的性能较好,取得了较好的实验结果。
首先,提出了基于多策略的本体映射方法,主要考虑概念映射和属性映射。其中概
念映射方法采用基于名称、属性和分类关系的概念相似度策略来计算概念相似度,不仅
考虑概念本身的语义和词义,而且考虑概念的属性和上下文结构。属性映射方法对数据
类型属性和对象类型属性采取不同的策略,对属性进行筛选后得到最相关的属性作为某
个属性的候选属性集,对这个属性和候选属性集中的属性进行相似度计算。然后合并多
策略的映射结果,选择最佳结果并对概念映射和属性映射进行优化,由于充分使用了本
体中的多种信息,采用多种策略的方法映射效率和精度较高,通过实例验证该本体映射
方法具有较高的查全率和查准率。
其次,提出了基于候选概念集的本体映射方法。在计算概念相似度时,不仅考虑概
念本身所包含的语义,还考虑概念的上下文结构和属性。对于某个本体中的一个概念,
计算这个概念和另一个本体中所有概念之间的概念名称相似度,并且设定阈值,产生这
个概念的候选概念集。然后只对这个概念与候选概念集中的概念计算基于结构和基于属
性的概念相似度,并进行相似度的综合,以产生本体映射结果,通过实例验证该计算方
法具有较高的查全率和查准率。由于使用了候选概念集,相似度的计算量减少,因而这
种方法得到的映射效率较高。
最后,针对大规模本体映射问题,提出了基于 ROCK 聚类的本体分块与映射方法。
对两个大规模本体进行预处理,并提取概念对,之后计算基于语义、基于子串和基于分
类关系的概念相似度,从而得到概念之间的链接。通过计算块内聚度和块之间的耦合度,
在改进的 ROCK 聚类算法基础上,分别对两个本体进行分块,之后采取基于分类关系的
块映射策略和基于参考点的块映射策略,得到块之间的相似度,最终得到块映射结果,
实验结果表明本文采取的本体分块与映射方法具有较高的映***度。
摘 要
摘 要
异构本体映射中的关键方法研究
在这个信息技术飞速发展的时代,万维网改变了人们彼此交流的方式,并改变了信
息传播、获取的方式以及商业运作的方式。信息资源呈爆炸性地增长,面对海量的数据
信息,想要精确地、快速地检索信息变得异常困难,这是因为万维网上的大部分信息是
以用户可读格式来表示的,缺乏语义信息,而软件代理无法理解和处理这些信息。为了
解决这个问题,发明万维网的 T.Berners-Lee 提出了语义网的构想,语义网是现有万维
网的扩展和延伸,其目标是实现不同信息系统之间的数据交换、知识共享及重用,即语
义互操作性。但是在语义网中的分布式环境下,实现语义互操作性的难度相当大,本体
成为解决异构系统互操作性的关键因素,它是语义网的基础,可以描述数据的语义信息。
为了实现知识共享及重用,不同领域定义了相应的本体标准,但是本体的构建没有
统一的规范来进行约束。另外,本体设计者对领域中的概念、属性和关系等相关元素的
理解上的差异等原因导致出现了本体异构问题,阻碍了不同信息系统之间的语义互操作
性。本体映射作为解决本体异构的关键,已成为一个重要的的研究课题,吸引了众多研
究机构和学者的关注,本体映射可以找到不同本体中元素之间的语义对应关系。
目前,尽管有很多研究机构和学者设计开发出许多与本体映射相关的方法和技术,
但没有一个方案能够完全适应未来发展的需要,并能在没有领域专家参与的情况下自动
完成所有操作。因此,本体映射研究面临着许多挑战,本文针对本体映射中存在的问题
进行深入细致的研究,并提出了三种本体映射方法,以解决实际问题。
首先,提出了基

异构本体映射中的关键方法研究 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数110
  • 收藏数0 收藏
  • 顶次数0
  • 上传人iris028
  • 文件大小2.73 MB
  • 时间2021-12-02