下载此文档

基于XML的异构数据集成研究.pdf


文档分类:IT计算机 | 页数:约55页 举报非法文档有奖
1/ 55
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/ 55 下载此文档
文档列表 文档介绍
重大大学硕士学位论文中文摘要

摘要

随着计算机网络的飞速发展和信息化建设的大力推进,各种网络中可供利用
的信息总量正以惊人的速率增长。但这些为不同应用服务的信息都存储在许多不
同的数据源之中,其数据内容、数据格式和数据质量千差万别,且其管理系统也
各不相同。为更有效地利用这些信息,需要对多个分布、异构和自治的数据源中
的信息进行集成,向用户隐藏这些差异,提供给用户一个统一和透明的数据访问
接口,同时还需要保持数据在不同系统上的完整性和一致性。因此,在信息集成
过程中,如何有效解决这些差异是信息集成研究与应用领域所面临的一大挑战。
近年来,随着 XML 这样一种文档结构描述语言的不断发展和壮大,以 XML
及其相关技术为基础的半结构化信息表示技术正在影响着信息技术领域和计算机
技术领域发生着重大的变化,本文探讨了如何运用 XML 技术,集成结构化和非结
构化的问题。
论文从以下几个方面的内容进行了阐述:
(1) 对集成的数据进行了分类,一类是结构化数据,另一类是非结构化的数据。
在这里我们把半结构化的数据看做是非结构化数据的特殊情况。本文提出一种对
数据进行分类集成的策略,在 Mediator/Wrapper 的方式下,单独构建一个数据集成
池,专门用来整合集成结构化数据。
(2) 详细论述了 XHDIS 信息集成系统原型的各个功能模块和系统构架。
(3) 对信息集成中的相关技术进行了深入分析,如模式集成及公共数据模型和
包装器(Wrapper)模板生成等。
(4) 由于采用分类集成的策略,因而在非结构化数据的处理,本文的重点放在
了如何通过定制非结构化数据的提取规制,通过转化成 XML 数据的形式来进行集
成。重点讨论了以 HTML/XML 的 Web 页面的提取规则。
最后在总结全文的基础上,结合其它与集成系统相关技术的发展趋势,提出
了若干有待进一步深入研究和探讨的问题。

关键词:分类集成,公共数据模型,模式集成,数据池,数据颗粒


I
重大大学硕士学位论文英文摘要

ABSTRACT

With the rapid development works and the strong advance of
information construction, now the amount of information available on-line is
proliferating at a tremendous rated. However, all those information for many different
applications is independently stored in a great variety of data sources and managed by
different systems, and their contents, structures and quality are different in thousands
ways. In order to utilize this information more effectively, there is a need to integrate
information from multiple distributed, heterogeneous and autonomous sources, and
make differences invisible and provide uniform and transparent access to the data for all
users. In addition, it is necessary to preserve data integrity and consistency over
different systems. Thus, how to resolve those differences efficiently is a severe
challenge in the domain about application and research of information integration.
These years, with increasing development and strength of XML, which is
language to describe document structure, technology which is base on XML

基于XML的异构数据集成研究 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数 55
  • 收藏数 0 收藏
  • 顶次数 0
  • 上传人 511709291
  • 文件大小 0 KB
  • 时间2015-12-31
最近更新