下载此文档

基于语义网的博客搜索引擎的研究.pdf


文档分类:IT计算机 | 页数:约59页 举报非法文档有奖
1/59
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/59 下载此文档
文档列表 文档介绍
摘要 1
摘要 3
摘要 1
摘要
2005、2006 年博客在中国迅猛发展,博客已经成为继电子邮件、BBS 和 ICQ
之后的第四种互联网沟通工具。随着博客页面的数量呈指数级的上升,国外已经
出现了如 Technorati 等顶级的博客搜索引擎。而国内的博客搜索引擎只是将传统的
搜索引擎技术应用于博客页面之上,查询效率低下。如何设计一个合理的博客搜
索引擎系统,使其能在语义层次上收集、组织和检索博客资源,提高信息的利用
率,成为了一个很有挑战性的研究内容。
本文首先对传统搜索引擎技术和语义网技术分别做了深入的研究。通过比较
传统搜索引擎和博客搜索引擎的区别,融合传统搜索引擎的体系结构和语义网中
的本体知识,提出了一种基于语义网的博客搜索引擎模型,并对其体系结构和功
能模块做了详尽的阐述。该模型根据博客网页的特点规范了博客信息资源的抓取,
并将语义网研究中的本体知识应用到博客搜索引擎中,利用本体对概念间的各种
语义关系指导博客搜索引擎的检索过程,使用户能够快速、准确的找到所需的博
客资源,提升博客搜索引擎的查准率和查全率。模型的核心在于对博客网页资源
的规范化抓取,以及在本体支持下的资源语义标注和索引、用户查询词的语义扩
展。
最后对文中涉及的关键技术进行了深入的分析和研究。提出了一种规范的本
体构建方法——闭环本体构建法;研究了一种基于本体的信息检索模型,重点对
描述逻辑的推理理论以及检索过程中基于本体的语义扩展机制做了深入的研究。
对关键技术的研究为研究和完善基于语义网的博客搜索引擎奠定了良好的理论基
础。

关键词:博客搜索引擎 语义网 本体 搜索引擎
Abstract 2
Abstract
In 2005 and 2006, blog has developed promptly and become the forth network
communication tool after e-mail, BBS and ICQ. As the number of blogs increases
sharply, top blog search engines like Technorati have already appeared in the world.
However, the domestic blog search engines only apply the traditional search engine to
the blog searches, which results in low efficiency of query. Therefore, it is a challenging
task to design a reasonable blog search engine system to collect, organize and retrieve
blog sources, and to improve the utilization ratio of information resources.
The thesis conducts firstly detailed study on search engine techniques and semantic
web respectively. On the basis of the comparison between traditional search engines and
the blog search engine, it integrates the system structure of traditional blog search
engines and ontology in semantic web and proposes a new blog search engine model
based on semantic web with

基于语义网的博客搜索引擎的研究 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数59
  • 收藏数0 收藏
  • 顶次数0
  • 上传人iris028
  • 文件大小947 KB
  • 时间2021-09-27