刃 〕门 邢 丁刃叮 “了仁只 下丫
学校代码
学 号
基于 的分布式元搜索引擎架构研究与
实现
恤
一 一
学科专业
作 者 尚 攀 攀
指导老师 吴 国 文
答辩 日期 年 月
东华大学学位论文原创性声明
本人郑重声 明 我烙 守学术道德 , 崇 尚严谨学风 。所呈交 的学位
论文 , 是本人在导师 的指 导下 , 独立进行研 究工作所取得 的成果 。除
文中己明确注明和 引用 的内容外 , 本论文不包含任何其他个人或集体
已经发表或撰写过 的作 品及成果 的内容 。论文为本人亲 自撰 写 , 我对
所 写的内容负责 , 并完全意识到本声 明的法律 结果 由本人承担 。
学位论文作者签名
日期 不 年
东华大学学位论文版权使用授权书
学位 论文作者完全 了解学校有关保 留 、 使用学位论文 的规定 , 同
意学校保 留并 向国家有 关部 门或机构送交论文 的复 印件和 电子版 , 允
许论文被查 阅或借阅 。本人授权东华 大学可 以将本学位论文 的全部或
部分 内容编入有关数据库进行检索, 可 以采用影 印 、缩印或扫描等 复
制手段保存和汇编本学位论文 。
保密 口, 在 年解 密后适用本版权 书 。
本学位论文属于
不保密守
学位论文作者签名尚攀擎
日期 又 `年 月午日 ,日旨躲导教沙师签,拜、盲月 、
笨于 的分布式元搜索引擎架构研究与实现
基于 的分布式元搜索引擎架构研究与实现
摘 要
现有的搜索引擎在查全率和查准率方面很难满足用户的要求, 为 了查询到一
个相关 的内容 , 用户常常需要 使用多个搜索 引擎查询相 同的内容 , 然 后综合 出最
适合 自己的结果 。元搜索引擎通过调用多个成员搜索引擎来进行搜索 , 因此可 以
很好地解决上述 问题 。
数据提取技 术是元搜索引擎 的核心, 如何准确 、 高效地从 页面中提
取 内容对 于一个 元搜索 引擎来说 至关重要 。作 者对 开源 的 数 据提取 工具
一 进行了深入 的研究 , 并在此基础 上进行 了二次开发 , 摒弃了以前 的
通 过写配置文件 页面抽 取规则 进 行页面抽取 的方式 , 改用 的方式重新封
装 了
基于Agent的分布式元搜索引擎架构研究与实现 来自淘豆网www.taodocs.com转载请标明出处.