下载此文档

thundersearch一个元数据搜索引擎.ppt


文档分类:IT计算机 | 页数:约10页 举报非法文档有奖
1/10
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/10 下载此文档
文档列表 文档介绍
ThunderSearch一个元数据搜索引擎
元数据搜索引擎
元搜索引擎是架构在许多搜索引擎之上的搜索引擎,它利用各个成员搜索引擎的提供的效劳,能够高效方便地找到这些文档,然后合并成员搜索引擎返回的结果呈现给用户
系统设计说明〔1〕
系统边界图
系统模块分析
系统设计说明〔2〕
获取关键字模块
网页浏览器
系统分界线
提交关键字
搜索模块
系统分界线
网页解析
模块
返回处理模块
这个模块负责从网页浏览器提交的信息中提取客户想要搜索的关键字。
这个模块从上面一个模块中获取关键字,然后与知名效劳器通信,得到所要摘要 。
负责把上面解析出来的信息返回给客户端浏览器。
负责把摘要信息中的标签去掉,获得一个构造,这个构造包含一个摘要的超链接信息,描述信息
系统模块分析
1 获取关键字模块
void get_query(void)
2 搜索模块
void *search(void *engine_no)
3 网页解析模块
void *search(void *engine_no)
4 返回处理模块
void spout(char *data, struct engine *Engine)
系统设计说明〔3〕
系统设计实现中的几个关键点
知名搜索引擎的返回结果的格式
us1
baidu



/baidu?wd=
80
<ol>
<p class=p1>
</a></font>
</ol>
h t d
<a href=
>
.
</a>
<br>
</a>
系统设计实现中的几个关键点
对返回结果的解析
我们使用了内库函数regcomp,regexec。
这两个函数是用来进展正那么表达式解析的。我们利用配置信息中的构造和这两个函数对知名搜索引擎返回给我们的信息进展解析。
<p class=p1><a href= target=_blank>
<font color=#e10900>北京大学</font></a><font size=-1><br>
...中心 其 他... 校长信箱 | 住房资金 | 校历 | <font color=#e10900>北京大学
</font>防治&quot;非典&quot;专页<br> | 北大奥运场馆 相关链接 中国.

thundersearch一个元数据搜索引擎 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数10
  • 收藏数0 收藏
  • 顶次数0
  • 上传人1557281760
  • 文件大小192 KB
  • 时间2021-12-05