下载此文档

全文检索系统整体方案设计.docx


文档分类:IT计算机 | 页数:约26页 举报非法文档有奖
1/26
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/26 下载此文档
文档列表 文档介绍
1 全文检索系统方案

1) 系统提供模糊检索、分类搜索、高级复合搜索、全文检索、图片内容检 索、跨库检索等多种检索途径;
2) 支持字索引和词索引;
3) 检索条件具有完整的关键词布尔逻辑运算 AND OR NOT能力,支持复 合式布尔逻辑运算查询,并且可以配合多组左括号"("与右括号")"作关 键词查询优先级的设置;
4) 提供用户多次递进查询的功能,用户可根据上一次查询关键词得到的检 索结果集,增加查询关键词与缩小搜索日期范围,而得到更准确的查询 结果集;
5) 能够支持对以上文件中的中文(简体/繁体)、英文、日语、韩语内容实 现关键字检索;
6) 支持对Word TXT PDF等多种主流文档格式全文检索,并提供开发接 口以支持特殊文档格式的全文检索;
7) 在数据源数据发生更新时,能在索引库中反映出来,保证搜索的信息为 最新,即支持增量索引机制;
8) 用户可自行设定时间,让系统自动定时进行更新索引;
9) 对于百万级记录数的搜索以及结合模糊搜索等查询方式, 搜索时间不得
超过10秒;
10) 提供跨数据源、数据格式的搜索;
11) 同过相关性搜索,能够把和搜索条件相关联的信息搜索出来;
12) 不但能够对图片的描述信息进行搜索,还能对图片内容的检索;
13) 提供COM与 SOAP勺搜索接口(Interface) 可让其它应用程序或查询网
页能够提供用户查询入口和查询结果的呈现, 用户可通过应用程序或浏
览器访问全文检索服务器,提交查询条件,可在浏览器中查看检索结果;
14) 查询结果集中应包含结果集总数、命中的结果文件的完整路径,以及符 合关键词出现的内容片断;
15) 在搜索结果集中,关键词应被标识出来,用特殊的字体及颜色和其他文 字进行区别,查询者可在查询结果片断中一目了然的看到关键词出现的 位置;
16) 查询结果可按照关键词命中次数,命中结果文件的修改时间,大小等条 件进行排序;
17) 可提供用户对检索命中结果文件在索引库中进行标记,从而再次检索 时,不在标记过的文件中进行查询;

系统将采用以下全文检索流程
Fuzzy Search
Synonym Phrase
Wild-Card
Multi-field Filter


ngi ne
AAppccaoon (Useeinnface)
A
In dex Database
IRMS
IRMS. In dexer
Term Extract
Term Index
FileNET 內容管理
Lotus Domino R5,R6 (NSF)
二二“:「
Adapter
Data Source Composer
File Extractor
Share Folder with Documents
Web Site Robot/Spider By URL Entry
RDBMS
(ODBC /
OLEDB / JDBC)
针对企业内部的信息,包括文件服务器上的文件、网站网页、 ERP等系统存
放信息的数据库信息、办公应用中的公文档案文档已经内容管理系统中流转的内 容,本系统提供了两种数据适配器来提取其中的正文内容和属性内容, 形成一个
相对结构化的数据虚拟层;本系统的索引引擎(Indexer )对结构化的数据虚拟 层进行中文切分词、文件特征分析和逐步索引,以及其它索引算法,生成索引数 据库;使用者(user)在搜索页面中输入查询字串等搜索条件并提交给本系统后, 本系统的全文检索查询引擎(Searcher)会在索引库中进行搜索,并将符合搜索 条件的搜索结果返回给使用者;使用者(user)可于查询结果页面,进一步链接 到信息原文查看详细内容。
对于系统管理,管理员可通过相应web方式的管理程序来管理整个系统运行 环境及设置文件;并通过索引引擎( )实时或定时创建索引,更新 索引数据库的内容,使检索信息维持在最新状态。

? 高效率的整合搜索,大幅减少组织成员在取得信息时花费的时间!
本系统和其它搜索系统只针对特定信息源搜索不同,它能对企业内部绝大多 数的信息创建索引和搜索,具备强大的信息整合及快速回应能力,让企业成 员以单一搜索页面、简易的操作方式,即可在最短时间内,完整、准确、及 时地掌握企业内外所有信息,不必再耗费大量时间的找寻信息!
? 信息过量不会造成企业成员的信息焦虑!
通过本系统强大的索引/搜索能力,大量的信息也可在瞬间过滤出符合使用 者条件的信息,不必担心迷失在漫漫的信息洪流之中!
? 非

全文检索系统整体方案设计 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息