第三章 社科信息检索原理与技术
第一节 信息检索原理与检索语言
第二节 信息检索技术
第一节 信息检索原理与检索语言
The Principles and Language of
Information Retrieval
信息检索原理图
:将大量分散的文献信息搜集起来,根据其内容特征或外表特征进行标引,形成表征这些文献信息的特征标识,并存储在一定的载体上,成为有查询功能的检索工具。
:用户根据自己的信息需求,提出检索提问,然后使用有关的标引语言(也称检索语言)将拟定的检索提问规范成检索标识,用于检索的过程。
简言之,信息检索原理就是用户将信息需求转变为检索系统所能识别的检索标识,与信息检索系统中存储的信息特征进行逐一比对,两者完全一致或基本一致时,即为检索命中信息,可按用户要求从检索系统中输出。其检索结果既可能是用户需要的最终信息(一次信息),也可能是用户需要的信息线索(二次信息),用户可据此线索进一步进行判断、筛选,以获取所需要的最终信息。
概念: 信息检索语言就是信息组织和信息检索时所使用的语言(包括自然语言)。信息检索语言是文献信息标引的规则和标准,标引人员可用它来标引文献以便将文献整理、加工、存储于检索系统中,同时,检索人员可用它来表达检索课题信息的内容,以便把特定文献从检索系统中检索出来。
因此,检索语言就是一种把文献的存储与检索联系起来,把标引人员和检索人员沟通起来的约定人工语言。
功能:
①对文献的信息内容及其外表特征加以规范化的标引
②对内容相同及相关的文献信息加以集中或揭示其相关性
③可使文献信息的存储集中化、系统化、组织化,便
于用户按一定的排列次序进行有序化检索。
④便于将标引用语和检索用语进行相符性比较
例如:有三篇文献篇名如下:文献1:A Model of multimedia information retrieval文献2:The Information retrieval in chemistry WWW server文献3:ERIC resources在对信息存储的过程中,对这三篇文献内容分别进行了分析,并使用检索语言对其进行标引,标引结果为:文献1:篇名(title): A Model of multimedia information retrieval 主题(subject): information retrieval, multimedia computer applications
文献2:
篇名(title): The Information retrieval in
chemistry WWW server
主题(subject): chemistry, educational materials
文献3:
篇名(title): ERIC resources
主题(subject): educational materials
标引后这三篇文献分别被存储进数据库。
在信息检索过程中: 如果用户输入“information retrieval”一词,并将检索范围限定在篇名中,则文献1与文献2符合用户要求,成为检索结果。 如果用户输入“information retrieval”一词,并将检索范围限定在主题中,则只有文献1符合用户要求,成为检索结果 如果用户输入“educational materials”一词,并将检索范围限定在主题中,则文献2和文献3符合用户要求,成为检索结果。
在上述例子中,“information retrieval”、
“educational materials”都是检索语言,篇名和主题则
是检索语言的标识,检索系统就是通过他们将用户需求与
信息内容进行运算匹配,最终找到检索结果的。
由这个例子可以看出,检索语言的主要作用就是对文
献的外部特征和内容进行多层次描述,提供多种检索途径
,以方便用户从不同角度检索查找。
信息检索原理与检索语言 来自淘豆网www.taodocs.com转载请标明出处.