情报检索系统
出处:按学科分类—工业技术 企业管理出版社《工程师手册》第1181页(2082字)
情报检索系统,更确切地说是情报的存贮与检索系统。情报存贮是指编制检索工具和建立数据库;情报检索即是利用这些检索工具和数据库来查找所需的情报。情报的存贮与检索系统的结构与组成部分,如图1.4.2-1所示:
图1.4.2-1 情报的存贮与检索系统
从上图可以看到,情报存贮与检索系统包括以下六个子系统。
1.文献选择子系统
将搜集到的文献,按照检索工具或数据库所规定的科学、文种、时间、文献类型等范围,以及摘贮率,选择文献。将选出的文献进行登记,给出登录号。此子系统的重点一是要搜集到的文献系统全面,二是确定哪些文献入选。
2.词表子系统
检索语言(系统词表或检索词表)是作用于文献存贮与检索两个方面,用来表达文献内容与提问内容的共同依据,它的规模(网罗度)与细分程度(专指度)是影响查全与查准的重要因素。检索语言的种类很多,一般可分为:
(1)按其表述文献特征来划分,可分为表述文献外表特征的检索语言和表述文献内容特征的检索语言两类。
表述文献外表特征的检索语言,主要是书名(刊名、篇名)、着者姓名、文献号码、引文等。
表述文献内容特征的检索语言包括体系分类语言、组面分类语言、标题词语言、关键词语言、叙词语言等。
(2)按其组配方式来划分,可分为先组式检索语言和后组式检索语言两类。所谓先组式检索语言,是指在检索之前,表述文献主题概念的标识已经事先拟定好了的检索语言。如体系分类语言,标题词语言等。
所谓后组式检索语言,是指表述文献主题概念的标识,在编制检索语言(词表)和标引文献时,都不预先固定组配,而是在检索进行时,根据检索的实际需要,按照组配规则临时进行组配的检索语言。如叙词语言等。
(3)按其结构原理来划分,可分为分类语言和主题语言两类。主题法语言又可分为标题词语言、单元词语言、关键词语言、叙词语言等多种。
尽管检索语言从不同角度来划分有多种多样,但是,从使用的角度来看,主要有分类法语言及其检索工具、标题词与关键词语言及其检索工具、叙词语言及其检索工具三大类型,以后几章分别叙述。
3.标引子系统
所谓“标引”是指对文献(或提问)进行主题分析,并参照主题词表和分类表等参考工具,给出主题检索标识(如:主题词、分类号等)的过程。它一般分为主题分析和检索标识的给出两个阶段。主题分析就是从内容复杂的文献或提问中分析出构成主题的基本要素(概念)的处理过程。处理方法一般有看标题、阅读文献、浏览全文三种。检索标识的给出就是将抽出的概念借助于词表转换成正式主题词和分类号。然后编制检索工具或数据库。
4.制定检索策略子系统
此子系统是把情报用户的需求,经过概念分析,转换成检索语言的词汇,并指出其逻辑关系的过程。具体来说,就是构造检索策略的过程,注意避免概念太大或太小、虚假、遗漏等现象。
5.用户子系统
此子系统是通过同情报用户的商谈并收集反馈,弄清用户的真实情报需求,形成明确的检索概念,并将其准确地表达出来的过程,即确定具体检索目标的过程。它是决定检索的角度、深度、广度和时间、文种范围的关键一步。显然这是成功地制定检索策略,实施检索的前提。
6.匹配子系统
此子系统是将检索策略同检索工具(数据库)中的标引记录相比较而决定其取舍的过程。也就是文献特征与情报提问之间的“匹配”。匹配的各种技术与方法,决定了各种不同的检索方式——例如纯手工的检索方式、半机械的检索方式、光电检索方式、电子计算机检索方式等等。
总之,存贮是检索的基础,检索是存贮的相反过程。用通俗的话说,存贮与检索,一是放进去,一是拿出来。正因为如此,检索系统能够将分散的、无组织的大量文献线索集中起来,组织起来,累积起来,以备人们现在和今后按照自己的要求,从其中检出所需的文献。