第二节 计算机信息检索策略与步骤

一、检索策略

(一)明确检索目的和要求

明确检索的目的和要求是制定检索策略的前提。因此,在着手进行信息检索之前,必须全面了解用户的信息需求和检索目的、检索的学科内容、主题范畴。常见的需求包括以下四种类型:

1.了解学科发展动态的要求

这类信息需求的特点是一个“新”字,即用户要求及时获得学科前沿研究的最新动态、最新进展和研究成果。针对用户的这类检索要求,在选择数据库时,除了必须考虑选择在学科内容方面与检索要求相吻合的基本要求外,还应注意考虑到信息内容更新周期短的因素。

2.了解某一研究主题的片段性信息

这类信息旨在借鉴他人研究成果,用以解决研究中碰到的具体问题。这类信息的需求量最大,其特点是一个“准”字。即检出的信息应有针对性,能帮助用户解决具体问题。因此,在数据库选择方面,除了注意内容主题的匹配外,还应注意原始文献的易获取性,最好选择全文数据库。

3.了解某一研究主题的全面性信息

出于基础理论研究、编写教材及申请课题的需要,用户往往需要全面系统地收集某一个主题范围内的文献资料,这类检索具有横向普查、纵向追溯的特点,并对查全率有较高的要求。因此,针对这类检索类型在选择数据库时,要注意选择存储容量大、覆盖年限长以及具有较强随机存取能力的数据库。

4.检索特定的文献信息

用户已经知道文献的题名、作者,而只是要求获取原文。对这类用户需求只需要选择与学科主题相吻合的数据库。

除了需要清楚了解用户信息检索的要求和目的外,清楚了解待查找文献的年限、文献类型、语种和检索费用的支付能力等情况,对制定正确的检索策略也很重要。

不同类型的用户信息需求,对查全率和查准率的要求不尽相同,对选择数据库的要求也存有差异。

(二)选择数据库

数据库检索的正确与否将直接影响到检索结果的好坏。数据库选择不当,就会得出完全不符合要求的结果。选库时要遵循以下原则:

1.根据用户信息检索的学科内容和目的选择数据库。如果检索课题涉及的内容全面而广泛,为了避免漏检,应同时选择几个不同的数据库,如需检索的课题内容专业性很强,则可以选择专业文档进行检索。

2.在同时有几个数据库可供检索的情况下,应首先选择比较熟悉的数据库。这样能既快速又准确地查找出真正需要的文献信息。

3.当几个数据库的内容交叉重复率比较高时,应选择检索费用比较低廉的数据库。

4.当用户要求检索的文献量比较大时,可首先用浏览的方式,按主题或学科专业的方式查找。

(三)编制检索提问式、选择检索入口

利用各种算符构造检索式,然后选择检索入口即字段,如:题名、著者、主题词、文摘、全文等。

1.主题途径

指用主题词在主题范围(或字段)、文摘范围、题名范围、全文范围检索。

2.著者途径

指用著者姓名在著者范围检索。

3.分类途径

指用分类号进行分类检索。

4.其他途径

指用专利号、分子式检索。

(四)上机检索及反馈调节

在得到检索结果后,可能会出现三种不太满意的情况:检索结果太少、检索结果太多及检索结果并非用户要求的内容。

1.检索结果太少

扩大命中文献的数据量(提高查全率),可使用以下方法:①选择在文摘字段中检索;②减少用“AND”或“NOT”算符联结的概念;③增加用“OR”联结检索词;④选用上位词或近义词;⑤采用截词检索法。

2.检索结果太多

减少检索记录的总数(提高查准率),可使用以下方法:①将检索词的查找范围限定在篇名、关键词或叙词字段;②利用文献的外表特征限制检索;③增加用“AND”联结的概念。

3.检索结果并非用户要求的内容

利用逻辑“非”进行限制;充分利用下位类检索词;在检出记录中选取新的检索词对结果进行再次限制。

二、检索步骤

1.分析、理解课题

(1)了解用户信息需求的目的和意图,选择合适的检索式和检索范围。

(2)分析主题要求:①分析主题内容包括主题所涉及的广度和深度;②分析检索课题涉及的学科范围,以便选定合适的检索系统和数据库。

(3)检索的时间要求。

(4)检索效果的要求:即①检索结果的查全率、查准率;②所需文献的大概数量;③是否提供原始文献等。查全率要求较高时选择检索词的主题概念范围要宽一些。查准率要求较高时选择检索词的主题范围要窄一些,专指度要高一些。要求提供原文时应选用全文数据库。

(5)检索费用及其他要求。

2.选择检索系统和数据库

选择检索系统和数据库,应考虑以下内容:

(1)数据库内容,选择包括哪些学科的数据库?

(2)选择中文还是外文数据库?

(3)利用互联网上的各种信息查询工具,对网上免费的数据库进行检索和下载。

(4)数据库选择的原则:就近原则、全文数据库优先原则、成本 / 效益最低原则、中文数据库优先原则、专业数据库优先原则。

3.选择检索词,构造检索式

(1)利用检索词、逻辑运算符、位置运算符、字段限制符、截词运算符等构造表达检索目的的检索表达式。

(2)检索式要能够表达课题要求。

(3)检索式中字符必须与数据库文献标识相匹配。

(4)检索式可以应用逻辑运算符、位置运算符和字段限制符。

(5)检索式应简单明了。