现有的数字文献资源检索方法在传统的信息检索中,通过关键词进行检索是最常用的一种方法。其基本原理是:用户提出提问式——通常是由若干个反映文本主题的词汇组成,然后系统在信息资源中将提问式与预存的文本关键词进行自动匹配,两者相符的文本被检出。因此,可以利用单字或词组找到在书刊名称、篇名和其他检索字段中出现相同单字或词组的资料。在制定检索策略的时候,我们首先要把头脑中的概念用关键词的形式表达出来。在有的数据库系统里,当我们做关键词检索时,等于是在数据中去找所有字段,包括正文出现关键词的所有记录,因此也叫做自由关键词检索。所以,我们所用的关键词在很大程度上就决定了检索结果的好坏^关键词检索是目前普遍使用的一种检索方法与检索思路,但是大量的事实证明,这种通过词汇的简单匹配进行检索的方法井不是最优的。这是因为信息检索本质上是语义检索,而关键词检索则试图通过简单的几个词汇及其间的组配表达所要检索的概念或主题,其检索效果必然受到一定程度上的限制。在上文第一点原则中也已经提到,语言文字的多样性与多种表达方式,使得词汇间的同义性和单个词汇的歧义性,成为造成检索结果不理想的客观原因。其中,词汇间同义性引起的弊端体现在:不同的检索者,其检索目的、知识背景、语言习惯之间的差异,会导致他们对同一概念用不同的词汇来表达。有些国外学者研究发现,词汇运用的不确定性远远超乎想象,以西文表达为例,两人用相同词汇表达一个人们熟悉的概念的概率小于20%。这一因素大大降低了检索系统的检全率。而单个词汇的歧义性则表现为一个词汇在不同的语言环境下,或被不同的人使用,则可能代表不同的含义。因此,仅仅判断文本中是否包含与提问词“形态”一致的词汇,检出的文本很可能是不准确的。指定字段检索通常与关键词检索搭配使用,上文也己经提到,指定字段检索将检索的范围限定于特定的字段或位置,能够在一定程度上缩小检索范围,节省检索时间,提高文献的查准率。常用的检索字段有:题名、作者、出处、摘要、出版年、文献类型、主题等。不同类型的数据库系统所包括的字段不尽相同,字段标识也不一样,很多数据库为了提高查准率,将多个检索字段结合使用,进一步限定了检索的范围,更大程度上提高了检索的效率。加之很多字段具有较强的专指性,当检索者使用唯一的检索词检索特定字段时,通常可以相对准确的检出所需信息。例如,在“作者”字段输入特定作者姓名,即可检出所有该姓名的作者,为了排除同名同性的无关信息,可以配合出版年、出处、主题等多种字段一起使用,这样检出的信息就较为准确了。除此之外,题名字段检索除了具有查找特定文献的便捷功能外,还可以在搜集某一专题资料的时候,提高检索资料的相关性和精确性。这是因为文章的标题往往反映文章中心内容的焦点,符合人们思维习惯的方式。