1第一章文献检索第一节信息、知识与文献一、信息信息是事物存在和运动状态及其特征的反映,即客观事物所发出的信号和消息。人们就是通过获取、识别自然界和社会的不同信息来区别事物,从而认识世界和改造世界。根据来源不同,人们一般将信息分成四种类型:自然信息、生物信息、社会信息和机器信息。如风云雨雪、湖光山色是自然信息,花红柳绿、血压升降是生物信息,人们使用的文字、语言、图形符号是社会信息,机器发出的脉冲信号等是机器信息。信息已和物质、能源一起构成了人类社会的三大支柱,信息在人们日常生活、社会活动、科研活动中的作用越来越大,甚至将一个国家信息化程度的高低作为衡量这个国家发达水平的重要标志。二、知识知识是人的大脑通过思维重新组合的系统化的信息集合,是信息的一部分,是经过优化以后的理性化的信息。经过人脑的选择整理,系统化、理论化的信息就是知识。知识是人类在认识世界和改造世界的过程中所获得的认识和经验的总和,是人的主观世界对客观世界的如实反映和概括。一般来说,人们把知识分为自然科学知识、社会科学知识和哲学知识三大类。三、文献国际标准化组织《文献情报术语国际标准》对文献的描述是:“在存贮、检索、利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存贮有信息或数据的载体”。我国颁布的《中华人民共和国国家标准》对文献定义为:“文献是记录有知识和信息的一切载体”。上述定义强调了文献的三个基本属性,即文献的知识性、记录性和物质性。或者说文献有三个基本要素构成:1知识信息内容:这是文献的核心和灵魂2信息符号:提示和表达信息的标示符号,如文字、图形、数字、声频视频等。3载体材料:是记录知识信息符号的物质材料,如龟甲兽骨、纸张,胶片胶带、光盘磁盘等。四、文献的分类和分级(一)文献的分类按照载体不同,可对文献进行如下分类1印刷型文献以纸张为载体,通过印刷的方式将知识固定倾载体上的文献。这是一种传统的文献类型,因符合人们的阅读习惯而成为目前使用最多的文献形式。如图书、报纸、报刊等。这种文献的优点是便于携带和阅读。缺点是存储密度低,体积大而且易燃,害怕虫蛀、鼠咬、水蚀,长期保存困难。按其出版方式不同,又可分为以下三种。(1)图书图书是将生产技术、科技成果进行总结和对人们社会活动进行概括的文献,系统论述某一个方面的专题,内容比较成熟、系统、稳定,但一般不能反映最尖端的科技成果和社会发展水平,是印刷型出版物中最普遍的一种文献。根据内容与作用,图书又可分为一般性图书(如专著、文集、教科书、丛书等)和参考工具书(如词典、百科全书、指南、手册)两大类。2(2)期刊是定期或不定期的连续出版物,具有固定的名称、编辑机构、装帧版式和结构编排,内容专深新颖、信息量大、报道迅速,能反映当前的科技水平和社会发展状况,是最主要的信息源,也是信息检索的主要对象。(3)特种文献又称非书非刊出版物,是除图书、期刊以外的其他出版类型的总称。科技报告:是科技人员的科学研究成果的正式科研报告或阶段性报告。内容具体且专深。按科研进度划分,有初步报告、进展报告、中间报告、终结报告;按流通范围有绝密报告、机密报告、秘密报告、非密级报告等。专利文献:一般是指发明申请说明书和发明专利说明书,它具双重性,既是一种技术性资料,又是一种法律性文件。专利文献有时间上的局限性,发明专利的保护年限一般为3.5~20年,我国是20年。二是地区局限性,发明专利仅是限于专利权授予国所属国土内得到保护,在未授予专利权国家中的国土区域内任何人使用专利不需经专利权人同意,或支付专利费;第三是内容上的局限性,往往一项专利不包括一项新产品、新工艺的全部内容,而仅包括一项新产品或新工艺的某一局部的内容。会议文献:主要是指各种科技专业会议上宣读或交流的论文。依其出版形式分为会前文献和会后文献。特点:学术性强,传播速度快(通过会议直接交流传播),比以期刊形式出版要快的多。学位论文:一般指高校或研究院(所)的学士、硕士或博士论文。特点:有独创性,阐述较系统、详细,有较高的参考价值。政府出版物:是指各国政府及其所属的单位发表、出版发行的行政性文件和科技文献。行政性文件主要包括国会或议会记录、听证记录、政府法令、调查报告等。科技文献主要包括标准规格、地质水文航线图。技术标准文献:是技术标准、技术规格、试验规范等的总称。按规定的程序编制,经权威的机构批准,大家共同遵守的技术文献。技术标准等级:国际标准、国家标准、部颁标准和企业标准。技术档案:它是科研和生产建设单位针对具体项目,在科研和生产活动中形成的技术文件、蓝图、照片、图表、原始记录的原件或复制件。如任务书、设计方案、设计图纸、试验方面的记录等。产品样本:它是厂商为了对其产品扩大影响,参与市场竞争,占领市场而采用的措施。如产品说明书、产品数据手册、企业介绍、产品目录。这类文献的特点是一般不公开出版,普通图书馆也不收藏,但特种文献反映了许多最新科学研究和技术以及国家的法规、标准等不可或缺的信息,也是重要的和新颖的情报源。2缩微型文献以感光材料如胶片、胶卷为载体,将印刷型文献通过摄影技术缩小后形成的文献。由于摄影技术发达,小小一张胶片上可以存放成千上万张印刷型文献.。这类文献的优点是易复制、再现度高,存储密度高于印刷型文献、体积小,易保管,但缺点是不方便阅读,必须借助特定设备,缩微阅读机才能阅读,流传并不广泛。保存条件高。3声像型文献也称视听型文献。是以磁性材料如磁带、录像带为载体,将文献以声音、图像等方式录制而成的文献,包括唱片、录音带、电影片、幻灯片等。这是一类用途特殊的文献,可闻其声,观其形,具有形象、直观的特点(图文并茂),在特殊的场合(如教学实践、临3床观摩等)具有独特的作用。4电子型文献又称机读型文献,即计算机可以阅读的文献。载体为计算机存储介质,如计算机硬盘、软盘、光盘等。这种文献主要采用磁性存储技术,通过编码程序设计,把文献内容变成逻辑语言和机器语言,输入到计算机中进行存储,阅读时再由计算机进行输出。机读文献的优点是存储密度高,通过计算机程序可以随意处理和使用,并可通过网络进行传输,共享性好。缺点是需要借助计算机,价格昂贵,保存条件要求较高。(二)文献的级别按照文献加工程度的不同,可对文献进行如下分级:1零次文献:是指未经刊载或未经公开交流的最原始的文献,如私人笔记、实验记录、设计草图、论文草稿、书信等,是一次文献的素材。其主要特点是内容新颖,但不成熟,不公开交流,难以获得。2一次文献:也称原始文献,是作者以生产实践或科研成果为依据创作而成的文献,是创作者对其新发明、新创造、新技术、新方法、新见解的真实记录,比较具体、详尽、系统,它的特点是有创新性。专著、期刊论文、专利文献、技术标准、科研报告、学位论文、会议论文等都属于一次文献。它是最主要的文献情报源,是产生二次、三次文献的基础。其主要特点是内容新颖丰富,叙述具体详尽,参考价值大,但数量庞大,分散。零次文献与一次文献的主要区别在于其记载的方式、内容的价值及加工深度有所不同。3二次文献:二次文献是对分散的无组织的一次文献进行分析、加工、提炼、排序整理后形成的文献。一般将原始文献提炼出主要的外表和内容特征,然后排序而成。它是为了便于管理和利用一次文献,由情报人员编辑、出版和积累起来的工具性文献。二次文献包括目录、索引、文摘。由于二次文献中包含大量内容相关的一次文献,因而成为信息检索的主要工具。二次文献具有汇集性、工具性、综合性、交流性的特点。4三次文献:三次文献是为了一定的目的,在利用二次文献的基础上选用大量与某专题相关的一次文献,将其内容进行分析、整理、综合后形成的文献。三次文献是对某一个学科领域或专题的概括性叙述,是人们从总体上把握科技动态的重要工具。它源于一次和二次文献,又高于一次和二次文献。是情报研究的产物和成果,是人们掌握情报源的主要资料。三次文献主要包括三种类型,一是综述研究类,如专题述评、总结报告、动态综述、进展通讯、信息预测、未来展望等;二是参考工具类,如年鉴、手册、百科全书、词典、大全等;三是文献指南类,如专科文献指南、索引与文献服务目录、书目之书目、工具书目录。在上述的四个级别的文献中,零次文献由于没有进入出版、发行和流通这些渠道,收集利用十分困难,一般不作为我们利用的文献类型。而后三种文献是从一个分散的原始文献到系统化、密集化的过程。一般说,一次文献是基础,是检索利用的对象。二次文献是检索一次文献的工具,故又称之为检索工具。它也为三次文献服务。三次文献是一次文献内容的高度浓缩,也是我们利用的一种重要信息源。第二节文献检索人类进入20世纪以来,科学技术的高速发展,研究规模的迅速扩大,各种研究成果大量涌现,导致科技文献数量的急剧增长。另一方面,由于条件的限制,人们吸收和利用4信息的能力并未得到相应的提高,许多有用的信息还未来得及发现和利用就自生自灭了。文献量的增长和人们利用信息能力两者之间出现了起来越大的剪刀差。对这种社会现象,人们惊呼为“信息危机”或“信息爆炸”。因此迫切需要更加有效的信息技术和方法,需要培养信息资源管理专家。因此,信息检索作为一个专门的研究领域,逐步纳入许多国家的高等学校的教学计划中。各种与信息检索有关的研究开发活动、培训活动和学术交流活动越来越频繁,规模也起来越大,有关的书刊和文章也纷纷涌现。一、文献检索的定义(一)信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息的过程和技术。全称为“信息存储与检索”。这是广义的信息检索,狭义的信息检索仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程。信息检索的本质是信息用户将自身的需求和信息集合进行比较和选择的过程。对于手工检索来讲就是将检索提问标识与检索工具书中的标识进行人工比较,选出相匹配的信息的过程;对于计算机检索来讲,就是将检索提问标识与存储在数据库中的标引标识自动进行比较,含有该标识相匹配的信息就会从数据库中并通过计算机输出的过程。(二)文献检索根据检索对象的形式不同,信息检索可分为数据检索、事实检索和文献检索。数据检索是以特定数值型数据为检索对象,它包括各种统计数字、图表、化学结构式、计算公式等。如某种药物的理化常数、常用剂量、结构式等;事实检索是以特定的事实为检索对象,如什么是艾滋病等等。文献检索则是从大量的文献中将涉及某一特定课题的文献查找出来。所以文献检索是信息检索的组成部分,但又是其中最重要的一部分。因为人们对数据和事实的检索,在很多情况下都要借助文献检索,因为目前文献检索仍是存储信息、数据、事实的主要形式。文献检索还可以分为手工式文献检索(简称“手检”)和计算机化的文献检索(简称“机检)。两者的关系是:手检是基础,机检是发展方向。从性质上说,文献检索是一种相关性检索,系统不直接解答用户所提出的技术问题本身,只提供与之相关的文献供用户参考。例如,某用户需要有关红豆草的胚胎发育方面的资料。这是属于文献检索的范畴的问题。而数据检索则是一种确定性检索,系统要直接回答用户提出的技术问题,即直接提供用户所需要的确切的数据或事实。而且检索结果一般也是确定性的,要么是有,要么是无;要么是对,要么是错。例如,某用户询问我国在哪一年人工合成了结晶牛胰岛素,或者询问第一例人类“试管婴儿”是何时、由何人培养出来的,等等。这些都是属于数据检索范畴的问题。某用户需要有关建造压水堆式核电站的技术资料,这是属于文献检索范畴的问题;某用户询问目前全世界有多少座核电站,世界上有哪些国家建有核电站,年发电量分别是多少,有效利用率如何,等等,这些都是属于数据检索范畴的问题。文献检索也数据检索除有上述的区别之外,两者在原理方法和实践方面并无其他本质区别。相反,它们之间倒是存在着密切的关系。二、文献检索的重要作用1.促进信息资源的开发和利用历代流传下来的和正源源不断地涌现着的文献,是一个巨大的知识宝库,是一种如同能源、材料和劳力一样的重要资源。能否充分地利用这种资源,直接影响到一个国家的科学、教育、文化和经济的发展。科学技术是第一生产力。生产率的提高已愈来愈依赖于信息的传播和有效利用。信息事业是否发达,