13级生物科学(生物学基地班)信息检索考试要点(Word版)考试题型:考试分试卷一,试卷二两部分,试卷一:(客观题80分)(一)单选(20题,20分)(二)多选(20题,40分)(三)判断(20题,20分)试卷二:(20分)(四)填空题(20空,10分)(五)实务题1、写检索式(三题,6分)2、调整检索策略(4分)13级生物科学(生物学基地班)第一章绪论信息素质:在信息化时代,人们认识、利用和创造信息的品质与素养,它是创新人才应具备的素质。信息素质由信息意识、信息知识、信息能力和信息道德素质四部分构成。信息:是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。信息具有客观性、时效性、共享性、价值性、传递性、开发性知识:是人们在改造世界的实践中所获得的认识和经验的总和,是人的大脑通过思维重新组合的系统化的信息集合。知识具有意识性、信息性、实践性、规律性、继承性、渗透性情报:是为了解决一个特定的问题所需要的激活了、活化了的特殊知识或信息。情报具有知识性、传递性和效用性三个基本属性。文献:凡是记录有信息或知识的一切载体均为文献。文献具有三个基本功能:存贮知识、传递信息和交流信息;四个基本要素:知识内容、记录符号、物质载体和记录手段。文献信息资源类型划分标准:一、按物质载体和记录形式划分划分标准文献类型载体及记录手段印刷型(含手写型)、缩微型、机读型、声像型内容加工深度(文献的级次)一次文献(含零次文献)、二次文献、三次文献出版形式及内容图书、期刊、报纸、特种文献等十大文献13级生物科学(生物学基地班)类型1)印刷型载体纸张等记录手段手写、印刷、打印、复印种类图书、报刊、特种资料等优点便于阅读及广泛流传,成本低缺点存储密度低,所占空间大,保管耗较多人力物力,难于实现自动化类型2)缩微型载体感光材料记录手段缩微拍摄种类缩微平片、缩微胶卷、全息胶片优点体积小,存储密度高,成本低,传递较为方便缺点不能直接阅读,需要借助于缩微阅读机,存储要求较高类型3)声像型载体磁性、感光材料记录手段机械装置输入种类唱片、录音带、录像带、光盘等优点高密度存储,直观、真切,图文并茂,制作快缺点不能直接阅读,需要先进的技术设备,制作成本稍高13级生物科学(生物学基地班)类型4)机读型载体磁性、感光材料记录手段键盘、扫描等方式输入种类磁盘、磁带、光盘等优点存储密度高,存取速度快,变更记录,易于实现自动化,便于实现信息共享缺点需要先进的技术设备才能“读出”、制作成本较高二、按加工深度划分一次文献:以作者本人的科研、生产和工作成果为依据创作而成的文献。二次文献:对无序的一次文献进行加工、整理、提练和浓缩汇集而成的系统完整的便于检索和提取的文献三次文献:在利用二次文献基础上,对大量的一次文献进行综合、分析、研究后撰写的文献。13级生物科学(生物学基地班)三、按出版形式对原始文献(一次文献)进行划分1)图书:内容比较系统、全面、完整、成熟、可靠,有一定的新颖性、连续性,但编辑出版稍长,专递信息的速度慢,一般只能反映3-5年前的研究水平。适用于对某一领域获得一般的知识、一般的了解或问题的解答。分为:阅读性图书和工具书国际标准书号(ISBN):组号+出版者号+书名号+较验位(从2007年1月1日起,国际标准书号升级为13位。如ISBN978--7--5341--1951—0/G.362,现有的出版机构在原ISBN号结构前加上一个三位数字的前缀“978”,新成立的出版机构则加上前缀“979”)图书的参考文献的标准著录格式是:作者、书名、出版地点、出版社、出版时间。有时还有版本号和国际标准书号2)期刊:内容新颖、信息量大、出版周期短、传递信息快、传播面广、时效性强,能及时反映国内外各学科领域的发展动态。据统计,科技人员所获取信息的65%以上来源于期刊,它是十分重要和主要的信息源和检索对象。期刊有国际标准刊号(ISSN)和国内统一刊号。种类:(1)学术性、技术性刊物(2)检索性刊物(3)其它类型期刊,如快报性刊物、消息性刊物、科普性刊物等期刊论文的参考文献的标准著录格式是:作者、论文题名、出处项(期刊名、出版年、卷号、期号、起止页码)。3)报纸:报纸以刊载新闻和评论为主的出版周期较短的定期连续性出版物。特点:传递信息快,信息量大,现实感强,传播面广,具有群众性和通俗性。按出版周期可分日报、周报等。13级生物科学(生物学基地班)通常我们把期刊、报纸合称报刊4)会议论文内容:同一个会议的文献论题集中,内容新颖、丰富、专深、学术性强,能反映某一学科或专业最新的成果水平和发展动态,与其它文献交叉重复的现象比较严重。流通面不广。分类:按会议议程:会前、会中和会后型。按组织者:国际会议文献、全国会议文献、省级、地区级和基层。5)专利文献内容上具有新颖性,创造性,实用性。外表上有统一的书写格式,统一的标记符号,是一种法律性的文献。我国专利类型:发明专利实用新型专利和外观设计专利6)标准文献按成熟程度:法定标准、推荐标准、试行标准。按使用范围:国际标准、区域标准、国家标准、行业标准、企业标准等。按标准化对象:技术标准、管理标准和工作标准三大类。7)学位论文学位论文有博士论文、硕士论文、学士论文之分,其研究水平差异较大,博士论文论述详细、系统、专深,研究水平较高,参考价值大。(1)有独创性和学术性(2)一般不出版发行,属于非卖品,故收藏有一定困难,只有授予学位权力的单位才有收藏能力学位论文分博士、硕士、学士论文。第二章信息检索基础信息检索的含义广义:包括信息存贮和信息检索两个过程。信息存贮:指依一定的规则和方式把信息整序编排组织成文献集合体的过程,即编制检索工具和建立检索系统的过程。信息检索:指利用编制好的检索工具或检索系统来查找信息用户所需信息的过程。狭义:仅指后者。二、信息检索的类型13级生物科学(生物学基地班)文献检索:对象是书目信息(目录、题录、文摘或全文、引文)相关性检索,结果不确定数据检索:也称数值检索,对象是数值性数据(数值、公式、图表等)。结果确定事实检索:又称“事项检索”,对象是事实(事物发生的时间、地点及过程或事物的性质、定义、原理等),结果确定三、信息检索系统信息检索系统:是指为满足信息用户的信息需求而建立的、存贮经过加工了的信息集合,拥有特定的存贮、检索与传送的技术装备,提供一定存贮与检索方法及检索服务功能的一种相对独立的服务实体(包括人和检索工作单位),统称为信息检索系统(InformationRetrievalSystem,简称IRS)。13级生物科学(生物学基地班)(3)数据库的结构从使用者观点看,数据库主要由“字段—记录—文档”三个层次构成。一行即为一个记录,它标明一篇文献一列即为一个字段,反映文献的某一属性,是数据库中最小单位众多的记录积累就形成文档13级生物科学(生物学基地班)检索语言的概念及作用文献信息检索语言:是用来描述文献特征和表达信息提问,沟通信息标引人员和信息检索者双方思想的一种人工语言。作用:①表达描述信息内容和信息需求;②对内容相同或相关的信息加以集中或揭示其相关性;③对大量信息加以系统化和程序化;④便于用户进行信息检索体系分类语言:如《中图法》、《科图法》《人大法》(全称请查教材)、国外:《国际十进制分类法》、《杜威十进制分类法》标题词语言:如1993年以前的《工程标题词表》单元词语言:如《WPI—规范化主题词表》叙词语言:如《汉语主题词表》主题分类一体化:如《中国分类主题词表》主题语言选介(标题词、叙词、关键词)主题语言:以直接表达信息概念的词语标引和检索信息。主题词规范化:所谓的规范化是指对自然语言中的同义词进行优选,对词的不同形式进行归一,对近义词进行合并,对多义词进行注释,对简称进行补全,对俗称进行引进等,这些词语用词表固定下来,便可保证一种事物只用一个主题词表达。例如:“马铃薯、土豆、洋芋”先组式检索语言:指在检索之前,表述文献主题概念的标识已经事先拟定好了的检索语言,如标题词语言、体系分类语言等。后组式检索语言:它是指表达文献信息主题概念的标识,在编制检索语言词表和标引文献时,都不预先固定组配,而在检索进行时,根据检索的实际需要,按照组配规则临时进行组配的检索语言。后面所讲的叙词检索语言则属于此种类型。13级生物科学(生物学基地班)我校图书馆索书号:分类号+著者号《中图法》构成:《中国图书馆图书分类法》是我国图书分类法的基础,中图法把一切知识门类按“五分法”分为马列、毛泽东思想、邓小平理论;哲学;社会科学;自然科学;综合性图书这五大部类。在此基础上建成由22个大类(L、M、W、Y除外),每一大类又层层细分,形成的一个有机体系系列。注意事项:(1)分类标识即分类号,由字母和数字组成(2)采用等级列举表达从属关系上位类目与下位类目的关系:上位类目一定包含其各个下位类目,而下位类目一定带有上位类目的属性。(3)分类号越长,表示的学科范围越窄。为了清楚醒目,通常在分类号的第三位数字后,隔以.,如F279.712,TQ032.4具体分类:(22大类)13级生物科学(生物学基地班)体系分类法的特点主要特点就是按学科专业性质集中信息,区分不同性质的信息,集中性质相同的信息,按照远近亲疏的关系将无序信息组织成有序体系提供从学科分类查找信息。不足:由于是先组式检索语言,缺乏进行概念灵活组配的能力,不利于特性检索;体系分类法是按学科性质建立的直线式序列结构,对全面检索边缘学科资料造成较大的困难;分类表一般几年才修订一次,因此,无法体现新学科内容。体系分类语言与主题语言的区别:比较内容分类语言主题语言结构体系以学科的逻辑体系为中心反映事物的从属、派生和平行关系以语言为中心,直接用词语作主题标引标记符号人为的标记符号不直观,较难记以自然语言中表示概念的词语作为标识,直观易记组织方式以线性序列结构为特点,其类号只代表线性序列不受科学体系限制,主题词之间完全独立比较内容分类语言主题语言提示事物提示文献研究和讨论的问题所属学科门类提示特定事物,特定对象目录组织较为容易较为复杂读者使用需要熟悉分类法,较难用需要掌握专业知识及对应的文字表述适应性体系固定,类目稳定,修改困难,适应性差不受体系约束,能较及时反映新技术,增删灵活,适应性强第三章信息检索技术计算机检索系统中常用的算符有四种:一是布尔逻辑算符;二是位置算符;三是截词符;四是字段限制符。要注意运算符应用达到的效果布尔逻辑算符:是用来处理检索词语或代码之间的逻辑关系的一种算符,是计算机检索系统最常用的算符。通常有三种:即逻辑“与”、“或”、“非”。注意:逻辑运算符运用前后的文献数量的变化逻辑“与”:这种组配关系用“AND”或“*”表示,是用来处理概念交叉或限定关系一种组配方式,能达到缩小检索范围,提高查准率的效果。(A和B的交集)逻辑“或”:用“or”或“+”连接检索概念。用来处理概念同义、相关等并列关系的一种算法,其作用是扩大检索范围,避免漏检,提高查全率。(A和B的补集)逻辑“非”:用“not”或“-”连接检索概念。用于在某一概念集合中排除含有另一概念的记录,其作用是缩小检索范围,提高查准率。(A去掉A和B的交集)位置算符:用于限定两个检索词之间的位置关系,以提高查准率,避免误检。在不同的检索系统中,所采用的位置算符不尽相同的,功能也有差异。13级生物科学(生物学基地班)注意:同一字段位置算符跟字段限制符的区别例:截词检索功能:在检索中,常会遇到一些词干相同、词头、词尾使用可随时变化,如英文有单、复数,有名词、形容词的拼法区别,以及英美拼法区别等,为了减少检索词输入量,扩大检索范围,可使用截词算符,以提高检索效率,一般用“?”和“*”表示截词符。要注意在不同的系统中,使用的符号及其含义有所不同。例:(以英文为例)无限截词:常用“*”,代表零到多个字母。例:输入cat*则catatonic、cat、cats、catatonia,category等都会在检索结果中出现有限截词:常用“?”,代表一个或零个字母。例:输入cat?则cat