1信息检索考试提纲一、【概念】1、信息——广义:通过信号带来的消息就是信息。——概念:自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互联系、相互作用等运动状态的表达。2、知识——人们在改造世界的实践中所获得的认识和经验的总和,是人的大脑通过思维重新组合的系统化的信息集合。3、文献——凡是记录有信息或知识的一切载体。——具体而言,文献是指文字、图像、符号、声频、视频等作为记录手段,将信息记录或描述在一定的物质载体上,有其特定的表现形式,并能起到存储和传播信息情报和知识作用的一切载体。——四个基本要素:知识内容、记录符号、记录手段、物质载体4、情报——为了解决一个特定的问题所需要的激活了的、活化了的特殊知识或信息。——特征:知识性、传递性、效用性二、关系:P17①包含关系文献是记录有知识的载体,知识是信息的一部分;情报来源于信息,信息包含了情报;文献包含于信息内②转化关系文献是记录有知识的载体,当文献中的知识信息传递给用户并为用户所利用时,就转化为情报。③交叉关系情报虽多来自文献,但也可能来自口头和实物信息,所以情报与信息、文献存在交叉关系。例如:感觉到天气的冷暖(信息)知道是气候的变化引起了冷和热(知识)收听天气预报得知气温变化了(文献)为了研究果树的生长规律而收集的气象资料(情报)5、文献信息检索语言——用来描述文献特征和表达信息提问,沟通信息标引人员和信息检索者双方思想的一种人工语言。6、检索工具——用来报道、存储和查找文献线索或全文的工具。7、文献信息检索概念:依据一定的方法,从已经组织好的文献信息集合中,查处说需要特定文献信息的过程。三、【文献类型的划分及判断】1、按文献的载体形式划分P9①手写型信息资源手写记录,包括泥板、羊皮纸、甲骨、卜辞、碑铭、竹简、绢帛以及后来的笔记。记录方式为人工抄写,包括手写稿、信件、日记、原始档案等。②印刷型信息资源以纸张为载体,通过铅印、油印、胶印等手段。例如各种书刊。占据空间大,不易管理保存。③缩微型信息资源以印刷型文献为母本,以感光材料为载体。包括缩微胶卷、缩微平片、缩微卡片。节省空间,保存时间长,不易损坏,但必须借助微缩阅读机,设备投资较大。④声像型信息资源采用录音、录像、摄影、摄像等手段,将信息记录在光学材料、磁性材料上。例如磁带、磁盘、光盘、软盘等。存储密度高、直观、真切,尤其适于记录用文字、符号难以描述的复杂信息和自然现象,但是不能直接阅读,费用高。⑤机读型信息资源以磁性材料为载体,以磁录技术为记录方式。以数字代码方式将信息存储到磁、光、电介质上。存储信息2密度高、存储速度快、读取速度快、原有记录可更改、易于实现资源共享、易于网络化和网络化程度高、高速度远距离传输信息。2、按文献的出版形式划分P10(1)图书:作者、书名、出版地点、出版时间、出版社、版本号、ISBN内容比较成熟全面、系统可靠;但是出版周期长,传递信息速度慢分为A.阅读型图书a.教科书b.专著(学术著作)c.技术书d.文集e.丛书B.参考工具书例如:字词典、类书、政书、百科全书、年鉴、手册、名录、图谱、传记资料etc。(2)期刊:作者、论文提名、期刊名、出版年、卷号、期号、起止页码定期或不定期的连续出版物。(3)报纸以刊载新闻和评论为主的定期出版物。特点:时事性、普及性、大众性、服务性、传递速度快、信息量大、保存性、便览性、集纳性最具影响力的“第一传媒”(4)特种文献:○1科技报告对科学、技术研究结果的报告或研究进程的记录。大部分报告秘密发行,小部分公开。○2会议文献在各种科技会议上,宣读和交流的论文、报告及其他的有关资料,它是科技文献的重要组成部分。特点:A.内容新颖,及时性强B.学术水平高,专业性强,可靠性强C.数量庞大,内容丰富;出版形式多样按出版时间的先后可分为:会前文献、会中文献、会后文献○3专利文献由政府专利机构出版的、有创造发明的设计、制造工艺的详细说明,表明在一定年限内发明所有者享有制造、使用、销售占有权的法律性文献。特点:编写格式统一、出版快、内容新颖、技术性强、实用性强、具有法律效力。寓技术、法律、经济情报于一体。○4标准文献对重复性事物或概念所作的统一规定。是一种规章性的技术文献,具有一定的法律约束力。一个标准解决一个问题,标准的新陈代谢频繁。按标准化对象分为:技术标准、管理标准、工作标准按审批机构的级别和标准的使用范围,我国分为:国际标准、国家标准、部颁标准、企业标准国外分为:国际标准、区域标准、国家标准、专业(部)标准、企业标准按内容特点可分为:方法标准、术语标准“GB”——我国的强制性国家标准(具有法律属性)“GB/T”——我国的国家推荐性标准“ZB”——专业标准“NY/T”——我国的一项农业推荐标准标准号—每个标准的编号,由权利机构代号、顺序号、制定年份组成例如:GB3559-2001○5学位论文3○6政府出版物各国政府部门及其所属机构所出版的文献。分为行政性文件和科技性文件政府出版物大部分公开,少数保密,但若干时间后则予以公开○7产品资料各国厂商为了推销产品而出版发行的一种商业性宣传资料。特点:图文并茂、形象直观、出版发行快、鲜明的商业性质,较散○8技术档案在自然科学研究、生产技术、基本建设等活动中形成的应当归档保存的科技文件。特点:内容真实详尽具体可靠、保密性强、保存期长3、按文献的加工深度划分P17①零次文献——未经出版发行或未进入社会交流的最原始的文献。例如:私人笔记、工程图样、实验记录、论文草稿、发言稿、会议记录、私人信件、绝密文件、技术档案等。特点:信息量丰富、内容新颖、不成熟、难以获得②一次文献(原始文献)——以作者本人的生产或科研工作成果为依据所记载的例如:科学专著、独创部分的学位论文、科研报告、专利说明书、会议文献、期刊论文等。特点:“第一手资料”内容具体详尽注!无论是否参考或引用了他人的资料,无论其载体或出版类型如何,均属于一次文献。③二次文献(检索信息工具)——对大量无序的一次文献的内外部特征(题名、作者、出处等)进行加工整理而成的各种书目、题录、索引、文摘等。特点:报道性、检索性、汇编性、简明性④三次文献(既是信息检索和利用的对象,又是检索信息的工具)在二次文献的基础上,将搜集到的一次文献进行再加工的产物特点:综合性强、系统性好、知识面广、有的还具有检索功能例如:综述、专题述评、学科年度总结、进展报告、数据手册、年鉴、百科全书、名录、图录、表谱、指南等。四、【文献重要外表特征】1、国际标准书号(ISBN)P112007年以前10位数ISBN7-5341-1951-0/G.362①②③④⑤4①——地区或语种号0-美语、1-英语、2-法语、3-德语、4-日语、5-俄语、7-汉语等②——出版者号①②合称“出版者前缀”,是一个出版者的标准代号。③——书序号④——计算机校验码⑤——《中图法》基本大类类号和种次号2007年以后13位数ISBN978-7-5341-1951-0/G.362(13位)现有的出版机构在原ISBN号前+“978”,新成立的出版机构+“979”。2、国际标准刊号(ISSN)P13ISSN1001-8867由8位数字组成3、国内统一刊号CNP13CN11-2746/G2由地区号(2位数)+序号(4位数),分类号4、专利号ZL+年代号(2位数)+专利类型(1位数)+流水号(5位数)+计算机校验码例子:ZL02346023.7、ZL200420034660.3注:2004年以后,年代号使用4位数,流水号使用7位数专利类型:1—发明专利、2—实用新型专利、3—外观设计专利五、【文献信息检索语言类型及判断】P33A.按规范化程度分为:自然语言(未规范化语言)、受控语言(规范化语言)B.按表达信息的特征分为:描述外部特征语言、描述内部特征语言1、文献外部特征语言(较简单)以文献上客观存在显而易见的外部特征(题名、作者姓名、机构、出版地、出版社、ISBN号、ISSN号、专利号、标准号等)作为检索依据2、文献内部特征语言(较复杂)对文献的内容进行分析判断而得出的主题概念或学科类别,按一定结构和规则加以描述的人工语言。如:分类号、主题词等六、【主题词检索语言类型】1、标题词:最早出现的,他是用规范化了的语词来标引文献主题,并按字顺序排列标识的方法2、单元词:从文献何种抽取出来的,经过规范化处理的,能表示文献主题的最基本、概念上不能再分的最小的语词单位,又称元词。3、叙词语言:为了适应计算机检索的需要产生的,特点具有概念组配性,通过概念组配来表达主题,它吸收了标题语言的优点编制了常见著录项目。4、关键词:是直接以能够表达文献主题概念的关键词作为主题表示的一种主题组织法。(2)主题途径检索:题名、关键词、主题、摘要、全文任意字段.直观、灵活,检索词源于自然语言。适合:专指性较强的,狭窄主题,或多科学、跨科学等多位复杂的特性检索。七、【分类法的分类原则和分类号结构】P35+P93学科专业角度,适用:专业较单一、明确的文献主题检索,或泛指性较强的族性检索。1、我馆书刊索书号图书:G210.7/X165期刊:F4/710.32、《中国图书馆分类法》中图法(最通用):基本部类5、基本大类22、简表、详表、复分表(1)22个基本大类,逐级展开为二级、三级、四级......类目5例如:I“文学”——一级类目I2“中国文学”——二级类目I24“小说”——三级类目I242“古代至近代作品”——四级类目I242.4“章回小说”——五级类目被区分的类为上位类,区分出来的类为下位类(2)分类表的类号每增加一位字母或数字代表增加一级分类(3)“工业技术”所属的二级类目用双字母表示,如“TB、TD、TE...”(4)分类号的三位数后,用“.”隔开,例如I242.4(5)O17数学分析(按学科专业归类)(6)《中图法》特点:A、能体现学科的系统性B、揭示事物纵向的隶属性和派生关系以及横向的平行关系C、简单明了D、直线型序列结构,难以适应复杂的主题概念E、类目预先确定,灵活性差3、中国科学院图书馆图书分类法51.6数学分析(按学科专业归类)4、国际专利分类法IPC(最重要、使用最广泛的一种专利分类法)采用功能和应用结合的分类原则,按发明的技术主题设置类目,以等级形式逐级分类分类号采用英文大写字母和数字混排由部号、大类号、小类号、主组号、小组号组成,例如:A01B1/02部号用大写字母A-H表示,分部只有标题没有类号;大类号=部号+2位数字例如:B01D01/02;小类号=大类号+1个字母,但A、E、I、O、U、X6个字母不能用;主组号=小类号+1-3位数+/00,例如:F04D29/00分组号=主组号+一个除00以外的至少两位数字(斜线后的2-5位数字),例如:F04D29/30PS:斜线后的数字不表示等级关系A63B53/12金属长柄的高尔夫球棍(按功能和用途归类)八、【信息检索的类型】(根据检索对象和目的不同划分)P43检索类型文献检索数据检索事实检索检索对象原始文献的线索或原文数值数据已存在的事实利用工具检索工具或书目型数据库参考工具书或数据型数据库参考工具书或事实型数据库检索结果相关的文献确定的数据已确定的事实或有关的数据【检索工具的类型及判断和著录格式】P51(按著录文献的特征划分)1、目录(书目):以单位出版物为著录对象。如:一本书或一种期刊揭示出版物外表特征的检索工具著录包括:出版物名称、责任者(著者、编者或译者)、出版项(出版地、出版社、出版时间、版次等)和稽核项(开本、ISBN号、价格等)著录格式示例:物流信息技术与应用/孟军齐编.-北京:人民交通出版社,2009.04.-26cm.-ISBN978-7-220-07784-5:¥33.00常见的目录型检索工具:国家书目、馆藏目录、联合目录、出版社目录、专题文献目录等。2、题录:以单篇文献为著录对象。如:一篇文章或一本书中的某一章节6揭示文献外表特征的检索工具著录包括:题录号、文章题名、著者及其工作单位、文献出处(刊名、年、卷、期、页码)等。著录格式示例:080910413存款保