文献检索-第二章文献检索基本知识(100829)(包括第三章)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第二章信息检索基础知识第一节检索基本原理第二节检索语言第三节检索工具基础知识第四节检索途径和检索步骤第五节主要检索技术第一节检索基本原理信息用户(检索者)根据自己的需求将检索提问标识与存贮在检索系统中的文献(信息)特征标识(又叫检索标识)进行比较;比较结果凡是检索提问标识与文献(信息)特征标识相一致,或者文献(信息)特征标识包含了检索提问标识(即两者完全相符或部分相符),那么具有这些特征标识的文献就从检索系统中输出(即为命中文献)。(见示意图)第二节检索语言一、检索语言的定义:从上节“检索原理”可以看出,必须有同样的检索标识系统(即检索语言)来标引文献特征和检索提问,这是文献检索成败的关键。这就要求信息标引人员和信息用户应当具有必要的检索语言的基本知识。文献检索时,检索标识和用户提问都需要用一定的语言来表达,这种标引人员表达检索标识和信息用户(检索者)表达检索提问所共同采用、共同理解的语言,就是信息检索语言。二、检索语言的种类1、按表达文献特征划分检索语言描述文献外部特征描述文献内容特征学科分类—分类索引描述文献内容特征分析单元性概念—叙词索引、单元词索引所包含的关键词—关键词索引研究对象—主题索引分子式、结构式—分子式索引、结构式索引地理位置等特种内容—经纬度索引等特种索引2、按结构划分分为分类语言、主题语言、代码语言、引文语言。(1)分类语言分类是人类思维的一种最基本的形式。分类语言(又叫分类法)是以学科分类为基础,按照概念划分的原理,将知识概念从一般到具体,从简单到复杂,从低级到高级的逐级划分。每划分一次就形成一批并列的概念—下位概念(下位类),它们同属于一个被划分的概念—上位概念(上位类)。分类语言就是用分类号和类目名称表达学科体系的各种概念,将各种概念按学科性质进行分类和系统排列。体现这种分类体系的就是各种图书分类法(表)。例如在我国广泛使用的《中国图书馆分类法》(简称《中图法》)就是其典型代表。《中国图书馆分类法》(原称《中国图书馆图书分类法》)是我国建国后编制出版的一部具有代表性的大型综合性分类法,是当今国内图书馆使用最广泛的分类法体系,简称《中图法》。《中图法》初版于1975年,1980年出版的第二版,1990年出版的第三版,1999年出版的第四版,2010年9月出版了第五版。《中图法》是以科学分类和知识分类为基础,并结合文献内容特点及形式特征进行逻辑划分和系统排列的类目表,它是类分文献、文献分类排架与分类检索、编制分类检索工具的工具。目前,它在全国图书信息资料组织等方面应用最为广泛。《中国图书馆分类法(中图法)》(第四版)简介《中图法》类目体系是一个层层展开的分类系统。它以科学分类为基础,结合文献分类的需要,在五大部类的基础上展开,组成22个基本大类(即一级类目),这五大部类及其展开的22个基本大类是:马克思主义、列宁主义、毛泽东思想……哲学……社会科学……(扩充为9个基本大类)自然科学……(扩充为10个基本大类)综合性图书……A——马克思主义、列宁主义、毛泽东思想、邓小平理论B——哲学、宗教C——社会科学总论D——政治、法律E——军事F——经济G——文化、科学、教育、体育H——语言、文字I——文学J——艺术K——历史、地理N——自然科学总论O——数理科学和化学P——天文学、地球科学Q——生物科学R——医药、卫生S——农业科学T——工业技术U——交通运输V——航空、航天X——环境科学、安全科学Z——综合性图书O数理科学和化学(一级类目)O1数学(二级类目)O3力学O4物理学O6化学O61无机化学(三级类目)O611化学元素与无机化合物(四级类目)(2)主题语言主题语言(又叫主题法)又按主题词性质不同分为下面三种:标题词语言叙词语言关键词语言①标题词语言它是以标题词作为文献内容标识和检索依据的一种主题语言。所谓标题词,是从文献的题目、摘要或正文中抽选出来,经过规范化处理,用以描述文献内容特征的词或词组。标题词受词表控制。标题词一般具有从属关系,如:主标题词和副标题词(或称一级标题词和二级标题词)。②叙词语言它是以叙词作为文献内容标识和检索依据的一种主题语言。叙词是从文献的题目,摘要或正文中抽取出来,用以表达文献基本内容的概念单元。叙词受词表控制,词表中词与词之间无从属关系,都是相互独立的概念单元。检索时,利用这些概念单元组配起来,表达一个复杂的概念。叙词语言特别适用于计算机检索。③关键词语言它是以关键词作为文献内容标识和检索依据的一种主题语言。关键词是从文献的题目、正文或摘要中直接抽取出来,未经规范化处理的自由词汇。关键词不受词表控制,标引文献时根据文献内容选择恰当的词汇进行组配,以表达文献的内容特征。第三节检索工具基础知识一、什么是检索工具?检索工具是积累和查找文献线索的工具。它报导文献的存在,揭示文献的内容,帮助科技人员鉴定和选择文献、开发和利用文献资源。检索工具具有存贮和检索两方面的功能。检索工具应具备的五个条件:1、有明确的收录范围;2、有完整明了的文献特征标识;3、每条文献条目中必须包含有多个(一般至少是3个)有检索意义的文献特征标识,并标明供检索用的标识(即标目);4、全部条目科学地按一定规则组织成为一个有机整体;5、有索引部分,提供多种必要的检索途径。二、检索工具的种类主要有以下几种划分方法:1、按著录内容划分(1)目录:它是对图书、期刊等单位出版物外表特征的揭示和报导;是记录具体出版物和收藏单位情况的工具。目录通常以一个完整的出版单位或收藏单位为著录的基本单位。(2)题录:它是对单篇文献外表特征的揭示和报导。题录的著录项目有:文献篇名+著者+文献出处(3)文摘:它是系统著录、报道、积累、检索文献外表特征和内容特征的检索工具。文摘的著录项目有:题录的著录项目+文章内容摘要(文摘)文摘分为两种:指示性文摘:文摘内容比较简单。一般在100字左右,简明扼要地介绍文献的主题、研究方法、结论、用途等。报道性文摘:是对原文内容的高度浓缩。一般字数为200~300字。这种文摘信息含量大,参考价值高。在文摘类刊物中,有时是指示性文摘、报道性文摘和题录并用。(4)索引:通过一定线索而引导出所要查找的文献资料的工具称索引。在检索工具中,一般是附在文摘正文的后面。索引的种类很多,如主题索引、分类索引、作者索引、专利索引等。2、按信息处理手段划分:(1)手工检索工具(2)计算机检索工具3、按出版形式划分:(1)期刊式检索工具;(2)单卷式检索工具;(3)附录式检索工具;(4)卡片式检索工具;(5)胶片式检索工具;(6)磁带式检索工具;(7)电子式检索工具4、按收录文献的内容范围分为综合性检索工具和专业性检索工具。三、数据库1、数据库的类型题录型数据库(对应于题录)、文摘型数据库(对应于文摘)、数值型数据库、事实型数据库、全文数据库。2、数据库的组成数据库→文档→纪录→字段许多文档构成了完整的信息检索的数据库。表2.3数据库常用检索字段列表四、检索工具中的缩写和音译1、单词的缩写2、学会简称3、刊名缩写关于刊名缩写,有统一的国际标准,现择其主要数条简述如下:(1)单词缩写单词缩写方法基本上同一般单词缩写类型,但有一些限制。国际标准列出了刊名用的缩写词。(2)词序缩写刊名时,词的顺序一般同原刊名。(3)缩写点刊名中所有缩写词尾,或者全部加缩写点,或者全部不加缩写点。(4)冠词、连词和介词①刊名中这三类词一般都删掉。②介词是刊名的首词时应予保留③含义相当于“和”的连词,应该用代号“&”保留在刊名内,以便区别相同的缩写刊名。(5)大写用法每个缩写词的首字母大写。(6)单词刊名只用一个单词(不计介词)命名的刊名不予缩写。(7)相同缩写刊名两种刊名缩写后相同时,应注明出版国或出版地。(8)分册对于有分册的刊物,缩写刊名时,分册特征不能省略。分册若有代码,可省去分册名。刊名全称与缩写对照举例:•IEEETransactionsonComputers缩写为:IEEEtrans.Comput.•InternationalJournalofInformationManagement缩写为:Int.J.Inf.Manage.•ProceedingsoftheInternationalConferenceonArtificialIntelligenceandLaw缩写为:Proc.Int.Conf.Artif.Intell.Law•AdvancesinModellingandAnalysisA(B)缩写为:Adv.Model.Anal.A(B)4、音译一部检索工具只使用一种文字,但它收录的文献有各种文字,因此,必须将它们翻译成本国文字,翻译有意译和音译两种。著者姓名用音译,期刊名称一般也采用音译。所谓音译,实际上是两种文字的字母彼此对译,所以又称对译。⑴英文—俄文音译P38是英文字母与俄文字母音译对照表。利用这个表,就可以把检索工具中已经音译为英文的苏联刊名和著者姓名,逐字地还原为俄文原刊名和原著者姓名。也可以利用有关工具书从音译为拉丁文的期刊名查到俄文原刊名。⑵英文—日文音译P39是美国传教士黑本(J.H.Hepburn)建立的一套拉丁字母与日文字母(假名)的音译法,常称黑本式音译法。利用该表可将检索工具中音译为英文的期刊名及日本人姓名逐字还原为日文的假名。对于用日本汉字书写的日文刊名,还要再用日语词典或日汉词典,才能查到日本汉字。(3)英语—汉语音译在检索工具中对于我国大陆作者姓名和期刊刊名均采用汉语拼音法;港、澳、台地区的人名、刊名和地名以及某些海外华人的姓名则仍采用威氏拼音法。从2000年10月起,美国国会图书馆等机构联合起来,按照预先制定的时间表,实施一系列由威氏拼音法向汉语拼音法转换的工作。刊名举例:JinShuXuebao(汉语拼音法:金属学报)ChinShuHsuchPao(威氏拼音法:金属学报)ShengwuYixueGongchengYanjiu(汉语拼音法:生物医学工程研究)QingnianXinli(汉语拼音法:青年心理)人名举例:Yang,zhen-ning(杨振宁)Yang,chen-ning(威氏拼音法)Li,zheng-dao(李政道)Li,cheng-tao(威氏拼音法)一、文献的检索途径文献检索是根据文献信息的某一特征,从各种不同的角度进行检索,即为文献的检索途径。检索途径有以下几种:第四节检索途径和检索步骤分类途径主题途径检索途径著者(作者)途径名称途径序号途径其他途径1、分类途径是按照学科分类体系来编排和检索文献的一种途径。常用的工具有“分类目录”、“分类索引”等。2、主题途径是从文献中抽选出来的,代表文献内容实质词汇——主题词,包括关键词、标题词、叙词等作为检索标识,进行文献检索的一种途径。3、著者途径是根据已知文献著者(作者)的姓名来查找文献的途径。4、名称途径这是根据文献的名称来查找文献的途径。如:“书名目录”、“刊名目录”。5、序号途径这是以文献的编号为特征编排和检索文献的途径。如:“专利号索引”、“报告号索引”等。6、其他途径有些检索工具还附有一些特殊索引,可提供从特殊途径查找所需文献的线索。如《CA》中的分子式途径、环结构式途径等。二、文献的检索步骤1、分析研究待查课题检索的目的是什么?课题属于什么学科专业?需要什么类型的文献?是只需要中文文献还是中、外文文献都需要?所需文献的年代范围等。另外,还需要了解与检索课题相关的专业背景知识、有关的专业名词、术语等。2、选择检索系统(检索工具)这就需要了解有关检索工具的收录范围和所收录的文献类型等,再结合检索课题来考虑,选择最能满足检索要求的检索工具(或计算机检索系统)。3、选择检索途径(即检索入口),找出检索标识选用什么检索途径为好,可以从以下几个方面考虑:⑴从检索课题的要求选择检索途径。⑵从检索工具的编排以及检索工具中所提供的索引种类来选择检索途径。计算机检索还包括了构造检索表达式,用于表达用户检索提问。检索途径决定检索标识,例如:分类途径→分类号和类目名称主题途径→主题词(包括标题词、叙词、关键词等)著者途径→著者(作者)姓名4

1 / 55
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功