第二章信息检索方法12.1检索的概念及原理2.2检索工具概述2.3检索方法及检索途径2.4检索式的拟订2.5检索步骤22.1信息检索的概念一、信息检索的基本概念狭义:是指依据一定的方法,从已经组织好的大量有关文献信息集合中,查找并获取特定的相关文献信息的过程。广义:将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。3信息检索的类型(根据不同的检索对象):一、数据检索:检索的结果是数据。如某种材料的电阻;某变压器的参数;化学分子式、数据图表等(手册),某地方GDP增长情况(年鉴)二、事实检索:检索的结果是事实结论。查询某一事物(事件)的性质、定义、原理以及发生的时间、地点过程等。如某产品是哪个厂家生产,哪个牌子的最好;第一颗人造卫星是什么时候升空的(年鉴)三、文献检索:检索的结果是文献资料。查找相关文献的内容、出处、收藏单位等。如系统地查找信息检索方面的相关文献(论文)文献检索是信息检索的一种最基本的、最主要的形式。4检索工具是人们用来存储、报道和查找各类信息的工具。一、检索工具的定义及类型2.2检索工具概述5数据库的类型书目数据库全文数据库文摘数据库按信息处理层次划分期刊论文数据库书目及图书全文数据库专利数据库学位论文数据库产品数据库按收录的文献类型划分图像数据库文本数据库数值数据库声音数据库视频数据库多媒体数据库按媒体信息划分综合性数据库专业性数据库按收录文献信息的范围划分单机数据库联机数据库网络数据库按服务模式划分6索引数据库(一)按著录信息的特征划分著录是指编制检索工具时对文献的内容和形式特征进行分析、选择和记录的过程。索引型检索工具目录型检索工具文摘型检索工具全文型检索工具71、索引型检索工具索引一般是附在专著或年鉴、百科全书等工具书之后以及收录内容较多的二次文献之后,按主题词、人名、地名、事件、概念等内容要项编排,按其内容可分为主题索引、分类索引、关键词索引、引文索引。图2-2《中国大百科全书》的一例索引8目录能反映一定历史时期科学文化发展的概貌作用:了解本学科的研究历史和研究现状。通过各类书目,可查寻与研究课题密切相关的事实和资料。按收录的范围可分为:馆藏目录、出版社目录、国家书目、联合目录。2、目录型检索工具9各时期有代表性书目:《TheWholeEarthCatalog》、《四库全书总目提要》、《民国时期总书目》、《中国国家书目》、《全国总书目》、《全国新书目》。联合目录主要有:CALIS联合目录和OCLC联机目录。CALIS(中国高等教育文献保障系统)提供以中国高等教育数字图书馆为核心的中国高校图书馆联合目录。OCLC(联机计算机图书馆中心)是世界上最大的提供网络文献信息服务和研究的机构。103、文摘型检索工具特点:具有摘要,提供文献的外表特征和内容特征。如:《中国生物学文摘》、美国《化学文摘》作用:帮助读者快速判断文献内容,节省阅读时间替代原文11图2-3EI的一例文摘12特点:提供全文下载4、全文型检索工具13elsevierwiley(二)按所收信息的学科内容划分:综合性检索工具涉及多学科,收录范围广。专科性检索工具能够比较集中、迅速准确和全面地反映某学科领域的最新发展状况和最前沿的科研水平。详细完整的专业信息极具针对性。14二、检索工具的选择考虑学科范围、信息类型和数据量【例题】用____检索α-呋喃甲醇羧酸酯的合成、含有碳和氢元素的化合物的英文综合学术性文献。A.外文Elsevier数据库B.外文农业类CAB文摘数据库C.外文农业类AGRICOLA数据库D.外文食品科技文摘数据库FSTA15了解收录的文献类型【例题】已知参考文献:王涛.土木工程CAD.中国水利水电出版社.2012.要找原文,使用____检索《土木工程CAD》。A.中文科技期刊数据库B.中国人民大学报刊全文数据库C.国务院发展研究中心信息网D.图书馆的馆藏查询16【例题】使用——检索CN200920135079.3一种土木连锁建筑结构。A.维普中文科技期刊数据库B.图书馆馆藏查询C.中国人民大学报刊全文数据库D.中国国家知识产权局专利数据库E.中国国家科技图书文献中心(NSTL)17【例题】用——检索编号是GB/T17302.2-1998的文献A.中国国家知识产权局专利数据库B.中国国家科技图书文献中心(NSTL)C.国务院发展研究中心信息网D.中国标准信息服务网18考虑信息的时间范围同一个数据库版本不同,时效性也不一定相同。例如图书馆收藏的《工程索引》(EI)各种载体及馆藏的简况比较:印刷版(EI)月刊,年度更新,收录文献源2600种,馆藏年限1968-1996。光盘版(EiCompendex)季度更新,收录文献源2600种,馆藏年限1970—1997年。网络版(EiCompendexWeb)包括光盘版(EiCompendex)和EiPageOne两部分,半月更新,收录文献源5000种,馆藏年限1970至今。因此网络版(EiCompendexWeb)信息更新最快,量最大。192.3检索方法及检索途径检索方法:1.常规法:所谓常规法就是利用常规检索工具查找有关文献的方法顺查法、倒查法、抽查法2.引文法就是查找参考文献或引用文献的方法。由远及近地搜寻;由近及远地追溯3.综合法引文法和常规法结合20思考:信息检索就是从一定的文献集合(即检索系统)中查找出符合特定需要的文献,那么这个过程是如何实现的呢?21标引检索输出存储过程一次信息信息特征信息特征标识检索过程检索课题检索提问检索提问标识分析分析标引输入图2-4信息检索原理图检索结果信息检索语言检索系统存储信息与检索信息所依据的规则不一致22检索语言是应文献信息的加工、存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。23按照其结构原理来划分,信息检索语言主要有:信息检索语言分类语言名称语言主题语言代码语言引文语言等级体系分类语言分面组配分类语言标题词语言元词语言叙词语言:自行车、脚踏车、单车——自行车关键词语言24检索途径25常用字段缩写:TI——Title文章题目AB——Abstract文章摘要KW——KeyWord关键词AU——Author作者AF——Affiliation作者单位SO——Source文章来源(刊名信息等)ISSN(ISBN)——InternationalstandardSerial(book)NumberPY——Publicationyear出版年LA——Language语种261、主题途径2、分类途径3、责任者/刊名途径4、号码途径检索途径27主题途径是采用反映文献主题概念的检索词作为检索入口的一种检索途径,也是最常用、最重要的检索途径。主题“是一组具有共性事物的总称,用以表达文献所论述和研究的具体对象和问题”,即文献的“中心内容”。每种文献都包含着若干主题,研究或阐述一个或多个问题。1、主题途径28主题途径的优缺点通常适合特性检索,查准率高;不适合族性检索,查全率低【实例】主题词“C语言—程序设计”就比分类号TP312表达得更准希望专指度高时采用主题途径。29【获取主题词的技巧】在图书的版权页可以找到在版编目里面的主题词和分类号码。或者在图书馆的馆藏数据找到主题词。【实例】版权页样例如右图所示302、分类途径(1)图书期刊分类法(2)专利分类法(3)标准文献分类法(4)分类途径的优缺点31(1)图书期刊分类法世界三大图书分类法:《杜威十进分类法》(DDC)(DeweydecimalClassification)《国际十进分类法》(UDC)(UniversalDecimalClassification)《国会图书馆图书分类法》(LCC)(Librarycongressclassification)中国图书分类法:《中国图书馆分类法》(中图法)《中国科学院图书馆分类法》(科图法)《中国人民大学图书馆分类法》(人大法)32《中图法》介绍《中图法》——《中国图书馆分类法》,以学科来组织知识,将全部知识领域划分为5个基本部类,22大类。五大部类分别为:马列主义、毛泽东思想;哲学;社会科学;自然科学;综合性图书。33A马克思主义、列宁主义毛泽东思想、邓小平理论B哲学、宗教C社会科学总论D政治、法律E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史、地理N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科学T工业技术U交通运输V航空、航天X环境科学、安全科学Z综合性图书U1综合运输U2铁路运输U4公路运输U6水路运输[U8]航空运输U41道路工程U44桥涵工程U45隧道工程U46汽车工程U48其他道路运输工具U49交通工程与公路运输技术管理U441结构原理、结构力学U442勘测、设计与计算U443桥梁构造U444桥梁建筑材料U445桥梁施工U446桥梁试验观测与检定U447桥梁安全与事故U448各种桥型U449涵洞工程图2-4《中图法》结构示意图简表马列哲学社会科学自然科学综合基本大类详表34T类又可分为以下几类TB一般工业技术TD矿业技术TE石油、天然气工业TF冶金工业TG金属学、金属工艺TH机械、仪表工艺TJ武器工业TK动力工程TL原子能技术TM电工技术TN无线电电子学,电信技术TP自动化技术,计算机技术TQ化学工业TS轻工业、手工业TU建筑科学TV水利工程35《中图法》从大类到小类,层层展开,不断细分,形成完整的知识体系。例如:关于红楼梦研究资料的分类为I207.411I文学I2中国文学I207文学评论和研究I207.4小说研究I207.41古代小说研究I207.411《红楼梦》研究与评论36【例题】《哲学辞典》类号为:B-61【例题】《法国的货币与银行》的类号为:F825.6537【例题】在图书馆公共查询系统中检索游记小说:I267.438(2)专利分类法专利分类法是根据专利的功能(效果)或其用途所属的行业部分来分类,目前,世界上大部分国家采用国际专利分类法(Interna-tionalPatentClassification,简称IPC)国际专利分类法(简称IPC),IPC是世界上应用最广泛的专利分类体系,覆盖了世界所有专利文献的95%。IPC适用于发明和实用新型专利的分类。我国于1997年正式加入IPC联盟。39部号部名分部名部号部名分部名A人类生活必需农业E固定建筑物建筑食品;烟草钻进;采矿个人或家用物品保健;娱乐B作业;运输分离;混合F机械工程;照明;采暖;武器;爆破发动机和泵成型一般工程印刷照明;加热交通运输武器;爆破C化学;冶金化学G物理仪器冶金核子学D纺织;造纸纺织或未列入其他类的柔性材料H电学造纸IPC分类简表第2讲信息检索基础404142(3)标准文献分类法世界各国的标准分类法同文献资料分类法类似,或以数字为标记、或以字母为标记、或以字母和数字混合为标记。我国的标准分类法采用混合标记,一级类目以专业划分,用字母表示类号,二级类目采用等级列类方法用双位制数字表示。排检时先按照字母顺序,大类相同再按双位数字顺序排列。中国标准分类法(ChineseClassificationforStandards,简称CCS)【部分分类】A综合……………………………………00/09标准化管理与一般规定10/19经济、文化20/39基础标准40/49基础学科50/64计量65/74标准物质75/79测绘B农业林业………………………………00/09农业、林业综合10/14土壤与肥料15/19植物保护20/29粮食与饲料作物30/39经济作物40/49畜牧50/59水产、渔业43(4)分类途径的特点1)通常适合族性检索,查全率高;不适合特性检索,查准率低2)不能适应学科发展中的变化,难以反映新学科和新名词术语44【实例】食品风险分析是保证食品安全的一种新模式,同时也是一门正在发展中的新兴学科。风险分析的目标在于保护消费者的健康和促进公平的食品贸易。目前的文章在分类上暂时归入