全国工程硕士专业学位教育指导委员会推荐公共课第2章信息海洋冲浪的基本方法与技巧钟建法厦门大学图书馆2主要内容工具箱——检索系统工具箱——信息检索工具箱——检索语言信息检索五步走31.信息检索信息检索的概念信息的存储过程信息的检索过程4广义信息检索:包括信息存储与查找两个过程。(p12)狭义信息检索:指信息的查找。信息检索(informationretrieval):是指用户根据特定的需求,借助某种检索工具或检索系统,采用一定的检索策略和方法,从待检的信息源或信息集合中查找出所需信息的过程。1.1信息检索的概念Retrieval=Searching+Browsing5F252/108物资经济F25物资流通F252经济类FU252/108F252F一书的信息存储过程书的信息检索过程例如:《物流系统规划与设计》61.2信息的存储过程信息的存储过程:即将信息中具有检索意义的特征标识出来,编制检索工具,建立检索系统的过程。按照检索语言(主要是主题词表和分类表)及其使用规则对每条原始信息进行处理,形成一系列信息特征标识,组成一条记录。许多条记录形成有序的信息集合。7目录文摘索引编制概念转换主题分析信息源信息集合存储标识题名:信息获取与利用作者:杜慰纯出版社:清华大学出版社ISBN:978-7-302-19641-9主题词:情报检索分类号:G252.7········81.3信息的检索过程信息的检索过程:是根据信息特征,利用检索工具,查找所需信息的过程按照同样的主题词表或分类表分析检索需求,形成检索提问标识。依据信息存储时所形成的检索途径,从信息集合中查找与检索提问标识匹配的信息特征标识。9目录文摘索引概念转换主题分析信息需求信息集合检索标识题名:信息获取与利用作者:杜慰纯出版社:清华大学出版社ISBN:978-7-302-19641-9主题词:情报检索分类号:G252.7········10信息检索的原理信息汇集信息存储信息检索收集信息排序存储主题分析外表内容特征提问匹配显示输出存储是检索的基础和前提,检索是储存目的实现。存储和检索汇集信息思路一致,但操作过程相反。112.检索系统检索系统的概念检索系统的分类122.1检索系统的概念信息检索系统:由一定的设备和信息集合构成的服务设施。例如:中国期刊网(CNKI)、在线公共目录检索系统(OPAC)、工程索引(EI)1.问题给出需要查找资料时,首先涉及检索系统和工具的选择搜索引擎or学科导航门户or专业数据库or图书馆检索系统or纸本工具书or······132.2检索系统的分类检索系统目录检索系统全文检索系统文摘检索系统14(1)目录检索系统目录检索系统(也称书目检索系统):用于对出版物进行报道和对图书资料进行科学管理。包括:机读目录(MARC)联机公共检索目录(OPAC)——查询单个图书馆的馆藏目录及多个图书馆的联合馆藏目录适合查找图书馆所收藏的图书15(1)目录检索系统OPAC16(1)目录检索系统检索结果17(1)目录检索系统CALIS信息素养18(1)目录检索系统19(2)文摘检索系统文摘检索系统:用于对信息题录和文摘的检索,检索结果一般是文献的来源信息。检索后得到的结果,主要包括文献的题目、作者、出处和摘要等,不包含全文(但可能提供全文链接),也称二次文献检索系统。常用文摘检索系统SCI(科学引文索引)、EI(工程索引)、INSPEC(科学文摘)、ISTP(科学会议录索引数据库)适合全面了解某课题的综合情况,跟踪课题的前沿动态,分析课题的发展趋势等。20(2)文摘检索系统EI数据库检索词选择字段21(2)文摘检索系统检索结果√√22(2)文摘检索系统23(3)全文检索系统全文检索系统:集文摘检索与全文提供于一体,是目前发展较快和前景较好的一类数据库。全文也包括内容简短的事实和数据,优点:免去了费力获取原文的麻烦;提供全文字段检索常用的全文检索系统:Wiki百科、中国知网(CNKI)、ScienceDirect等24(3)全文检索系统CNKI25(3)全文检索系统检索结果26(3)全文检索系统27检索系统小结全文用户提问全文检索系统目录检索系统文摘检索系统收藏地来源信息馆藏信息282.3解决问题常用文摘检索系统EI、SCI等进行初步检索依据摘要对检索出的文献进行筛选,得到相关的二次文献依据来源出处,通过全文检索系统得到全文通过搜索引擎,对最新科研信息动态拾遗补漏常用书目检索系统如CCC\CALIS联合目录库等,以及题名293.检索语言检索语言的基础知识检索语言的分类检索运算符303.1检索语言的基础知识检索语言概念作用检索原理31检索语言的基础知识(概念)信息检索语言:用于描述信息系统中信息的内容特征和外表特征,并可以表达用户提问的一种专门语言。作用:信息存储信息检索把文献的存贮与检索、把标引人员与检索人员联系起来,以便取得共同理解、实现交流检索语言的词汇是用来表达文献主题概念而形成的检索标识。如分类号、关键词等检索语言32检索语言的基础知识(作用)文献存储子系统文献检索子系统信息群主题分析编制目录文摘索引概念转换概念转换主题分析查找用户群信息集合著录标引过程检索语言目录数据待标文献特征标识主题概念用户提问主题概念检索标识编制检索策略过程输出检索结果33检索原理信息检索的原理:用检索标识与信息的存储标识相比较,若取得一致,则为匹配,即可得到命中文献检索标识:分类号、主题词、关键词等检索语言能保证检索效率,提高检索效果的全面性和准确性。343.2检索语言的分类外表特征语言书名/刊名著者名/团体著者出版事项出版日期出版者名称编号引文按文献出版特征内容特征语言分类语言各种分类法主题语言叙词标题词关键词代码语言分子式结构式35(1)分类检索语言分类检索语言:是以号码为基本字符,用分类号和类目表达文献主题概念的检索语言。特点:是用分类号表达各种概念,根据概念之间的关系,把它们组织成一个逻辑体系。36分类语言作用:•反映知识的分类或社会实践活动的职能分工,具有较好的系统性。•把同一学科、同一专业、同一职能活动的文献集中在各个类目之下,满足族性检索(类检索)需要。37分类语言分类语言的具体表现形式是分类表,如在国内图书馆常用的《中国图书馆分类法》。分类表的作用:指导存储文献,正确标引出分类号;适用于从分类的角度检索某一类的文献。举例:信息检索与利用方面图书G252.7H319.4英语读物F25物流管理方面书籍F224.5集中大部分项目管理方面书籍38分类语言国内:《中国图书馆分类法》《科学院图书馆分类法》《人民大学图书馆分类法》国外:《杜威十进分类法》(DeweyDecimalClassificationandRelativeIndex)《美国国会图书馆分类法》(LibraryofCongressClassification)39分类语言基本大类(22大类)A马克思主义、列宁主义、毛泽东思想B哲学C社会科学总论D政治、法律E军事F经济F0经济学G文化、科学、教育、体育F1世界各国经济概况、经济史、经济地理H语言、文字F2经济计划与管理I文学F3农业经济J艺术F4工业经济K历史、地理F49信息产业经济(总论)N自然科学总论F5交通运输经济O数理科学和化学F59旅游经济P天文学、地球科学F6邮电经济Q生物科学F7贸易经济R医药、卫生F8财政、金融S农业科学T工业技术U交通运输V航空航天X环境科学、劳动保护科学Z综合性图书每一个大类又可以细分成若干个二级类目,二级类目还可以再细分。例如经济又可以划分为:40分类语言索书号G252.7200G254.12/B125著者号分类号(A,B,C,D,E,F,G,H,I,J,K,N,O,P,Q,R,S,T,U,V,X,Z)TP312BA/126著者号表示图书作者,由数字(中日文)或英文与字母数字组合(西文)表示41分类途径的缺点①不适用于特性检索,查准率比主题词低【题解】这类课题仅仅采用分类号无法准确表达课题,用分类号只能粗略表达,并且分到两个类目,不易归类,适宜用主题途径检索。【关键词】:昆虫insect鸣声信号acousticsignal信号采集signalacquisition信号分析signalanalysis褐飞虱brownplanthopper水稻rice害虫pest【实例】多功能昆虫鸣声信号采集和分析系统及其在褐飞虱鸣声研究中的应用?42②不能适应学科发展中的变化,难以反映新学科和新名词术语【实例】食品风险分析风险分析的目标在于保护消费者的健康和促进公平的食品贸易,在分类上暂时归入[R155.5]食品卫生与检验和[TS201.6]食品安全与卫生。没有一个专门的“食品风险分析”分类号。43③人的认识不统一,往往造成分类不一致及排检错误,不易反映交叉学科。【实例】管理心理学心理学的一个分支,主要是研究企业中人的心理活动规律,用科学的方法改进管理工作,充分调动人的积极性的一门学科。但是,人们很可能误解为归入管理学。【实例】《新世纪英汉计算机词典》如何归类?一般读者不知道分入计算机类TP3还是英语类H31。实际归入计算机类TP3-61/19。44主题语言:是一种描述语言,即用自然语言中的名词、名词性词组或句子描述文献所论述或研究的事物概念。主题:指信息对象所表达或反映的主要内容、问题或事物。主题词:表达各种文献信息主题概念的词语。狭义的主题词仅指叙词;广义主题词可以分为规范词汇和自由词汇,包括关键词、单元词、标题词、叙词。例如:我们在搜索引擎中查找文献时输入的“汽车燃料”就是主题语言的一种。(2)主题检索语言45主题语言特点:直接用词语来表达各种概念。它以词汇规范化为基础,通过概念组配用以表达任何专指概念。直指性强,专指度高,便于特性组配检索。不必从知识体系的角度去判断所需文献属于什么学科,只要根据课题研究对象、直接使用表征文献内容的主题词查询同一篇文献可用多个主题词标引,扩大了检索途径。46主题语言叙词语言:最有代表性的主题语言,由规范化的概念及其指代关系组成。叙词表常用主题语言关键词语言:题目、摘要、原文中出现的,对表述文献主题内容有实质意义的词汇,是未经规范化的自然语言词汇。主题语言标题词语言单元词语言叙词语言关键词语言47(1)标题词语言(subjectheading):是一种先组式的规范词语言,即在检索前已经将概念之间的关系组配好。具有较好的通用性、直接性和专指性,但灵活性较差。常用的标题词表有《美国国会标题词表》(LibraryofCongressSubject)、《医学主题词表》(MedicalSubjectHeadings)。(2)单元词(元词法,uniterm):是一种最基本的、不能再分的单位词语,亦称元词,从文献内容中抽出,再经规范,能表达一个独立的概念。如“信息检索”是一个词组,“信息”和“检索”才是单元词(3)叙词法(descriptor):采用表示单元概念的规范词语揭示文献的主题。包含多个主题的文献可以用多个叙词进行标引。在检索时可由多个叙词形成任意合乎逻辑的组配,构成多种组合方式。如有关汽车发动机制造方面的文献,可用汽车、发动机、制造三个叙词来标引。叙词的这一优点很适合于计算机检索。主题语言的类型48叙词表(thesaurus):由叙词按一定的规则编制而成的词表。它是对文献进行主题标引的依据。1959年美国杜邦公司编制了第一部叙词表,其后,随着计算机的应用,叙词表的编制迅速发展,叙词语言成为受控信息组织和检索的主要语言。国内外叙词表的数量不下千种,我国叙词表已超130多种常见的叙词表:《汉语主题词表》、《中国分类主题词表》、《教育分面叙词表》、英国《科学文摘》的《INSPEC叙词表》、《EIThesaurus叙词表》、美国《政府报告和索引》的《NTIS叙词表》、《ASM冶金词表》等。叙词表成为规范各学科或某一专业领域名词术语的工具49叙词词表中的关联关系Y(用)USE指引正式主题词D(代)UF