信息检索与分析利用本课程基本目的理论和知识方面掌握信息检索的基本理论知识,通过实习掌握获取各类信息资源的的基本能力。能力和技能方面能熟练检索常用数据库,为撰写文献综述、开题报告、毕业论文进行检索14信息素养(InformationLiteracy)的概念于1974年由美国信息产业协会主席保罗·泽考斯基提出,是信息时代人才培养模式中出现的一个新概念,已引起了世界各国越来越广泛的重视。定义为“知道何时需要信息,并已具有检索、评价和有效使用所需信息的能力”已成为评价人才综合素质的一项重要指标。基本概念信息(information)2文献(literature/document)345知识(knowledge)情报(intelligence)信息、知识、情报和文献之间的关系1精炼的知识记录下来的知识对信息的理解与认识有组织的数据信息的原材料智慧文献知识信息数据客观事物本身的运动关系信息数据信息知识文献信息(文献)的类型2按物质载体和记录形式划分按出版形式和内容划分1按物质载体和记录形式划分印刷型主要指以纸张为载体,通过印刷手段把负载知识的文字固化在纸上缩微型以感光材料为载体,以光学缩微技术为记录手段声像型以磁性、感光材料为载体,直接记录声音、图像的一种文献机读型利用计算机进行存储和阅读的一种文献形式手写型古代各种非印刷型文献如甲骨、简策、帛书等以及还没有正式付印的手稿信息(文献)按出版形式和内容划分图书期刊报纸专利文献标准学位论文科技报告会议论文政府出版物产品样品资料技术档案信息(文献)信息检索概念信息检索就是从信息集合中找出所需信息的过程,也就是我们通常所提及的信息查寻(InformationRetrieval或InformationSearch)。信息检索能力是信息素养的集中表现,提高信息素养最有效的途径则是通过学习信息检索的基本知识,进而培养自身的信息检索能力。信息检索的原理检索提问标识(检索词)检索结果检索过程表述输出检索课题检索提问分析转换检索一次信息信息特征检索语言信息特征标识(检索项)标引检索工具和系统归入存储过程分析转换从本质而言,信息检索是一种匹配和选择,是信息需求与检索结果的匹配。信息需求决定检索工具、检索方式的选择。如常识、大众化、新闻、娱乐信息可用搜索引擎检索;专利、标准与统计信息可从发布机构的网站检索;学术科研信息可用数据库检索;复杂、精确的需求可采用高级检索方式;模糊、简单的需求可采用简单检索方式。检索工具的功能设计(检索选项或检索框)正是用来满足各种需求的,灵活运用各种检索功能能够有效提高检索效率。信息检索和利用的意义可以较快了解所参与的工作、生活、业务、设计等的基本知识继承和借鉴他人的成果,避免重复或少走弯路可提高效率,节省科研人员的时间,减少人力或投资方面的费用建立跟自己密切相关的行业动态信息的获取渠道,随时收集与掌握相关信息,并作出调整有利于提高自学能力,培养创新人才国内天气机票、酒店信息检索的类型按存储和检索的内容,可分为:文献(document)检索数据(data)检索事实(fact)检索按用户使用目的分:撰写论文的信息检索学科建设和科学研究的信息检索科研立项成果查新学科建设生产开发的信息检索回答或解决单一问题对已知文献的查找信息检索工具及其类型定义信息检索工具是用于报道、存储与查找信息的工具。它是经过对信息进行搜索整理、特征分析和组织加工后的产物,同时也是信息检索的主要手段和条件。类型通常按信息的著录特征可将信息检索工具划分为以下几类:目录题录文摘参考工具书全文数据库搜索引擎信息检索途径所谓检索途径就是检索时切入信息群体的路径。检索途径有两大类:一类是用信息的外部特征,如题名、责任者、某种序号、机构名等作为检索标识;另一类是用能够描述信息内容的分类号、关键词、主题词等作为检索标识。在数据库中检索时,几乎所有的字段都可以作为检索的途径。信息检索途径及其选择内容特征检索途径主题途径指通过能表达文献内容的主题词来检索文献的一种途径。是信息检索的一种主要途径。【如何提取检索词】:1、切分切分就是以词为单位划分句子和词组。例:高校|扩招|对|劳动力|市场|及|教育|收益率|影响|的|研究要点:A.词是语义切分的最小单元,也是检索的最小单元。切分必须彻底,必须“到词为止”。如:“信息检索”可切分为:“信息|检索”。B.切分也要适度,不能因切分而改变语义。如:不能将“操作系统”切分为“操作|系统”如何提取检索词2、删除将课题转换成关键词的集合A.删除不具有检索意义的虚词(a,the,is等)和关键词(因使用太宽泛而不具有检索意义,如:http,com等)B.删除过分宽泛和过份具体的限定词稀土材料的研究现状及发展趋势稀土材料(太宽泛)自动熔化极气体保护弧焊的可控硅电源可控硅电源(太狭义)删除具有包含关系的其中一个教学用的信息检索课多媒体课件信息检索*多媒体*课件3、替换用更本质的概念替换表达欠佳的概念西部地区社会发展状况(社会发展状况=文化教育+医疗卫生+工业水平+农业水平+……)水果营养(水果[fruit]=梨[pear]+橙[orange]+苹果[apple]+……)如何提取检索词4、补充A、补充还原词组:WTO世贸组织世界贸易组织B、补充同义词或相关词:计算机病毒(计算机+电脑)*病毒C、增加限定词(解决一词多义现象):杜鹃杜鹃(动物)、杜鹃(植物)【获得主题词的技巧】:1、利用google关键词工具;2、利用数据库的检索词扩展功能。信息检索途径及其选择分类途径指根据文献所属的类别,利用特定的分类号来检索文献的途径。优点:能够从学科或专业角度广泛地获得较系统的文献,能够达到较高的查全率。当所需要的信息范围比较宽泛或涉及内容复杂,仅用几个词语已无法涵盖检索需求时多采用分类途径。例:检索中药材“黄莲”中的微量元素的分析的中文信息,该用何种途径?分析:A、如果明确知道所指的微量元素是特定的几种,而且知道具体名称,就用主题途径;B、如果课题所指的微量元素不是特定的几种,而是多种,也不知道具体的名称,就用分类途径。检索途径及其选择著者途径即根据已知文献著者来查找文献的途径。【排列规则】1、统一采用姓+名的顺序。英文的人名需实行倒置!如:ArrowB·Smith(阿罗·B·史密斯)Smith,Arrow.B.2、复姓作者,将复姓作整体看待例:MargaretMartin-SmithMartin-Smith,Margaret【中文翻译成英文的处理】3、音译:直接用汉语拼音。西南交通大学Xinanjiaotonguniversity4、意译:通常有多种写法,检索式必须列举各种写法,才能保证查全率。例:原西南师范大学在欧洲专利数据库中就有三种写法:SouthwestChinaNormalUniwersity/SouthwestUniversity/XinanTeachers,University【拼写形式】如:张建国ZhangJG或ZhangJianGuo(通常),ZhangJ(有时),JianguoZ(偶尔)检索途径及其选择其他途径题名途径即直接利用图书的书名、期刊的刊名、标准文献的标准名来查找所需停息的方法途径。机构名称途径主要包括作者所在的单位,以及图书期刊的出版发行单位等。代码途径如专利号、标准书号(ISBN)、标准刊号(ISSN)、馆藏号等。在已知文献特定代码的前提下,利用代码途径检索文献是最为快捷的方法之一。引文途径从被引论文去检索引用论文的一种途径。检索式的表达常用检索技术(P52-P54):布尔逻辑检索*截词检索字段检索字段符字段名称字段符字段名称TITitle(标题)AUAuthor(著者)JNJournalName(期刊名称)KWKeyword(关键词)DEDescriptors(叙词)ABAbstract(文摘)CSCorporateSource(机构)CTConferenceTitle(会议名称)常用检索字段表例:论|高校|扩招|对|劳动力|市场|的|影响|研究中文:(高校+大学)*扩招*劳动力*市场外文:(UniversityORcollege)AND(enrollmentexpansionORenlarg*enrollment)AND(labormarketORlabourmarket)【实例】要检索张启发院士刊登在《分子植物育种》上关于水稻基因表达方面的论文。信息检索的一般步骤信息检索的一般步骤1、分析检索课题、明确检索要求分析研究课题,是实施检索中最重要的一步,也是影响检索效果和效率的关键因素。在课题分析中,要明确以下几个问题。(1)明确研究课题所需的信息内容,提出能准确反映核心内容的主题概念。(2)确定课题需要查找的文献类型、语种及出版年代等方面的要求。(3)明确课题对查新、查准、查全的指标要求及其侧重点。信息检索的一般步骤分析检索课题的具体实例:例:我校一老师就课题“保土、治水、移民”查找文献,应如何确定具体的检索点?1、拆分大主题为小主题。经过与用户的交流,我们将课题拆分为如下几个检索点:1、近代以来我国森林覆盖率、区域覆盖变化情况及其原因;2、我国历代移民概况;3、建国以来中央领导人关于我国移民问题的讲话;4、黄河、长江水是何时由清变混的?2、明确课题要求的各种限制条件检索文献:期刊、学位论文、报纸、图书时限要求:一般来说,社会科学、基础科学、高层次的科学研究都要检索20年左右的相关信息,自然科学一般要求检索10年左右;就应用科学,一般层次的研究一般提供5年的相关信息就能满足要求。3、查询的指标要求:查全信息检索的一般步骤2、选择检索工具选择检索工具应参考的原则是:(1)考虑学科范围和数据量(2)了解收录的信息类型(图书、期刊、学位论文)(3)考虑信息的时间范围(4)考虑检索工具的检索功能(易用性,是否熟悉)(5)检索工具的检索费用(中文:一般为0.5元/页或2元/篇)信息检索的一般步骤3、确定检索途径、检索方法检索途径是开始查找的入口点。常用的有分类检索途径、主题检索途径、著者检索途径、题名检索途径。采取哪种检索途径,要从课题检索要求出发。如果课题检索要求泛指性强,所需文献范围较广,则最好选择分类途径;如果课题检索要求专指性强,所需文献比较专深,则最好选择主题途径、题名途径、分子式途径等进行检索为好;知道著者的姓名,则可以采用著者途径;同时根据用户检索的目的,期望的文献数量以及有关主题在学科中的状况,选用适当的检索方法。常规方法:按时间顺序获取文献(顺查法、倒查法、时间抽样法)引文法:利用文献后所附的参考文献、引文注释查找相关文献。【示例】交替法:常规法+引文法信息检索的一般步骤4、调整检索策略确定了具体的检索方法后,就要利用所用的检索工具,在一定的年代范围内具体查找,以获得文献线索。在具体的检索过程中,当结果中出现了太少(10)的不相关记录或太多(1000)的相关记录时,则需要对我们的检索策略进行调整和优化。5、获取原文信息检索的最终目的是获取有用的原始文献。原文获取的方式主要有以下几种:利用全文数据库直接获取。现在有许多全文数据库,通过检索均可直接获得原文。如“中国期刊全文数据库”、万方数据化期刊等。利用文摘数据库传递系统获取。利用OPAC检索系统,进行馆际互借。优化检索效果的方法一、提高查全率的方法(扩检——让结果更多)增加对相关领域(如边缘学科和交差学科)的检索放宽检索途径,全文主题摘要篇名/关键词放松或取消某些限定条件,如信息的类别、语种、年代范围等降低检索词的专指度,如用“教育”取代“高等教育”增加同义词或近义词,并用逻辑“或”将它们连接起来;外文单词进行截词检索,如用“plant*”,可检索出plant/planting/planter等