CompanyLOGO信息检索CompanyLOGO课程性质《文献信息检索》课就其实质来说,是一门方法课,即通过讲授信息检索基础理论、信息检索方法和各种中外文数据库的使用,提高同学们获取信息的能力,主要是培养学生的情报信息意识和提高检索技能。CompanyLOGO一、信息素质信息素养的概念•Tobeinformationliterate,apersonmustbeabletorecognizewheninformationisneededandhavetheabilitytolocate,evaluate,anduseeffectivelytheneededinformation.•具有信息素养的人能够知道什么时候需要信息,能够有效地获取、评价和利用所需要的信息。•——美国图书馆协会ALA,1989信息素质•信息素质(InformationLiteracy简称IL),又称信息素养,简单地讲,信息素养是指个人“能认识到何时需要信息,和有效地搜索、评估和使用所需信息的能力”。•它包含了三个层面:信息意识、信息能力、信息道德。信息素质的内涵:信息意识——对各种信息自觉的心理反映信息能力——信息技术的应用能力•信息查询、获取的能力•信息组织加工、分析能力•信息的有效利用、评估、传播能力信息道德——整个信息活动中的道德规范学术道德规范——(学术规范的核心部分,具体包括:)①学术研究应坚持严肃认真、严谨细致、一丝不苟的科学态度。不得虚报教学和科研成果,反对投机取巧、粗制滥造、盲目追求数量不顾质量的浮躁作风和行为。②学术评价应遵循客观、公正、准确的原则,如实反映成果水平。③学术论著的写作应树立法制观念,保护知识产权,要充分尊重前人劳动成果。信息道德学术法律规范:《中华人民共和国著作权法》合作创作的作品,其版权由合作者共同享有。未参加创作,不可在他人作品上署名。不允许剽窃、抄袭他人作品。禁止在法定期限内一稿多投。合理使用他人作品的有关内容。学术不端检测系统信息道德第三层次:信息选取与综合利用(信息增值)第二层次:从检索系统中检索出信息(检索技术)第一层次:知道什么信息在什么地方(熟悉了解信息源)如何具备信息素质如何判断自己已具备了信息素质?•1、能够独立决定所需信息种类和程度。•2、能够高效地获取所需信息。•3、能够根据现有的知识背景和评价标准对信息及其来源进行评价及遴选。•4、能够有效地利用信息达到某一特定的目的。•5、能够在信息利用过程中遵守相关的法律法规。CompanyLOGO二、信息源•信息的来源叫做信息源。•信息源可按不同的方法分类描述,比较常见的分类方法有如下三种:•1、按信息的载体形式划分(电子文献等);•2、按信息加工的级别划分(四次文献);•3、按信息的发布形式划分(十大文献信息源等)(1)、按信息的载体形式划分信息源•1)印刷型(Printedform)(书本型)以纸张为载体2)缩微型(Microform)以缩微胶片、平片等感光材料为载体3)声像型(Audio-Visualform)(视听材料)以磁性和感光材料为载体4)电子型(MachineReadableform)以计算机信息存储设备为载体,以数字代码将图、文、声、像等信息存储到介质上通过计算机阅读。(2)、按信息加工级别划分信息源•信息出版量的急剧增长,信息类型的多样化和信息分布的离散状态,获取相关信息犹如大海捞针。利用信息的可塑性,将信息处理为不同等级。通常文献学上将其称为“三次文献”:一次文献primarydocument二次文献secondarydocument三次文献Tertiarydocument零次文献最原始的资料文献零次文献:普通网页,电子邮件等一次文献:正式在期刊上发表的论文等二次文献:数据库中的题录、目录等三次文献:文献综述、进展报告等(2)按文献加工深度划分1)图书(book)2)期刊(journal)3)科技报告(report)4)会议文献(proceeding)5)专利文献(patent)6)学位论文(dissertation)7)政府出版物(governmentpublication)8)标准文献(standards)9)产品资料(productliterature)10)科技档案(scientificandtechnicalarchives)(3)、十大信息源—按出版形式划分特种文献CompanyLOGO三、网络检索的六大方面•一个原则:选择合适的关键词,制定正确的检索策略。•两类搜索引擎•三大系列中文网站•四次文献•五大多媒体技术•十大文献信息资源•一个原则•两类搜索引擎:全文搜索引擎(FullTextSearchEngine)百度搜索引擎、Google搜索引擎分类目录(Directory)雅虎中国、搜狐、新浪、网址之家、网易分类目录等•三大系列中文网站•四次文献•五大多媒体技术•十大文献信息资源•一个原则•两类搜索引擎•三大系列中文网站:•三大中文门户网站—新浪、搜狐、网易•三大中文期刊数据库—清华库、维普库、万方库•三大中文数字图书馆—超星、方正、书生之家•四次文献五大多媒体技术十大文献信息资源•一个原则•两类搜索引擎•三大系列中文网站•四次文献:零次文献一次文献二次文献三次文献•五大多媒体技术•十大文献信息资源•一个原则•两类搜索引擎•三大系列中文网站•四次文献•五大多媒体技术:素材下载技术素材转换技术多媒体制作技术素材发布技术网页制作和网站发布技术•十大文献信息资源•十大文献信息资源•科技图书•科技期刊•特种文献(科技报告政府出版物•会议文献标准文献•专利文献科技档案•学位论文产品样本)CompanyLOGO四、信息检索什么是信息检索?信息检索(InformationRetrieval)指对文献信息资料的查找与获得。检:即查找,索:即获得与索取。也就是说,检索者利用检索工具按照文献编排的特点,采取一定的途径、方法和步骤,将所需文献资料查找出来,并加以利用。前提:必须有检索工具其次:途径和方法——桥梁、纽带最后:检索者信息检索活动的功用一、利用信息检索工具,全面细致地搜索前人的工作经验与成果,及时掌握事物的最新动态及发展趋势;二、提高工作效率,提高人们的自学能力、科研能力、鉴赏能力;三、避免重复劳动,规避风险,维护正当权益;信息检索活动的功用•四、节省检索文献的时间•文献检索在科研中所占时间的比例:•开展思考计划—文献查找—科学实验—编写科研报告•8%48%35%9%•五、有利于专题文献查准和查全•检索工具——原始文献(线索)•六、克服专业语言和自然语言的障碍CompanyLOGO五、检索语言检索语言•是根据检索的需要而创造的人工语言,用于描述检索系统中信息的内部特征和外部特征并能表达用户信息提问的一种专门语言。标引文献与揭示文献内容的两种基本方法:1、分类法:按照文献资料的学科属性(分类法最有利于查全)分类法的特征在于知识的系统性,不仅揭示图书的学科知识内容,而且把有关同一学科内容的文献资料集中在一起,使学科临近的文献排在相近的位置,根据各类图书之间的亲疏关系将藏书组织成一个系统.2、主题法:按照所论述的事物将文献所论述的事物按照规范化的语言(主题词)的字顺进行排检,从本质上讲,是用词语来揭示文献所阐释或研究的对象、事物和问题。与分类法相比,从不同角度来揭示文献。分类法世界上有代表性的分类法:1、《杜威十进制分类法》(DeweyDecimalClassificationandRelativeIndex简称DDC)2、《国际十进制法》(UniversalDecimalClassification,简称UDC)(被广泛应用于科学论文的分类)3、《美国国会图书馆图书分类法》(LibraryofCongressClassification,简称《国会法》或LC)(目前广泛应用于北美大中型图书馆,特别是大学等学术性图书馆)4、《中国图书馆分类法》•《中图法》——《中国图书馆分类法》,以学科来组织知识,将全部知识领域划分为5个基本部类,22大类。•马克思主义、列宁主义、毛泽东思想、邓小平理论(A)•哲学(B)•社会科学(C)•自然科学(N)•综合性图书(Z)•在5个基本部类的基础上,按照从总到分,从一般到具体的编排原则进一步展开,组成了22个基本大类:A、B、C、D、E、F、…Z(L、M、W、Y)•这就是俗称的《中图法》五部二十二大类。《中图法》介绍主题法1、自然语言(非规范语言):信息检索系统中使用的标引词直接来自文献和用户提问而不加控制的一类检索语言,主要有关键词语言。自然语言的应用以计算机为前提,否则,自然语言检索将难以实现。2、受控语言(规范语言或人工语言):标引词来自文献或者用户,并受到信息检索系统的控制的一类检索语言的总称,又叫规范化语言。受控词在检索实践中具体体现为词表。词表在网络检索工具中的应用主要体现在辅助选词以及检索式的扩展。汉语主题词表《汉语主题词表》是我国第一部大型综合性主题词表。1979年出版,自然科学部分1991年修订.收录正式主题词91158条,非正式主题词17410条。全表共分3卷10分册,由主表、词族索引、范畴索引、英汉对照索引等组成。是我国应用最广的一部主题标引和检索的工具。CompanyLOGO六、检索工具目录型检索工具目录是图书、期刊等出版物外表特征的揭示和报道。它以完整的出版物(如一本书、一种期刊)作为著录的基本单位,所以也可以说它是按某种顺序编排的文献清单。是指导阅读和科学管理文献的重要手段。目录的著录对象一般是整本书或整种刊物《全国总书目》揭示每年国内图书出版情况每个图书馆的OPAC(联机公共目录)揭示该馆的馆藏联合目录揭示许多家图书馆出版物收藏情况。题录型检索工具题录的含义题录是描述文献外部特征的文献条目。文献的外部特征包括题名、著者、出处、卷期、页码、时间、文献类型、语种等著录项目。题录的著录对象一般是单篇文献。文摘型检索工具文摘的定义我国国家标准GB3468-1983;《检索期刊编辑总则》说明定义:“除题录部分外还对文献内容作实质性描述的文献条目称之为文摘”。文摘是文献原文浓缩后的产物,是忠实于原文内容的简要记录单元。揭示文献的内容特征,在文摘的编写中不能加入编写人员的主观见解和任何解释性说明,也不能对原文作任何修改。全文型检索工具全文也包括内容简短的事实和数据。全文性检索系统集文摘检索和全文提供于一体,是近年来发展较快和前景较好的一类数据库。优点:一、可以直接获取全文。二、多数全文数据库提供全文字段检索,这个有助于文献的查全。手工检索工具索引:将文献中具有检索意义的事项(可以是人名、地名、词语、概念、或其他事项)按照一定方式有序编排起来以供检索的检索工具。相对于目录,题录、文摘等类型的检索工具,索引深入到文献的细节,涉及到具体的知识点。常用的印刷版的工具书都有索引,以便检索。其他类型的手工检索工具——工具书年鉴——查找事实或统计数据百科全书——查找不熟悉的知识手册——成熟稳定的知识,查找参数,公式等辞书——词典或辞典,查找科技词汇的解释,或汉外对照辞典,缩略语辞典。还有大量的专门性辞典。年表——查找一些历史大事记录CompanyLOGO七、计算机检索1、机检包括以下几个主要过程:•1、识别用户:帐号密码、IP地址•2、接收提问:接收输入的检索词•3、提问校验:语法检查(布尔逻辑组配)及用词检索•4、转化提问式:将用户的原始提问式转化成计算机处理的目标提问式•5、检索:进行匹配选择的过程•6、结果输出:按照相关性的大小等顺序进行排序后输出1)、分析检索课题(界定问题):分析研究问题,建立背景知识。明确检索目的、学科、年代范围、所需信息类型——开始检索的前提2)、选择检索系统和数据库(选择信息源):考虑数据库涉及的学科范围、文献类型、数量、时间、更新周期、检索功能和服务方式等选择检索系统和数据库——对检索工具和方法的选择2、计算机检索步骤:3.1)、确定检索途径和检索方式(制定检索策略):许多数据库提供多种检索途径,如初级检索、高级检索、专业检索和分类检索等途径。检索方