文献检索基础知识(检索过程)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2012年3月信息检索与学科热点问题调研2012年3月第三讲文献检索基础知识(教材中第一、第二章内容)第3页一、信息资源概论1、信息资源的概念数据:从现实事物中抽象出来的,用来描述现实事物特征的符号。信息:定义1:是经过收集、记录、处理,以能检索的形式存储的数据定义2:人们所感知和表述的事物运动的状态和方式。…定义n信息资源:信息的内容以及与信息内容相关的:信息技术——数据库技术、网络技术、搜索引擎等人员——信息系统开发人员、信息系统管理人员、图书管理人员等设备——微机设备、网络设备等第三讲文献检索基础知识第4页一、信息资源概论(续)2、信息资源的分类(1)按加工层次划分一次信息资源未经他人加工和组织的,已公开发行的,作者的研究或工作成果为基础而创作形成的信息资源,例如:期刊论文、会议论文、图书等。也称为“原始文献”。一次信息资源特点是:详细、无序,是最基本的信息源和检索对象二次信息资源对一次信息资源进行加工,使之有序化而形成的信息资源。例如:索引、文摘等二次信息资源的特点是:有序化,容易被检索三次信息资源对一、二次信息资源进行综合分析、评价,进一步综合、浓缩形成的信息资源。例如:词典、年检、百科全书等三次信息资源的特点是:高度综合、信息量大。零次信息资源非公开发行的信息资源(以上一、二、三次信息资源均指公开发行的信息资源)。例如:手稿、笔录等。第三讲文献检索基础知识第5页一、信息资源概论(续)讨论:以下几种信息资源按加工层次划分分别属于几次信息资源?我系某位老师在《计算机工程》杂志上发表的一遍论文09级通信班某位同学向07级某同学要来的《通信原理》课程考研笔记滨州学院年鉴中国《发明专利公报》第三讲文献检索基础知识第6页一、信息资源概论(续)2、信息资源的分类(续)(2)按载体形式划分印刷型存储介质:纸张优点:直接阅读缺点:存储密度小,体积大缩微型存储介质:胶卷等优点:存储密度大,体积小缺点:借助特定设备阅读音像型利用录音、录像等技术,直接将声音、图象等记录下来。如:音像磁带、唱片等这里主要指模拟信号电子型以数码方式将各种信息存储在磁、光、电介质上。这是目前大量使用的如:磁盘、光盘等是数字信号第三讲文献检索基础知识第7页一、信息资源概论(续)2、信息资源的分类(续)(3)按出版形式划分图书优点:系统、全面缺点:出版周期长,传递信息慢。例如计算机图书期刊优点:周期短,信息量大(学术论文举例)科技报告研究人员经过对某个专题进行研究后撰写的研究报告。有密级,发行范围严格控制会议文献在各类学术会议上产生的会议论文集比期刊还能及时的反映最新学术动态专利文献(举例)将科技信息与法律信息融为一体的,具有明显知识产权特征的文献资料专利类型:发明专利、实用新型专利、外观设计专利第三讲文献检索基础知识第8页一、信息资源概论(续)2、信息资源的分类(续)(3)按出版形式划分(续)学位论文博士论文(举例)硕士论文(举例)学士论文(举例)标准文献人们在科研和生产过程中所遵循的共同的技术依据和原则,要经过权威机构验证和批准。按使用范围可分为国际标准、国家标准、行业标准、企业标准等谁掌握了标准,谁就掌握了话语权。一流企业做标准,二流企业做技术,三流企业做产品国家标准化委员会:全国信息技术标准化委员会:例:软件开发类国家标准软件工程国家标准第三讲文献检索基础知识第9页一、信息资源概论(续)2、信息资源的分类(续)(3)按出版形式划分(续)政府出版物由各级政府出版发行的文献。例如政府法令、方正政策等便于了解国家、各级政府的方针政策、发展规划、产业政策等例:滨州市人民政府公报政府网站:产品资料产品说明书等报纸新闻报道、评论等信息量大,实时性强。第三讲文献检索基础知识第10页二、信息资源检索1、信息资源检索的概念信息检索:将信息按一定的方式组织和存储起来,并根据用户需求找出相关信息的过程。包含两个方面:信息的组织和存储信息查找三个主要环节:对信息内容进行分析和编码,产生信息记录和检索标识组织和存储,将全部记录按文件、数据库的形式组成有序信息集合根据特定检索提问,查找出需要的信息课堂讨论:以学校图书馆为例,说明信息检索的概念、环节以班级电子档案系统为例,说明信息检索的概念、环节第三讲文献检索基础知识第11页二、信息资源检索(续)2、信息资源检索的分类按检索内容划分文献检索——以文献为检索对象,包括:书目检索——检索文献线索,如文献的目录、文摘等全文检索——检索文献的全部(以图书或论文为例)事实与数据检索——以数据为检索对象,例如:山东省的人口北京师范大学的位置李叔同的出生年月…按是否使用检索工具划分直接检索一次性文献检索,例如直接到书库中找书间接检索先利用检索工具获得文献线索,例如先通过索引库找到书的位置,再到书库找书按检索手段划分手工检索现代检索(借助计算机、网络等现代手段)第三讲文献检索基础知识第12页三、信息资源检索的基本原理1、基本原理信息资源检索包括:信息的存储信息的存储:是将收集到的一次信息,经过著录其特征(题目、作者、关键词等)而形成索引条目,将这些索引条目组织起来成为二次信息的过程信息的检索信息的检索:是针对已存储好的二次信息库,查找与某特定信息相匹配的信息资源。信息存储与检索所依据的规则必须一致。信息检索语言:信息存储与检索共同遵循的规则称为信息检索语言信息存储人员(标引者)与检索者要使用同一种信息检索语言因此,信息检索的基本原理是:通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个基本过程所采用的特征标识达到一致,以便有效地获取和利用信息资源。检索系统例:图书馆的书目和索引,计算机检索系统如cnki、万方数据、维普咨询等第三讲文献检索基础知识第13页三、信息资源检索的基本原理(续)1、基本原理(续)信息检索原理图手工检索例:图书馆书目和索引系统计算机检索例:CNKI第三讲文献检索基础知识第14页三、信息资源检索的基本原理(续)2、检索效果评价检索效果:用户向检索系统提交检索后,系统返回检索的结果的有效程度评价检索效果的两个物理量是:查全率查准率%100*100caa%=系统中的相关文献总数检出的相关文献总数查全率=%100*100baa%=检出文献总数检出的相关文献总数查准率=用户相关性判断系统相关性预报相关文献非相关文献总计被检出文献aba+b未检出文献cdc+d总计a+cb+da+b+c+d第三讲文献检索基础知识第15页三、信息资源检索的基本原理(续)2、检索效果评价(续)例如:某一检索系统,有1000万条数据,其中含有“滨州市环境保护与治理”的文献2000条,在对该系统进行检索时,共检出数据3000条,其中与“滨州市环境保护与治理”相关的1500条,则:查全率:=1500/2000=75%查准率:=1500/3000=50%影响查全率与查准率的因素(了解)标引的影响检索语言的影响检索策略的优劣第三讲文献检索基础知识第16页四、信息资源检索语言1、检索语言的概念(理解)一个实例:我系教学档案库建设我系教学档案库包含的内容:各年级教学计划、各年级课程表、各年级学生成绩、各年级学生试卷、教师发表的文章、各类研究项目立项书、结项书、学生各类获奖、教师各类获奖、…我系教学档案库建设的目标:所有文档有序存储,以备以后随时调阅。例如:查一下2010年我系学生在“齐鲁大学生软件设计大赛”活动中的获奖情况。实现原则之一:制定一个文档分类方案,建立教学档案库时按照这个分类方案建设,将来查阅时也按这个分类方案来查找这个分类方案就是一种检索语言检索语言:表达1:人们在加工、存储、检索信息时所使用的一种规则、标识符号等。表达2:根据信息检索的需要创造出来的一种人工语言,是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。检索语言是一种受控语言,它依据一定的规则对自然语言进行规范,将其编制成表,供信息标引以及检索时使用标引人员依据检索语言对文献进行整理、加工、存储于检索系统中,检索人员依据检索语言从检索系统中查找自己要的信息第三讲文献检索基础知识第17页四、信息资源检索语言(续)2、检索语言的分类分类语言——按学科性质进行分类并排序例:中国图书分类法共有二十二个基本大类,每个大类都用一个英文字母表示。如下所示:第三讲文献检索基础知识A马列主义、毛泽东思想、邓小平理论B哲学宗教C社会科学总论D政治法律E军事F经济G文化科学教育体育H语言文字I文学J艺术K历史地理•N自然科学总论•O数理科学化学•P天文学地球科学•Q生物科学•R医药卫生•S农业科学•T工业技术•U交通运输•V航空航天•X环境科学劳动保护科学•Z综合性图书主题语言主题检索语言是直接以代表文献内容特征作为检索标识,并按其外部形式(字顺)组织起来的一种检索语言。如:如标题词,关键词等第18页五、信息资源检索技术1、检索方法顺查法以课题的起始年代为起点,按时间顺序,由远及近系统地收集该课题的文献。检索目的:了解该课题发展的全过程。优点:漏检率低缺点:工作量大倒查法从现在开始,由近及远,逆着时间顺序向前查找文献。检索重点在于近期文献,达到目的为止。检索目的:把握课题的最新进展优点:快速获得该课题最新的资料缺点:容易造成漏检抽查法以课题研究最活跃的年代为检索的时间段引文追溯法通过文章后面所列参考文献目录的线索,查找所需信息。综合法将几种检索方法综合利用第三讲文献检索基础知识第19页五、信息资源检索技术(续)2、检索技术1、检索词与检索式检索词:表示文献特征的标题、作者、关键词等。如:“传感网”、“RFID”等检索式:直接面对检索系统的检索条件表达式,是要求检索系统执行的检索语句。2、布尔检索利用布尔逻辑算符检索,是现代信息检索最常用的方法三种逻辑算符:与and或or非not例如:“RFID”and“校园管理”3、截词检索根据西文的构词特性,用截断的词的一个局部进行检索,并认为凡满足这个词局部的所有字符串都为命中文献。截词算符:不同检索系统不一样,一般用?例:后截词:comput?表示computer,computers,computing等前截词:?computer表示minicomputer,mocrocomputer等中截词:?comput?表示minicomputer,microcomputers等第三讲文献检索基础知识第20页五、信息资源检索技术(续)3、检索策略举例:滨州市教育局委托我们构建一个“滨州市中小学教师网络教学资源库(B/S结构)”。在进行设计开发之前,首先要进行大量的文献调研,把握该课题当前国内研究状况。需要:需要确定检索词(如:“网络教育”、“教学资源库”、“B/S结构”、“网络课程”等)确定检索式选择检索数据库(CNKI、万方、维普或百度等其它搜索)等。初步检索调整检索,优化检索获取检索结果所以:一个检索任务的执行一般是有过程、按步骤地有序完成。检索步骤的科学安排就是检索策略。包括:分析检索课题确定检索词确定检索式选择检索工具及数据库输出结果或索取原始文献第三讲文献检索基础知识第21页五、信息资源检索技术(续)4、检索步骤:(1)分析检索课题,明确检索需求课题检索的意图,立项、论文

1 / 31
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功