中文数据库及信息检索技术

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

黄艳娟Huangyanjuan@hrbeu.edu.cn中文数据库检索——信息检索技术与过程信息检索技术与策略CNKI检索维普检索万方检索CNKI检索CNKI资源总体介绍1数据库检索与使用方法2CNKI资源总体介绍1我校购买的资源包括:CNKI资源总体介绍1该库收录1915年至今国内出版的近7000种学术期刊,其中核心期刊、重要评价性数据库来源期刊近2600种。内容覆盖自然科学、工程技术、农业、哲学、医学、人文社会科学等各个领域,全文文献总量2200多万篇。该库收录1999年至今全国420家博士培养单位的博士学位论文。累积出版博士学位论文全文文献6万多篇。该库收录1999年至今全国652家硕士培养单位的优秀硕士学位论文。累积出版硕士学位论文全文文献44万多篇。收录2000年以来国家二级以上学会、协会、高等院校、科研院所、学术机构等单位的论文集,年更新约10万篇论文。累积出版会议论文全文文献73万篇。CNKI数据库登录CNKI使用指南数据库检索与使用方法2CNKI数据库登录需要注意的是:偶尔会提示输入用户名和密码。请记住:用户名:DX0437密码:hrbgcCNKI数据库登录CNKI使用指南数据库检索与使用方法2CNKI使用指南:认识CNKI检索平台利用CNKI查找有关“机械手自由度”的文献认识检索平台A通用菜单在各个总库平台首页和检索结果页都提供了通用菜单B统一检索平台可进行跨库检索C总库文献出版报表D文献资源统一导航利用CNKI查找有关“机械手自由度”的文献CNKI的检索方式:跨库检索还是进入单库检索?如何选择,这就需要分析检索人的需求跨库:可以同时检索多个子库,获取更多更全面的结果,而且省时省力单库:一次只检索一个类型的文献,避免结果过多造成的困扰检索人的需求是什么?是为了获取关于某一内容的系统的全面的信息,还是只是想搜索特定类型的文献信息?跨库检索检索字段检索词机械手布尔逻辑算符自由度检索结果检索字段——信息检索途径检索途径是用户根据需要,以文献信息的外部特征和内容特征来确定的检索入口。根据信息的外部特征:题名途径、著者途径、序号途径根据信息的内容特征:分类途径、主题途径信息检索途径(检索字段)责任者途径题名途径分类途径主题途径序号途径引文途径信息检索途径1题名(题目、标题等)途径2责任者(作者、编者等)途径3序号(ISBN号等)途径4分类途径5主题途径(主题词)6关键词途径ISBN是国际标准书号(InternationalStandardBookNumber)的简称,是国际通用的图书或独立的出版物(除定期出版的期刊)代码。出版社可以通过国际标准书号清晰的辨认所有非期刊书籍。一个国际标准书号只有一个或一份相应的出版物与之对应。ISSN(国际标准连续出版物编号,InternationalStandardSerialNumber)是根据国际标准ISO3297制定的连续出版物国际标准编码,其目的是使世界上每一种不同题名、不同版本的连续出版物都有一个国际性的唯一代码标识。信息检索技术布尔逻辑检索位置算符检索截词检索与词根检索精确检索与模糊检索布尔逻辑检索——最常用的信息检索技术布尔逻辑检索(Booleanlogical)就是利用布尔逻辑算符进行检索项的逻辑组配,用以表达检索者的提问概念。布尔逻辑(台湾译布林逻辑)得名于乔治·布尔,他是爱尔兰科克的皇后学院的英国数学家,他在十九世纪中叶首次定义了逻辑的代数系统。现在,布尔逻辑在电子学、计算机硬件和软件中有很多应用。使用集合代数作为介绍布尔逻辑的一种方式。还使用文氏图来展示各种布尔逻辑陈述所描述的集合联系。布尔逻辑检索逻辑“与”逻辑“或”逻辑“非”逻辑“与”:用“AND”或“*”表示。用于连接概念交叉和限定关系的检索词。功能:以缩小检索范围,有利于提高查准率。逻辑“或”:用“OR”或“+”表示。用于连接并列关系的检索词,功能:以扩大检索范围,防止漏检,有利于提高查全率。逻辑“非”用“NOT”或“-”号表示,用于连接排除关系的检索词,功能:即排除不需要的和影响检索结果的概念,以提高查准率。逻辑与检索式构造举例如:查找“胰岛素治疗糖尿病”的检索式为:insulin(胰岛素)anddiabetes(糖尿病)逻辑或检索式构造举例如:查找“肿瘤”的检索式为:cancer(癌)ortumor(瘤)orcarcinoma(癌)orneoplasm(新生物)逻辑非检索式构造举例如:查找“动物的乙肝病毒(不要人的)”的文献的检索式为:hepatitisBvirus(乙肝病毒)nothuman(人类)。2位置算符检索位置检索也叫邻近检索。位置算符检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的邻近关系。表示两词之间的位置邻近关系,常用到的位置算符有(W)(nW)(N)nN)等。W算符W算符是word或with的缩写,表示在此算符两侧的检索词必须按输入时的前后顺序排列,而且所连接的词之间除了有一个空格或一个标点外不得夹有其他的单词或字母。information2Wmanagement可包括Informationtechnologiesandmanagement和InformationmanagementN算符N算符是near的缩写,表示在此算符两侧的检索词必须紧密相连,词序可颠倒。nN表示两检索词之间最多可以插入n个单词,且词序可颠倒。informationNretrievalinformation2Nretrieval3截词检索截词检索就是用截断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。按截断的位置来分,截词可有后截断、前截断、中截断三种类型。不同的系统所用的截词符也不同,常用的有?、$、*等。分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。(1)后截断,前方一致。如:comput?表示computer,computers,computing等。(2)前截断,后方一致。如:?computer表示minicomputer,microcomputers等。(3)中截断,bas?s=basisbasescolo?r包含colour(英)和color(美)模糊检索与精确检索模糊检索(fuzzysearch)是与“精准检索”相对应的一个概念,是指搜索系统自动按照用户输入关键词的同义词进行模糊检索,从而得出较多的检索结果。同义词由系统的管理界面配置。如配置了“电脑”与“computer”为同义词后,检索“电脑”,则包含“computer”的网页也会出现在检索结果中。模糊检索也就是同义词检索,用户在检索页面中输入同义词中任何一个词检索时,只要选中“模糊检索”复选框,则该关键词的所有同义词信息也都被检索出来。精确检索精确检索是指检索词与检索字符串完全相等。如检索作者马智,仅检索出作者为马智的文献,作者为“马智勇”的就不会被检索出来。模糊检索模糊检索结果精确检索进入单库检索请看检索举例视频期刊导航使用CAJ阅读器和PDF阅读器2019/8/239同方知网(北京)技术有限公司浏览器下载点击文章篇名,进入知网节页面:CAJ下载的优势:占用空间小下载速度快内嵌专业词典即时工具书释义个性化编辑文献文档定位功能打开大部分PDF文档并进行个性化编辑……2019/8/22019/8/2机械手以“学术趋势”为例:2019/8/22019/8/2信息检索过程分析需求确定检索词选择信息源确定检索途径和方法1234实施检索获取原始文献信息检索过程是从确立检索需求到信息需求得到满足的全过程。过程一:分析需求,确定检索词1明确检索目的*需要关于某方面的系统详尽的信息*需要关于某方面的最新信息*了解一些片段信息,解决一些具体问题2明确课题的主题或主要内容要形成若干个既能代表信息需求又具有检索意义的关键词(检索词),确定检索词之间的关系3涉及的学科范围4所需信息的数量、语种、年代范围等需求分析:课题一:“赟”这个字的读音课题二:中西关系发展综述课题三:机械手的定义课题四:近2年气动机械手的新技术研究课题五:新中国60年城镇化发展综述北大政府管理学院老师燕继荣的联系方式及近3年发文情况过程一:检索词的确定信息检索语言分析课题的概念隐含概念的分析核心概念的选取选取检索词应注意问题主题检索语言常用的就是关键词关键词:从文献的题目、正文或摘要中抽出的能表达文献主题内容的具有实质意义的语词。确定关键词的步骤:a.分析课题,提取概念b.整理概念,扩充同义词汇c.运用分析所得词汇试查,确定课题适用的关键词主题检索语言叙词:又称主题词语言,是指从自然语言中优选出来并经过规范化处理的名词术语。“沪产脚踏车”“上海”、“自行车”自然语言主题词确定检索词分析课题的概念隐含概念的分析核心概念的选取选取检索词应注意问题分析课题的概念选择所涉及的主要概念,并找出能代表这些概念的若干个词或词组,进而分析各概念之间的上、下、左、右关系,以便制定检索策略。如课题“政策与行政学的关系”可选“政策”、“行政学”作为关键词。隐含概念的分析有些课题的实质性内容很难从课题的名称上反映出来,其隐含的概念和相关内容需从专业的角度做深入的分析,才能提炼出确切反映课题内容的检索概念。如“知识产权保护”概念中的“知识产权”一词隐含着“著作权”和“版权”、“工业产权”等概念。核心概念的选取有些检索词概念已体现在所使用的数据库中,这些概念应予以排除。如WorldTextiles中“世界”一词应排除。另外有些比较泛指、检索意义不大的检索概念,如“发展”“现状”“趋势”等在不是专门检索综述类信息时也应予以排除。检索词选取时应注意的几个问题。①检索词的选取应适当,具有专指性,涵盖主要主题概念,意义明确。一般应优先选择规范化主题词做检索词,但为了检索的专指性也可选用关键词配合检索。②尽可能地考虑其相关的同义词、近义词作为检索词,以保证查全率。如同一概念的几种表达方式,同一名词的单、复数,动名词、过去分词形式,上位概念词与下位概念词,化学物质的名称、元素符号,植物和动物名的英文、拉丁名等。过程二:选择信息源明确了信息需求之后,信息源的选择尤为重要,它直接影响着检索的效率。工欲善其事,必先“选”其器,信息源选择得当,就会给人以愉悦的搜索体验,能够收到事半功倍的效果。一北京大学政府管理学院硕士招生信息二该院导师三某一导师的姓名、联系方式四该导师的发文情况,近3年第一项可以选择搜索引擎查找二三项可以进入北大政府学院网站查找第四项需要使用CNKI等数据库过程三:选择检索途径和方法检索途径信息检索技术检索式的构造与调整信息检索途径(检索字段)责任者途径题名途径分类途径主题途径序号途径引文途径检索式的构造与调整检索式:是检索策略的逻辑表达式,是用来表达用户检索提问的,由基于检索概念产生的检索词和各种组配算符构成。(篇名=聚氯乙烯orPVC)and年代=2005-2009过程四:实施检索获取原始文献问题:北大政府管理学院老师燕继荣的联系方式及近3年发文情况可分为2个问题:A北大政府管理学院老师燕继荣的联系方式B北大政府管理学院燕继荣近3年发文情况A北大政府管理学院老师燕继荣的联系方式利用搜索引擎找到北大政府管理学院网页浏览找到燕继荣的联系方式北大政府管理学院燕继荣近3年发文情况检索式:作者=燕继荣AND单位=北京大学政府管理学院AND(时间=2007-2009)检索结果的评价查全率:从数据库中检出的相关文献量与数据库中总文献量的比率。查准率:指数据库中检出的相关文献量与检出的文献总量的比率。查全率=a/a+c×100%查准率=a/a+b×1000%查全率=检出的相关文献数系统中的相关文献总数查准率=检出的相关文献数检出的文献总数例题:如CNKI数据库中共有“企业管理”方面的相关文献280篇,而小李同学在CNKI数据库中只检索出160篇,

1 / 81
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功