布尔检索技术实验报告班级:信息管理与信息系统姓名:**学号:**********实习时间:2011年10月25日地点:学校机房检索课题:ERPEnterpriseresourceplanning检索目标文章:AnITgovernanceframeworkofERPsystemimplementationforChineseenterprises检索系统及数据库:engineeringvillage一、实验目的及要求学习掌握计算机检索的基本步骤,并通过对检索结果的分析,对检索系统分析与评价。二、数据库介绍在本次检索实验中,我所使用的数据库是外文数据库EICompendex。Ei创办于1884年10月,由美国工程信息公司主办。EI网络版由光盘版和网络扩展版合并为而成,是目前全球最全面的工程类二次文献数据库。该数据库每年新增500000条工程类文献,数据来自5100种工程类期刊、会议论文和技术报告,(包括90年代以后新增的2500种文献来源)收录的每篇文献都包括书目信息和一个简短的文摘。囊括世界范围内工程的各个分支学科,如:土木工程、能源、环境、地理和生物工程;电气、电子和控制工程;化学、矿业、金属和燃料工程;机械、自动化、核能和航空工程;计算机、人工智能和工业机器人。化工和工艺的期刊文献最多,(约占15%),计算机和数据处理占12%,应用物理占11%,电子和通信占12%,另外还有土木工程(占6%)和机械工程(占6%)等。大约22%的数据是有主题词和摘要的会议论文,90%的文献是英文文献。数据库每周更新,目前可以检索到1970年以来的数据,对检索全世界范围内工程与技术文献,跟踪与评价技术新成果非常有用。三.实验内容课题的内容分析,检索词的选择,检索式的编制。检索过程的详细描述,检索的具体步骤,各个检索词的检索结果,要求使用各种不同的布尔逻辑算符、位置算符、截词符和字段限制进行比较检索。对检索结果的输出方式、格式及排序方式的比较。四、实验步骤布尔检索一、AND1、首先进入检索页面,选择快速检索。在检索框输入ERP,时间选择2000—2011,检索结果如下:有4108条记录,要找到我所需的文章犹如大海捞针。2、返回检索页面,在检索框中输入ERP,在第一个AND链接后输入Chineseenterprises,为缩小范围,比便更快的检索到所需文章,此处限制为subject/title/abstract,时间仍然限制在2000---2011年。(下同)检索结果如下:此时检索出73篇文章,大大减少了查找量,而检索结果中第3条即我所需文章。3、返回检索页,在第2个AND后输入IT,再次进行检索,检索结果入下:检索结果有46条,而第1条就是我所需文章。二、OR1、进入检索页,在检索框中输入ERP,在第1个OR后输入Chineseenterprises进行检索。检索结果如下:检索结果有5631条,但第2条即是我所需文章。2、返回检索页面,在第2个OR后面输入IT,再次进行检索。检索结果如下:检索结果多大2738073条,很难再找到我所需要的文章。三、NOT返回检索页面,在第一个AND后输入Chineseenterprise.在NOT后输入IT。检索结果如下:有72条检索结果。第32条即使我所需文章。邻近检索(proximitysearch)在检索框输入ITONEAR/nERP检索结果如下:有186条检索结果。第5条即是我所需文章。截词检索1、有人工检索,有自动检索。检索结果如下:有294条检索结果。第5条即是我所要文章。2、有人工检索,无自动检索。检索结果如下:有296条检索结果。第5条即是我所需文章。限制检索输入关键字和限制字符,进行检索。检索结果如下:检索结果只有9条,而第一条就是我所需文章。五、实验结果与结论通过这次的实验学习,我获得了很大的收获。从对信息检索完全不懂,一头雾水到现在慢慢知道,了解,理解。首先,对EI数据库有一定的了解,具体如下:一、数据库的范围上Ei创办于1884年10月,由美国工程信息公司主办。EI网络版由光盘版和网络扩展版合并为而成,是目前全球最全面的工程类二次文献数据库。数据库涵盖工程和应用科学领域的各学科,涉及核技术、生物工程、交通运输、化学和工艺工程、照明和光学技术、农业工程和食品技术、计算机和数据处理、应用物理、电子和通信、控制工程、土木工程、机械工程、材料工程、石油、宇航、汽车工程等。还选择收录一些与工程和应用科学有关的专业,但不收录纯理论方面的文献。可检索1969至今的EiCompendex数据和1990至今的PageOne数据。数据库每周更新。该数据库似乎对浏览器有一定的选择,用搜狗浏览器进不去,用IE则可行。二、数据库的检索方法上1.简易检索(easysearch):是非常简单的关键词检索,将关键词输入检索框,点Search即可,没有其它限制。可以跨库检索。2.快速检索(quicksearch):可以进行复杂检索,使用布尔检索中AND,OR,NOT等,可以限制检索字段、文件类型、处理类型;可以自动截词,也可人工截词。限定时间范围,选择检索范围,选择排序方式等。3.高级检索:提供更强大而灵活的功能,用户可以使用更复杂的布尔逻辑算符、位置算符、截词符等,有更多的检索项选择,系统严格按检索式进行检索。3、专业检索(expertsearch):三、检索技术:1.布尔检索:使用算符有:and、or、not2.邻位检索:用NERA算符,ONEAR算符。nN,nW等算符。EI还提供了短语检索:相关短语检索:输入的短语不加任何括号或引号;精确短语检索:在输入的短语加上大括号{}或引号“”。3.截词检索:一种是在单词的适当位置加截词符*和?,另一种是系统默认自动取词根,点击“Autostemmingoff”则可关闭此功能。读者可根据自己的需要自己选择。4.限制检索:限制检索是将检索词限制在特定的范围内,有:字段、文献类型、语种以及年代等第二,在实验过程中,通过不断所练习布尔检索,使用各种不同的布尔逻辑算符、位置算符、截词符和字段限制进行比较检索,发现检索结果的输出方式、格式及排序方式各不相同文章的检索页面的排序方式有两种:relevance和publicationyear.进入检索结果页面时,则有5种可选择的排列方式,分别是relevance,data,author,source,publisher.检索结果最初都是默认为相关性(relevance)的方式进行排序。在AND和OR检索时,检索结果是明显不同的,OR检索出来的结果更为丰富,范围更广,而AND检索的结果更准确一些。OR提高了查全率,而AND则提高了查准率,所以,OR适用于目的性不太强的检索,而AND则适用于目的性较强的检索。截词检索也相当于扩大了检索范围,因为词的匹配范围更大了,检索出了更丰富的结果,提高了查全率。限制检索则更加精准,通过一定的限制,提高了查准率。第三,对传统信息检索技术及系统有了一定的认识。信息检索技术主要有4个阶段:初级阶段,手工阶段,计算机检索阶段,网络检索时代。传统信息检索是指手工信息检索,而现代信息检索包括计算信息检索和网络信息检索。传统信息检索是利用各种专门用于检索的印刷出版物,即常说的检索工具来查找所需信息的手段。其检索方法主要有直接检索和间接检索。直接检索这是人们最常用的一种查找信息的方法,如去图书馆查阅各种图书、期刊及其他资料,找到需要的信息,需花大量的时间和精力,在过去文献较少时,还能达到目的,而在信息大量产生的年代里犹如大海捞针。间接检索就是利用各种检索工具获取线索,再根据线索来查找原始文献信息的方法,也就是手工检索。间接检索还分为①追溯法通过已知文献所附的参考文献,“由一变十,由十变百”地进行追溯查找有关信息。还可以利用各种“引文索引”等工具进行追溯检索。②工具法利用各种检索工具文摘、题录、目录等进行查找文献,是文献检索最常用的方法。传统信息检索与现代倍息检索的比较:检索语言--检索语言就是检索信息时所使用的语言词汇,在检索语言上,手工检索与计算机检索基本相同,不同的是计算机检索可以使用较多的自然语言,网上检索一般使用自然语言。检索概念的组配--手工检索主要是以人脑进行检索概念的组配,而计算机检索则是用布尔逻辑、位置逻辑等逻辑算符进行概念组配,网上检索概念组配方式尚不成熟。其中计算机检索的概念组配最为严谨,手工检索的概念组配最灵活。检索途径--检索途径也就是检索入口是根据信息的某种特征所进行的检索,手工检索与计算机检索的基本检索途径是相同的,如著者、分类、主题等。但计算机检索的检索途径要更加广泛和灵活,可以从年代、题目、文摘、语种等途径进行检索,并能进行多途径同时检索。检索结果相比则是,手工检索的结果准确率最高,误检率最低,查全率较低。计算机的查准率要低于手工检索,误检率要高于手工检索,查全率较高。网络检索结果误检率最高,查全率也较高,查准率较低。信息内容范围不同--传统的信息检索主要以检索文献信息为主。如现代信息检索的信息则不再以文献信息为主,其范围很大,网上的信息是全世界最大的信息阵,信息资源分布在整个网络中,没有统一的组织和管理,也没有统一的目录。许多希望和他人进行信息共享的机构和个人将自己的信息以有偿或无偿方式通过网络对外提供。信息质量及可靠性不同--传统的文献信息,如各种书刊、报纸、广告、专利、标准等。基本上是经过专业编辑人员审核、筛选、加工后才问世的,检索出的信息比较可靠,质量也较高。网络上的信息,质量参差不齐,可靠性较差。包括各种生活信息,公用软件、事实和数据信息等,并对外开放,任何人都可以查询利用。参考文献:《传统信息检索与现代信息检索的比较研究》来源:维普数据库。以下是我所需文章全文的部分截图