第六章计算机信息检索的基本策略一、检索策略的实施技巧检索策略:为实现检索目标而实施的方法。计算机信息检索,实质上由计算机将输入的检索策略与系统中存贮的文献特征标识及其逻辑组配关系进行类比、匹配的过程。由于信息需求本身具有不确定性,加之对数据库中的文献特征标识不能充分了解,以及系统功能的某些限制,都会不同程度地影响检索效果。但是只要遵循一定的检索步骤,制定良好的检索策略,便可以减少各种不利因素的影响,尽可能地使检索提问标识与信息需求和检索系统保持良好的一致性,从而在系统中检索出满足用户需求的信息。信息需求是人们客观上或主观上对各种情报信息的一种需求。这种需求是人们索取情报信息的出发点,也是计算机信息检索时选择数据库、确定检索策略以及评价检索效果的依据。不同类型的课题,其信息需求的范围和程度也不尽相同。例如,申请发明、申报成果奖励、鉴定及立项类的查新课题,往往需要全面地收集某一主题范围的文献信息,这类课题具有普查、追溯的特点,应着眼于查全;而对于科研、生产中为解决某一特定问题的攻关课题,往往只要求检出的信息对自己的研究有所帮助,而对查找的文献范围不需要很广。因此,这类课题则要求查准。检索策略制定的原则:(1)快,即从检索请求的提出到检索结果的提交要快速:(2)准,即检索结果要准确,避免检索出过多无关内容;(3)全,检索结果全面,满足用户的需求;(4)效益原则,即以最低的费用获取所佳的信息。五、计算机信息检索的具体步骤1分析检索课题,制定切实可行的检索策略(这是检索的出发点,依据)2利用检索系统特定的指令正确实施检索3通过人-机对话的方式不断调整、修改、检索策略4根据查找的文献线索获取原始文献1、认真进行课题分析,制定切实可行的检索策略(1)分析主题内容,确定正确的检索词(关键词或主题词)(2)正确选择各种算符,如逻辑算符,位置算符,截词符,字段限定符等,编制合理的计算机检索式。(3)分析学科范畴,以便确定所要检索的学科领域,提高查全率。(4)确定检索年代、文献类型明确检索需求,即弄清检索目的及要解决的问题。用户的检索目的和要求是多种多样的,是撰写学位论文,还是申报科研课题,是技术革新还是成果鉴定,目的不同,检索的策略和范围也不同。检索需求主要反映在用户对命中文献的类型、语种及所需文献的年代等不同(5)选择检索方法(常用法、追溯法和循环法)常用法:顺查法(顺着时间的推移由远及近的查找)倒查法(由近及远的往前追溯查找)抽查法(根据学科发展的时代背景,发展的高峰期查找)追溯法:参考文献法(根据所附参考文献的出处追溯检索)科学引文法(通过被引用作者查找引用作者的文献)如:ARIKAWAK80NATURE268700KATAGIRINJELECMICR393639087JCOMPPHYSLA1611161STOWESCELLTISRE2624839087NATURWISSENSCHAFTEN74297SHIMOHIGMCELLTISRE2634691循环法:常用法和追溯法的结合(6)确定检索的信息源(包括中外文数据库和网络资源等)在分析检索课题,明确检索要求的基础上,必须综合考虑检索系统的特点、收录的学科范围、各数据库的专业范围、主题内容、数据来源与文献类型、技术含量、数据的存贮年限、更新频率、检索费用以及使用方法等。2、利用检索系统特定的指令正确实施上机检索3、通过人-机对话的方式不断调整、修改、检索策略,尽量减少漏检和误检,提高查全率和查准率。(1)扩大命中文献数量以提高查全率:选用文摘字段或全文字段检索;使用上位词或近义词、同义词并且用逻辑或(OR)连接;利用截词检索;参考文献检索;引文检索,各种相关链接等等。(2)缩小检索范围以提高查准率。检索词限定在题名、主题或关键词字段;使用下位词,利用逻辑非去掉无关信息;利用逻辑积限定相关主题等。4、根据查找的文献线索获取原始文献(1)查找全文数据库或者通过搜索引擎查找互联网全文信息资源(2)查找馆藏书目系统(OPAC),获取纸本全文(3)查找开放存取的的学术资源(OpenAccess)(4)馆际互借与原文传递实例分析与说明课题一GIS技术的可视化研究课题分析:二十一世纪是一个信息大爆炸的时代,随着“信息论”,“控制论”及“认知论”等理论的产生,作为一门古老的学科的地图学也在这些新兴理论的指导下,在这个信息时代产生了新的发展点,“数字地球”的提出为地图科学提出了更新更高的要求,GIS作为处理地理信息的一种技术,应运而生。GIS是一种采集,加工,分析,访问及表达空间数据的信息系统。作为数据本身是抽象的,不易直观接受的信息,因此研究如何对数据进行加工和可视化表达,对于用户来说是十分必要的。目前的GIS可视化的研究正方兴未艾,对DEM,DTM和DLG等数据模型特别是DEM的研究进展飞速,而三维可视化的表达方式又成为其中最热门的方向,通过DEM生成的等高线,地貌晕渲土,三维透视景象,三维地形漫游及交互式三维可视系统在地图学界开始发挥其强大的效用,并将在GIS技术中占有三分天。数字高程模型(DEM)作为数字地形模拟的重要成果已经成为国家空间数据基础设施(NSDI)的基本内容之一,其相关学科有数据库,软件工程,遥感与航测等。在不久的将来,随着虚拟现实技术与GIS的融合,必然为地理信息学科带来翻天覆地的变化。检索关键词与表达式中文关键词:地理信息系统或GIS(上位)数字高程模型,可视化,三维,虚拟现实(下位)基本表达式:关键词=(地理信息系统ORGIS)AND(可视化)AND(三维OR虚拟现实)英文TopicWords:GISorGeographyInformationSystem3D,DEM,VR,visualizationBooleanExpression:kw=GISANDvisualizationAND(3DORDEM)城市生活污染研究关键词:城市(都市、城区)生活污染(生活污水、生活垃圾、电磁辐射污染等)检索式(城市or都市or城区)and(生活污染or生活污水or生活垃圾or电磁辐射污染)了解有关国内近十年来室内装修污染方面的研究关键词:室内、装修、污染同义词或近义词:室内(住宅、居室、房屋)污染(放射性、化学、氡气、甲醛、苯等)确定学科范畴等辅助信息:环境科学。中文库为主,十年期限。以室内环境污染检测,危害和处理等方面研究为主选择专业数据库和各类型综合数据库为主,以google等网络资源为辅计算机检索逻辑表达式举例:例1:GPS在建筑事业中的应用主题词:A:全球定位系统;B:建筑测量;组配词:C:应用表达式:AANDBANDC例2:加拿大遥感活动展望主题词:A:遥感;B:测绘科技活动;组配词:C:加拿大;D:展望表达式:(AORB)ANDCANDD例3:Peter教授在测量平差理论方面的研究主题词:A:测量平差;组配词:B:理论;C:研究;D:Peter表达式:AAND(BORC)ANDD例4:Batson关于土地规划与地籍测量方面的论述主题词:A:土地规划;B:地籍测量;组配词:C:评论;D:Batson;表达式:(AORB)ANDCANDD例5:专题测图用于土地利用制图和植被制图主题词:A:专题测量仪;B:土地利用制图;C:植被制图;D:测绘仪器;E:地图制图;F:专题制图表达式:(AORD)AND(BORCOREORF)例6:新型的自动化数字制图软件的开发与利用主题词:A:机助制图系统;B:系统软件;C:软件技术;D:自动化测图组配词:E:开发;F:应用表达式:(AORD)AND(BORC)AND(EORF)例7:利用人造卫星数据及地理信息分析森林用途主题词:A;卫星影象;B;卫星遥感;C;地理信息系统;D:森林遥感;E;森林判读;F;森林调查;G;森林监测;H;数据处理表达式:(AORB)ANDCAND(DOREORFORG)ANDH注意在检索过程中,由于可以随时修改检索策略,因此一方面要以制定的检索式为基础,要服从检索式,但不要过多地受构造检索式的限制,要把条件适当放宽一些,逐步缩小检索范围,多次试验,以找到最佳检索式课题二移动通信定位技术的研究和应用课题分析:随着移动通信的发展,人们之间的联系更为紧密,生活也更加方便,手机等移动通信工具已经成为生活中不可缺少的伙伴。科技的发展速度是难以估量的,如今,单纯追求语音服务的时代已经逝去,人们越来越“贪婪”,希望自己的手机不仅能打电话发短信,而且要能听歌,玩游戏,大规模传送数据……这些便是移动通信的“新课题”,它摆脱了原有的束缚,向生活的每个角落扩张,已经而且将更加深地影响我们的生活。移动通信定位技术作为这些新技术之一,渐渐显现出自己独特的优势,已经从军用扩展到了民用。移动通信定位技术作为一种新兴的技术,涉及多个学科,包括计算机科学与技术,数学和移动通信技术等等。所以这项技术的发展需要多种知识的结合,需要做出合理的人才和资源配置,是一项复杂的工程。而作为一项新的具有无限活力的技术,我们可以预见,移动通信定位技术的作用将会越来越大,它的发展势头将不可阻挡。通过课程分析,可以做出以下的检索策略:1、关键词:移动定位技术移动定位通信检索式:中文((移动)*(定位技术))+((移动定位)*(通信技术))英文(mobileLocation)or((locationtechnology)*(mobilecommunication))2、学科范畴:电子技术与通信计算机技术信息科学技术3、检索时间范围:由于移动通信定位技术是最近才发展起来的,不管是在国内还是国外,都属于历史较短的技术,所以我把检索时间定在20世纪90年代到现在。4、文献类型:鉴于移动通信技术的发展历史较短,属于前沿科学,而这种技术又有广阔的前景,所以我认为检索的文献应该主要是:科技期刊,学位论文,学术会议,科技报告,科技图书等。5、检索方法:针对所检索的课题,移动通信技术的发展状况和前景分析,用倒查法不仅可以实现查全,而且可以更大程度的满足信息的及时性,使我们的检索更具有实际意义。6、使用的数据库:根据图书馆导航系统,加上对检索课题的分析和研究,选择合适的数据库中文库:中国期刊网重庆维普万方数据库英文库:CSAProquestOCLCEBSCOISIProceedingsEIIEEEElsevierSDOS课题三关于地震研究与预报前言:二十一世纪到来,我们的生活水平是越来越高,那么我们对自身安全的要求也越来越高。地震已经成为我们人类安全的最大敌人之一。前不久,在江西发生5.5级地震,造成了数十人死亡,数百人受伤,更是让许许多多的人无家可归。而在地震发生前夕,地震监控并没有向广大人民发出地震到来的信号,这是为什么?我们有必要对这个问题做伸一层的讨论。课题分析:地震是一种自然现象,是地球内部运动变化的必然结果,自古就有之,这一点可以从中国的地方志和有关记载中看出。最早的地震记录可以追述到公元前1800多年。2004年,全球共发生6级以上破坏性地震26次,尤其是6月份以来,印度尼西亚、菲律宾、日本、缅甸、以及印度等地区先后发生里氏5.5-7.8级地震。例如,2004年6月17日宜宾ML45级地震造成的直接经济损失为1535万元,约占宜宾县2003年国民生产总值200429亿元的077%。一次地震,特别是一次强烈地震之前,往往出现一些异常现象,这些与地震发生有密切联系的异常现象,就叫做地震前兆。地震前兆是客观存在的,一般分为微观前兆和宏观前兆两类。人类能凭听、看、嗅、触等感觉器官直接感觉到的称为宏观前兆,主要有动植物异常、地下水异常、地气、地光异常等。这就使得地震可以预报,从而使我们减少人命伤亡与经济损失。如何来预报呢?靠什么来感知它的到来呢?这就是我们要讨论的问题了。由以上课题分析,制定以下检索策略:1、根据课题自拟主题词,关键词,并构件计算机逻辑检索表达式如下:关键词:地震研究地震预报主题词:地震地震研究地震预报地震的发生基本的逻辑检索表达式:中文:地震AND(研究OR预报)英文:earthquake