信息检索论文范本

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

信息检索结课论文题目:网络信息资源检索、技巧及问题研究学院:艺术与设计学院专业:多媒体技术动画学生姓名:******学号:***********授课教师:李凤英收稿日期:2004-01-12基金项目:国家自然科学基金项目(2002A1030405)作者简介:******(1975-),男,安徽马鞍山人,桂林电子科技大学硕士生,主要研究方向为移动通信理论与技术。网络信息资源检索、技巧及问题研究******(桂林电子科技大学艺术与设计学院,广西桂林541004)摘要:互联网已经成为全球最大的信息资源库,这对于网络信息资源的检索提出了更高要求从网络信息资源的发展及探讨检索的意义入手,分析网络信息资源检索工具的类型内容和作用,探讨网络信息资源检索的若干技巧,指出网络信息资源在检索过程中存在着诸如信息质量网络检索工具信息用户等方面的问题,并提出了相应的解决对策,重点为网络用户介绍了一些常用的网络信息检索途径方法和技巧。关键词:网络信息资源;检索途径;检索方法;检索技巧中图分类号:G354文献标识码.ATechniquesandproblemsofthenetworkinformationresourcesretrieval******(CollegeofartanddesignofGuilinUniversityofElectronicTechnology,GuangxiGuilin541004)Abstract:theInternethasbecometheworld'slargestinformationresourcedatabase,theretrievalofnetworkinformationresourcesputforwardhigherrequirementsfromthedevelopmentofnetworkinformationresourcesandtoexplorethesignificanceofanalysisofthetypesofretrieval,contentandfunctionofthenetworkinformationresourceretrieval,researchesonTechniquesofnetworkinformationresourceretrieval,andpointsoutthatnetworkinformationresourcesinthetheretrievalprocesssuchastheexistenceofinformationqualityofnetworkinformationretrievaltoolsusersandotherissues,andthecorrespondingcountermeasuresareputforward,mainlyintroducestheretrievalmethodsandskillsofsomecommonlyusednetworkinformationforInternetusers.Keywords:networkinformationresources;search;retrieval;SearchTips1.网络信息资源及检索网络信息资源是指以电子数据形式的文字图像、声音、动画等,以光磁等非纸质为载体存储,通过网络和计算机等方式再现的信息资源。或者说,是网络和计算机交流利用所有信息资源的总和。目前,网络信息已成为世界上信息量最丰富利用最便捷用户群最大拓展性最强的信息资源。据2013年12月《中国互联网状况》白皮书显示,截至2013年底,中国网民人数达到8亿多,年均增长3195万人,互联网普及率达到60.9%,超过世界平均水平;中国境内网站达323万个,比1997年增长了2152倍;中国拥有IPV4地址约2.3亿个,已成为世界第二大IPV4地址拥有国;中国宽带网民达到5.46亿人,手机网民达到2.33亿人网民人数的迅速增加和信息需求的不断增强,促进了互联网的飞速发展,而网络机构及技术的快速发展,又极大地丰富了网络信息资源网络信息资源的发展,有效地补充了信息咨询机构的资源不足,使其信息资源保障能力大幅度提高基于信息资源的检索,无论是对于信息资源的提供者还是获取者都提出了更高的要求。网络信息资源检索有别于传统的文献资源检索。其不同在于,它以计算机高速信息网络作为检索平台,对于用户检索提问以“匹配运算”方式,对存储在检索系统中的信息进行逻辑比对、组配,将符合者调出;与传统检索一样也是信息的查找过程,但需要人、计算机、互联网的协调来完成网络信息资源数量庞大内容繁杂且无序,对于信息提供者或获取者来说,快速准确高效获取网络信息资源,网络信息资源检索工具是必须面对的问题。同时在信息类型多样化,如何在巨大的网络信息中找到所需要的内容,是每个上网者都面临的问题。2.基于网络信息资源的检索工具快速准确高效地获取网络信息资源,是信息提供者或获取者追求的目标;而合理利用网络信息检索工具,则是实现其目标的有效途径。网络信息检索工具,泛指由因特网提供的网页信息资源检索和网站导航服务站点,通常又称搜索引擎搜索引擎利用网络自动搜索技术,对各种互联网资源进行采集标引组织加工整理,并将其建立管理和存储信息的索引数据库,以此实现为用户提供基于数据库的检索服务主要有以下几种类型:2.1关键词型关键词型搜索引擎,是指根据用户在检索界面输入的检索词(词组或语句),与数据库中的索引记录进行匹配比较,以此查找用户所需信息的一种网络检索工具,如Google百度等它采用自动索引软件来发现收集并标引网页和建立数据库其优点在于,信息量大更新及时,检索界面直观、简洁方便,而且绝大多数都支持布尔逻辑、截词运算模糊检索和自然语言检索等检索技术,并可准确表示检索需求。还在于,借助于全文检索技术,可实现网页内容的全文检索由于检索结果与输入的关键词相关,是一个个网页的地址和信息全文的小段文字提要,因此也称其为全文搜索引擎。其缺点是,返回的检索结果数量大,无关和冗余信息较多,用户必须从中进行筛选。2.2目录型目录型搜索引擎,或称指南目录,是一种按照某种分类体系编制可供分类浏览和检索的等级结构式目录,属于浏览式搜索引擎,如雅虎搜狐等用户通过浏览其树形分类目录,可循类逐层点击各大小类目,层层递进不断缩小检索范围,最终获取所需信息目录型搜索引擎采取人工方式或半自动方式,进行搜集信息编写网站概述来形成摘要信息,并将这些信息置于分类目录体系中,用户从中可获得网站的站名、地址和内容简介这种类型的检索工具层次和结构清晰、易于查找,网站简介一目了然便于取舍由于人工的介入,确保了信息的准确性和较高的导航质量其缺点是,有时分类目录体系不够完善与合理,人工介入引起维护量大,导致信息量少更新不及时查全率不高。2.3元搜索型元搜索引擎,也称集合型搜索引擎,如InfoSDogpile等它包含多个单一型搜索引擎,在统一的用户查询界面与信息反馈形式下,共享多个搜索引擎的资源库,并以此为用户提供信息检索服务,因此又称为是对搜索引擎进行搜索的引擎用户为了全面准确查询信息,需访问不止一个搜索引擎,并希望只通过一次性查询,获得多个搜索引擎的查询结果,而不是枯燥繁琐的重复劳动,而元搜索引擎可以满足用户这一要求它的最大特点,是没有属于自己的信息资源库,只相当于一个中间代理;还在于具有搜索范围广泛查全率高,能够在较短时间提供相对全面准确的信息之不足在于,不能充分概括所用搜索引擎的所有功能,用户需要对反馈结果进行进一步筛选。2.4垂直搜索型垂直搜索引擎是针对某个行业的专业搜索引擎,是搜索引擎的细分和延伸其特点在于:针对某一特定的领域人群需求提供信息及相关服务,且“专、精、深”,具有行业色彩,如音乐搜索、旅游搜索、车票搜索、文学搜索、视频搜索等,都有着较好的用户体验;硬件成本低,用户需求特定,查询方式多样,且具有行业化分工众多的专业行业网站独立服务于互联网,从这一层面证明了互联网格局的多方面性通用搜索引擎性质使然,决定其不能满足特殊领域和人群的精准化信息需求,而市场需求多元化又决定了搜索引擎服务模式的细分,以针对不同行业提供更加精确的行业服务。可以说,通用搜索引擎的发展,为垂直搜索引擎的出现提供了良好的市场空间,为垂直搜索引擎在互联网中占据部分市场提供了机会,因此也使搜索引擎行业细分化成为了必然。3.网络信息资源检索的若干技巧随着网络信息资源的发展,互联网已成为全球最大的信息资源库,这就为网络信息检索的查全率查准率及效率提出了更高的要求然而,了解网络信息资源特征以及掌握网络信息检索技巧,是优化检索结果实现其要求的有效途径。3.1选择适当的检索工具各类搜索引擎的查询范围检索功能各有侧重,因此根据检索主题的需要和要求,选择适当的检索工具,是提高检索查全率查准率及效率的首要条件选择检索工具应遵循以下原则:其一,以专业对口高质量为原则一般来说,网络资源信息检索应从本单位本地区或系统现有检索工具的实际出发,选择专业对口质量高的搜索引擎。其二,以先综合性后专业性为原则先考虑综合性的全文索引搜索引擎,然后选择专业性垂直搜索引擎加以补充这是由于综合性全文搜索引擎通常以全球网络资源为目标,而一些中小型垂直搜索引擎则以某一区域或专业的专题信息为侧重点,前者的搜索范围虽然广泛,但就某一局部或某个专业而言,内容却未必有后者的丰富和完备。其三,以先中文后外文为原则在选择语种方面,先考虑选用中文的检索工具或系统,然后考虑英文语种,最后使用其他语种,这是基于中国人语言实际而考虑的此外,选择检索工具应了解其工具特有的检索方式所支持的检索功能,以及了解和掌握检索结果有几种表达方式。3.2选用贴切的关键词选用贴切的关键词,既是检索中的技巧,也是检索经验积累的结果选用关键词能力的提升除了实践中不断尝试和积累外,还应掌握以下原则:其一,表述准确贴切网站或数据库都有自动搜索关键词的功能,因此,准确表述关键词是获得良好搜索结果的前提条件搜索结果欠佳。存在的问题有:主题思路正确,但不能正确的作出表述,如关键词语义不清或有错别字,因此应在提升关键词准确度上发力。其二,主题关联并简练搜索引擎要求关键词简练匹配,因此提交搜索请求,应把关键词提炼成简单的所希望找到的并与信息主题相关联的查询词关键词并不是越长越好,而是合适贴切。其三,使用多个关键字对于大部分搜索请求来说,都能够通过搜索网站找到需要的网页,但如果选择关键字不合适贴切,搜索网站会返回很多不是所需的结果如果将另一搜索目标相关的关键词加在一起搜索,返回的结果就会少很多,结果也会更加准确。3.3构造正确的检索式检索式是检索策略的具体体现,它控制着检索过程,构造是否合理正确关系到检索结果一个好的检索式应准确地反映检索的内容主题,符合检索系统的功能限制条件和规定,将检索结果控制在准确的范围内基于布尔逻辑检索理论的成熟性,其理论便成为了构造检索表达式最基本、最简单的匹配模式。这是由于数据库或搜索引擎的基本检索命令,与布尔逻辑规则、字符串检索、截词检索、字段索、限制检索等的语法基本上是通用的针对不同的搜索引擎、数据库和信息需求,应有不同的检索策略,这样检索式构造也应有所不同常用的检索式有以下几种:其一,逻辑“与”,以“AND”或“*”表示以此表示其所连接的两个检索项的交叉部分,即交集部分逻辑与检索能增强检索的专指性,使检索范围缩小。其二,逻辑“或”,以“OR”或“+”表示,用于连接并列关系的检索词、运算逻辑或检索可扩大检索范围,提高检索的查全率。其三,逻辑“非”,以“NOT”或“-”号表示,用于连接排除关系的检索词,即排除不需要的和影响检索结果的概念逻辑“非”用于表达两个或两个以上检索词之间中排除不需要的检索词、(关键词主题词)、运算,以缩小检索范围,增强检索的准确性。若使用不当,将会排除有用信息,导致漏检。其四,邻近度算符With,以“With”表示用于表示同时出现在同一文献的一个字段的两个词,用With连接检索词A和B,检索式为A表示检索词A和B不仅要同时出现在一条记录中,还要同时出现在一个字段里的文献才

1 / 11
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功