浅谈网络信息检索的现状及其发展趋势【摘要】随着计算机技术及网络技术的发展,网络信息检索显得越发重要。本文主要综述了网络信息检索的全文数据库、搜索引擎、互联网“超链接”等现行检索模式及它的智能化、一站式化、可视化等发展趋势。【关键词】网络信息检索;现状;发展趋势1.信息检索概述信息检索(InformationRetrieval)是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要指出其中相关信息的过程,因此它的全称叫“信息存储与检索”。随着互联网的发展,人类社会的信息化、网络化进程大大加快。当今出现的一系列新型检索模式,包括网络信息规范控制标准等为网络检索技术的未来展现了新希望,与之相适应的信息检索的交流平台也迅速转移到以为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。2.网络信息检索的现状对大多数读者而言,检索并不意味着发现,而是获得。人们希望不仅仅是提供宽泛的检索结果,而应该是计算机能试图理解用户提问的意图,并对检索结果进行适当的分类和排序。但是,现有的搜索引擎大多是基于简单的关键词匹配,不能真正理解用户的检索意图;各个搜索引擎的信息搜集和索引建立有很大的不同,每个搜索引擎平均只能涉及到整个网上资源的30%~50%,而其中真正有用的信息也只占很小的比例,这就意味着使用任何一个搜索引擎都只能检索到网络中的部分资源。目前网络检索面临一系列的挑战,网络信息量迅猛增加,人工已经无法对它们进行有效的分类、索引和利用;简单的关键词搜索,返回的信息量过大,已经让用户无法承担;网络信息组织的无序性;信息有用性评价困难;网络信息日新月异的更变;信息媒体的多样化;带宽等其它因素的制约,这些都给因特网信息的获取造成了极大的阻碍。这样就造成了要求智能化、专业化、多元化、多媒体化的网络信息检索工具出现的呼声越来越高,并且有更多的人参与到其中来。如此种种,给当今的网络信息检索研究带来了发展机遇,也给了它无限的发展空间。3.网络信息检索的现行模式3.1网络全文数据库检索网络全文数据库是以全文数据为数据库对象,并在网上提供全文检索服务的数据库。按数据库的生产机构分类,可分为出版商全文期刊数据库和生产商全文期刊数据库。前者主要是那些期刊出版单位在其出版的印刷期刊基础上建立的网络电子期刊全文数据库。而后者则是由数据库生产商根据一定的主题或一定的收录范围整合一定数量的期刊出版物而产生的全文数据库。国内全文数据库主要有中国学术期刊全文数据库。3.2网络搜索引擎检索搜索引擎是一个专门的系统,它可以对互联网信息资源进行搜索整理和分类,并将其储存在网络数据库中供用户查询。搜索引擎包括搜集信息、分类和用户查询等三大部分。目前流行的搜索引擎有两大类:关键词全文检索式搜索引擎和分类目录式搜索引擎。关键词全文检索式搜索引擎主要利用其内部的搜索机器人和蜘蛛程序,自动搜索来自互联网上的各种内容,在每一个关键词和所有相关的网页之间按照网页相关性原理建立一个对应关系,储存在其网络服务器的数据库中。用户只要输入关键词就可以找到符合该关键词特征的所有被索引的网页,搜索结果以超链接的方式列表,搜索结果有简单介绍,用户点击相应的链接就可以进入相应的网络资源网站,从而找到所需信息。用这种方式搜索到的结果通常数以百万计,但是相关性越高的信息,在搜索结果列表中的位置越靠前。分类目录式搜索引擎将互联网信息按照一定的标准进行收集和分类,并编入相应目录,以层级和逐次分项的方式管理目录,查找信息可以按照分类目录一层层进入,最终找到所要的信息。3.3互联网“超链接”搜索Web信息以超文本链接方式组织,基本组织单元是信息节点而不是字符串,信息节点之间通过链接进行联系。超链接是网页必不可少的一个元素,同一主题或相关的信息因超链接构成了信息网。超文本信息检索技术,以超文本信息节点之间的多种链接关系为基础,根据思维联想或查找信息的需要,通过链接从一个信息节点转到另一个信息节点。4.网络信息检索的未来发展趋势网络技术的发展,给网络信息检索及信息的网络化带来的极大的便利,进一步推动了网络信息检索理论和技术的快速发展。怎样为网络用户提供高质量、高效率的检索方式是网络信息检索研究者的努力方向。信息检索的对象已从传统的文本信息扩展到如今开放、动态、分布广泛的多媒体信息。那么,网络信息检索的发展趋势如何呢?4.1智能化信息检索智能化信息检索是基于自然语言处理的检索形式。检索工具是对用户提供的以自然语言表达的检索要求进行分析,从而形成检索策略进行检索。检索工具智能化的内涵在于检索工具具有学习、分析、辨别和推理的能力。近年来,因特网上不断涌现的人工智能产品,如智能搜索引擎、智能浏览器、智能代理等,它们将提高网络信息检索的智能化程度,促进智能信息检索的发展。网络中的智能代理通常是一个专家系统、一个过程、一个模块或一个求解单元。智能代理可以获得用户的信息需求,自动检索信息和推送检索结果信息。多智能代理系统还具有信息发现、信息筛选、信息推送和信息导航功能,可满足专业研究人员的特定需求,实现网络信息检索与服务的智能化。4.2一站式信息检索一站式(OneStop)信息检索是指用户通过一个检索工具能满足自己所有的信息检索需求。一站式信息检索将是网络信息检索服务的一种发展模式。一站式检索服务是人性化服务的重要体现,它将大量节约用户的检索时间。全球最大的搜索引擎Google正在朝着一站式服务的方向发展。2004年12月,Google宣布与纽约公共图书馆和包括哈佛大学图书馆在内的4个主要图书馆合作,将这些图书馆的大约1500万册藏书扫描进自己的数据主库以提供网络用户检索。目前,Google已经为其用户提供了某种程度上的一站式的检索服务了。而其他越来越多的检索服务提供商将向一站式检索方向发展。4.3可视化可视化指的是运用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。据统计,获取信息有70%~80%靠视觉,20%靠听觉,10%靠触觉。用图像取代文字帮助人们检索的优点在于:图像的表达更生动、结束语形象、准确,效率更高,具有交互性、多维性、可视性等特点,可以大大加快检索速度,使时刻都在产生的海量数据得到有效利用。4.4商业化目前网络信息检索系统已成为新的投资热点,网络信息检索系统不再仅仅是一种检索工具,而且是一种商业产品。2001年10月,全球最大的中文搜索引擎提供商百度()联合新浪等多家中文门户网站,共同推广“搜索引擎竞价排名”全新网络商业服务模式。网络信息检索的商业化还体现在联机和光盘检索逐渐进入网络环境。由于目前网络信息检索的检准率低,联网的收费联机和光盘检索依旧受到青睐,如世界著名的联机信息系统DIALOG、OCLC、EBSCO、Silverplatter,国内的万方数据资源系统、中国学术期刊光盘、重庆维普公司系列光盘等都纷纷在网上设立自己的网络检索入口。许多著名科技期刊的上网丰富了网络资源,它们大多数都是在提供印刷版的同时提供期刊的网上服务,包括收费检索。5.小结在的网络信息资源中寻找自己所需要的信息资源是一件极具挑战性的工作。为此,许多信息专家正在积极地研究探索,并且取得了不少成果。我们相信随着科学技术的进步,网络信息检索发展会越来越快,人们所利用的检索工具和手段的更替会更加频繁。参考文献[1]黄静.网络信息检索发展方向展望[J].JournalofLibraryandInformationSciencesinAgriculture,2008(1):15-19.[2]霍小梅,王小兰.网络信息检索的现状及发展趋势[J].图书馆论坛,2004(4):180-182.[3]戴莉.网络信息检索的发展趋势[J].情报探索,2005(2):52-54.[4]徐谦.网络信息检索的智能化趋势[J].图书馆理论与实践,2006(2):63-65.[5]谢新洲.网络信息检索技术与案例[M].北京:北京图书馆出版社,2005:9.[6]易向军.网络信息检索现状及未来[J].合肥学院学报,2007(7):90-92.