508构建专业内容服务网站的思路及相关技术摘要本文从国内内容网站的发展困境出发,提出向专业内容网站发展的思路。介绍了专业内容服务网站的功能,构建的思路以及相关技术。据此,我们还针对科技信息类内容服务网站进行了实例化工作,开发出了适合科技信息网的集内容采集、编排、集成管理、发布为一体的内容服务网站解决方案。关键词专业内容网站信息中间件1引言近年来,互联网得到了迅猛的发展。根据中国互联网信息中心(CNNIC)于2001年1月17日发布的第七次中国互联网用户调查结果,至2000年12月31日,中国上网用户总数已发展至2250万人。这无疑对网络的经营、开发奠定了用户基础。在网络发展的初期,对网络的经营占主流的是因特网服务提供商(ISP,InternetServiceProvider),主要是向没有专线接入因特网的最终用户提供使用因特网的厂商,它是广大个人用户和众多小公司用户进入因特网的入口和桥梁。接入因特网之后,随之而来的是用户日益增长的对信息内容及信息服务的需求。这时,因特网内容服务提供商(ICP,InternetContentsProvider)逐渐发展起来,它们是在因特网上提供各种信息(内容)的厂商。很多经营者看到了ICP巨大的发展潜力和未来庞大的用户群,投资经营内容网站。根据调查结果,至2000年底互联网站点数已突破3万个,其中内容网站占有相当大的份量。内容网站已经成为当代互联网上门户网站的主流。专业内容服务网站,是内容网站往纵向深向发展的一种趋势。它拥有一般内容网站的内容及服务,但它主要是在此基础上针对特殊的用户群,提供专业的内容及服务。它是一种特殊的内容网站,有其独到的特点。它主要根据各专业领域中不同的技术要求、方向提供专业服务,其长处在于将互联网上海量的信息进行分门别类的归纳、升值,提供富含价值、质量高的知识。我们纵观国内外的专业内容网站,看出不少专业内容网站都面临着如下的困难:⒈数量多,竞争激烈;⒉信息大量重复的原因是不少内容提供商仅满足于Copy和Paste,而这样的ICP显然不具竞争力,极易被复制、被替代;⒊大多数的ICP之间仅仅是一种低水平的竞争,因为所提供的信息内容基本相似,所以即使竞争再激烈,也掩盖不了这样一个事实:“多个”实际上是“一个”;⒋虽然有些专业内容服务网站可以提供基本的专业信息,然而真正有价值、高质量的信息并不多,用户很难在有限的时间内找到对自己有用的信息,即效率低下的问题;⒌很少专业内容网站可以从大量简单的信息提炼出高级的知识,形成特色服务。本文针对专业内容服务网站所面临的困难,提出了增加知识含量、提高自身竞争力的解决思路,并从技术上分析如何实现更深层次、更有效的服务。2专业内容服务网站的发展思路509世界正步入知识经济时代,人们对信息的需求越来越大,网络的用途也越来越大。信息服务就是为了满足人们的信息需求,它的本质是信息资源与信息需求的接口。随着社会的发展和信息技术水平的提高,信息需求也在不断的演变和发展。现在人们已经越来越认识到网络信息资源的重要性,认识到信息服务的真正价值最终体现在它所提供的信息内容之中。随着人们信息意识的增强,人们对获取信息的时效性、针对性、多媒体性等方面有了新的要求,而且由于信息爆炸增加了信息获取的难度,我们提出的专业内容服务网站就被赋予了更加深刻的意义。针对专业领域中的特定的用户群,专业内容服务网站可以为他们提供专业的、度身量造的服务,它能够限制用户查找类别信息的范围,使用户快速找到他们需要的信息。这种信息的附加值明显增加,是普通内容网站所不能及的。我们知道,信息与知识的区别,简单地说,知识是人经过精心研究(research)和领会(haveatruegrasp)后的信息,即被深度注意、处理后的信息。一个内容提供商所能担当的,应该是知识导航和知识集成的角色。它所提供的内容,说到底是深加工后的而不是粗放的信息。`另一方面,网络经营,就是从更高的层面建设企业的站点,积极的融入企业文化特色,提供多元化的网上服务,它强调的是理念的熏陶和传导,而非一时的利润及回报。如科技类网站,使用户进入到一种科学技术气息极为浓厚的氛围中,从中切身感受科技的实力和魅力。它不仅为现在的用户提供价值含量高的科技信息,更是培育了明天甚或是下一代的潜在的用户群,它带给人们的应该是一种科技的力量和震撼。我们分析国内外的内容服务网站,发现它们提供的服务内容基本上可分为新闻、工具、交流三大类服务。其中新闻类提供包括时事、金融财经、社会文化、体育、娱乐等多方面的信息;工具类为用户提供电子邮件、软件下载、搜索引擎,以及为用户度身量造的记事本、地址簿、字典等各类服务;交流类则提供了聊天、BBS、游戏、调查、用户反馈、视频点播(VOD)、及电子商场等。那么,作为专业内容服务网站,自然必不可少的应该包括这几个层面。但是具体形式上有所不同。以科技信息类内容服务网站为例,新闻信息类应该围绕着科技方面展开,比如可分为国外科技新闻、国内科技新闻、本地科技新闻、科技纵览、科技政策及新产品视窗等;提供的工具则与科技的相关性更强,除了电子邮件和软件下载等服务,搜索服务就可以紧紧围绕科技内容进行,并且提供同类别的其它科技网站的联接;用户交流可具体确定为科技论坛、技术交流等,有条件可以提供多媒体的手段进行,增加交互性。3专业内容服务网站的技术构架任何一类内容网站都离不开强劲的技术支持。只有这样,才能将网络服务、媒体服务、网上搜索、网上内容开发结合起来,形成有力的信息服务能力,并在激烈的竞争中占据有利地位。从技术上看,当前广泛采用的是B/W/D三层结构的技术构架,它包括数据库(DB)、数据库服务器、数据库后台管理以及WEB服务器。图1给出了该结构的示意图。510首先,专业内容服务网站必须有一个强大的数据库支持。它存放所有的原始资料,以文字、数据、图片、甚至声音等多种形式存在;它是按照一定的规律放置,不同于一般的杂乱无章、无序的排列;同时它可以指定不同的用户拥有不同的权限,有利于数据的管理和安全。数据库服务器工具可以选取SQLServer、Oracle、Sybase等,都能够实现对大量数据的管理。无论是后台管理软件还是WEB服务器,通过数据库接口对数据库进行访问,避免直接操作数据库。数据库后台管理软件是信息管理人员对数据库进行有效管理的工具。通过软件友好的界面,实现信息人员对数据库的内容进行添加、修改、删除、查询等各种基本操作。并且在软件中可以界定信息主管和各级信息人员的权限,不允许跨部门、跨等级管理,再次保证了信息管理的安全。同时可以根据实际要求开发各种更加高级的功能,增加其实用性。其实现工具可用各种高级语言来进行软件的编制,如VC、Delphi、VB、PB等。WEB服务器是该网站真正与用户打交道的通道,用户通过访问由html语言和各种脚本语言编制而成的静态网页及动态网页,实现网上交互,满足信息需求。网页制作,则可用脚本语言实现,如ASP、PHP、JSP等,结合服务器端和客户端共同实现。用户在客户端连接上Internet,访问网站的WEB服务器,提交各类需求(包括查询、反馈、VOD等)。WEB服务器接到请求后进行分析,如果需要从数据库提取信息时,就将请求送到数据库服务器。数据库服务器根据提交的需求从数据库中取出相应的信息资料,然后通过来路在Internet上返回给用户。通过用户获取信息的全过程,我们可以看出这是典型的客户/服务器的体系结构,它能够在数据完整性、管理和安全性方面提供严格的集中控制;并且由于数据的集中存储,能让管理员集中备份数据和定期维护,使数据存储在集中的安全的地方。用户的应用程序并不直接访问数据,而是通过将请求发送给服务器去处理。图2给出了客户与服务器之间的交互过程。511数据库服务器客户①用户向服务器发出请求②服务器检查优先级;处理/分解用户请求③服务器进入数据源④服务器送出结果给用户图2客户与服务器的交互过程从上面可以看出,这是一种典型的分布式网络环境。为了解决应用中和数据库的互连和互操作问题,我们使用了中间件(middleware)的技术。4数据存取中间件技术需要说明的是,中间件正处在迅速发展之中,目前尚不能精确定义。比较常见的定义是:中间件是一种独立的系统软件或服务程序,分布式应用软件借助这种软件在不同的技术之间共享资源,中间件位于客户机服务器的操作系统之上,管理计算资源和网络通讯。由于实际用途的不同,中间件的类型和规模也千差万别。能够处理连接以及读写现有数据库逻辑步骤的中间件,被称之为数据存取中间件。数据存取中间件通过两个相关的标准与数据库相连。这两个标准分别是标准化SQL通用语言和可传输SQL的事实标准界面——开放数据库连接(ODBC)。这里我们所涉及到的动态网页与数据库的连接技术,就属于数据存取中间件。对于应用开发者来说,中间件封装了事务处理涉及的许多技术细节,适当地减少了开发的难度与工作量。对于应用系统的用户而言,中间件的应用可以为降低应用系统的开发成本奠定良好的基础;同时它可以低成本地提高联网应用系统的灵活性、可靠性和对大量用户要求的响应速度。对于Web应用来讲,数据库存取的格式相对较复杂,数据存取中间件的功能也应该相对灵活。它不但能执行简单的数据查询及报告功能,还能设定格式,并将数据转换成有意义的信息,以方便用户参考并制订决策。同时在不同系统的实际应用上,开发出符合具体情况的功能,使其进一步具有适用性。用户向服务器提出请求时,系统便会执行一系列操作。考虑到服务器可能同时接到数以百计的用户请求,因此系统必须能妥善处理各项请求的安全性及排序工作。然后由指定的数据库引擎来处理和提供所需的数据。最后利用中间件按指定的格式向最终用户返还所需的请512求数据。5专业内容服务网站的实例我们以一个科技信息类的内容服务网站为例,具体阐述如何开发集内容采集、编排、集成管理、发布为一体的内容服务网站。数据库管理器我们采用关系数据库管理系统SQLServer7.0,可以满足上面提到的客户/服务器结构,从而能够使用高级的开发工具进行系统开发。使用VisualC++开发出信息采集编发系统,使信息管理人员能够方便地对数据进行后台管理。数据存取中间件使用PHP4.0编制,实现动态网页与数据库的交互。我们开发的系统实现了对信息的录入、各级管理、检索等基本功能,并且在此基础上针对科技信息类网站的特点进行开发。大多数的专业内容服务网站,都会将信息完整的保存为两份,以不同的形式存在。一种就是上述的数据库形式,用户通过访问本站的动态网页实现站内信息搜索。另一种则是以静态网页形式存在。大多数门户网站的搜索引擎,其机理是在整个赛伯空间里,根据网址的题头定位以便对网页的内容进行搜索,它无法也不允许进入到网站的数据库中查找信息。如果能被其它各大门户网站方便、快速地搜索到,显而易见必将有利于提高网站的知名度,从而提高网站的竞争力和生命力。所以第二种存在形式也是非常重要的。但是对于信息管理人员来说,手工进行两份几乎相同的劳动,既枯燥无味又效率低下,还很烦琐,易于出错。而我们的信息编发系统具备了直接从数据库到网页的转换功能。操作人员只需选定待转换的所有记录,并选定网页模板文件,即可完成所有的转换,数据库中的每条记录对应生成了一个网页文件。模板可以根据网站特色设计,若有页面美工和更新的需要,只用重新定义模板文件,就可以完成所有生成网页的更新。这就是一个典型的根据具体要求开发的功能模块。6结束语总结前文,专业内容服务网站的专业信息量大且专业性强,对网站及信息的维护要求有较高的专业知识和网页制作技能。而我们构建的专业内容服务网站把对内容的管理与发布简单地转换为对数据库内的数据的管理,降低了信息工作人员的技术门栏,使他们能够有更多的精力为用户收集、提供价值含量高的信息。参考文献1浩峰.网络为家.时代出版社,2000年1月出版2陈幼松.数字化浪潮.中国青年出版社,1999年12月出版3秦荪滔.因特网时代的中国IT业.互联网世界,2000.94王华莹.中国互联网产业的现状与发展趋势.科技进步与对策,2000,55清华同方研发中心市场战略研究部.中间件