XML的应用领域(许雪)XML是万维网联盟(W3C)创建一组规范,目前的正式版本是W3C在1998年2月10日发布的XML1.0规范和2000年10月6日发布的第二版。与HTML一样,XML也源自SGML(StandardGeneralizeMarkupLanguage一种老资格的通用标记语言),它保留了SGML80%的功能,使复杂程度降低了20%,与HTML不同XML实际上是一种元语言,可以让信息提供者根据需要,自行定义标签及属性名,从而突破了HTML固定标记集合的约束。XML具有如下的特点:自描述性,XML允许自定义标签(tag),因此标签可以包含丰富的语义信息。比如表示一本书的信息独立于平台和应用,XML的文档内容是基于UNICODE的文本,适于网络的传输半结构化,不同于纯文本中的数据,XML数据可以用DTD或者Schema来规范;但同时XML表示的是一种层次型的数据,因此比数据库更适合描述现实中的数据。机器可处理的(machineprocessable),相对于完全无规则的文本,计算机很容易处理XML文档,同时相对于无法表示语义的HTML文档,计算机很容易理解XML文档的语义,并且这种可读性对人同样适用可扩展性广泛的支持,XML得到了众多的软件厂商比如Microsoft、IBM、Sun、Oracle等几乎所有大公司的支持目前XML已经发展成为一个比较独立完整的知识体系,在这个体系中包含了非常丰富的内容。Xml的应用领域有:1互联网2.政府电子政务3.城市计划4.土地管理5.电力6.气象7.房地产8.电信9.水利10.农业XML与互联网应用技术的过去、现在和将来自由的矛和盾网络技术发展到今日,的确已渗透到社会生活的每一个角落。而令网络如此平易近人,为大众所接受的是HTML语言,正是因为HTML语言的发展,互联网也才得以有现在的辉煌。毫无疑问,未来世界将会是一个互联的世界,未来的经济也将会是以互联网为载体的网络经济。但是互联网技术发展到今日出现了一种山重水复的境地,它越来越难以满足不同用户提出的各种要求。在互联网的世界里,用户有权利选择自己的存在方式,选择自己的平台、数据库、脚本语言和样式等;同时迫于各种各样的需要,不同的存在方式之间有自由的沟通,自由地选择存在方式意味着不同的操作系统、不同的数据库、不同的WebB服务器、不同的脚本语言、不同的表现样式,从而构成异种的平台;而自由地沟通则要求在这些异种的平台之间、异种的数据库之间、甚至异种地系统之间能够毫无障碍地交流,比如说交换数据,同时它还要求应用程序具有应付不同的平台的能力,一个应用程序能够在不同的系统中得到需求的数据,总之是一种跨系统和跨平台交流的自由。这是两种自由,两种自相矛盾的自由,两种需要同时满足的自由。目前以HTML为网络通用语的WEB架构不能同时满足这两个要求,于是XML应运而生,从而WEB又开始了柳暗花明的新一页。XML是通过对本体(ontology)的描述满足两方面的要求的,XML要求以一种统一的方式描述现实中的本体(举个例子,树和tree所表示的对象是同一个本体,XML要求在必要的范围内对本体使用同一种描述方式,比如用某一个符号代表树的本体),但对本体进行的操作是各自独立实现的。在一个理想的环境下,XML统一地描述了所有的本体,这样,所有的应用只要知道这些本体以及本体的表示方法就可以透过不同的表象的面纱自由地相互交流。XML的过去和现在XML是万维网联盟(W3C)创建一组规范,目前的正式版本是W3C在1998年2月10日发布的XML1.0规范和2000年10月6日发布的第二版。与HTML一样,XML也源自SGML(StandardGeneralizeMarkupLanguage一种老资格的通用标记语言),它保留了SGML80%的功能,使复杂程度降低了20%,与HTML不同XML实际上是一种元语言,可以让信息提供者根据需要,自行定义标签及属性名,从而突破了HTML固定标记集合的约束。XML具有如下的特点:自描述性,XML允许自定义标签(tag),因此标签可以包含丰富的语义信息。比如表示一本书的信息独立于平台和应用,XML的文档内容是基于UNICODE的文本,适于网络的传输半结构化,不同于纯文本中的数据,XML数据可以用DTD或者Schema来规范;但同时XML表示的是一种层次型的数据,因此比数据库更适合描述现实中的数据。机器可处理的(machineprocessable),相对于完全无规则的文本,计算机很容易处理XML文档,同时相对于无法表示语义的HTML文档,计算机很容易理解XML文档的语义,并且这种可读性对人同样适用可扩展性广泛的支持,XML得到了众多的软件厂商比如Microsoft、IBM、Sun、Oracle等几乎所有大公司的支持目前XML已经发展成为一个比较独立完整的知识体系,在这个体系中包含了非常丰富的内容。XML文法,主要由XML1.0规范、XMLSchema(模式)和DTD构成,它们规定了XML文件的逻辑结构,定义了XML文件中的元素、元素的属性以及元素和元素的属性之间的关系,可以帮助XML的分析程序校验XML文件标记的合法性XSL(eXtensibleStylesheetLanguage可扩展样式语言),主要包括XSLT、XPATH、XSLFO等规范。这些规范共同定义XML文档的定位(addressing)、转换(transformation)和表现(presentation)XLL(eXtensibleLinkLanguage可扩展链接语言),扩展目前Web上已有的简单链接。DOM和SAX标准,用于规定XML文档的编程接口的标准应用程序接口RDF和XTM(XMLTopicMaps),用于定义和描述网络中存在的资源XP,规范了XML形式的传输协议和Web服务的定义、使用等XML的行业应用,包括电子商务,数字图书馆,远程教育,同步多媒体传输,语音,医疗,数学等各行各业的行业规范。可以看到,XML的应用层面是非常广的,总的来说XML的应用可分为四类:一、异种平台间的数据交换,此时XML作为中间件使用二、平衡服务器的负载,将XML文档和对XML文档的处理程序发送到客户端三、将同一数据以不同的面貌展现给不同的用户,并对数据作不同的过滤四、用于更加智能化的搜索XML的将来Sun公司曾经提出了网络计算(networkcomputing)的口号,如今在XML2000年大会上,XML之父JohnBosak提出了服务驱动的网络(servicedrivennetwork)的概念,他认为网络最终能够演变成服务的有序集合,并且这些服务能够通过XML、UDDI、SOAP向远程用户提供。JohnBosak的观点和BernersLee的观点是不谋而合的,Berners提出了语义Web的概念和体系架构,他认为Web最终将发展成为机器可处理的可浏览的资源空间。他的语义Web概念是分层次的,并且认为上述的所有层次需要10年左右的时间才能发展完善。微软基础的下一代网络应用平台.NET体系也完全是构架在XML之上,在该体系中,所有中间传输的文件都以XML的形式传输,XML将成为.NET体系的血液。电子商务的下一波发展浪潮必将跨越目前发展中的障碍从而导致的一系列变化带来的发展生机。需要做的第一步就是来将企业之间日常交流和交换的信息尽可能地电子化,统一化,来满足不同商业系统之间的数据交换需求。微软的电子商务框架BizTalk和OASIS组织提出的ebXML电子商务框架正在朝这个方向发展,它们将在未来的电子商务,尤其是B2B的电子商务中得到应用。另外,XSLT由于本身的特性而被称为天赐之物,它将在今后不同文档格式的转化中扮演越来越重要的角色。同样重要的是Schema,由于它具有丰富的数据类型和强大的数据表达和限制能力,它必将成为将来XML文档首选的类型语言。我们认为今后国内外XML的发展趋势是:人们将完全认识到XML的巨大前景软件厂商开始注重XML商业产品和应用的开发大型软件厂商提供更完善的XML工具和编程接口RDF、XTM成为关注的重点XSLT和XMLSchema日益受到重视Web服务的规范(如UDDI,WSDL等)将日益完善,应用系统逐渐推出XML和数据库的结合将是关注的焦点之一