XML基础教程XML简介用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。XML与Access,Oracle和SQLServer等数据库不同,数据库提供了更强有力的数据存储和分析能力,例如:数据索引、排序、查找、相关一致性等,XML仅仅是存储数据。事实上XML与其他数据表现形式最大的不同是:他极其简单。这是一个看上去有点琐细的优点,但正是这点使XML与众不同。XML指可扩展标记语言(EXtensibleMarkupLanguage)XML是一种标记语言,很类似HTMLXML的设计宗旨是传输数据,而非显示数据XML标签没有被预定义。您需要自行定义标签。XML被设计为具有自我描述性XML与HTML的主要差异XML不是HTML的替代。XML和HTML为不同的目的而设计:XML被设计为传输和存储数据,其焦点是数据的内容。HTML被设计用来显示数据,其焦点是数据的外观。HTML旨在显示信息,而XML旨在传输信息。没有任何行为的XML,XML是不作为的。也许这有点难以理解,但是XML不会做任何事情。XML被设计用来结构化、存储以及传输信息。下面是John写给George的便签,存储为XML:上面的这条便签具有自我描述性。它拥有标题以及留言,同时包含了发送者和接受者的信息。但是,这个XML文档仍然没有做任何事情。它仅仅是包装在XML标签中的纯粹的信息。我们需要编写软件或者程序,才能传送、接收和显示出这个文档。XML仅仅是纯文本XML没什么特别的。它仅仅是纯文本而已。有能力处理纯文本的软件都可以处理XML。不过,能够读懂XML的应用程序可以有针对性地处理XML的标签。标签的功能性意义依赖于应用程序的特性。通过XML您可以发明自己的标签上例中的标签没有在任何XML标准中定义过(比如to和from)。这些标签是由文档的创作者发明的。这是因为XML没有预定义的标签。在HTML中使用的标签(以及HTML的结构)是预定义的。HTML文档只使用在HTML标准中定义过的标签(比如p、h1等等)。XML允许创作者定义自己的标签和自己的文档结构。XML不是对HTML的替代XML是对HTML的补充。XML不会替代HTML,理解这一点很重要。在大多数web应用程序中,XML用于传输数据,而HTML用于格式化并显示数据。对XML最好的描述是:XML是独立于软件和硬件的信息传输工具。XML用途:XML应用于web开发的许多方面,常用于简化数据的存储和共享。XML把数据从HTML分离如果你需要在HTML文档中显示动态数据,那么每当数据改变时将花费大量的时间来编辑HTML。通过XML,数据能够存储在独立的XML文件中。这样你就可以专注于使用HTML进行布局和显示,并确保修改底层数据不再需要对HTML进行任何的改变。通过使用几行JavaScript,你就可以读取一个外部XML文件,然后更新HTML中的数据内容。XML简化数据共享在真实的世界中,计算机系统和数据使用不兼容的格式来存储数据。XML数据以纯文本格式进行存储,因此提供了一种独立于软件和硬件的数据存储方法。这让创建不同应用程序可以共享的数据变得更加容易。XML简化数据传输通过XML,可以在不兼容的系统之间轻松地交换数据。对开发人员来说,其中一项最费时的挑战一直是在因特网上的不兼容系统之间交换数据。由于可以通过各种不兼容的应用程序来读取数据,以XML交换数据降低了这种复杂性。XML简化平台的变更升级到新的系统(硬件或软件平台),总是非常费时的。必须转换大量的数据,不兼容的数据经常会丢失。XML数据以文本格式存储。这使得XML在不损失数据的情况下,更容易扩展或升级到新的操作系统、新应用程序或新的浏览器。XML使您的数据更有用由于XML独立于硬件、软件以及应用程序,XML使您的数据更可用,也更有用。不同的应用程序都能够访问您的数据,不仅仅在HTML页中,也可以从XML数据源中进行访问。通过XML,您的数据可供各种阅读设备使用(手持的计算机、语音设备、新闻阅读器等),还可以供盲人或其他残障人士使用。XML用于创建新的Internet语言很多新的Internet语言是通过XML创建的:其中的例子包括:XHTML-最新的HTML版本WSDL-用于描述可用的webserviceWAP和WML-用于手持设备的标记语言RSS-用于RSSfeed的语言RDF和OWL-用于描述资源和本体SMIL-用于描述针针对web的多媒体XML树结构XML文档形成了一种树结构,它从“根部”开始,然后扩展到“枝叶”。一个XML文档实例XML使用简单的具有自我描述性的语法:第一行是XML声明。它定义XML的版本(1.0)和所使用的编码(ISO-8859-1=Latin-1/西欧字符集)。下一行描述文档的根元素(像在说:“本文档是一个便签”):接下来4行描述根的4个子元素(to,from,heading以及body):最后一行定义根元素的结尾:XML文档形成一种树结构XML文档必须包含根元素。该元素是所有其他元素的父元素。XML文档中的元素形成了一棵文档树。这棵树从根部开始,并扩展到树的最底端。所有元素均可拥有子元素:父、子以及同胞等术语用于描述元素之间的关系。父元素拥有子元素。相同层级上的子元素成为同胞(兄弟或姐妹)。所有元素均可拥有文本内容和属性(类似HTML中)。例子中的根元素是bookstore。文档中的所有book元素都被包含在bookstore中。book元素有4个子元素:title、author、year、price。XML语法规则所有XML元素都须有关闭标签在HTML,经常会看到没有关闭标签的元素:在XML中,省略关闭标签是非法的。所有元素都必须有关闭标签:注释:您也许已经注意到XML声明没有关闭标签。这不是错误。声明不属于XML本身的组成部分。它不是XML元素,也不需要关闭标签。XML标签对大小写敏感XML元素使用XML标签进行定义。XML标签对大小写敏感。在XML中,标签Letter与标签letter是不同的。必须使用相同的大小写来编写打开标签和关闭标签:注释:打开标签和关闭标签通常被称为开始标签和结束标签。不论您喜欢哪种术语,它们的概念都是相同的。XML必须正确地嵌套在HTML中,常会看到没有正确嵌套的元素:在XML中,所有元素都必须彼此正确地嵌套:在上例中,正确嵌套的意思是:由于i元素是在b元素内打开的,那么它必须在b元素内关闭。XML文档必须有根元素XML文档必须有一个元素是所有其他元素的父元素。该元素称为根元素。XML的属性值须加引号与HTML类似,XML也可拥有属性(名称/值的对)。在XML中,XML的属性值须加引号。请研究下面的两个XML文档。第一个是错误的,第二个是正确的:在第一个文档中的错误是,note元素中的date属性没有加引号。实体引用在XML中,一些字符拥有特殊的意义。如果你把字符放在XML元素中,会发生错误,这是因为解析器会把它当作新元素的开始。这样会产生XML错误:为了避免这个错误,请用实体引用来代替字符:在XML中,有5个预定义的实体引用:注释:在XML中,只有字符和&确实是非法的。大于号是合法的,但是用实体引用来代替它是一个好习惯。在XML中,空格会被保留HTML会把多个连续的空格字符裁减(合并)为一个:在XML中,文档中的空格不会被删节。XML元素什么是XML元素?XML元素指的是从(且包括)开始标签直到(且包括)结束标签的部分。元素可包含其他元素、文本或者两者的混合物。元素也可以拥有属性。在上例中,bookstore和book都拥有元素内容,因为它们包含了其他元素。author只有文本内容,因为它仅包含文本。在上例中,只有book元素拥有属性(category=CHILDREN)。XML命名规则XML元素必须遵循以下命名规则:名称可以含字母、数字以及其他的字符名称不能以数字或者标点符号开始名称不能以字符“xml”(或者XML、Xml)开始名称不能包含空格可使用任何名称,没有保留的字词。最佳命名习惯使名称具有描述性。使用下划线的名称也很不错。名称应当比较简短,比如:book_title,而不是:the_title_of_the_book。避免-字符。如果您按照这样的方式进行命名:first-name,一些软件会认为你需要提取第一个单词。避免.字符。如果您按照这样的方式进行命名:first.name,一些软件会认为name是对象first的属性。避免:字符。冒号会被转换为命名空间来使用(稍后介绍)。XML文档经常有一个对应的数据库,其中的字段会对应XML文档中的元素。有一个实用的经验,即使用数据库的名称规则来命名XML文档中的元素。非英语的字母比如éòá也是合法的XML元素名,不过需要留意当软件开发商不支持这些字符时可能出现的问题。XML元素是可扩展的XML元素是可扩展,以携带更多的信息。请看下面这个XML例子:让我们设想一下,我们创建了一个应用程序,可将to、from以及body元素提取出来,并产生以下的输出:想象一下,之后这个XML文档作者又向这个文档添加了一些额外的信息:那么这个应用程序会中断或崩溃吗?不会。这个应用程序仍然可以找到XML文档中的to、from以及body元素,并产生同样的输出。XML的优势之一,就是可以经常在不中断应用程序的情况进行扩展。XML属性XML元素可以在开始标签中包含属性,类似HTML。属性(Attribute)提供关于元素的额外(附加)信息。XML属性从HTML,你会回忆起这个:imgsrc=computer.gif。src属性提供有关img元素的额外信息。在HTML中(以及在XML中),属性提供有关元素的额外信息:属性通常提供不属于数据组成部分的信息。在下面的例子中,文件类型与数据无关,但是对需要处理这个元素的软件来说却很重要:XML属性必须加引号属性值必须被引号包围,不过单引号和双引号均可使用。比如一个人的性别,person标签可以这样写:XML元素vs.属性请看这些例子:在第一个例子中,sex是一个属性。在第二个例子中,sex则是一个子元素。两个例子均可提供相同的信息。没有什么规矩可以告诉我们什么时候该使用属性,而什么时候该使用子元素。我的经验是在HTML中,属性用起来很便利,但是在XML中,您应该尽量避免使用属性。如果信息感觉起来很像数据,那么请使用子元素吧。避免XML属性?因使用属性而引起的一些问题:属性无法包含多重的值(元素可以)属性无法描述树结构(元素可以)属性不易扩展(为未来的变化)属性难以阅读和维护请尽量使用元素来描述数据。而仅仅使用属性来提供与数据无关的信息。不要做这样的蠢事(这不是XML应该被使用的方式):针对元数据的XML属性有时候会向元素分配ID引用。这些ID索引可用于标识XML元素,它起作用的方式与HTML中ID属性是一样的。这个例子向我们演示了这种情况:上面的ID仅仅是一个标识符,用于标识不同的便签。它并不是便签数据的组成部分。在此我们极力向您传递的理念是:元数据(有关数据的数据)应当存储为属性,而数据本身应当存储为元素。XMLHttpRequest对象XMLHttpRequest对象用于在后台与服务器交换数据。什么是XMLHttpRequest对象?XMLHttpRequest对象用于在后台与服务器交换数据。XMLHttpRequest对象是开发者的梦想,因为您能够:在不重新加载页面的情况下更新网页在页面已加载后从服务器请求数据在页面已加载后从服务器接收数据在后台向服务器发送数据所有现代的浏览器都支持XMLHttpRequest对象。创建XMLHttpRequest对象所有现代浏览器(IE7+、Firefox、Chrome、Safari以及Opera)都内建了XMLHt