OFFICE-OPEN-XML-概述

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1OFFICEOPENXML概述ECMATC45TOMNGO(NextPage),编辑1简介OfficeOpenXML(OpenXML)是一项针对字处理文档、演示文稿和电子表格的建议开放标准,可由多个应用程序在多个平台上自由地实施。不管是要实施支持该格式的应用程序的组织、采购此类软件的商业实体和政府实体还是从事该格式教学的教育者或作家,都会因这种标准的发布而获益。昀终,所有用户都可以享受“所有文档,一种XML标准”所带来的好处,包括稳定性、持久保存性、互操作性和正在进行的其他改进。OpenXML的标准化工作是由EcmaInternational通过其TechnicalCommittee45(技术委员会45,TC45)执行的,来自Apple、BarclaysCapital、BP、英国国家图书馆(TheBritishLibrary)、Essilor、Intel、Microsoft、NextPage、Novell、Statoil、Toshiba和美国国会图书馆(UnitedStatesLibraryofCongress)的代表参与了该项工作(1)。本白皮书对OpenXML进行了总结。阅读本白皮书可以:•了解OpenXML的目的及其规范的结构•了解其特性:它处理向后兼容性、持久保存性、可扩展性、自定义架构、子设置、多平台、国际化和辅助功能的方式•了解如何了解任何OpenXML文件的高级结构,快速导航到您需要从中获取更详细信息的规范部分2标准的目的OpenXML昀初的设计目的是为了能够如实地再现以MicrosoftCorporation定义的二进制格式进行编码的字处理文档、演示文稿和电子表格的预先存在的主体。标准化过程包括:在XML中镜像表示现有主体所需的功能、对其进行扩展、提供详细文档和支持互操作性。编写时,4亿多的用户以二进制格式生成文档,估计文档数量会超过400亿,而每年正以数十亿的速度增加。这些文件的原始二进制格式是在空间宝贵、分析时间严重影响用户体验的时代创建的。它们基于Microsoft®Office®应用程序使用的内存中数据结构的直接序列化。当今的硬件、网络和标准基础架构(尤其是XML)容许通过多个平台上的多个供应商支持实现并考虑到发展的新设计。2在这些技术发展的同时,市场已经多样化,包含了一系列在简单的文档编辑程序中昀初没有考虑的新应用程序。这些新的应用程序包括:•根据业务数据自动生成文档的应用程序;•从文档中提取业务数据并将这些数据输入到业务应用程序中的应用程序;•只对文档的一小部分执行受限任务,但保留文档可编辑性的应用程序;•为具有特殊需要的用户群(如盲人)提供辅助功能的应用程序;或•在各种硬件(包括移动设备)上运行的应用程序。也许,昀深奥的问题是关于长期保存的问题。我们已经学会了创建快速增长的大量信息,但是我们使用数字表示形式对这些信息进行了编码,这些表示形式与创建它们的程序结合得如此紧密,以致于一、二十年后,读取它们时通常很难保证不会有明显的损失。保存这些文档(现有文档和新文档)中的金融投资和智力投资已经成为头等大事。二进制格式的广泛采用、技术发展、需要多种应用程序的市场力量以及长期保存的难度增加这四种影响力的浮现形成了一种迫切的需要,即定义一种开放的XML格式并以尽可能少的损失将数十亿文档迁移到该格式。此外,对该开放XML格式实现标准化并随着时间推移对其进行维护会创建一个环境,在该环境中,任何组织都可以安全地信任规范的持续稳定性,确信进一步的发展将受益于标准流程提供的制衡。目前已经存在着各种文档标准和规范,包括HTML、XHTML、PDF及其子集、ODF、DocBook、DITA和RTF。就像各种表示位图图像的标准(包括TIFF/IT、TIFF/EP、JPEG2000和PNG)一样,每种都是针对一组不同的用途创建的。OpenXML满足了人们的需要,提供了一种能涵盖现有文档主体中所表示功能的标准。据我们所知,它是唯一支持每种二进制格式功能的XML文档格式。3该标准的结构OpenXML定义了字处理、演示文稿和电子表格文档的格式。每种文档都是通过以下主标记语言指定的:WordprocessingML、PresentationML或SpreadsheetML。嵌入机制允许这三种文档中任何一种文档包含其他主标记语言格式的材料以及大量支持标记语言格式的材料。规范中既包含标准性材料(用于定义OpenXML的材料),也包含信息性材料(帮助读者了解的材料,但不是说明性材料)。它的结构按部分进行组织,以满足不同读者的需要。3—定义词汇表、符号约定和缩写。第1部分-基础知识165页—总结了三种主标记语言和支持标记语言。—建立一致性条件,提供互操作性指导。—描述开放数据包约定中针对每种文档的约束。第2部分-开放数据包约定125页—定义开放数据包约定(OPC)。每一OpenXML文件包含一组称为part(部分)的字节流,这些部分合并到一个称为数据包的容器中。数据包格式由OPC定义。—描述使用Zip文件格式的OPC的推荐物理实现。—在仅以电子形式提供的附件中,将OPC的XML架构声明为XML架构定义(XSD)(2)。该附件还包含使用RELAXNG(ISO/IEC19757-2)(3)的架构非标准表示形式。第3部分-初级知识466页—介绍每种标记语言的功能,提供上下文,并通过示例和图表来阐明元素。此部分是信息性材料(非标准性材料)。—描述在数据包中存储自定义XML数据以支持与业务数据的集成的功能。第4部分-标记语言参考5756页—定义每个元素和属性、元素父/子关系的层次结构,并根据需要定义其他语义。此部分主要用作需要有关元素或属性的完整详细信息时的参考。—定义用于存储自定义XML数据的功能。—在仅以电子形式提供的附件中,将标记语言的XML架构声明为XSD(2)。该附件还使用RELAXNG(ISO/IEC19757-2)(3)以非标准的形式表示了这些架构。—描述用于扩展OpenXML文档的功能。—指定具有不同扩展的应用程序进行互操作所需的元素和属性。第5部分-标记兼容性和可扩展性34页—使用NVDL(ISO/IEC19757-4)(4)表示了可扩展性规则。为了更轻松地读取和浏览这些文档,电子版本包含许多内部活动链接。尤其是,第4部分中通篇包含了指向父/子元素的链接。44该标准的特性本节通过描述OpenXML的一些高级特性,帮助您了解OpenXML。每个小节描述了其中的一个特性,并介绍了OpenXML中的特定功能。•“互操作性”描述OpenXML如何独立于专有格式、功能和运行时环境,使开发人员可以进行广泛选择。•“国际化”介绍了OpenXML支持每一主语言组的一些代表方式。•“对开发人员采用的障碍较低”、“精简性”和“模块性”列出了OpenXML避免或消除各方实现的实际障碍的具体方式:学习曲线、昀小功能集和性能。•“高保真迁移”描述了OpenXML如何满足在现有文档和新文档中保存信息(包括原始创建者的所有意图)的总体目标。•“与业务数据集成”描述了OpenXML如何在自定义架构中并入业务信息,以支持生产力应用程序和信息系统之间的信息集成和重用。•“创新空间”描述了OpenXML如何通过定义进一步的可扩展性机制和提供具有不同功能集的应用程序间的互操作性,来为将来做好准备。本文档的其余部分(包括本节)是OpenXML的主题性指南。对规范的引用都采用“§部分:节.小节”的形式;例如,§1:2.5指的是规范的第1部分的第2.5节。对本文中其他标题的引用则采用名称形式。4.1互操作性开发人员可以编写在多个平台上使用和生成OpenXML的应用程序。昀重要的是,具有不同背景和集团利益的EcmaTC45委员会(1)成员通过撰写、修改和审阅规范,实现了OpenXML的互操作性。代表包括:•要将OpenXML用于多种用途的多平台(Linux、MacOS和Windows)供应商(Apple、Intel、Microsoft、NextPage、Novell和Toshiba)•在现有内容(包括关键任务事务系统)上具有重大投资的集团(BP、BarclaysCapital、Essilor和Statoil)•英国国家图书馆(TheBritishLibrary)和美国国会图书馆(UnitedStatesLibraryofCongress),它们都对“持久保存”抱有浓厚兴趣5在准备期间,委员会成员提出并解决了数百个与策略、明确性、语义和对环境的可能依赖有关的问题。代表性问题和其他活动包括:•支持独立于平台机制的、原始二进制格式的专有功能•一致性条件•架构内容•使用RELAXNG(ISO/IEC19757-2)和NVDL(ISO/IEC19757-4)(4)对架构和可扩展性机制的其他表示•对用于自动分析和可视化架构的工具进行的开发•国际化•在整个规范中对说明进行完善、更正和明确,在很多情况下是尝试实现各个规范部分的结果本小节的其余部分重点介绍OpenXML在互操作性方面与原始二进制格式的具体不同之处。对互操作性的一个核心要求是独立于任何特定类型的源内容。•OpenXML不对图像、音频或视频类型进行限制。例如,图像可以是GIF、PNG、TIFF、PICT、JPEG或任何其他图像类型(§1:14.2.12)。•嵌入的控件可以是任何类型,例如Java或ActiveX(§1:15.2.8)。•WordprocessingML字体规范可以包括字体指标和PANOSE信息,以便在原始字体不可用时帮助查找替代字体(§3:2.10.5)。另外,OpenXML避免依赖生成文档的应用程序的运行时环境。•例如、显示外观的一部分图像由外部控件或应用程序生成。为了防止出现控件或应用程序不可用或者在给定的运行时环境中无法运行的情况,文档文件可以包含图像表示。该机制在早期的二进制格式中也存在。•OpenXML引入了一个更通用的称为“替代内容块”(§3:2.18.4)的机制,该机制可在使用应用程序无法解释生产应用程序所编写的内容的各种情况下使用。它通常在可扩展性上下文中使用。“创新空间”小节中将进一步描述该机制。•OpenXML避免依赖任何在文档生成者环境中有意义、但在使用者环境中无意义的参数。例如,参数CT_SYSCOLOR在生产环境中是颜色表的索引。为了支持向另一使用环境的可移植性,PresentationML允许生成者缓存在创建文档时使用的系统颜色。昀后也是昀根本的,OfficeOpenXML符合开放W3C标准(例如XML(5)和XML命名空间)(6)。这一事实本身即支持了所有符合这些开放标准的平台和操作系统中的基本级别的互操作性。64.2国际化OpenXML支持阿拉伯语、中文(三种变体)、希伯来语、印地语、日语、朝鲜语、俄语和土耳其语等多种语言所需的国际化功能。OpenXML本身支持Unicode,因为它是XML。另外,OpenXML具有一组经过多年细化的丰富国际化功能。下面的列表具有代表性:文本方向:OpenXML支持从左向右(LTR)和从右向左(RTL)语言。它还支持双向(“BiDi”)语言,例如阿拉伯语、波斯语、乌尔都语、希伯来语和意第绪语,这些语言从右向左读写,但是可以包含从左向右读写的嵌入文本段。在WordprocessingML中,既可以在段落级别(§4:2.3.1.6)也可以段落中的片段级别(§4:2.3.2.28)控制文本方向。同样,在DrawingML文本中,可以在正文级别(§4:5.1.5.1.1)、段落级别(§4:5.1.5.2.2)和项目符号(§4.5.1.5.4)中控制文本方向。文本流:在WordprocessingML中,可以在节或表的级别(§4:2.3.1.41)或在段落级别(§4:2.3.2.28)控制文本流的方向。在节和表级别,可以在垂直和水平方向上控制文本流。这使得OpenXML可以支持所有可能的文本布局(例如支持蒙古语所需的自上而下并从左向右堆叠的垂直线条)。这会影响列表、表和其他演示文稿元素的布局。DrawingML还在段落级别和片级别使用Kumimo

1 / 17
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功