于关系数据库的XML数据存储技术的研究

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

北京工业大学硕士学位论文基于关系数据库的XML数据存储技术的研究姓名:吕云霞申请学位级别:硕士专业:计算机应用技术指导教师:朱青20080501基于关系数据库的XML数据存储技术的研究作者:吕云霞学位授予单位:北京工业大学相似文献(10条)1.学位论文张均胜XML和关系数据库整合方法的研究及其应用2004XML是一种新的网络数据表示形式,如何有效的存储和查询XML数据成为近年来的研究热点.目前应用的数据大多存储在关系数据库中,随着需求的不断变化,需要把传统的关系数据转换为XML数据.一种可行的方法是把XML文档数据存储到关系数据库中,利用成熟的关系数据库技术存储和管理,并从关系数据库获取所需XML文档.该文首先介绍了关系数据库、XML的基本概念,分析了XML的优点及不足,讨论了如何用关系数据库的优点弥补XML不足,利用XML和关系数据库整合网络资源的可能性及意义.然后,我们分析了实现XML向关系数据库的模式转换的有关算法,重点介绍了规则树语法(RTG)、混合内联(HybridInlining)、新内联(NewInlining)和语义保存(CPI)等算法.在对几种算法的性能比较的基础上,结合混合内联算法和新内联算法的优点,我们提出了一种新的结构转换算法并应用到语义保存算法中.其次,介绍了实现关系模式向XML的转换的相关算法,如:平面转换(FT)、嵌套(NeT)以及基于约束的转换(CoT)等算法及其性能,并简要介绍了从关系数据库向W3CXMLSchema的转换方法.再次,总结了XML和关系数据库之间常用的数据交互技术SAX、DOM以及OracleXSU的用法,重点比较了应用程序接口SAX和DOM的异同,并以实例阐述了DOM的应用方法.日渐成熟的网络技术使得科学数据共享成为可能,种类繁多的科学数据需要统一化管理,因此科学数据库的建设提上了日程.文章的最后介绍了地球化学动力学数据库系统的设计与实现,包括相应的数据库系统管理软件和数据可视化平台的设计与开发,如何成功使用OracleDBMS的BLOB类型实现谱图数据的存储和显示,以及XML技术在该系统设计中的应用.在数据采集中,我们用XML数据文件存放临时的采集数据,数据经审查后,进入永久数据库,方便了数据的输入和收集,不仅改变了以往的数据采集流程,而且提高了系统的工作效率.为实现数据的网络可视化,我们结合使用XSLT和XML技术,实现同一XML数据文件的不同显示.我们还综合运用前述模式转换及数据交互技术,实现XML文档形式的实验报告的生成等等.2.学位论文王佳青把XMLSchema模式转化成关系数据库模式的研究2004数据以XML文档存储可以更加广泛的应用于许多领域.这是由于XML有大量的相关技术对它支持,其中就包括XMLSchema协议.XMLSchema可以通过指定元素内容和属性值的数据类型来限制XML文档.另一方面,如果数据想要有某种保护或使用事务处理功能时,存入到某个关系数据库是十分理想的.由于XMLSchema可以用来检查XML文档的有效性,所以如果可以把某个XMLSchema模式转换到关系数据库的模式,那么符合这XMLSchema限定的XML文档就很容易地加入到被转换成的关系数据库模式中去了.这有助于数据的灵活存储.该文着重研究了如何将一个XMLSchema转换成关系数据库模式.该文讨论的方式是自下而上的,就是先讨论XMLSchema中简单的部分,然后逐步讨论较为复杂的部分.每个部分转换都给出了必要的步骤,可以根据这些步骤自动实现这部分的转换.在转化过程中,目的是尽量保证XMLSchema信息的完整性,对确实不能保证的,采用某种变通的方式来实现.先简单分析了XMLSchema中主要组件的转换.研究了内置基础类型如何转换到关系数据库模型中.讨论了简单类型的元素是如何转换的:分别对原子类型,列表类型和联合类型的元素采用了不同地转换方法.在此基础上进一步讨论了对带有属性的元素的转换方法,并研究了复杂类型元素的内容模型的转换方法.接下来研究了二级组件的转换.着重讨论了模型组元素的转换,依次分析了sequence模型组、choice模型组和all模型组在转换时采用的方法.对带有一致性约束的元素进行了比较详细的分析和讨论.其中着重讨论了对unique限定在转换时的分析,并根据不同情况给出不同的解决步骤.最后重点研究了XMLSchema数据类型对转换的影响.给出了每个刻面在转换时需要考虑的步骤.提出了两种解决模式Rule+NewType模式和CHECK模式.此外还简单地讨论了命名规则和转换后关系模式的优化.3.期刊论文朱珊娜.李书琴.安福定.ZHUShan-na.LIShu-qin.ANFu-dingXML文档到关系数据库的转换研究-计算机工程与设计2008,29(21)XML作为网络数据交换的标准技术,广泛应用于计算机软件.目前存储数据的主流手段是关系数据库,因此XML文档与关系数据库之间必须进行转换.通过分析XML文档的层次结构,建立了XML文档树模型,并给出结点定义.依据XML的BNF规则给出了元素与属性的正规表达式和相对应的状态转换图,设计了识别元素和属性的词法分析程序用于解析XML文档.提出了XML文档树到关系数据库存储的转换思想和算法,并结合实例给出转换后的关系表.4.学位论文祝炳强基于关系数据库及面向对象方法的XML存储技术的研究与实现2006如今的软件开发过程中,以XML作为数据传输媒介,基于面向对象开发业务逻辑,以关系数据库存储数据成为一种主流的开发模式。从XML模式到对象模式再到关系模式,数据格式都在变化。XML是层次式的,自描述的,拥有自己的模式和规范以及编程接口。对象则由类实例化而来,通过属性和方法来描述事物的属性和行为。而关系数据则通过平面的二维表来保存数据。如何保持这一过程中数据的完整性以及对数据的灵活应用是整个软件开发过程中的难点。已有的很多研究都只考虑了一个XML文档和关系数据库之间一次性的映射转换,不能与面向对象开发紧密结合,映射出的表结构较复杂,表之间的关系也比较特殊。而实际应用中,我们往往需要对多个XML转换来的数据进行操作,如删除、修改、筛选、合并等,以重构新XML供其它系统使用。另外,许多研究只关注于保存文档的结构和内容信息,忽略了保存语义约束,导致转换后对数据的维护比较困难。针对以上问题,我们在解析XML时结合面向对象及UML建模方法,先把XML文档转换为对象模式,再根据对象一关系映射方法,把XML对象数据持久化到关系数据库中。我们重点研究了XML到对象模式再到关系模式的映射方法,采用一种基于元表的存储模型来保存数据,并通过触发器来维持XML,中的语义约束信息。在持久层中,扩充了对XML操作的封装,方便业务逻辑层以操作对象的方式对关系数据库中的XML对象数据进行操作,如变更及重构XML文档等,并使得对数据的变更能及时反映到关系数据库中。在上述研究的基础上,我们设计开发了一个XML存储系统原型XOR(XML-Object-Relation),实现了自定义的存储XML以及从关系数据库中重构XML,并对系统原型进行了性能测试。5.期刊论文李俊.LIJunXML数据存储映射模型研究-顺德职业技术学院学报2006,4(2)随着网络技术的发展和XML的标准化,越来越多的信息以XML文档的形式表示和交换.针对如何对XML数据进行有效管理的问题,提出了一种将XML文档存储到关系数据库中的存储映射模型X2RDB,该模型首先对XMLSchema进行简化和处理,并由此构造对应的关系数据库模式,最终将XML文档中的数据提取并存储到关系数据库中.6.学位论文李玉章基于关系数据库的XML数据管理技术研究2006XML正迅速取代HTML成为Web上数据表示、集成和交换的标准,与HTML相比,XML简单、自我描述,实现了内容、结构和表现三者的分离,更适合于数据表示和交换。近年来,XML在许多领域得到了广泛的使用,Web上涌现了海量的XML数据。为了有效地加工、分析和处理XML数据,研究者们已经提出了各种XML数据管理技术。关系数据库技术已经十分成熟,在商业数据管理中占据着主导地位,如何利用关系数据库来实现XML的数据管理已经受到了广泛的关注和重视。然而,由于数据模型的差异,利用关系数据库管理XML数据给传统数据库技术带来了许多新的挑战。本文主要研究基于关系数据库的XML数据的存储和查询技术,对保持语义约束的XML关系存储和基于视图的Xquery查询处理等方面进行了深入的研究和探讨。本文的研究工作主要包括以下几个方面:1)对XML的存储方式进行了归纳和总结。当前已有的XML存储方式大致可分为三类:文件系统、半结构化数据仓库、数据库管理系统。本文对这三类存储方法进行了详细的介绍,同时分析和比较了它们各自的优缺点。2)研究了基于关系数据库的XML存储技术。首先比较和分析了几种主要的XML关系存储方法。接着介绍了DTD中包含的语义约束。最后给出了一种保持语义约束的XML关系存储方法。利用该方法可以把DTD模式中的结构信息和语义信息完整地转换到关系数据库模式中。3)研究了基于关系数据库的Xquery查询技术。首先分析了Xquery查询语言到SQL的转换处理方法,然后在此基础上设计了一个Xquery查询处理的方案。该方案可以获得较好的适应性及扩展性,使用户使用Xquery查询存储于关系数据库中的XML数据更为方便。最后在总结全文的基础上,提出了若干有待进一步深入研究和探讨的问题。7.期刊论文刘健.马宗民.严丽.LIUJian.MAZong-min.YANLi含有效时间时态关系数据库到XML映射方法的研究-计算机科学2008,35(6)在讨论现有时态XML数据模型的基础上,引入有效时间XML表示模型,进而研究含有效时间时态关系数据库到时态XML文档的映射问题.给出时态关系数据库到时态XML文档映射的一般性映射规则,重点研究时态关系数据库中一些复杂映射问题,包括类层次、联系集、弱实体集的映射转换问题.8.期刊论文丁益祥.DINGYi-xiangXML文档在关系数据库中基于SAX的高效存取实现-现代计算机(专业版)2009(3)提出一种XML文档的编码方案,并给出关系数据库中相应的表结构,采用Java语言基于SAX设计将XML文档存储到关系数据库中的高效算法,只用有限的几张表即可将任意数量、任意结构的XML文档存储到关系数据库中.在此基础上,给出从关系数据库中还原XML文档的算法实现,并能将对XML文档的3种常用查询转换为对关系数据库的查询.9.学位论文段洪秀一种基于关系数据库的XML文档存储和查询的方法2006XML已成为Web上数据表示、集成和交换的标准,它的格式简单、自我描述能力强,实现了内容、结构和表现三者的分离,更适合于数据表示和交换。近年来,XML在各个领域得到了广泛的使用,Web上已经涌现了大量的XML数据。为了有效地加工、分析和处理XML数据,国内外学者已经提出了各种XML的查询语言和存储管理技术。由于关系数据库是目前最成熟的一种数据管理技术,在存储和管理XML数据的各种方式中,基于关系数据库的XML数据存储和处理技术显然是一种可行而有效的方式,并在学术界受到了广泛的关注。然而,由于数据模型的差异,利用关系数据库存储和查询XML数据给传统数据库技术带来了许多新的挑战。本文对XML数据的关系存储、路径表达式的查询处理等方面进行了深入的研究和探讨,提出了一种新的利用关系数据库存储和查询XML数据的方法,这种方法将XML文档树中有文本值的节点和无文本值的节点分别存储在两个关系表中,它不关心文档DTD的模式信息,也不需要建立任何索引结构。具体来说,本文的主要工作如下:(1)提出了一种新的基于路径的XML数据的关系存储方法。这种方法完整无损地记录了XML文档中的各节点信息、边信息和值信息,即在关系表中存储XML文档中各元素的name、id、parentid、level以及所有有值元素/属性的路径,加快了查询处理的速度。(2)针对这种存储结构,提出了新的基于表连接的查询转

1 / 72
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功