据库中存储和查询XML文档的设计与实现

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

天津师范大学硕士学位论文关系数据库中存储和查询XML文档的设计与实现姓名:王刚申请学位级别:硕士专业:计算机应用技术指导教师:包小源20070501关系数据库中存储和查询XML文档的设计与实现作者:王刚学位授予单位:天津师范大学相似文献(10条)1.学位论文苏明柿基于XPath查询的XML文档过滤2005本文对XML文档过滤技术进行了系统地研究:从一个大的XPath表达式集合中寻找与输入的XML文档匹配的XPath表达式子集的一些关键技术,包含XML文档索引、XPath查询索引、XPath查询索引的增量维护和文档过滤算法等。本文的主要研究成果有:采用对XML文档构造索引的方法,提出了一种新的XML文档索引结构,以增强对较大的XML文档和XPath查询中的祖先-后代关系“∥”的支持。针对路径表达式中存在的大量共享结构,我们介绍了一种基于共享前缀树的XPath查询索引结构,并对YFilter匹配算法进行改进,以解决XPath查询的结构匹配问题;同时,通过该索引结构可以很容易地对XPath查询进行增量维护,这对有效性和可扩展性要求较高的XML文档过滤系统来说无疑是非常重要的。提出了一种新的方法以支持对XPath查询谓词的匹配。将每个XPath查询分解为多个查询分支,并将所有XPath查询的查询分支构造成一个共享前缀树与输入的XML文档匹配,然后对匹配算法返回的结果进行处理以得出与XML文档匹配的所有XPath查询。2.学位论文陈刚用Xpath和XSLT查询XML文档2005XML只是类型化值的多种表示方法中的一种,软件代理程序可以利用其进行数据互换和互操作,根据MarkBirbeck提出的观点-XSLT可用于查询XML文档,本文详细论述了综合运用Xpath和XSLT查询XML文档,并对多个关键性问题作了深入的阐述,同时在文章结尾部分,提出了运用这两个规范来查询存储在关系数据库中的XML数据的构想,并对此作了初步的探讨。  本文从XML的产生背景着手,简单介绍了HTML的不足和XML的相对优点,接着分析了XML文档的结构,然后对XMLInfoset作了介绍。本文的第二部分对Xpath作了比较详细和全面的阐述,从Xpath简介,Xpath的数据模型,到Xpath表达式,其中对Xpath的定位路径表达式又专门作了说明,详细介绍了Xpath核心函数库中的函数。第三部分讲述XSLT。首先简单介绍了XSLT,接着分析了XSLT样式表的结构和处理机制,也谈到了Xpath在XSLT中的运用,接下来对XSLT的专有函数和XSLT元素作了比较细致而全面的介绍,最后专门谈及了XSLT中很重要的一个构件——模板。  在第四部分论述了运用Xpath和XSLT查询XML文档。针对查询XML文档,本文作者提出了查询处理模型,解决了查询过程中的多文档管理和模块化问题,并实现了递归与循环处理,条件控制,排序,分组和数学计算等诸多查询功能。在本文的结束语部分首先对Xpath和XSLT在查询存储在关系数据库中的XML数据作了探讨。针对从XSLT到查询图的转换,本文提出了该转换的一般规则,并基于一个已知的关系数据库的web应用的中间件-SilkRoute,提出了将XSLT和Xpath应用于查询存储在关系数据库中的XML数据的查询中间件。该中间件基于SilkRoute,但为了适用于XSLT,作者对其做了适当的更改。在文章的最后对XSLT1.0和XQuery1.0作了比较。3.期刊论文刘秋香.张永胜.LIUQiu-xiang.ZHANGYong-sheng对XPath,XLink和XPointer的分析研究-微机发展2005,15(10)XML是针对网络应用的一项新技术.当越来越多的信息存为XML文档时,就需要构造一种方式,通过接口获取信息.这就需要一种方法来确定文档各个部分之间的关系,以及访问一个与其他资源有关的文档的内部各部分.XPath,XLink和XPointer这3种语言都可以用来访问数据.其中,XPointer用来确定文档个别部分的位置,XPath与XSLT和XPointer一起使用来对XML文档各部分进行定位,而XLink则用来与XML文档链接.4.学位论文陈宏XML上的XPath全文查询技术2006随着Intemet和Web应用的迅速发展,越来越多的Web数据都开始使用XML作为数据表示和交换的语言,这使得XML在电子信息发布、数字图书馆、Web信息搜索和集成等领域有着广阔的应用前景。大规模XML文档的出现,如数字图书馆,IEEEINEX数据集,SIGMOD和DBLP数据集等等,使XML数据的管理和查询成为一个研究热点。如何在这些海量的XML数据上进行查询和检索,实现一个高效的XML文档的搜索引擎就显得越来越迫切。支持普通用户仅仅通过输入关键词就可以在XML文档上进行查询,处理XML文档内容和结构联合查询的任务,具有重要的理论和现实意义,也是当前XML研究方面的热点。本文结合XML数据本身的结构,将XML数据的结构和内容联合,研究了XML文档的标注方法;汲取信息检索的一些技术和已有的一些全文查询方法,研究了XML数据上全文查询的相关技术。然后对于XML文档上的全文距离(distancepredicate)查询方面进行了深入的研究和探讨,提出了有效的解决方案、I关键算法和技术,并通过一系列的实验证明了这些方法的有效性。本文的贡献和创新之处总结如下:探讨了W3C制定的XMLFull-Text的语法和语义。探索了对XML文档的内容和结构联合进行标注的方法,有效的支持了XMLFull-Text全文检索形式的查询。我们提出了基于窗口的算法实现对全文查询中距离谓词的处理,大大减少了查询处理的时间。该方法对在大量的XML数据集上进行距离查询提供了具有实际意义的有效处理方法。为了说明我们算法的有效性,我们给出了一系列实验结果来证明基于窗口的算法的有效性和健壮性。5.期刊论文邢海花.陈焕东.吴淑雷基于XML文档划分的多重数字签名研究-现代计算机(专业版)2009(6)在研究RSA数字签名算法和XML的基础上,结合RSA算法的安全性和XML文档的结构优势,提出一种基于XML文档划分的多重签名方案.此方案利用xpath语言访问节点数据的相应规则,把XML文档划分成与不同签名者对应的子文档,并建立Xpath规则与不同签名者的对应关系.签名者只需要时相应的Xpath规则进行签名即可,这样既保证了各签名者对其负责的子文档签名,又提高了签名的效率和灵活性.6.会议论文林大海.万常选带谓词XPath查询的流处理算法2004本文对基于XML流数据处理带谓词XPath查询的有效算法进行研究,提出了时间复杂度为0(n)的处理带谓词XPath路径表达式的有效算法XPSS。算法XPSS只需对原XML文档进行一次遍历即可找出满足查询要求的所有祖先-后裔节点对。该算法不需要事先将源XML文档分裂为元素(或属性)列表进行存储,而是直接将源XML文档作为输人,并采用SAX(SimpleAPIforXML)来产生XML数据流。由于SAX是基于流方式来解析XML文档,而且算法XPSS也只需要同时在内存中保存每个查询表达式根节点下的满足查询要求的所有节点,因此,算法XPSS对大型XML文档的处理能力远远超过目前基于DOM的XML查询执行器。7.会议论文徐林昊.杨文柱.陈少飞.郝亚南.李天柱基于XPath的Web信息抽取2002本文将信息抽取的过程看作是应用XPa山查询XML文档的过程;通过标记学习的方式,将语义项与DOM树的节点特征联系起来,并采用类似XPath的形式描述这种对应关系(相当于用学习来代替书写查询语句)。该方法具有描述特征丰富,样本学习次数较少,查准率和查全率较高的特点。8.学位论文房斐斐基于SAX的XML文档的快速更新算法的设计与实现2004随着XML文档在网络中的应用越来越频繁,XML文档也越来越向海量的方向发展,它的变化也越来越频繁.在处理大文本的XML文档的变化时,为了节省网络资源或者存储设备,我们用自定义的编辑脚本来纪录XML文档在某一特定时期内的变化.在需要的时候,将编辑脚本作用到原XML文档上,生成新的XML文档.将编辑脚本作用到XML文档并完成它的快速更新的过程,即是我们在该文中介绍的算法所实现的.该文所研究的算法,采用的是基于SAX模型的XML解析器.用来纪录XML变化的编辑脚本由两部分组成:表示编辑所作用的节点集合在XML文档中的路径以及编辑类型.我们把XPath表达式做了一定的约束来表示节点集合的路径,编辑类型为自定义格式.为了查找上的快速方便,我们将编辑脚本分成不同的类,分别解析成一棵自定义结构的ES树及数组链表的结构,放在内存中.当SAX解析XML文档时,应用程序会在内存中做相应的查找,同时完成相应的修改.解析器可以只关心需要做出修改的XML的子集,而无须关心其余不需要修改的部分.当解析器一次扫描完XML文档时,所有的修改也一次完成.快速更新实现.该算法的优点是:效率高,它的复杂度是多项式级的;占用内存少,它采用的是基于SAX模型的解析器,解析器占用的内存几乎是常量,远远小于DOM所生成的XML文档树所占用的内存.9.学位论文郭永明XML文档检索技术研究2003该文在对XML文档的特点、XML的基本理论、XML查询语言以及传统信息检索模型在XML文档检索中的应用等问题进行仔细分析的基础上,提出了XML文档检索的总体系统框架、具体算法及其实现.作者首先将XML文档进行分类,在此基础上认为一个好的检索算法应该能适用于不同类型的文档检索需求.根据这一思想,作者提出了将XPath语言与传统的向量空间模型相结合,实现基于简单XPath路径的向量检索算法来实现对XML文档的检索.充分利用XML文档分类层次体系结构的特点,对于每篇XML文档分析其文档结构,并采用聚类学习算法形成文档结构类属词典,从而实现XML文档查询的导航机制和消除文档结构的异构性.采用自底向上的查找方法实现路径匹配,准确定位用户的兴趣需要,同时最大限度地减少检索时间,提高检索速度.10.学位论文刘图招基于XML文档流的信息推送系统的设计与实现2004随着Internet和无线互联网的蓬勃发展,信息推送系统(SDI)正越来越成为人们方便、即时地获取信息的强有力工具.典型的,它是将数据流信息发送到无线用户的必由桥梁.在Internet环境下,由于用户信息订购的巨量性以及Internet本身的开放性、动态性,需要在新近数据与用户查询之间做出快速匹配,因此SDI系统的可扩展性成为考虑其是否可用的一个关键技术因素.该论文主要研究实现基于XML文档流的SDI系统可扩展性的关键技术,包括查询索引、查询聚类、查询包含、复杂查询处理等,在考察当前最前沿的研究成果的基础上作进一步深入的探索和研究,并最终建立起一个基于XML的、适合于海量用户访问数据流的信息服务模型.论文的主要贡献如下:首先,在通用的SDI系统体系结构基础上进行改进,提出了能够提供较好的系统扩展性的体系结构.通过将用户定购组织和管理模块独立出来,同时在该模块中引入查询的聚类分析阶段,可以更有效地进行查询聚集.其次,提出了一种有效的XPath查询相似性计算方法.该算法充分考虑了XML文档数据自身的特征和XPath树模式的特性,能够真正意义地找出相似的树模式进行聚类聚集处理,保证了比较理想的匹配精度和系统可扩展性权衡.第三,该文提出了一种效率较高的两级查询索引机制,在结构索引的基础上引入了基于值的谓词索引.与已有的NFA查询索引不一样:我们不将嵌套路径作为谓词索引的一部分,而是把它完全结合到了基于NFA的结构索引中.同时论文针对基于值的选择谓词构造了各种不同的索引结构,包括等值Hash结构,二叉平衡树等,能够提供更加快速的查询匹配.最后,论文提出了处理复杂查询布尔树结构(逻辑树),使得系统能够很好的处理复杂的XML查询,同时提供了逻辑树计算的有效算法,提高匹配效率.本文链接:

1 / 71
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功