1本科生毕业论文(设计)论文(设计)题目:基于XML的WEB查询技术研究系:信息管理系专业(方向):信息管理年级班:学生姓名:指导教师:2010年0月00日2基于XML的Web查询技术研究xxx(XXXX学院2003级信息管理专业本科班)摘要信息服务系统,它为用户提供了一个搜索和浏览信的工具。但是一个信息的海洋,数亿万计的Web文档散布在世界各地的成千上万个Web服务器上,并且每个服务器自主管理自己的资源,没有一个统一的管理机制。总体状况是,整个网络上资源丰富,内容庞杂,很难实现数据的共享,亦不能进行有效地查询。XML的出现为解决上述问题提供了理想的解决方案。XML全称为ExtensibleMarkupLanguage,即扩展标记语言,是SGML(StandardGeneralizedMarkupLanguage)的一个简化的而又严格的子集,它是特别为Web应用设计的,XML是一个在互联网上进行数据交换的理想工具。由于XML能够使不同来源的结构化的数据很容易地结起,从而使搜索多样的不兼容的数据成为可能,为解决Web查询问题带来了希围绕着基于XML的Web查询技术涉及到的几个主要问题展开研究与讨论:1.针对Web上的数据格式差异大、数据来源差别大及当前的数据模型不能很好地描述Web上数据的缺点,研究和探讨了Web上的数据模型--XML数据模型。32.解决异构数据的集成问题。由于异构数据的集成主要是异构关系数据库中数据的集成。所以本文采用了基于“中间模式”的方法进行数据的集成,将关系数据库中的数据转换为通用的XML格式的数据,从而更好地实现数据的共享。3.利用XML数据模型在半结构化数据表示和查询方面的优势,通过基于XML查询语言XML-QL实施Web查询。在XML出现以前,面向Web数据查询是一项复杂的技术。通过本文的研究方法,如果通过XML数据模型描述Web上的数据,把不同来源的结构化的数据转换成XML格式的数据,就能够方便的实现数据的共享和进行精确、有效的信息查询,将极大的简化复杂性,提高工作效率。关键词:XML;Web查询;半结构化数据;数据模型4BasedonXMLWebinquiryengineeringresearchxxx(UndergraduateClassesofInformationmanagementandinformationsystemSubjectof2003Grade,CollegeofLongQiao,LanZhouCommercialCollege)ABSTRACT。Itoffersatooltosearchandhiuwseinformation.But:51.ConsiceringthebigdifferenceofdataformatanddatasourcesontheWeb,WemaderesearchanddiscussontheWebdatamodel-XMLdatamodel.2.Toresolvetheproblemofintegrationofdatawith.differentstructure.BecausetheintegrationproblemmainlyfocusontheintegrationofdifferentstructuredRDBMS,thisarticleadoptedmediatedschemaandtransformedthedatainRDBMSintoXMLdatasource.Therefore,bettersharingofdatacanbeealized.3.MakingfulluseoftheadvantagesofusingXMLdatamodelinsemi-structureddatarepresentationandquery,wecancarryoutdataretrievingqueriesfromXMLdataresourcesonWebbyusingXML-QL.BeforetheemergenceofXML,Web-orienteddataqueryisacomplextechnique.ThroughtheresearchinthisarticleifwerepresentWebdatabyXMLdatamodelandtransformthestructureddatafromdifferentdatasourceintoXMLdataformatsourcesWewillrealizedatasharingandcarryoutexactandefficientdataquery,whichwillsimplifyourworkandenhanceefficiencygreatly.Keywords:XML,Webquery,Semi-structureddata,Datamodel6目录一、引言·····························································································(7)二、基于XML的Web查询技术研究···························································(8)1Web查询涉及的几个主要问题······························································(8)2Web上的数据模型-XML数据模型·························································(9)3异构数据库的集成·············································································(20)4基于XML的Web查询·······································································(29)三、结论···························································································(44)参考文献································································································(45)7基于XML的Web查询技术研究一、引言随着互联网的普及,网络已成为人们获得信息的主要途径和重要手段网络}资源丰富,闷容庞杂,网络上的数据能否很好地得到共享成为影响网络发展的个重要因素但就目前来看,我们日常用到的数据大部分是无结构的文档和完全结构化的关系数据库中的数据,如果把这些数据放在互联网上很难实现数据的共享为此,必须改变当前数据格式的多样性和共享性差的缺点,用一种统一的数据格式来表示数据,从而实现数据在互联网上更大范围内的共享。如果能够把不同来源的结构化的数据比较容易地结合在一起,将使搜索多样的不兼容的数据库成为可能,从而为解决Web数据查询难题带来了希望。XML的出现为解决上述问题提供了理想的解决方案。它是特别为Web应用设计的,它是针对于HTML和Internet的标准的、可扩展的、通用的数据格式。XML保留了SGML可扩展性、结构性以及数据确认方面的主要优点,它的灵活性允许表示各种各样的信息,而这些信息是自我描述的,所以XML表示的结构化的数据可以被那些没有关于这些数据的知识的软件来处理,实现数据在互联网上更大范围内的共享。XML是一种半结构化的数据模型,XML的文档描述的语义非常清楚,它的可供操作的基础要比HTML好得多,而且很容易就可以将之和关系数据库中的属性一一对应起来,能够支持实施十分精确有效的查询。8本文围绕着基于XML的Web查询技术涉及到的几个主要问题展开研究与讨论:1.针对Web上数据的自身特点,研究与探讨了适于表示Web上数据的数据模型XML数据模型;2.为了更好地实现Web数据的共享,本文给出了从关系数据库中结构化的数据向XML格式数据的转换方法,解决异构数据的集成问题;3.利用基于XML的查询语言XML—QL实施Web上XML数据源的查询。二、基于XML的Web查询技术研究1.Web查询涉及的几个主要问题Web上有海量的数据信息,怎样对这些数据进行有效的应用成了现今数据库技术的研究热点。所谓数据查询,就是从大量的数据中发现真正需要的内容,解决数据的应用质量问题。如何充分利用有用的数据,废弃无用的数据,是Web数据查询所面临的一个难题。相对于Web的数据而言,传统的数据库中的数据结构性很强,数据为完全结构化的数据,而Web上的数据是半结构化数据。所谓半结构化是相对于完全结构化的传统数据库的数据而言。显然,面向Web的数据查询比面向单个数据仓库的数据查询要复杂得多。Web查询涉及的几个主要问题是:1.1寻找一个描述Web上数据的数据模型Web上的数据与传统的数据库中的数据不同,传统的数据库都有9一定的数据模型,可以根据模型来具体描述特定的数据。而Web上的数据非常复杂,没有特定的模型描述,每一站点的数据都各自独立设计,并且数据本身具有自述性和动态可变性。Web上的数据具有一定的结构性,但因自述层次的存在,从而是一种非完全结构化的数据,这也被称之为半结构化数据。半结构化是Web上数据的最大特点。要解决Web上的异构数据的集成与查询问题,就必须要有一个模型来清晰地描述Web上的数据。针对Web上数据的半结构化特点,寻找一个描述半结构化数据的数据模型是解决问题的关键所在。1.2通过Web上的数据模型实现异构数据库数据的集成从数据库研究的角度出发,Web上信息的来源主要是从不同的数据库中提取。如果要想充分利用这些数据进行有效地数据查询,就必须解决异构数据的集成问题,用一种统一的数据格式表示数据。只有将各个异构数据