分布式数据库第一章--概论

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

START--------分布式数据库系统概论分布式数据库系统概论1.分布式数据库系统的起源和发展2.分布式数据库系统的定义和分类3.分布式数据库系统的体系结构4.分布式数据库系统与C/S模式5.分布式数据库管理系统6.其他非集中式数据库系统7.分布式数据库目录系统的主要内容8.分布式数据库系统的主要技术9.分布式数据库的主要应用10.分布式数据库系统的优点和存在的技术问题1.分布式数据库系统的起源和发展1.1分布式数据库的起源促使分布式数据库的研究提上日程的因素:*技术因素----计算机相关的各种技术飞速发展(计网和数字通信)技术发展方向:*卫星系统*Internet/Intranet*移动通信/蜂窝通信*局域网/广域网*······*客观因素----数据库应用需求的拓展*地理上分散,管理上集中的企业越来越多*既要实现本地数据管理,也要存取异地的数据*既有各部门的局部控制和分散管理,也有整个组织的全局控制和高层次的协同管理1.分布式数据库系统的起源和发展面对DDBS的产生提出一个问题------为什么以前的DBS不能满足当今应用系统的要求呢?集中式数据库系统分布式数据库系统1.分布式数据库系统的起源和发展集中式数据库系统*优点:费用低,不易感染病毒数据处理*缺点:处理速度慢,客户的不同需要数据传输(不做任何处理)大型中央系统客户机客户机客户机数据库ATM1.分布式数据库系统的起源和发展1.2分布式数据库系统的发展*分布式数据库的发展阶段*20世纪70年代末期-----产生*20世纪80年代-----成长阶段*20世纪90年代-----------商品化应用阶段*21世纪--------------------大规模应用阶段*分布式数据库系统的12条规则:*本地自治*不依赖于中心站点*可连续操作性*数据位置透明性和独立性*数据分片独立性*数据复制独立性*分布式查询处理*分布式事务管理*硬件独立性*操作系统独立性*网络独立性*数据库管理系统独立性1.分布式数据库系统的起源和发展12条规则:*不是相互独立,也不是同等重要,完全实现的难度很大*帮助理解DDBS,帮助规划一个DDBS的功能,区分一个真正的、普遍意义上的DDBS与一个只能提供远程数据存取的系统一个只能提供远程数据存取的系统:*用户可以操作远程站点上的数据,甚至可以同时操作多个远程站点上的数据,但远程与本地不是无缝连接的。如,客户机/服务器模式,浏览器/Web服务器/数据库服务器三层模式的数据库系统。2.分布式数据库系统的定义与分类分布式数据库:分布式数据库是一个数据集合,这些数据分布在由计算机网络连接起来的若干节点上,每个节点可以管理本地的数据应用,也可以参与全局数据应用。同时这些数据在逻辑上形成一个整体,由统一的数据库管理系统进行管理。站点:被计算机网络连接的每个逻辑单位是能够独立工作的计算机,这些计算机成为站点或节点。本地用户/应用:一个用户/应用只访问他所注册的那个站点。全局用户/应用:一个用户访问涉及两个或两个以上的站点中的数据。全局数据库,局部数据库:从全局的角度和各个场地的角度2.分布式数据库系统的定义与分类分布式数据库系统的定义:物理上分散而逻辑上集中的系统,它使用计算机网络将地理位置分散而管理和控制有需要不同程度集中地多个逻辑单位(通常是集中式数据库系统)连接起来,共同组成一个统一的数据库系统。每一个站点都具有自治能力,每一个站点都至少参与一个全局应用。可以看成是计算机网络和数据库系统的有机结合。分布式数据库系统包括:分布式数据库+分布式数据库管理系统2.分布式数据库系统的定义与分类分布式数据库系统的特点:*物理分布性:数据不是存储在一个站点上,而是存储在计算机网络的多个站点上。*逻辑整体性:数据物理分布在各个站点,但逻辑上是一个整体,它们被所有用户(全局用户)共享,并由一个DDBMS统一管理。*站点自治性:各站点上的数据由本地的DBMS管理,具有自治处理能力,完成本场地的应用(局部应用)。2.分布式数据库系统的定义与分类其他特点:*数据分布透明性:数据的逻辑分片、数据的物理位置分布、数据的复制,对用户透明。用户也不必关心局部站点数据库的数据模型。*集中与自治相结合的控制机制:数据共享的两个层次--局部共享(本站点数据)、全局共享(各个站点数据)。相应的控制机构有两个层--集中和自治。*存在适当的数据冗余度:利用数据冗余提高系统可靠性、可用性和系统性能*事务管理的分布性:一个全局事务可以分解为若干个站点上的子事务来分别执行,以并行的方式来实现网间查询和网内查询,使执行性能得以改进。2.分布式数据库系统的定义与分类2.分布式数据库系统的定义与分类分布式数据库系统的分类:按LDBMS的同构同质型DDBS(同DM&同DBMS)数据模型同构异质型DDBS(同DM&异DBMS)异构型DDBS(异DM)全控集中型(全控&GDD位于一个中心S)按全局控制系统全控分散型(全控&GDD分散各个站点)类型全控可变型(根据需要,分为两组站点)3.分布式数据库系统的体系结构3.1基于三层模式的DDBS的体系结构六层模式结构5级映像三级独立性3.分布式数据库系统的体系结构数据库的组成:数据和数据目录数据:全局数据,局部数据数据目录:全局数据目录,局部数据目录数据存储:先数据分片,再数据分配数据分片:对全局数据进行逻辑划分。DDBS中的数据可以被分割和复制到网络场地的各个物理数据库中。数据存放的单位不是关系而是片段,一个片段是逻辑数据库中某个全局关系的一部分。数据分配:根据选定的分配策略,对各个数据片段的物理存放站点进行分配。即定义片段映像的类型。3.分布式数据库系统的体系结构全局外模式:全局应用的用户视图。全局概念模式:描述全局数据的逻辑结构和数据特性。分片模式:描述全局数据的逻辑划分。定义全局关系与片段之间的映像。一对多,一个全局关系可对应多个片段。分配模式:定义各个片段的物理存放站点,定义片段映像的类型。确定分布式数据库是冗余的还是非冗余的,以及冗余程度。如果一个片段分配在多个站点上,则此映像是一对多的,也就是冗余的,有副本。局部概念模式:所有全局关系在该站点上的物理映像集合局部内模式:关于物理数据库的描述3.分布式数据库系统的体系结构3.分布式数据库系统的体系结构例:全局关系R的分片与分配情况:R划分成四个逻辑片R1,R2,R3,R4,并以冗余方式将这些片段分配到网络的三个场地上生成了三个物理映象:S1,S2,S3。R1在站点1和2上重复存储:得到映像R11,R12R2在站点1,2,3上重复存储:得到映像R21,R22,R23R3在站点3得到映像R33R4在站点3得到映像R34是否存在副本3.分布式数据库系统的体系结构三级独立性*映象1和映象5是类似于集中式数据库的逻辑独立性和物理独立性。*分布独立(透明)性:位于中间三个级别的映象体现的独立性分别称为分片透明性、位置透明性和局部透明性。这三个透明性合起来统称为“分布透明性”。使用户或应用程序不必关心数据的逻辑分片,不必关心数据物理位置分配的细节,也不必关心各个场地上数据库的数据模型是哪种类型,可以像集中式数据库一样来操作物理上分布的数据库。3.分布式数据库系统的体系结构5级映像和3级独立3.分布式数据库系统的体系结构3.2基于组件模式的DDBS体系结构应用处理器(AP)数据处理器(DP)通信管理器(CM)3.分布式数据库系统的体系结构组件结构:4.分布式数据库系统与C/S模式客户机/服务器模式:*某些站点是客户机站点而另一些站点是服务器站点*所有的数据都驻留在服务器站点*所有的应用都在客户机站点进行*应用请求是通过客户机请求和服务器响应的协作方式来完成的*一般不提供完全的位置透明性,即“存在接缝”4.分布式数据库系统与C/S模式*集中式客户机/服务器模式:只有一个服务器和一个应用,即只有一个应用处理器和数据处理器。*多客户机/单服务器模式:多个应用处理器和一个数据处理器,减少了应用处理器的负载,不同用户可以在同一时间完成其所要完成的工作。*多客户机/多服务器模式:多个应用处理器和多个数据处理器,提高了系统的吞吐率,减少了数据处理器的负载。*服务器/服务器模式:多个应用处理器和多个数据处理器,增加了数据处理器之间的交互,是查询处理工作更加灵活。*对等客户机/服务器系统:C/S系统的最终归宿,分布式处理的极限,网络上每个站点既是服务器也是客户机。P175.分布式数据库管理系统定义:分布式数据库系统的核心,负责实现分布式数据库的建立、查询、更新、复制和维护等功能,同时还包括提供透明性,查询优化、协调全局事务的执行,协调各局部DBMS共同完成全局应用,保证数据库的全局一致性,执行并发控制,实现更新同步和全局恢复等功能。与集中式数据库管理系统不同的功能:*数据跟踪:能够通过扩展DDBMS日志来记录数据分布、分片和复制*分布式查询处理:能够通过通信网络存取远程站点的数据,以及在不同站点间传输请求和数据*分布式事务管理:能够为需要从多个站点存取数据的查询和事务设计执行策略,将分布式数据的存取和整个数据库完备性的维持保持同步*复制数据的管理:能够把数据库从单个站点故障和新类型故障中恢复*安全性:数据安全管理以及用户授权/存取权限的安全管理*分布式目录管理:包含了数据库中有关数据的信息5.分布式数据库管理系统分布式数据库的组成5.分布式数据库管理系统DDBMS的四个基本功能模块:*查询处理模块:包括查询分析和优化处理两部分。*完整性处理模块:负责维护数据库的完整性和一致性,检查完整性规则,处理多副本数据的同步更新等。与查询处理模块一起制定查询处理策略。*调度处理模块:进行一些局部处理和数据传输时向有关的站点发出命令,使各站点的通信管理软件相互配合,完成查询并把结果传回发出该查询的站点。*可靠性处理模块:负责不断地监视系统的各个部分是否有故障出现,当故障修复后,负责将该部分重新写入系统,保持数据库一致5.分布式数据库管理系统分布式数据库管理系统的结构6.分布式数据库目录系统定义:存放与分布式数据库系统有关的对象和各种控制信息的场所,包括:*全局模式描述:数据库逻辑结构,即所有的全局关系及其属性描述*分片模式描述:对全局关系的逻辑分片方法,片段定义的描述*分布模式描述:建立逻辑片段和物理映像之间的对应,即定义片段的物理存放站点*局部名映射:映射到本地站点的数据名,即把物理映像名与站点上的数据名联系起来*存取方法描述:给出每一站点上可使用的存取方法,如关系数据库中索引结构、数目和类型*数据库的统计信息:记录着有关数据库的特征参数,如关系的记录个数等*一致性约束:用户存取数据的权限和权限转移,以及数据的完整性约束*状态信息:记录站点及事物的运动状态,为死锁检测和预防及恢复提供信息*数据表示:提供异种语言、协议或命令的格式转换信息*数据命令:定义数据命令格式,是指规范化*系统描述:提供各站点的软、硬件配置及处理能力等信息6.分布式数据库目录系统分布式数据库目录系统的主要用途:*设计应用:系统设计人员根据目录系统中提供的系统需求信息、站点配置信息和数据库统计信息来定义各级模式、导出数据分布、数据处理的来源和去向,以及设计评价。*翻译应用:存取映射,将用户的数据请求按不同的透明度映射为单一的物理数据。*优化处理:为产生一个优化的访问策略,需要知道数据分片、分布、存取路径与访问方法等提供可用信息或统计数据。*运行监督:提供分布式事务分析、分解、处理所需要的必要信息,并为检查各种程序存取数据的合法性、有效性和权限提供必要的信息。*系统维护:记录和统计系统运行时的各种性能因素,为维护和调整系统各种参数,提高系统运行效率提供有关信息。6.分布式数据库目录系统分布式数据库目录系统的组织方式:*独立式:利用操作系统提供的文件管理功能来建立和维护目录信息,这时目录系统具有独立的数据定义、装入、查询、修改和报告生成功能。*分离式:利用DBMS建立和维护目录信息,但它的用户界面与功

1 / 48
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功