分布式数据库技术2011版-厦门大学数据库室

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/17厦门大学计算机科学系2011年新版林子雨厦门大学计算机科学系E-mail:ziyulin@xmu.edu.cn专题一分布式数据库介绍厦门大学计算机科学系研究生课程《分布式数据库技术》《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/17专题一分布式数据库介绍第0章数据库研究内容与本课程设置第1章分布式数据库基本知识第2章分布式数据库系统的体系结构《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/17第0章数据库研究内容与本课程设置0.1数据库理论与技术研究方向综述0.2《分布式数据库技术》讨论要点0.3学习安排0.4参考书籍《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/170.1数据库理论与技术研究方向综述埃德加·科德EdgarFrankCodd关系数据库之父1981年图灵奖获得者詹姆斯·格雷JamesGray1998年图灵奖获得者数据库事务处理专家查尔斯·巴赫曼CharlesW.Bachman网状数据库之父1973年图灵奖获得者《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/170.1数据库理论与技术研究方向综述萨师煊(1922.12-2010.7)中国数据库学科的奠基人之一萨师煊,1922年12月27日出生于福州。福建闽侯萨氏家族,源于山西雁门萨氏先祖,已有六七百年的历史。1941年9月考入厦门大学数理系。1950年中国人民大学成立,萨师煊随着华北大学的全体教员一起成为中国人民大学教师。萨师煊是中国人民大学经济信息管理系的创建人,是我国数据库学科的奠基人之一,数据库学术活动的积极倡导者和组织者。萨师煊以他的人格魅力和渊博学识,团结了全国数据库工作者,成为我国数据库界有口皆碑的组织者和带头人,为我国数据库学科的人才培养和技术发展作出了开创性的贡献。《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/170.1数据库理论与技术研究方向综述•VLDB\SIGMOD•ICDE\EDBT\ICKM•DASFAA\ER\PAKDD•WAIM\APWEB•NDBC•参见PPT“数据库学术会议”本领域学术会议《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/170.1数据库理论与技术研究方向综述数据库实现新技术云计算环境中的数据管理Web数据管理查询处理与查询优化数据流管理XML和半结构化数据数据仓库和OLAP近似和非确定性数据库内容与知识管理数据挖掘和知识发现元数据管理数据集成和迁移嵌入式数据库与移动数据库并行和分布式数据库系统特定领域的数据库系统数据库自管理智能用户接口技术空间和时态数据库系统多媒体数据库技术数据隐私与安全信息检索与数据库协同工作技术物联网数据管理《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/170.2《分布式数据库技术》讨论要点第一专题:分布式数据库概述介绍分布式数据库系统的定义、类型、特点和体系结构;第二专题:数据分布介绍分布式数据库的数据分布理论,包括数据分片、数据分配、数据分布模式定义和分布透明性等内容;第三专题:分布式查询处理介绍如何在分布式数据库系统中实现查询操作,包括分布式查询特点、全局查询转换、联接操作和综合性查询等内容;第四专题:分布式数据库系统理论介绍分布式数据库系统的核心理论,包括分布式事务管理、分布式并发控制、分布式恢复、分布式数据库完整性和安全性、分布式数据库的目录系统等内容;第五专题:分布式数据库相关技术介绍分布式数据库技术紧密相关的一些其他技术。《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/170.3学习安排听课读参考书检索相关的研究论文期中作业学期考《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/170.4参考书籍《分布式数据库系统原理(第二版)》,清华大学出版社(外文影印版)《分布式数据库系统及其应用》,科学出版社,邵佩英《分布式数据库》,科学出版社,郑振楣于戈郭敏《分布式数据库技术》,国防工业出版社,贾焰等《数据库系统概论》,高等教育出版社,萨师煊王珊《数据库系统教程》,高等教育出版社,施伯乐等《分布式数据库管理系统实现技术》,科学出版社,周龙骧等《分布式系统设计》,机械工业出版社,高传善等译《多层分布式数据库实战》,清华大学出版社,王涛……《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/17第1章分布式数据库基本知识1.1什么是分布式数据库1.2分布式数据库的分类1.3分布式数据库的特点1.4分布式数据库系统的问题《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/171.1什么是分布式数据库(1)分布式数据库(2)分布式数据库管理系统(3)分布式数据库系统《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/171.1什么是分布式数据库(1)分布式数据库分布式数据库是计算机网络环境中各场地(Site)或节点(Node)上的数据库的逻辑集合。逻辑上它们属于同一系统,而物理上它们分散在用计算机网络连接的多个节点/场地,并统一由一个分布式数据库管理系统管理分布式数据库是一组数据集针对全体用户的数据库称全局数据库各节点/场地的数据库称局部数据库结论:分布式数据库是虚拟的、逻辑的,只有局部数据库才是物理的数据库。《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/171.1什么是分布式数据库(2)分布式数据库管理系统分布式数据库管理系统是分布式数据库系统中的一组软件负责管理分布环境下逻辑集成数据的存取、一致性、有效性、完整性等由于分布性,在管理机制上必须具有计算机网络通讯协议上的分布管理特性分布式数据库管理系统比集中式数据库管理系统更加复杂可能由于各个局部数据库有不同的模型,涉及模型转换《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/171.1什么是分布式数据库(3)分布式数据库系统分布式数据库系统是为地理上分散、而管理上又需要不同程度集中管理的企、事业单位提供数据管理的信息系统。DB1服务器1网络服务器2服务器3DB2DB3客户客户客户DB2后台服务器2网络后台服务器1后台服务器3DB1DB3客户客户前台客户机客户……分布式数据库系统多处理机系统(非DDBS)《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/171.2分布式数据库的分类分布式数据库异构自治通过系统集成分布式数据库分类图非自治同构通过系统集成通过网关集成全DBMS功能部分DBMS功能(多数据库)多个单个松耦合集成紧耦合集成非联邦联邦目前对分布式数据库的分类还没有标准的定义,但有些提议也得到一定的认同,即从局部数据库的异同上加以划分:同构异质以构造相同、性质不同的局部数据库组成的分布式数据库。所谓构造相同,指的是构成局部数据库的数据模型;即使构造相同,但不同公司的产品,其性质不尽相同,则称为异质。同构同质异构构造、性质等都不同的分布式数据库系统。《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/171.3分布式数据库的特点•(1)共享性与自治性•(2)冗余的可控性•(3)事务管理的分布性•(4)存取效率•(附)回顾数据库系统基本知识•(5)数据模型•(6)数据独立性《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/171.3分布式数据库的特点(1)共享性和自治性共享性:在分布式数据库系统中,多个场地或节点的局部数据库在逻辑上集成为一个集体,并为分布式数据库系统的所有用户使用,这种应用称为分布式数据库的全局应用,其用户为全局用户,亦称为共享性。自治性:分布式数据库系统还允许用户只使用本地的局部数据库,这种应用为局部应用,其用户即为局部用户,甚至局部用户所使用的数据可以不参与到全局数据库中去。这种局部用户独立于全局用户的特性即是局部数据库的自治性。由于自治性,对于场地来说有两种数据,一种是参与全局数据的局部数据,而另一种则不参与全局数据库但又为本地共享的场地数据。《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/171.3分布式数据库的特点(2)冗余的可控性•集中式数据库减少冗余•分布式数据库适当冗余–节省开销–提高系统可用性–提高自治性冗余不利影响–增加存储开销–增加完整性一致性控制代价《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/171.3分布式数据库的特点(3)事务管理的分布性一个事务(全局事务)的执行将划分成在许多场地上执行的子事务(局部事务),子事务的执行结果合并而成全局事务的结果。例某银行对地处不同场地上的两个帐户转移资金对集中式数据库,A帐户的资金100元转移到B帐户名下,事务:T∶A,A∶A-100,B,B∶B+100则保证了事务的正确性。对分布式数据库也是同样的要求,但A和B不在同一场地,A和B都有多个副本。假设A在S1、S2各有一副本,B在S3、S4各有一副本,用户请求在S5发出,即结果应回送至S5,则分布事务T:T1,T2:A,A:A-100T3,T4:B,B:B+100T5[返回结果(或结束)消息]此时T由T1,T2,T3,T4,T5组成。《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/171.3分布式数据库的特点(3)事务管理的分布性分布式事务处理的复杂性:(1)由于结构性变化,要保证分布事务的操作结果具有语义完整性和全局数据库的一致性(2)与集中式数据库的事务管理在处理策略上有本质上的差别:保证可行性和有效性,以及并行能力(3)各局部子事务必须在本场地是可串行化的,同时全局事务对系统而言也是可串行化的(4)分布事务的可恢复性变得复杂《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/171.3分布式数据库的特点(4)存取效率集中式数据库层次模型、网络模型数据库,过程性查询,靠用户程序优化关系模型,非过程性查询,靠查询优化处理部件进行优化分布式数据库全局查询被分解成等效的子查询优化分两级进行:全局优化和局部优化《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/17(附)回顾数据库系统基本知识模式外模式2外模式1外模式3应用A应用C应用D应用E应用B数据库外模式/模式映象内模式/模式映象内模式•数据模型•数据库模式–一个数据库只有一个模式–是数据库数据在逻辑级上的视图–以某种数据数据模型为基础•数据库系统的三级模式结构•数据独立性–逻辑数据独立性(外模式\模式映像)–物理数据独立性(模式\内模式映像)1.3分布式数据库的特点《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/171.3分布式数据库的特点(5)数据模型在分布式数据库系统中,DDB是一个逻辑的、虚拟的数据库(被称为全局数据库(GDB))和实际分布在各场地的局部数据库(LDB)(物理的、实际存储的数据库)这样两级数据库组成。系统将数据库划分为四层:全局外层(即用户层)、全局概念层、局部概念层和局部内层。《分布式数据库》厦门大学计算机科学系林子雨ziyulin@xmu.edu.cn2020/1/171.3分布式数

1 / 46
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功