数据库新技术讲座之数据库技术新进展

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

数据库新技术讲座-数据库技术新进展1数据库技术发展概述2数据模型及数据库系统的发展3数据库技术与其它相关技术相结合4面向应用领域的数据库新技术1数据库技术发展概述•数据库系统已从第一代的网状,层次数据库系统,第二代的关系数据库系统,发展到第三代以面向对象模型为主要特征的数据库系统.数据库技术与网络通信技术,人工智能技术,面向对象程序设计技术,并行计算技术等互相渗透,互相结合,成为当前数据库技术发展的主要特征.2数据模型及数据库系统的发展•数据模型是数据库系统的核心和基础格式化数据模型(包括层次数据模型和网状数据模型)关系数据模型面向对象的数据模型等非传统数据模型•结构化数据模型与非结构化数据模型的转换与处理•1,第一代数据库系统(层次数据库系统和网状数据库系统)格式化模型,层次模型是网状模型的特例•第一代数据库系统指层次和网状数据库系统,其代表是:1969年IBM公司研制的层次模型的数据库管理系统IMS(InformationManagementSystem).数据库任务组DBTG(DataBaseTaskGroup)于20世纪60年代末70年代初提出的DBTG报告,数据库网状模型的典型代表.两种数据库系统具有下列共同特点:•1.支持三级模式的体系结构2.用存取路径来表示数据之间的联系3.独立的数据定义语言4.导航的数据操纵语言•2,第二代数据库系统(关系数据库系统)关系模型简单,清晰,关系代数作为语言模型,关系数据理论作为理论基础.关系数据库系统具有形式基础好,数据独立性强,数据库语言非过程化等特色.•20世纪70年代是关系数据库理论研究和原型开发的时代.其中以IBMSanJose研究室开发的SystemR和Berkeley大学研制的INGRES为典型代表.发展过程:奠定了关系模型的理论基础,关系模型的规范说明.研究了关系数据语言攻克了系统实现中查询优化,并发控制,故障恢复等一系列关键技术.促进了RDBMS产品的蓬勃发展和广泛应用.•关系模型具有以下主要特点:关系模型的概念单一,实体以及实体之间的联系都用关系来表示以关系代数为基础,形式化基础好数据独立性强,数据的物理存储和存取路径对用户隐蔽关系数据库语言是非过程化的,将用户从编程数据库记录的导航式检索中解脱出来,大大减小了用户编程的难度•3,第三代数据库系统更加丰富的数据模型,更强大的数据管理功能,满足新应用要求•一,应用领域的需求二,传统数据库系统的局限性三,第三代数据库技术的特点•一,应用领域的需求新的数据库应用领域,如计算机辅助设计/管理(CAD/CAM),计算机集成制造(CIM),办公信息系统(OIS),地理信息系统(GIS),知识库系统和实时系统等新应用需求需要数据库系统支持以下功能:(1)存储和处理复杂对象(2)支持复杂的数据类型(3)需要常驻内存的对象管理以及支持对大量对象的存取和计算(4)实现程序设计语言和数据库语言无缝地集成(5)支持长事务(saga)和嵌套事务的处理•二,传统数据库系统的局限性传统数据库系统的局限性主要表现在以下几个方面:1.面向机器的语法数据模型2.数据类型简单,固定3.结构与行为分离4.阻抗失配(编程模式不同,类型系统不匹配)5.被动响应6.存储,管理的对象有限7.事务处理能力较差(只能支持非嵌套事务)•三,第三代数据库技术的特点支持面向对象数据模型面向对象模型的概念是:对象标识,封装类和类层次继承一个面向对象的数据库系统是一个持久的,可共享的对象库的存储和管理者一个对象库是由一个面向对象数据模型所定义的对象的集合体一个数据库可称为OODBS,必须满足以下条件支持一核心的面向对象数据模型支持传统数据库系统所有的数据库特征在研究热潮中,许多厂商推出的产品粗糙,质量低,导致OODBS有某种回归到人工导航系统的倾向面向对象数据库的实现方式一种是在面向对象的设计环境中加入数据库功能另一种是对传统数据库系统进行改进,使其支持面向对象的数据模型,如ORACLE8.0,INFORMIX9.0等与传统数据库系统相比有许多优点,如包含更多数据语义信息,对复杂数据对象的表达能力更强等面向对象数据库还只是一种新兴的技术,它的发展远不如关系数据库成熟是一项具有重大理论意义和应用前景的数据库技术然而,面向对象的数据库是一项相对较新的技术,尚缺乏理论支持,在处理大量包含很多事务的数据方面比关系数据库系统慢得多,但人们已经开发了混合关系对象数据库,这种数据库将关系数据库管理系统处理事务的能力与面向对象数据库系统处理复杂关系与新型数据的能力结合起来。3数据库技术与其它相关技术相结合•数据库技术与其他学科的内容相结合,是新一代数据库技术的一个显著特征,涌现出各种新型的数据库系统,例如:数据库技术与分布处理技术相结合,出现了分布式数据库系统;数据库技术与并行处理技术相结合,出现了并行数据库系统;数据库技术与人工智能技术相结合,出现了知识库系统和主动数据库系统;数据库技术与多媒体技术相结合,出现了多媒体数据库系统;数据库技术与模糊技术相结合,出现了模糊数据库系统等.3.1分布式数据库系统3.2并行数据库3.3多媒体数据库3.4主动数据库3.5对象-关系数据库3.1分布式数据库系统•随着地理上分散的用户对数据共享的要求日益增强,以及计算机网络技术的发展,在传统的集中式数据库系统基础上产生和发展了分布式数据库系统1.分布式数据库系统的特点2.分布式数据库的体系结构•1.分布式数据库系统的特点分布式数据库应具有以下特点:(1)数据的物理分布性(2)数据的逻辑整体性(3)数据的分布独立性(也称分布透明性)(4)场地自治和协调(5)数据的冗余及冗余透明性•例子:假设一个大公司拥有四个子公司,总公司与各子公司各有一台计算机,并已联网,每台计算机带有若干终端.场地A为公司的总部,位于场地B的公司负责制造和销售其产品,位于场地CDE的公司负责销售其产品.各场地都存储了本场地雇员的数据,场地B存储了产品制造情况的数据,场地BCDE存储了本场地销售,库存情况的数据.可执行的全局应用包括:总公司总销售情况,总公司总库存情况,公司间的人员调动,等等;可执行的局部应用包括:场地B检查产品制造情况,场地E统计本子公司雇员的平均工资等等.这是一个典型的分布式数据库系统.•分布式系统的优点分布式控制数据共享可靠性和可用性得到加强性能得到改善可扩充性好分布式系统缺点复杂增加开销:硬件开销通信开销冗余数据的潜在开销保证数据库全局并行性,并行操作的可串行性,安全性和完整性的开销•原则(若干个)局部数据模式+(一个)全局数据模式全局数据模式四个层次全局外模式全局概念模式分片模式:水平分片,垂直分片,混合分片分片时必须遵守的准则完全性可重构性不相交性分布模式分布模式的分配方案划分式全副本式部分重复式•四层模式之间的联系和转换由三层映象实现映象1:定义全局外模式与全局概念模式之间的对应关系映象2:定义全局关系与片段之间的对应关系映象3:定义片段与网络结点之间的对应关系•分布透明性式分布式数据库系统的一个显著特点分布透明性三个层次从高到低依次为:分片透明性,位置透明性局部数据模型透明性3.2并行数据库•计算机体系结构的一个明显发展趋势是从单处理器结构向多处理器结构过渡原因:提高单处理器的性能越来越困难,单处理器性能有物理极限高性能处理器价格昂贵,可以用廉价的多处理器来代替能否为越来越多的用户维持高事务吞吐量和低响应时间以成为衡量DBMS性能的重要指标并行数据库以高性能,高可用性,高扩充性为指标,充分利用多处理器平台的能力,通过多种并行性,在联机事务处理与决策支持应用两种典型环境中提供优化的响应时间和事务吞吐量1.并行数据库系统的体系结构2.并行处理技术3.并行数据库与分布式数据库系统的区别•1.并行数据库系统的体系结构目前并行计算机的体系结构主要有以下几类:紧耦合全对称多处理器(SMP)系统,所有CPU共享内存与磁盘松耦合群集机系统,所有CPU共享磁盘大规模并行处理(MPP)系统,所有CPU均有自己的内存和磁盘相应并行数据库系统的体系结构:共享内存结构共享磁盘结构无共享资源结构•三种结构各有利弊共享内存结构相对来说容易实现,各处处理器的负载较平衡;但存在访问内存和磁盘的瓶颈,可伸缩性不佳,可用性不太好共享磁盘结构消除了访问内存的瓶颈;但存在访问磁盘的瓶颈,分布式缓存器也是一个瓶颈,可扩充性不佳无共享资源结构不易做到负载平衡;具有极佳的可伸缩性•2.并行处理技术采用多线程多线索结构,提供四种不同粒度的并行性不同用户事务间的并行性同一事务内不同查询间的并行性同一查询内不同操作间的并行性(垂直并行,或流水线并行)同一操作内的并行性(水平并行,或划分并行)水平并行性要求物理地将数据库划分为小分片,并存放在不同磁盘上――并行数据库中的数据划分划分时依据一个属性的值,就是一维数据划分划分时依据多个属性的值,就是多维数据划分一维数据划分有以下几种方法Round-robin(轮转)划分法Range(值域)划分法Hash(杂凑)划分法User-defined(用户定义)划分法Schema(模式)划分法目前商用并行数据库系统都只提供了一种或多种一维数据划分法•3.并行数据库系统与分布式数据库系统的区别应用目标不同实现方式不同各结点的地位不同3.3多媒体数据库•多媒体数据库实现对格式化和非格式化的多媒体数据的存储,管理和查询,其主要特征有:(1)多媒体数据库应能够表示多种媒体的数据.(2)多媒体数据库应能够协调处理各种媒体数据,正确识别各种媒体数据之间在空间或时间上的关联.(3)多媒体数据库应提供比传统数据管理系统更强的适合非格式化数据查询的搜索功能.多媒体数据库应提供特种事务处理与版本管理能力3.4主动数据库•主动数据库(ActiveDataBase)是相对于传统数据库的被动性而言的.在传统数据库基础上,结合人工智能技术和面向对象技术提出了主动数据库.主动数据库的主要目标是提供对紧急情况及时反应的能力,同时提高数据库管理系统的模块化程度.主动数据库通常采用的方法是在传统数据库系统中嵌入ECA(即事件-条件-动作)规则为了有效地支持ECA规则,主动数据库的研究主要集中于解决以下问题:主动数据库的数据模型和知识模型执行模型条件检测事务调度体系结构系统效率3.5对象-关系数据库•是将关系数据库和面向对象的数据库相结合的产品特点运行用户扩充基本数据类型能够在SQL中支持复杂对象能够支持子类对超类的各种特性的继承能够提供功能强大的通用规则系统•实现方法从头开始对象-关系DBMS在现有的关系型DBMS基础上进行扩展将现有的关系型DBMS与其他厂商的对象-关系型DBMS连接在一起,使现有的关系型DBMS直接而迅速具有对象-关系型DBMS的特征将现有的面向对象型DBMS与其他厂商的对象-关系型DBMS连接在一起,使现有的面向对象型的DBMS直接而迅速地具有对象-关系型DBMS的特征扩充现有的面向对象型DBMS,使之成为对象-关系型DBMS4面向应用领域的数据库新技术•数据库技术被应用到特定的领域中,出现了数据仓库,工程数据库,统计数据库,空间数据库,科学数据库等多种数据库,使数据库领域的应用范围不断扩大.•4.1数据仓库4.2工程数据库4.3统计数据库4.4空间数据库4.1数据仓库•1.从数据库到数据仓库2.数据仓库的特点3.分析工具4.基于数据库技术的DSS解决方案•1.从数据库到数据仓库操作型处理和分析型处理的区分这种分离,划清了数据处理的分析型环境与操作型环境之间的界限,从而由原来的以单一数据库为中心的数据环境发展为一种新环境:体系化环境.体系化环境由操作型环境和分析型环境(全局级数据仓库,部门级数据仓库,个人级数据仓库)构成.事务处理环境不适宜DSS应用:(1)事务处理和分析处理的性能特性不同(2)数据集成问题(3)数据动态集成问题(4)历史数据问题(5)数据的综合问题•2.数据仓库的定义和特点数据仓库概念的创始人W.H.Inmon在其《BuildingDataWarehouse》一书中,列出了操作型数据与分析型数据之间的区别

1 / 35
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功