第七章数据库恢复技术第七章数据库恢复技术7.1事务的基本概念7.2数据库恢复概述7.3故障的种类7.4恢复的实现技术7.5恢复策略7.6具有检查点的恢复技术7.7数据库镜像第七章数据库恢复技术7.1事务的基本概念7.2数据库恢复概述7.3故障的种类7.4恢复的实现技术7.5恢复策略7.6具有检查点的恢复技术7.7数据库镜像7.1事务的基本概念事务(Transaction)是用户定义的一个数据库操作序列,这些操作要么都做,要么都不做,是一个不可分割的工作单位恢复和并发控制的基本单位7.1事务的基本概念示例银行转帐:事务T从A帐户过户50¥到B帐户T:read(A);A:=A–50;write(A);read(B);B:=B+50;write(B);read(X):从数据库传送数据项X到事务的工作区中write(X):从事务的工作区中将数据项X写回数据库7.1事务的基本概念事务和程序比较在关系数据库中,一个事务可以是一条或多条SQL语句,或整个程序。一个程序通常包含多个事务7.1事务的基本概念显式定义事务BEGINTRANSACTIONCOMMITROLLBACK事务以Begintransaction开始,以Commitwork或Rollbackwork结束Commitwork表示提交,事务正常结束Rollbackwork表示事务非正常结束,撤消事务已做的操作,回滚到事务开始时的状态7.1事务的基本概念显式定义事务BEGINTRANSACTIONBEGINTRANSACTIONSQL语句1SQL语句1SQL语句2SQL语句2…………COMMITROLLBACK例如,银行转账事务,这个事务把一笔金额从一个账户甲转给另一个账户乙。BEGINTRANSACTION读账户甲的余额BALANCE;BALANCE=BALANCE-AMOUNT;(AMOUNT为转账金额)写回BALANCE;IF(BALANCE0)THEN{打印'金额不足,不能转账';ROLLBACK;(撤销刚才的修改,恢复事务)}ELSE{读账户乙的余额BALANCE1;BALANCE1=BALANCE1+AMOUNT;写回BALANCE1;COMMIT;}7.1事务的基本概念隐式方式当用户没有显式地定义事务时,DBMS按缺省规定自动划分事务7.1事务的基本概念AutoCommit事务是SQLServer默认事务方式。它指出每条SQL语句都构成事务,隐含事务的开始和结束控制点。例:updateaccountssetbal=bal-100whereaccountno=‘A’updateaccountssetbal=bal+100whereaccountno=‘B’7.1事务的基本概念例:采用显示事物的处理方式begintranupdateaccountssetbal=bal-100whereaccountno=‘A’updateaccountssetbal=bal+100whereaccountno=‘B’endtran7.1事务的基本概念事务的ACID特性原子性(Atomicity)一致性(Consistency)隔离性(Isolation)持续性(Durability)7.1事务的基本概念事务的ACID特性原子性(Atomicity)事务中包含的所有操作要么全做,要么全不做原子性由恢复机制实现7.1事务的基本概念事务的ACID特性一致性(Consistency)事务开始前,数据库处于一致性的状态;事务结束后,数据库必须仍处于一致性状态7.1事务的基本概念事务的ACID特性隔离性(Isolation)系统必须保证事务不受其它并发执行事务的影响对任何一对事务T1,T2,在T1看来,T2要么在T1开始之前已经结束,要么在T1完成之后再开始执行隔离性通过并发控制机制实现7.1事务的基本概念事务的ACID特性持续性(Durability)一个事务一旦提交之后,它对数据库的影响必须是永久的系统发生故障不能改变事务的持久性持久性通过恢复机制实现事务状态活动状态失败状态部分提交状态提交状态中止状态初始状态事务无法继续正常执行事务回滚,数据库恢复到事务开始前状态最后一条语句被执行后成功完成,永久写入数据库7.1事务的基本概念事务ACID特性可能遭到破坏的因素:多个事务并行运行时,不同事务交叉执行事物在运行过程中被强行停止第七章数据库恢复技术7.1事务的基本概念7.2数据库恢复概述7.3故障的种类7.4恢复的实现技术7.5恢复策略7.6具有检查点的恢复技术7.7数据库镜像7.2数据库恢复概述故障是不可避免的系统故障:计算机软、硬件故障人为故障:操作员的失误、恶意的破坏等。数据库的恢复把数据库从错误状态恢复到某一已知的正确状态(亦称为一致状态或完整状态)第七章数据库恢复技术7.1事务的基本概念7.2数据库恢复概述7.3故障的种类7.4恢复的实现技术7.5恢复策略7.6具有检查点的恢复技术7.7数据库镜像7.3故障的种类事务内部的故障系统故障介质故障计算机病毒7.3故障的种类-事务内部的故障事物故障逻辑错误,事务由于某些内部条件而无法继续正常执行。系统错误,系统进入一种不良状态(如,死锁),使事务无法继续正常执行。有的是可以通过事务程序本身发现的,有的是非预期的例如,银行转账事务,这个事务把一笔金额从一个账户甲转给另一个账户乙。BEGINTRANSACTION读账户甲的余额BALANCE;BALANCE=BALANCE-AMOUNT;(AMOUNT为转账金额)写回BALANCE;IF(BALANCE0)THEN{打印'金额不足,不能转账';ROLLBACK;(撤销刚才的修改,恢复事务)}ELSE{读账户乙的余额BALANCE1;BALANCE1=BALANCE1+AMOUNT;写回BALANCE1;COMMIT;}7.3故障的种类-事务内部的故障事务内部更多的故障是非预期的,是不能由应用程序处理的。运算溢出并发事务发生死锁而被选中撤销该事务违反了某些完整性限制等以后,事务故障仅指这类非预期的故障事务故障的恢复:撤消事务(UNDO)日志文件数据库T,startT,A,1000,950A=950T,B,2000,250B=2050T,commits7.3故障的种类-系统故障系统故障称为软故障,是指造成系统停止运转的任何事件,使得系统要重新启动特定类型的硬件错误(如CPU故障)操作系统故障DBMS代码错误系统断电7.3故障的种类-系统故障系统故障称为软故障,是指造成系统停止运转的任何事件,使得系统要重新启动整个系统的正常运行突然被破坏所有正在运行的事务都非正常终止内存中数据库缓冲区的信息全部丢失不破坏数据库事务执行相关的地址空间日志文件数据库T,startT,A,1000,950T,B,2000,250T,commitsA=950B=20507.3故障的种类-系统故障发生系统故障时,事务未提交恢复策略:强行撤消(UNDO)所有未完成事务发生系统故障时,事务已提交,但缓冲区中的信息尚未完全写回到磁盘上。恢复策略:重做(REDO)所有已提交的事务7.3故障的种类-介质故障介质故障称为硬故障,指外存故障磁盘损坏磁头碰撞操作系统的某种潜在错误瞬时强磁场干扰破坏数据库或部分数据库,并影响正在存取这部分数据的所有事务。7.3故障的种类-介质故障装入数据库发生介质故障前某个时刻的数据副本重做自此时始的所有成功事务,将这些事务已提交的结果重新记入数据库7.3故障的种类-计算机病毒计算机病毒一种人为的故障或破坏,是一些恶作剧者研制的一种计算机程序可以繁殖和传播危害破坏、盗窃系统中的数据破坏系统文件7.3故障的种类各类故障,对数据库的影响有两种可能性一是数据库本身被破坏二是数据库没有被破坏,但数据可能不正确,这是由于事务的运行被非正常终止造成的。第七章数据库恢复技术7.1事务的基本概念7.2数据库恢复概述7.3故障的种类7.4恢复的实现技术7.5恢复策略7.6具有检查点的恢复技术7.7数据库镜像7.4恢复的实现技术恢复操作的基本原理:冗余利用存储在系统其它地方的冗余数据来重建数据库中已被破坏或不正确的那部分数据7.4恢复的实现技术恢复机制涉及的关键问题1.如何建立冗余数据数据转储(backup)登录日志文件(logging)2.如何利用这些冗余数据实施数据库恢复7.4恢复的实现技术-数据转储转储是指DBA定期地将整个数据库复制到磁带或另一个磁盘上保存起来的过程。备用的数据称为后备副本或后援副本如何使用数据库遭到破坏后可以将后备副本重新装入重装后备副本只能将数据库恢复到转储时的状态7.4恢复的实现技术-数据转储转储种类静态转储与动态转储海量转储与增量转储7.4恢复的实现技术-数据转储什么是静态转储在系统中无运行事务时进行的转储操作转储开始时数据库处于一致性状态转储期间不允许对数据库的任何存取、修改活动得到的一定是一个数据一致性的副本7.4恢复的实现技术-数据转储静态转储优点:实现简单缺点:降低了数据库的可用性转储必须等待正运行的用户事务结束新的事务必须等转储结束7.4恢复的实现技术-数据转储什么是动态转储转储操作与用户事务并发进行转储期间允许对数据库进行存取或修改7.4恢复的实现技术-数据转储动态转储优点不用等待正在运行的用户事务结束不会影响新事务的运行动态转储的缺点不能保证副本中的数据正确有效7.4恢复的实现技术-数据转储动态转储需要把动态转储期间各事务对数据库的修改活动登记下来,建立日志文件后备副本加上日志文件才能把数据库恢复到某一时刻的正确状态7.4恢复的实现技术-数据转储海量转储:每次转储全部数据库增量转储:只转储上次转储后更新过的数据海量转储与增量转储比较从恢复角度看,使用海量转储得到的后备副本进行恢复往往更方便但如果数据库很大,事务处理又十分频繁,则增量转储方式更实用更有效7.4恢复的实现技术-数据转储转储方法分类转储状态动态转储静态转储转储方式海量转储动态海量转储静态海量转储增量转储动态增量转储静态增量转储7.4恢复的实现技术-登记日志文件什么是日志文件日志文件(log)是用来记录事务对数据库的更新操作的文件,由系统自动记录。日志文件的格式以记录为单位的日志文件以数据块为单位的日志文件7.4恢复的实现技术-登记日志文件以记录为单位的日志文件内容各个事务的开始标记(BEGINTRANSACTION)各个事务的结束标记(COMMIT或ROLLBACK)各个事务的所有更新操作以上均作为日志文件中的一个日志记录(logrecord)7.4恢复的实现技术-登记日志文件以记录为单位的日志文件,每条日志记录的内容事务标识(标明是哪个事务)操作类型(插入、删除或修改)操作对象(记录内部标识)更新前数据的旧值(对插入操作而言,此项为空值)更新后数据的新值(对删除操作而言,此项为空值)7.4恢复的实现技术-登记日志文件以数据块为单位的日志文件,每条日志记录的内容事务标识(标明是那个事务)被更新的数据块7.4恢复的实现技术-登记日志文件日志文件的作用进行事务故障恢复进行系统故障恢复协助后备副本进行介质故障恢复7.4恢复的实现技术-登记日志文件利用静态转储副本和日志文件进行恢复静态转储运行事务正常运行─┼───────┼─────────────TaTbTf└────────────重装后备副本利用日志文件恢复继续运行恢复─┼───────┼┈┈┈┈┈┈┈┈┼────登记日志文件↓7.4恢复的实现技术-登记日志文件登记日志文件基本原则登记的次序严格按并发事务执行的时间次序必须先写日志文件,后写数据库写日志文件操作:把表示这个修改的日志记录写到日志文件写数据库操作:把对数据的修