AnIntroductiontoDatabaseSystem一、数据库恢复概述二、故障的种类三、恢复的实现技术四、恢复策略数据库恢复技术AnIntroductiontoDatabaseSystem事务的ACID特性原子性(Atomicity)一致性(Consistency)隔离性(Isolation)持续性(Durability)数据库系统常常允许多个事务并发地执行,在数据库管理系统(DBMS)中,事务管理程序的任务就是要保证这些事务全都能正确地执行。事务是数据库恢复和并发控制的基本单位,保证事务的ACID特性是事务管理程序的重要任务。事务的ACID特性:AnIntroductiontoDatabaseSystem事务的ACID特性因此,要保证事务能够正确地执行,就是要确保事务的ACID特性得到满足。事务ACID特性可能遭到破坏的因素有:(1)多个事务并发运行时,不同事务的操作交叉执行(2)事务在运行过程中被强行中止在第二种情况下,数据库管理系统必须保证被强行中止的事务对数据库和其它事务没有任何影响,这就是数据库系统中恢复机制的责任。在数据库恢复中,加锁、日志文件、事务提交等是常用的技术。AnIntroductiontoDatabaseSystem事务的两段提交一个事务完成其操作并提交,严格上讲并非已经“成功完成”该事务。实际上,事务的提交有一个过程,从开始提交到提交成功可以分为部分提交和提交两个阶段。要详细了解这个问题,首先要了解事务运行过程中的状态变化。AnIntroductiontoDatabaseSystem事务的两段提交事务运行时有如下五种状态:活动状态部分提交失败状态提交状态异常状态AnIntroductiontoDatabaseSystem事务的两段提交活动状态部分提交失败状态提交状态异常状态1、活动状态事务开始运行时被激活,就处于活动状态,直到事务被部分提交或失败。在这个状态中,事务将执行对数据库的读写操作,但这时的写操作并非立即写到磁盘上,一般是暂时存放在系统缓冲区中。AnIntroductiontoDatabaseSystem事务的两段提交活动状态部分提交失败状态提交状态异常状态2、部分提交状态事务中所有读写操作已经完成,事务进入部分提交状态。但这时对数据库的修改还存储在内存缓冲区中,事务还没有真正结束。AnIntroductiontoDatabaseSystem事务的两段提交活动状态部分提交失败状态提交状态异常状态3、失败状态当一个事务无法正常进行下去时,该事务就会处于失败状态。这时,数据库管理系统(DBMS)必须撤消它对数据库和其他事务的影响。AnIntroductiontoDatabaseSystem事务的两段提交活动状态部分提交失败状态提交状态异常状态4、异常结束状态当撤消一个失败事务对数据库和其他事务的影响,并恢复到事务开始执行之前的状态以后,该失败事务退出数据库系统,进入异常结束状态。AnIntroductiontoDatabaseSystem事务的两段提交活动状态部分提交失败状态提交状态5、提交状态当一个事务成功地完成所有操作,并且所有的操作对数据库的影响都已经永久地存入数据库之后,该事务退出数据库系统,进入提交状态,正常结束。异常状态AnIntroductiontoDatabaseSystem事务的两段提交活动状态部分提交失败状态通常,一个事务开始运行便立即进入活动状态,当执行最后一个语句时便进入部分提交状态。若处于活动状态的事务未能正常执行某一操作,或者在部分提交状态中无法安全地将数据存入数据库,则事务进入失败状态。此时,只要撤消其对数据库和其他事务的影响,该事务就进入异常结束状态。对于进入异常结束状态的事务,要根据失败原因分别作出相应处理:通常情况下,由与事务无关的外部原因(如硬件故障或系统软件错误)引起的失败,可以重新启动该事务;而对于事务内部错误所引发的失败,将予以废除,通知用户修改或重写该事务程序。异常状态提交状态AnIntroductiontoDatabaseSystem一、数据库恢复概述故障是不可避免的系统故障:计算机软、硬件故障人为故障:操作员的失误、恶意的破坏等。数据库的恢复把数据库从错误状态恢复到某一已知的正确状态(一致状态或完整状态)AnIntroductiontoDatabaseSystem二、故障的种类事务内部的故障系统故障介质故障计算机病毒AnIntroductiontoDatabaseSystem1、事务内部的故障事务内部的故障有的是可以通过事务程序本身发现的(见下面转账事务的例子)有的是非预期的AnIntroductiontoDatabaseSystem事务内部的故障(续)例如:银行转账事务,这个事务把一笔金额从一个账户甲转给另一个账户乙。BEGINTRANSACTION读账户甲的余额BALANCE;BALANCE=BALANCE-AMOUNT;(AMOUNT为转账金额)写回BALANCE;IF(BALANCE0)THEN{打印'金额不足,不能转账';ROLLBACK;(撤销刚才的修改,恢复事务)}ELSE{读账户乙的余额BALANCE1;BALANCE1=BALANCE1+AMOUNT;写回BALANCE1;COMMIT;}AnIntroductiontoDatabaseSystem事务内部的故障(续)这个例子所包括的两个更新操作要么全部完成要么全部不做,否则就会使数据库处于不一致状态。例如只把账户甲的余额减少了而没有把账户乙的余额增加。在这段程序中若产生账户甲余额不足的情况,应用程序可以发现并让事务滚回,撤销已作的修改,恢复数据库到正确状态。AnIntroductiontoDatabaseSystem事务内部的故障(续)事务内部更多的故障是非预期的,是不能由应用程序处理的。运算溢出并发事务发生死锁而被选中撤销该事务违反了某些完整性约束等以后,事务故障主要指这一类非预期的故障事务故障的恢复:撤消事务(UNDO)AnIntroductiontoDatabaseSystem2、系统故障系统故障称为软故障,是指造成系统停止运转的任何事件,使得系统要重新启动。整个系统的正常运行突然被破坏所有正在运行的事务都非正常终止不破坏数据库内存中数据库缓冲区的信息全部丢失AnIntroductiontoDatabaseSystem系统故障的常见原因特定类型的硬件错误(如CPU故障)操作系统故障DBMS代码错误系统断电AnIntroductiontoDatabaseSystem系统故障的恢复发生系统故障时,事务未提交恢复策略:强行撤消(UNDO)所有未完成事务发生系统故障时,事务已提交,但缓冲区中的信息尚未完全写回到磁盘上。恢复策略:重做(REDO)所有已提交的事务AnIntroductiontoDatabaseSystem3、介质故障介质故障称为硬故障,指外存故障磁盘损坏磁头碰撞操作系统的某种潜在错误瞬时强磁场干扰AnIntroductiontoDatabaseSystem介质故障的恢复装入数据库发生介质故障前某个时刻的数据副本重做自此时始的所有成功事务,将这些事务已提交的结果重新记入数据库AnIntroductiontoDatabaseSystem4、计算机病毒计算机病毒一种人为的故障或破坏,是一些恶作剧者研制的一种计算机程序可以繁殖和传播危害破坏、盗窃系统中的数据破坏系统文件AnIntroductiontoDatabaseSystem故障小结各类故障,对数据库的影响有两种可能性一是数据库本身被破坏二是数据库没有被破坏,但数据可能不正确,这是由于事务的运行被非正常终止造成的AnIntroductiontoDatabaseSystem三、恢复的实现技术恢复操作的基本原理:冗余利用存储在系统其它地方的冗余数据来重建数据库中已被破坏或不正确的那部分数据。恢复机制涉及的关键问题:1.如何建立冗余数据数据转储(backup)登录日志文件(logging)2.如何利用这些冗余数据实施数据库恢复AnIntroductiontoDatabaseSystem1、什么是数据转储?转储是指DBA将整个数据库复制到磁带或另一个磁盘上保存起来的过程,备用的数据称为后备副本或后援副本如何使用数据库遭到破坏后可以将后备副本重新装入重装后备副本只能将数据库恢复到转储时的状态AnIntroductiontoDatabaseSystem2、转储方法(1)静态转储与动态转储(2)海量转储与增量转储AnIntroductiontoDatabaseSystem静态转储在系统中无运行事务时进行的转储操作转储开始时数据库处于一致性状态转储期间不允许对数据库的任何存取、修改活动得到的一定是一个数据一致性的副本优点:实现简单缺点:降低了数据库的可用性转储必须等待正在运行的用户事务结束新的事务必须等待转储结束AnIntroductiontoDatabaseSystem动态转储转储操作与用户事务并发进行转储期间允许对数据库进行存取或修改动态转储的优点:不用等待正在运行的用户事务结束不会影响新事务的运行动态转储的缺点:不能保证副本中的数据正确有效[例]在转储期间的某个时刻Tc,系统把数据A=100转储到磁带上,而在下一时刻Td,某一事务将A改为200。转储结束后,后备副本上的A已是过时的数据了。AnIntroductiontoDatabaseSystem动态转储利用动态转储得到的副本进行故障恢复需要把动态转储期间各个事务对数据库的修改活动登记下来,建立日志文件后备副本加上日志文件才能把数据库恢复到某一时刻的正确状态AnIntroductiontoDatabaseSystem海量转储与增量转储海量转储:每次转储全部数据库增量转储:只转储上次转储后更新过的数据海量转储与增量转储比较从恢复角度看,使用海量转储得到的后备副本进行恢复往往更方便但如果数据库很大,事务处理又十分频繁,则增量转储方式更实用更有效AnIntroductiontoDatabaseSystem3、登记日志文件(1)日志文件的格式和内容(2)日志文件的作用(3)登记日志文件?AnIntroductiontoDatabaseSystem日志文件的格式和内容什么是日志文件?日志文件(log)是用来记录事务对数据库的更新操作的文件日志文件的格式以记录为单位的日志文件以数据块为单位的日志文件AnIntroductiontoDatabaseSystem日志文件的格式和内容(续)以记录为单位的日志文件内容各个事务的开始标记(BEGINTRANSACTION)各个事务的结束标记(COMMIT或ROLLBACK)各个事务的所有更新操作以上均作为日志文件中的一个日志记录(logrecord)AnIntroductiontoDatabaseSystem日志文件的格式和内容(续)以记录为单位的日志文件,每条日志记录的内容事务标识(标明是哪个事务)操作类型(插入、删除或修改)操作对象(记录内部标识)更新前的旧值(对插入操作而言,此项为空值)更新后的新值(对删除操作而言,此项为空值)AnIntroductiontoDatabaseSystem日志文件的格式和内容(续)以数据块为单位的日志文件,每条日志记录的内容事务标识(标明是那个事务)被更新的数据块AnIntroductiontoDatabaseSystem日志文件的作用进行事务故障恢复进行系统故障恢复协助后备副本进行介质故障恢复AnIntroductiontoDatabaseSystem利用静态转储副本和日志文件进行恢复静态转储运行事务正常运行─┼───────┼─────────────TaTbTf└────────────重装后备副本利用日志文件恢复继续运行恢复─┼───────┼┈┈┈┈┈┈┈┈┼────登记日志文件↓