AnIntroductiontoDatabaseSystem数据库系统概论AnIntroductiontoDatabaseSystem第十章数据库恢复技术AnIntroductiontoDatabaseSystem第十章数据库恢复技术10.1事务的基本概念10.2数据库恢复概述10.3故障的种类10.4恢复的实现技术10.5恢复策略10.6具有检查点的恢复技术10.7数据库镜像10.8小结AnIntroductiontoDatabaseSystem10.1事务的基本概念一、事务定义二、事务的特性AnIntroductiontoDatabaseSystem一、事务(Transaction)定义一个数据库操作序列一个不可分割的工作单位恢复和并发控制的基本单位事务和程序比较在关系数据库中,一个事务可以是一条或多条SQL语句,也可以包含一个或多个程序。一个程序通常包含多个事务AnIntroductiontoDatabaseSystem定义事务显式定义方式BEGINTRANSACTIONBEGINTRANSACTIONSQL语句1SQL语句1SQL语句2SQL语句2。。。。。。。。。。COMMITROLLBACK隐式方式当用户没有显式地定义事务时,DBMS按缺省规定自动划分事务AnIntroductiontoDatabaseSystem二、事务的特性(ACID特性)事务的ACID特性:原子性(Atomicity)一致性(Consistency)隔离性(Isolation)持续性(Durability)AnIntroductiontoDatabaseSystem第十章数据库恢复技术10.1事务的基本概念10.2数据库恢复概述10.3故障的种类10.4恢复的实现技术10.5恢复策略10.6具有检查点的恢复技术10.7数据库镜像10.8小结AnIntroductiontoDatabaseSystem10.2数据库恢复概述故障是不可避免的系统故障:计算机软、硬件故障人为故障:操作员的失误、恶意的破坏等。数据库的恢复把数据库从错误状态恢复到某一已知的正确状态(亦称为一致状态或完整状态)AnIntroductiontoDatabaseSystem第十章数据库恢复技术10.1事务的基本概念10.2数据库恢复概述10.3故障的种类10.4恢复的实现技术10.5恢复策略10.6具有检查点的恢复技术10.7数据库镜像10.8小结AnIntroductiontoDatabaseSystem故障的种类事务内部的故障系统故障介质故障计算机病毒AnIntroductiontoDatabaseSystem一、事务内部的故障事务内部的故障有的是可以通过事务程序本身发现的(见下面转账事务的例子)有的是非预期的AnIntroductiontoDatabaseSystem事务内部的故障(续)例如,银行转账事务,这个事务把一笔金额从一个账户甲转给另一个账户乙。BEGINTRANSACTION读账户甲的余额BALANCE;BALANCE=BALANCE-AMOUNT;(AMOUNT为转账金额)写回BALANCE;IF(BALANCE0)THEN{打印'金额不足,不能转账';ROLLBACK;(撤销刚才的修改,恢复事务)}ELSE{读账户乙的余额BALANCE1;BALANCE1=BALANCE1+AMOUNT;写回BALANCE1;COMMIT;}AnIntroductiontoDatabaseSystem事务内部的故障(续)这个例子所包括的两个更新操作要么全部完成要么全部不做。否则就会使数据库处于不一致状态,例如只把账户甲的余额减少了而没有把账户乙的余额增加。在这段程序中若产生账户甲余额不足的情况,应用程序可以发现并让事务滚回,撤销已作的修改,恢复数据库到正确状态。AnIntroductiontoDatabaseSystem事务内部的故障(续)事务内部更多的故障是非预期的,是不能由应用程序处理的。运算溢出并发事务发生死锁而被选中撤销该事务违反了某些完整性限制等以后,事务故障仅指这类非预期的故障事务故障的恢复:撤消事务(UNDO)AnIntroductiontoDatabaseSystem二、系统故障系统故障称为软故障,是指造成系统停止运转的任何事件,使得系统要重新启动。整个系统的正常运行突然被破坏所有正在运行的事务都非正常终止不破坏数据库内存中数据库缓冲区的信息全部丢失AnIntroductiontoDatabaseSystem系统故障的常见原因特定类型的硬件错误(如CPU故障)操作系统故障DBMS代码错误系统断电AnIntroductiontoDatabaseSystem系统故障的恢复发生系统故障时,事务未提交恢复策略:强行撤消(UNDO)所有未完成事务发生系统故障时,事务已提交,但缓冲区中的信息尚未完全写回到磁盘上。恢复策略:重做(REDO)所有已提交的事务AnIntroductiontoDatabaseSystem三、介质故障介质故障称为硬故障,指外存故障磁盘损坏磁头碰撞操作系统的某种潜在错误瞬时强磁场干扰AnIntroductiontoDatabaseSystem介质故障的恢复装入数据库发生介质故障前某个时刻的数据副本重做自此时始的所有成功事务,将这些事务已提交的结果重新记入数据库AnIntroductiontoDatabaseSystem四、计算机病毒计算机病毒一种人为的故障或破坏,是一些恶作剧者研制的一种计算机程序可以繁殖和传播危害破坏、盗窃系统中的数据破坏系统文件AnIntroductiontoDatabaseSystem故障小结各类故障,对数据库的影响有两种可能性一是数据库本身被破坏二是数据库没有被破坏,但数据可能不正确,这是由于事务的运行被非正常终止造成的。AnIntroductiontoDatabaseSystem第十章数据库恢复技术10.1事务的基本概念10.2数据库恢复概述10.3故障的种类10.4恢复的实现技术10.5恢复策略10.6具有检查点的恢复技术10.7数据库镜像10.8小结AnIntroductiontoDatabaseSystem10.4恢复的实现技术恢复操作的基本原理:冗余利用存储在系统其它地方的冗余数据来重建数据库中已被破坏或不正确的那部分数据恢复机制涉及的关键问题1.如何建立冗余数据数据转储(backup)登录日志文件(logging)2.如何利用这些冗余数据实施数据库恢复AnIntroductiontoDatabaseSystem10.4.1数据转储一、什么是数据转储二、转储方法AnIntroductiontoDatabaseSystem一、什么是数据转储转储是指DBA将整个数据库复制到磁带或另一个磁盘上保存起来的过程,备用的数据称为后备副本或后援副本如何使用数据库遭到破坏后可以将后备副本重新装入重装后备副本只能将数据库恢复到转储时的状态AnIntroductiontoDatabaseSystem二、转储方法1.静态转储与动态转储2.海量转储与增量转储3.转储方法小结AnIntroductiontoDatabaseSystem静态转储在系统中无运行事务时进行的转储操作转储开始时数据库处于一致性状态转储期间不允许对数据库的任何存取、修改活动得到的一定是一个数据一致性的副本优点:实现简单缺点:降低了数据库的可用性转储必须等待正运行的用户事务结束新的事务必须等转储结束AnIntroductiontoDatabaseSystem动态转储转储操作与用户事务并发进行转储期间允许对数据库进行存取或修改优点不用等待正在运行的用户事务结束不会影响新事务的运行动态转储的缺点不能保证副本中的数据正确有效[例]在转储期间的某个时刻Tc,系统把数据A=100转储到磁带上,而在下一时刻Td,某一事务将A改为200。转储结束后,后备副本上的A已是过时的数据了AnIntroductiontoDatabaseSystem动态转储利用动态转储得到的副本进行故障恢复需要把动态转储期间各事务对数据库的修改活动登记下来,建立日志文件后备副本加上日志文件才能把数据库恢复到某一时刻的正确状态AnIntroductiontoDatabaseSystem2.海量转储与增量转储海量转储:每次转储全部数据库增量转储:只转储上次转储后更新过的数据海量转储与增量转储比较从恢复角度看,使用海量转储得到的后备副本进行恢复往往更方便但如果数据库很大,事务处理又十分频繁,则增量转储方式更实用更有效AnIntroductiontoDatabaseSystem3.转储方法小结转储方法分类转储状态动态转储静态转储转储方式海量转储动态海量转储静态海量转储增量转储动态增量转储静态增量转储AnIntroductiontoDatabaseSystem10.4恢复的实现技术10.4.1数据转储10.4.2登记日志文件AnIntroductiontoDatabaseSystem10.4.2登记日志文件一、日志文件的格式和内容二、日志文件的作用三、登记日志文件AnIntroductiontoDatabaseSystem一、日志文件的格式和内容什么是日志文件日志文件(log)是用来记录事务对数据库的更新操作的文件日志文件的格式以记录为单位的日志文件以数据块为单位的日志文件AnIntroductiontoDatabaseSystem日志文件的格式和内容(续)以记录为单位的日志文件内容各个事务的开始标记(BEGINTRANSACTION)各个事务的结束标记(COMMIT或ROLLBACK)各个事务的所有更新操作以上均作为日志文件中的一个日志记录(logrecord)AnIntroductiontoDatabaseSystem日志文件的格式和内容(续)以记录为单位的日志文件,每条日志记录的内容事务标识(标明是哪个事务)操作类型(插入、删除或修改)操作对象(记录内部标识)更新前数据的旧值(对插入操作而言,此项为空值)更新后数据的新值(对删除操作而言,此项为空值)AnIntroductiontoDatabaseSystem日志文件的格式和内容(续)以数据块为单位的日志文件,每条日志记录的内容事务标识(标明是那个事务)被更新的数据块AnIntroductiontoDatabaseSystem二、日志文件的作用进行事务故障恢复进行系统故障恢复协助后备副本进行介质故障恢复AnIntroductiontoDatabaseSystem利用静态转储副本和日志文件进行恢复静态转储运行事务正常运行─┼───────┼─────────────TaTbTf└────────────重装后备副本利用日志文件恢复继续运行恢复─┼───────┼┈┈┈┈┈┈┈┈┼────登记日志文件↓AnIntroductiontoDatabaseSystem利用静态转储副本和日志文件进行恢复(续)上图中:系统在Ta时刻停止运行事务,进行数据库转储在Tb时刻转储完毕,得到Tb时刻的数据库一致性副本系统运行到Tf时刻发生故障为恢复数据库,首先由DBA重装数据库后备副本,将数据库恢复至Tb时刻的状态重新运行自Tb~Tf时刻的所有更新事务,把数据库恢复到故障发生前的一致状态AnIntroductiontoDatabaseSystem三、登记日志文件基本原则登记的次序严格按并行事务执行的时间次序必须先写日志文件,后写数据库¾写日志文件操作:把表示这个修改的日志记录写到日志文件¾写数据库操作:把对数据的修改写到数据库中AnIntroductiontoDatabaseSystem登记日志文件(续)为什么要先写日志文件写数据库和写日志文件是两个不同的操作在这两个操作之间可能发生故障如果先写了数据库修改,而在日志文件