数据备份与恢复摘要近年来,以计算机和网络为基础的信息产业获得了空前的发展,人们对数据的安全性越来越重视。数据备份和灾难恢复逐渐成为了热点问题。由于各种客观原因,人们无法预测何时、何地会发生何种程度的灾难,也不不可能完全防止、控制其发生。但高性能的数据备份和灾难恢复方案能充分保护系统中有价值的信息。保证灾难发生时系统任然正常工作。引言随着以计算机为基础的电子信息技术在社会各方面越来越广泛的深入应用,各种工作逐步走上了办公自动化网络管理的发展道路,大量的管理信息系统和专用办公软件被开发并投入使用,这对规范管理、提高工作效率起到了良好的促进作用。在实际工作中,信息系统和管理软件从开始投入使用起,就将随着工作的开展和时间的推移,持续记录并积累大量的数据。工作中的许多重要的决策就是以这些日常积累的数据为基础的。但信息系统在提供方便和高效的同时,在运行中却常常会出现一些意料之外的问题,如人为误操作、硬件损毁、电脑病毒侵袭、断电或其它意外原因造成网络系统瘫痪、数据丢失,给企业、单位和管理人员带来难以弥补的损失。避免这种损失的最佳途径就是建立可靠的数据备份恢复系统,但是大部分应用人员只是在受到损失后才意识到了数据备份的重要性。目录一、背景.....................................................................................................3二、解决方案.............................................................................................3三、什么是数据备份与恢复?................................................................4四、需要备份的数据对象........................................................................5五、备份设备.............................................................................................6六、备份类型(或备份模式)................................................................6七、备份窗口.............................................................................................7八、备份介质.............................................................................................7九、备份系统的逻辑结构和部署............................................................8十、恢复操作系统..................................................................................10一、背景有专业机构的研究数据表明:丢失300MB的数据对于市场营销部门就意味着13万元人民币的损失,对财务部门意味着16万的损失,对工程部门来说损失可达80万。而丢失的关键数据如果15天内仍得不到恢复,企业就有可能被淘汰出局。实际上,我们很多企业和组织已有了前车之鉴,一些重要的企业内曾经不止一次地发生过灾难性的数据丢失事故,造成了很大的经济损失,在这种情况下,数据备份就成为日益重要的措施,我们必须对系统和数据进行备份!通过及时有效的备份,系统管理者就可以高枕无忧了。所以,对信息系统环境内的所有服务器、PC进行有效的文件、应用数据库、系统备份越来越迫切。二、解决方案基于磁盘备份篇:企业数据主要分为结构化数据和非结构化数据。结构化数据,即行数据,存储在数据库里。非结构化数据包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等。专业的备份系统可同时备份结构化数据和非结构化数据,。目前市面上常见基于磁盘的备份系统类型可分为两种:备份软件+通用硬件存储平台(服务器、NAS存储、磁盘阵列柜)和存储一体柜。基于磁带备份篇:基于磁带备份主要是指利用磁带机、磁带库、虚拟带库等设备进行数据备份,磁带备份具有以下几个优点:1.大容量:1盘介质上可存储高达800GB以上的数据2.小尺寸:所有这些容量都可存储在1盘小巧的数据磁带上3.可移动性:介质可以与设备分离,提供额外的病毒保护4.便携性:介质可以在现场之外存储,提供额外保护5.长寿命:适合长期存储(至少10–15年)三、什么是数据备份与恢复?数据备份与恢复系统是指在运行业务软件的计算机上安装专用的备份软件,该软件将按照计算机管理员设定的规则,周期性地为业务数据制作一个或多个拷贝,并将其存放到专门的备份设备上;当在线存储中的业务数据因为各种原因(如磁盘坏、病毒、误删除等)丢失后,管理员或用户可以通过备份软件提供的GUI,从备份设备上将数据恢复到在线存储上。一般来说,在线存储是指计算机上存放数据的硬盘或磁盘阵列。存储设备通常是磁带机/磁带、或磁带库,今天也可能是磁盘、或磁盘阵列。SymantecBackupExec就是典型的备份软件。例如图书馆的借还书计算机上运行着图书馆软件,数据库采用Sqlserver,图书馆所有的书籍信息和借还信息均存放在数据库中,而数据库的数据物理地存放在计算机的硬盘中。显然如果这些数据丢失,图书馆就停止运转了,需要对这台机器上的数据进行保护。在这台计算机上安装BackupExec,同时连接一台磁带机,BackupExec按照计算机管理员的要求,每个星期六晚上将所有SqlServer数据库都制作一个拷贝,并存放到磁带机中的磁带中。一旦Sqlserver中某条记录丢失,BackupExec很容易在图书馆管理软件SqlServer磁带机备份软件data管理员借还书数据备份和恢复系统磁带中找到它的拷贝,并将其恢复到指定的位置。这就是一套数据备份和恢复系统。四、需要备份的数据对象通常计算机上有三种数据需要备份:文件数据、数据库数据、及裸设备数据文件数据:文件通常指操作系统中的文件系统直接管理的数据,它是数据在硬盘上的一种存放格式。我们可以通过Windowsexplore看到它的存在。在Windows中,一个文件同时只能被一个应用程序读写。这就意味着,当文件正被应用访问时,备份软件是不能够读取它并进行备份的。通常安装一个叫做openfileoption的软件来协调这种备份操作。数据库数据:数据库软件(Sqlserver、oracle等)是指以一定的逻辑关系将数据组织起来,便于用户进行各种计算、更新、检索和查询。符合这种逻辑关系的数据叫数据库数据。它们通常以文件的方式存放在磁盘上、或者直接放到裸设备上,但是文件系统不直接管理它。它们有数据库软件自身进行维护和存取。由于数据库中的数据之间存在着复杂的逻辑关系,且被数据库动态修改,因此当数据库软件正在运行时,不能读取这些数据。即使读出来也不一定能用。所以备份时需要与数据库软件配合,或停掉数据库进程。裸设备数据:不管文件系统文件还是数据库数据,都存放在磁盘上。Windows提供一种方式可以直接读取磁盘的数据块,而不管它们是什么逻辑关系。这种脱离上层应用的数据叫裸设备数据。五、备份设备备份设备是指存放数据拷贝的设备,也叫离线设备,通常是磁带机或磁带库。近来随着磁盘价格的下降,很多客户也采用廉价磁盘做备份设备。还有最近出现的虚拟磁带库,它是用磁盘来仿真磁带存放备份数据。在海量存储环境,一般采用磁盘做中间缓冲,磁带做最终备份设备。很多计算机本身带着一个磁带机,尤其是UNIX服务器。只有磁带机的情况下,需要人工将磁带送进去,或取出来,人工保存磁带。当数据量很大时,人工管理变得不可能。磁带库是指含有一个或多个磁带机、一定数目的磁带槽和一个机械手的存储设备。机械手负责将磁带槽中的磁带送到磁带机中,或反之;磁带机将要备份的数据写到磁带上,或从磁带上读数据恢复到应用计算机上;磁带槽保存含有关键数据的拷贝。生产磁带库的厂家很多如:HP、IBM、EXBYTE、Quantum等。六、备份类型(或备份模式)在图书馆的例子中我们说每周备份一次所有的数据,在实际当中是否可行?如果周五的时候发生了问题,数据被破坏,磁盘上的数据不能使用了,那么我们采用计算机上的BackupExec将数据的拷贝从磁带上重新恢复到磁盘中。但是那是上周六的数据,周一至周五发生的变更全部丢失了。我们能否推荐每天都备份呢?如果数据量小,还可以。如果数据量大,就太花时间,也占有太多的磁带容量。为了解决上述问题,提出了全备份与增量备份的概念。全备份是指将所有的数据都备份一遍。增量备份是指只备份相对于前一天改变过的数据。还有一种增量备份叫累积增量备份,指备份那些相对于上一次全备份以来改变过的数据。七、备份窗口在建立一个备份系统时,有一个重要因素要考虑,那就是每次数据备份允许在多长时间内完成。数据备份的过程是将数据从在线磁盘上取出来,然后传送到离线设备上。在这个过程中,运行应用的计算机需要花CPU资源、内存资源、及I/O带宽来处理备份,肯定会影响应用程序的正常运行效率。一般只允许在业务不繁忙的时间段内来完成备份,以减轻影响。这个时间段就叫备份窗口。备份窗口是指允许完成备份的时间长度。例如我们个人笔记本电脑上可能安装了备份软件,每次备份软件运行时,机器慢的我们几乎不能进行日常工作。我们的工作时间是早9:00至晚6:00,但常常会加班至晚12:00.因此为了不影响工作,我们要求管理员只能在0:00-9:00这9个小时内为我们做备份。这就是我们笔记本的备份窗口,长度为9小时。显然备份窗口的长短直接影响投资成本。例如需要备份的数据600G,备份窗口为4小时,如果采用LTO磁带库,那么我们需要600*1024/(4*3600*30)=1.4个磁带机,即至少两个。(这里没有考虑磁盘I/O是否可以支持,实际当中需要考虑)八、备份介质在备份与恢复系统中备份介质往往指磁带。介质服务器指的是连接磁带库、且运行备份软件的计算机,它通常负责将它自身或其它计算机上的数据拷贝传送给磁带机,由磁带机写到磁带中。一般在备份系统中将磁带库中的介质分成介质池(mediapool),以便将不同应用(或计算机)的数据存放到不同的磁带组中,便于分类。备份介质既可以保存在与备份服务器连接的磁带库中,也可以取出来异地保存,取决于你的备份策略九、备份系统的逻辑结构和部署在上面图书馆的例子中如果网络中有三台计算机均运行业务软件且产生数据,我们是否需要为每台计算机买一台备份设备呢?答案是视情况而定的。一般的备份软件(例如BackupExec)逻辑结构如下《数据备份与恢复系统结构图》所示:中央管理服务器备份服务器Mediaserver备份服务器Mediaserver备份服务器Mediaserver备份客户端Remoteagent备份客户端Remoteagent备份客户端Remoteagent数据备份与恢复系统结构图备份软件由三种模块组成:管理模块、备份模块、及客户端模块(也叫集中管理服务器、备份服务器、及远程客户端)。管理服务器相当于整个备份系统的大脑,负责策略制定、指挥备份服务器工作,唤醒客户端传送数据。备份服务器根据指令将客户端送来的数据保存到它所连接的备份设备中,或从备份设备中读出数据传送给客户端恢复。同时每个备份服务器还保存着自身所管理范围的所有备份信息。客户端定期将需要备份的数据从本机在线磁盘上读出,通过网络或共享内存传送给备份服务器,或在管理员干预下发出指令给备份服务器,需要恢复数据。这三种模块可以安