WORD格式-可编辑专业知识--整理分享1.1.1.1.1迁移方案总体思路中心系统迁移是一个整体系统工程。迁移必须保证用户系统建设的相关要求,在迁移方案设计中,我们重点考虑几个问题。保障业务中断停机时间最小化业务中断对于用户无论是运行环境还是测试环境均存在较大的恢复风险,这样的风险特别对于时间敏感型数据和数据完整性业务都是不可以接受的。我们基于这样的要求,考虑到如何将停机时间最小,能否实现0停机的建设目标?1、对于服务器操作系统而言,我们可以采用P2V的方式,利用操作系统的VolumeShadowCopy卷影副本复制服务作为基础,来实现在旧系统环境下的系统无修改,无停机的情况下,将数据和应用软件、操作系统环境、系统环境变量等全部以“快照”形式迁移到新服务器中。由此实现服务器环境的整体迁移。2、对于应用中间件和其他应用服务器来说,我们可以基于应用服务器的动态业务扩展集群方式,来实现服务器不停机环境下的增加业务节点操作,这样可以实现应用服务器“热添加”到新环境中的故障转移/负载均衡集群系统中,在部分应用服务中我们可以使用session会话复制来实现旧系统的全局环境变量和会话请求状态也迁移到新环境中来。考虑到会话复制和状态的快速实时,我们可以采用会话内存复制,考虑到会话复制和状态的安全性,我们可以采用会话数据库复制管理。3、对于数据库而言,我们可以基于数据库本身自带的数据库镜像技术、数据库日志传递技术来实现各自的分库、迁移库的构建,数据库镜像技术可以让我们不但保证数据库迁移的不停机,而且还可以保证万一迁移中出现停机故障也不影响源数据库,而日志传递技术构建的迁移可以保证系统数据库迁移以异步方式进行,这样可以让我们的系统环境在网络出现故障的情况依然可以进行迁移任务窗口的正常工作。业务切割时间节点优化针对现有系统需要对外提供服务的应用,需要通过对用户历史应用进行分析,选择最优的的切割时间节点,并提切割期间的备份链路、人工受理手段。WORD格式-可编辑专业知识--整理分享迁移后完整性测试迁移涉及到应用、实例、数据库的操作以外,还涉及到迁移前规划、迁移后测试的完整性测试。这些测试包括但不限于数据一致性测试、数据完整性测试、应用会话状态完整性测试、连接中断测试、数据恢复测试。只有这样才能保证迁移的安全性和有效性。1.1.1.1.2服务器硬件环境迁移方案按照用户招标要求,本次项目建设的服务硬件环境主要是从原有服务器向北京政务云平台的迁移。首先需向北京市政务云服务平台咨询其对原有服务器硬件环境和操作系统环境虚拟的支持程度,可以降低迁移的难度。迁移评估迁移前,我公司将对迁移方案进行评估以确保迁移成功。首先我公司将派工程师勘察现有系统的架构和资源使用状况,评估过程必须包含以下信息和内容:现有系统支撑的服务数量以及在服务器中的分布情况;现有物理服务器资源占用状况,包括CPU、内存、磁盘和网络连接状况,为保证迁移成功,目标虚拟机规格应不低于原物理机标准;当前的物理环境是否支持虚拟化,是否支持资源扩展,因为在迁移之前须在物理服务器上完成虚拟化;对当前的存储容量和资源利用率进行评估,需在目标系统中规划好迁移需要的存储空间。需明确现有存储如何利用,比如有些服务器是在本地磁盘上创建系统盘和用户盘,有些服务器则在本地磁盘上创建系统盘而在SAN/NAS上创建用户盘。迁移计划通过对现有网络环境的评估,我们对现有资源利用率,服务以及系统需求非常清晰并进行评估后才能开始对迁移进行计划,步骤如下:1、确定迁移步骤,包括所有服务器的迁移先后顺序,其顺序按风险的高低降序排列。2、确定备份方案,由于现有系统会被加固,某些服务器通过虚拟化重复利用,而在虚拟化前需要清除所有的数据,因此需要对这些服务器进行备份保证服WORD格式-可编辑专业知识--整理分享务的连续性。3、确定并准备好迁移所需的工具,包括工具在迁移中必备的一系列功能和使用工具所需具备的网络环境。4、在实际迁移开始之前确定额外的测试环境,该测试环境能够引导测试从而确保迁移成功。因此,测试环境需明确设计的服务器和存储数量。5、规划网络环境,由于网络中的服务器各处不同位置,因此在迁移中需考虑到网络连接情况、数据备份方式,以及网络流量来源,确定网络流量是否会引发网络拥塞6、确定迁移周期以及参与人员,包括迁移起止时间,团队能力建设以及团队成员的角色。测试计划迁移计划后,执行小批量的测试迁移方案,这里会涉及到首批迁移的测试和审核,步骤如下:准备用于测试迁移的测试系统环境,在测试时,第一批服务器将会迁移到该系统环境中。安装并核实迁移工具,此时要执行第一批服务器的迁移。对第一批服务器,需分析存储系统,不管该服务器在存储迁移中采用本地磁盘存储还是远端SAN/NAS存储系统。迁移测试在第一批服务器和服务的小批量测试迁移后,需对迁移后的服务器进行测试,包括单元测试和性能测试。迁移实施在迁移实施过程中,所有的服务器都会被迁移到虚拟化系统下。执行步骤如下:确保批量迁移的整个网络环境已准备完毕,并通过迁移工具完成源系统和目标系统之间的连通。此处的目标系统属于中转系统。对迁移系统进行性能审核和健康检查,如果系统状态监视则停用旧系统并将其服务暂时转移到新的虚拟化系统中。进行利旧,对于一部分可用的旧硬件可在服务器虚拟化中重新再利用,一WORD格式-可编辑专业知识--整理分享些软件资源需扩展,如内存和硬盘。这些服务器构成最终的虚拟化基础设施,即最终系统。最后,在目标系统和最终系统之间进行迁移。1.1.1.1.3迁移的详细操作步骤迁移的具体步骤及描述如下:1、在评估阶段,虚拟化和迁移之前需收集的信息如下:性能统计:包括CPU使用率,内存使用率,硬盘IOPS和硬盘使用情况;物理服务器配置:包括CPU规格,内存容量,硬盘容量统计物理服务器部署位置,分析是否支持虚拟化,累计支持虚拟化的服务器数量,并规划出虚拟化中需新增的硬件情况;通过上述无代理收集和代理收集两种场景收集当前系统的使用和配置情况。可采用信息收集工具。2、分析现有服务的依赖条件,对当前系统进行备份。确定应用系统对服务器的依赖关系,可作为迁移参考,确定所有服务器的迁移优先级顺序。在确定各服务的依赖条件后,对需进行虚拟化的服务器进行备份。3、容量规划和虚拟化执行根据当前的资源使用和需求情况,计算虚拟化所需的容量。4、规划应用服务在拟化解决方案中,同类虚拟机部署在同一个计算资源池中,在同一个池中可相互共享存储/计算资源,一个集群的故障不会影响其他资源池。5、虚拟化规划和虚拟机分配建立虚拟化平台后,要准备最终的迁移资源。迁移前,如果服务器a具备双核CPU和2G内存,那么在虚拟化平台中就创建一个2核/2G内存的虚拟机,并分配相应的硬盘。6、规划迁移工具采用迁移工具从物理或虚拟的服务器向最终的虚拟化系统中进行磁盘复制。7、通过工具执行在线迁移WORD格式-可编辑专业知识--整理分享准备好源系统,目标虚拟机以及目标系统后,决定迁移时需使用的迁移工具和迁移策略。8、迁移测试迁移后,需进行测试来验证迁移是否成功,测试场景如下:应用服务迁移后对虚拟化基本功能的监测;迁移前后应用服务的特性功能是否几乎相同;虚拟化系统的性能监控;….9、停用旧系统截至目前现有的服务器已经被虚拟化和重复使用,其他一些不支持虚拟化的服务器上对应的服务也已经迁移到虚拟化平台,那么现在可将应用服务切换到虚拟系统并停用旧系统。1.1.1.1.4应用系统和数据库迁移方案针对本项目建设,我们将在应用系统和数据库迁移前,在北京市政务云平台中部署与原应用一样的操作系统、中间件、服务器管理平台软件环境,确保迁移的环境变化风险最低。应用服务器迁移针对本项目应用系统迁移,原系统全部是基于多种应用环境、多种应用程序框架。本方案计划对应用环境以及应用程序框架提出构建NLB群集,将当前系统不停机加入到NLB群集中,使之成为群集中的一个节点,而新环境则为另外一个节点。实施完成后再退出此迁移群集,将新环境加入到新的构建的NLB群集。NLB不但能实现均衡负载,而且还能实现多种形式的冗余。NLB主要用于那些文件改动不大,并且不常驻内存的环境,比如WEB服务、FTP服务、和VPN服务等。当用户访问集群的时候,集群能将访问请求分摊到集群中的每个服务器上,以达到均衡负载的效果。这些服务器被称为集群节点。在负载平衡中,每个节点的文件一般都要求是一样的。这样每个节点返回给客户的结果都是一致的。一般来说组建一个NLB要求至少两个节点,其中一个节点不能使用,这全部负载将落WORD格式-可编辑专业知识--整理分享入到剩下的那个节点上,即全载。NLB能提供三种冗余功能,软件冗余、硬件冗余、站点冗余。数据库迁移实施针对本项目数据库迁移,需要将中心积累的历史数据文件搬迁到北京市政务云平台,并且要求最小宕机时间,同时面临的难点还包括服务器并不在同一个一个机房。1、分析与设计思路针对本项目数据库搬迁环境特点:第一个是数据库文件比较大;第二是传送文件的速度可能会比较慢(广域网传输)。初步解决方案如下。为了使宕机时间最短,我们这里使用完整备份和差异备份来迁移数据库,在白天的时候对需要迁移的数据库进行一次完整备份(XXX_full.bak),并把备份文件拷贝(这里可以使用FTP软件进行断点续传)到目标服务器进行还原,等到下班时间之后再进行一次差异备份(XXX_diff.bak),再把这个差异备份拷贝到目标服务器,在完整还原的基础上再进行差异还原。这里的宕机时间=差异备份时间+传送差异备份文件时间+还原差异备份文件时间,不存在宕机时间。2、保证数据迁移过程中的安全性和操作可审计性数据迁移中的安全性不可忽略,本方案设计基于多重数据审计功能实现迁移安全性和操作审计性。1.1.1.1.5系统迁移的具体组织实施方案针对本项目建设,涉及中心生产系统的搬迁,上述系统具有停机时间要求短、系统结构复杂、测试时间长、设备繁多、使用人员多、层次复杂等特点。本项目搬迁,时间非常紧,且设备间的稳定性也是一个考验。因此,必须协调好各单位人员的关系,齐心协力才可能在预定时间内完成搬迁工程。本项目搬迁组织以尽量不影响日常工作或将影响降低到最低为前提的情况下制定,即在保障内容最少日的最少时间节点开始搬迁,尽快完成必须搬迁的服务器、网络设备的搬迁、安装及测试。并且在开机以后,继续跟踪系统的运行情况,随时处理系统运行的异常情况。搬迁需要原系统建设公司人员的充分协调及WORD格式-可编辑专业知识--整理分享配合下才能完成本次搬迁任务。搬迁规划实施流程:现场勘察与XXX技术人员现场交流确定实施方案对所有设备进行分析,制定应急方案流程主要根据搬迁前的需要制定,主要详细了解当前系统设备情况,系统运行情况。针对所了解情况制定详细搬迁方案以及应急方案。专业工程师了解用户现在机房的现状以及搬迁后的具体要求。充分考虑在实施过程中可能出现的各种情况,定制详细可行性的迁移实施计划,将机房迁移工作对用户的影响降至最小。编制搬迁前及搬迁后的物理布置表、连接表、线缆号表。可根据用户情况分为多个系统进行分类。在搬迁过程中需要XXX技术人员密切配合。为保证搬迁工作顺利、有序、安全的进行将制定详细的搬迁流程,进行细致的分工,具体工作安排到人,责任到人。搬迁工作中的每项工作原则最少安排(2)人,以保证工作的准确性。详细实施方案为了搬迁能按时顺利进行,并且在搬迁后能够保证设备正常运行,我们制定了一系列简单明了的工作表,帮助工程实施人员确定各种搬迁工作中要执行的工作是否完成。避免工作失误,避免造成搬迁工作的延误。实施流程:WORD格式-可编辑专业知识--整理分享备品备件工具准备新机房现场检查设备标记数据备份目的机房检查表数据备份表设备端口标记表设备关机设备下架设备搬运设备连接设备端口标记表设备开机功能测试完成目的机房的要求:需要在搬迁前检查目的机房的必要设备设施是否符合要求,本工作表是保证搬迁后设备能否稳定正常运行的先决条件,在搬迁前由搬迁负责人同相关人员填写确认。应急处理在设备搬迁后出现异常情况时现场技术人员立即检查设备,检查故障现象,确定故障位置。硬件故障在备件准