公司机房突发事故应急处理预案为确保公司机房安全与稳定,以保证正常运行为宗旨,按照“预防为主,积极处置”的原则,本着建立一个有效处置突发事件,建立统一指挥、职责明确运转有序、反应迅速处置有力的机房安全体系的目标,特制定本预案。一、机房日常维护1、建立健全机房管理制度(1)在正常工作日内,信息技术中心人员负责对机房进行监控,主要职责是:巡视网络设备及系统的运行情况,发生异常情况及时处理,消除网络故障隐患。(2)节假日期间信息技术中心人员轮流值班,负责处理有关异常情况。(3)机房采取来人来访登记制度,未经允许,无关人员不得进入公司机房区域。2、机房内严格采取防雷、防火、防尘、防静电等措施以及机房入口处24小时监控录像等措施。3、认真做好数据备份工作,定期做一次数据库完全备份,每月检查服务器运行和备份情况。4、信息技术中心对机房的主要网络设备(路由器、主干交换机等)进行工作时间内全程监控,发现异常情况应及时进行处理,确保整个分公司网络的正常运行。二、机房突发事件应急处置方案1、电源系统应急预案(1)定期检查机房供电设备的运行状况和电路线缆器材情况,当发生下列突发事件时,按照以下方案进行处置:(2)当机房发生市电供电突然停电或是电源异常时。首先应和供电局联系确认正常停电以及预计停电时间。检查不间断电源的电池可供电时间,确保设备正常运行,如遇到突然断电,应及时将空调等不在UPS电源供电范围内的设备及时断电,预防突然来电时瞬间电流过大导致设备损坏等现象。(3)当确定停电时间超出机房UPS承载范围后,首先确定停电的范围以及受影响的设备范围。并及时通知各部门和支公司营销部做好停电应急准备。然后通知机房电源维护人和设备的负责人到达现场,做好各设备的电源停电准备。在UPS供电电量仅剩10%之后,严格按操作手册停掉各服务器的电源,最后停核心交换机和路由器,等待电力恢复。(4)当确定停电原因是在本身供电系统范围内,立即汇报给负责领导,并及时联系相关维护人员达到现场检修。对于恢复时间无法预计的,要通知出单点通过远程和VRC钥匙等方式做好出单工作。(5)恢复供电后,严格按照操作程序逐步恢复机房设备和UPS的供电,以防瞬间电流过大造成设备损坏。2、网络和服务器络系统应急预案(1)发生网络故障时,首先检查机房设备情况,确定网络故障的原因。(2)确认原因后,首先启动备用线路和设备,保证网络的正常运行。然后联系网络维护人员,及时处理和排除故障。(3)当确认原因为短时间无法恢复,应该及时向负责领导汇报,并向省公司相关部门汇报。然后通知各部门和支公司营销部,做好应急准备。然后再联系维护人员,及时处理故障。(4)当人为或病毒破坏的故障发生时,具体按以下顺序进行:判断破坏的来源及性质,断开影响安全与稳定的信息网络设备,断开与破坏来源的物理网络连接,跟踪并锁定破坏的来源和其他网络用户信息,修复被破坏的信息,恢复系统。(5)发生服务器系统故障后,应立即电话向相关领导汇报情况,及时组织启动备份服务器系统,由备份服务器接管相关业务应用,同时安排人员将故障服务器脱离网络,保存系统状态不变,保护原始数据。在确认安全的情况下,重新启动故障服务系统:若重启系统成功,则检查数据丢失情况,利用备份数据恢复;若重启失败,立即联系省公司相关部门,请求技术支持,做好技术处理。处置结束后,技术人员应将处理过程记录下来,以方便日后对此问题的处理。3、消防和防雷应急预案(1)上班工作时间发生火警,还在机房工作的人员应及时紧急撤离,并立刻拨打119报警。在确保自身安全的情况下,应尽量使用灭火器进行灭火,减少电子设备的损坏。同时采取关闭电源总闸等措施,尽量减少可能造成的损失和破坏。(2)非工作时间或节假日休息时间值班人员发现火情后,要立刻拨打119报警,并立刻通知相关部门和领导,做好火灾的处置工作。(3)火情结束之后,机房相关人员应全体赶赴现场,并向省公司相关部门汇报。同时立即联系电信、联通、移动等相关网络公司和设备相关厂家,及时评估事故损失情况,研讨恢复网络系统正常运行的最佳解决方案。(4)遇雷暴天气或接上级部门雷暴气象预警,应关闭所有服务器,切断电源,暂停内部计算机网络工作。雷暴天气结束后,及时开通服务器,恢复内部计算机网络工作。因雷击造成的损失,应及时进行核实、报损,并将详细情况向部门领导汇报。4、自然灾害和盗抢应急预案(1)发生自然灾害后,首先应该组织人员撤离现场。当确认灾害不会造成人生伤害后,在回到机房检查设备,立刻向上级领导和省公司汇报,并联系相关网络和设备厂家,积极做好灾后恢复工作,确保在最短时间内恢复机房正常运行。(2)发生盗抢事件后,要保护好现场然后报警,并向领导和省公司汇报情况。待现场处理完毕后,要组织相关人员估计损毁情况,并联系相关网络和设备厂家,积极做好恢复工作。