xxx股份有限公司1/8计算机机房管理制度2010年11月起执行第一章:总则第一条:为确保公司计算机机房的正常、安全、有效运行,制定本制度。第二条:该制度适用于xxx有限公司及其控股子公司的公司内部计算机机房。第三条:计算机机房的定义:计算机机房指用于存放并确保计算机系统及周边设施正常运行并提供电力保障和温度、湿度保障的房间。第四条:计算机机房涵盖内容:机房以其内部设施功能分为以下三类:机房环境:包括电力供应、温度、湿度、地板、照明等外界条件。机房设备:包括UPS、空调、计算机、网络设备、电话交换机等。应用系统:依靠计算机设备运行,提供相应功能的系统、软件等。第五条:机房管理的岗位职责分工:机房工作人员:包括机房负责人、设备管理员、运维工程师。机房负责人:机房直接负责人,主要职责包括:负责机房的整体管理工作管理机房环境、机房设备及应用系统,保证其正常运行和财产安全管理机房工作人员日常工作,每周上报工作内容制定与机房管理相关的制度和规定撰写《机房事故报告》设备管理员:负责机房设备的管理,主要职责包括:遵守机房管理制度负责机房内提供机房环境的设备及计算机设备的运行及硬件维护负责设备及配件进出机房的管理协助公司进行固定资产盘点xxx股份有限公司2/8管理与设备相关的文档、资料填写《机房日志》系统运维工程师:负责机房应用系统运行和维护,主要职责包括:遵守机房管理制度负责机房应用系统的运行和维护负责应用系统的数据、文件备份管理与系统维护相关的文档、资料填写《机房日志》第六条:相关单据《机房事故报告》《机房日志》第二章:人员出入管理第一条:人员出入是指机房工作人员或非机房工作人员出入公司机房的行为。第二条:出入机房需要具备的条件:遵守机房管理制度具备明确的工作任务机房工作人员或依照审批流程获得批准的非机房工作人员没有携带任何易燃、易爆、腐蚀性、强电磁、辐射性、流体物质等对设备正常运行构成威胁的物品第三条:非机房工作人员出入机房的申请人,审核人和批准人出入机房申请由公司员工申请并经部门经理审核后由机房负责人审核批准。第四条:非机房工作人员进入机房的申请申请人向部门经理提交机房出入申请,注明进入时间,申请人,所办事宜,进入机房人数等信息。部门经理审核通过后,提交机房负责人二次审批,通过后方能进入机房。申请中涉及施工的,需要申请人同时提供施工方案由机房负责人审批。施工方案中还应提供风险评估及应急处理方案。xxx股份有限公司3/8由机房负责人审批通过后,在正式施工前,施工人员必须经过安全培训,施工时须有机房工作人员陪同。第三章:机房安全第一条:机房安全包括机房环境安全、机房设备安全和应用系统安全。第二条:机房工作人员在机房安全中的工作要求:遵守与公司签署的《发明转让及保密协议》,不得泄漏公司各种资料和数据重要资料、文档、数据应采取对应的技术手段进行加密、存储和备份。对于加密的数据应保证其可还原性,防止遗失重要数据。严禁在机房内吸烟、喝水、吃食物或进行剧烈活动严禁将机房钥匙临时或长期借给他人使用第三条:机房环境、设备安全设备管理员负责机房环境和设备安全,工作要求如下:每月检查机房消防器材、监控设备,确保其有效性,上报结果至机房负责人每天检查机房电源及所有空气开关状态,填写《机房日志》每天检查机房门窗,保证下班时间门窗上锁每周对机房环境进行清洁,保持机房整洁第四条:应用系统安全系统运维工程师负责应用系统安全,工作要求如下:不定期但最长不超过一个月必须更改系统密码每天检查系统安全日志,填写《机房日志》实时查看MRTG图,检查网络流量实时查看网管平台,检查应用系统运行状况第五条:相关单据《机房日志》xxx股份有限公司4/8第四章:机房环境管理第一条:机房环境管理指维护机房内提供电力保障和温度湿度保障的设备,为机房内的计算机、网络设备等提供稳定可靠的运行保障条件。第二条:机房环境管理责任人:设备管理员负责机房环境管理的主要工作。第三条:保障机房环境所需的设施电源、UPS和空调是保障机房环境正常的最基本设施。第四条:电源、UPS管理电源和UPS作为保障机房正常运行最为重要的设施,对于其任何操作必须有设备管理员和机房负责人同时在场。机房内的电源开关、电源插座要明确标出所控制的设备。收到物业市电故障通知时,及时评估对机房运行带来的影响,并上报应对方案。市电故障期间安排人员值班。设备管理员必须熟悉UPS工作原理,依照操作规程操作UPS。每天检查UPS的WebPower日志,填写《机房日志》。每周五进行UPS报警系统检测,保障报警系统的有效与可靠。涉及电路的施工必须安排在非正常工作时间。第五条:空调管理空调作为保障机房正常运行的重要设施,需要由设备管理员专门负责维护。每天检查机房温度和湿度,填写《机房日志》每天检查机房空调运行情况,填写《机房日志》每周五进行机房温度报警系统检测,保障报警系统的有效与可靠。每月进行一次空调室外机清洗工作(2月份~5月份每月清洗两次)第六条:机房温度湿度要求:机房温湿度:22±4摄氏度;相对湿度:55%±15%。温度变化率:10℃/小时,不结露。温度、湿度的测量点应避开空调送、回风口处。如设备要求高于以上标准,应以设备要求为准。xxx股份有限公司5/8第七条:相关单据《机房日志》第五章:机房设备管理第一条:机房设备管理指设备自进入至该设备出机房为止,期间产生的保管、操作、维修及改良等行为。第二条:机房设备管理责任人:设备管理员负责机房设备管理的主要工作。第三条:机房设备保管机房设备保管指设备管理员保藏和管理机房设备的行为。设备需要出入机房时,设备管理员负责填写《设备进机房单》或《设备出机房单》,系统运维工程师协助完成部分表格后,交由机房负责人审核批准,才可将设备搬出或搬入机房。相关书面资料由设备管理员负责存档。设备管理员负责贴机房设备标签,标签内容包括:名称、IP地址、KVM、使用部门、用途等内容。未经机房负责人许可,任何人不得私自挪动机房设备位置,不得更改任何设备连线,包括电源线、网线、KVM数据线等。第四条:机房设备操作机房设备操作指设备管理员按照一定的程序和技术要求使用设备的行为。设备管理员要严格按照设备说明书要求进行设备的操作对于优先级为一级的计算机设备和保障机房环境的电源、UPS、空调等设备操作必须获得机房负责人许可。操作时,机房负责人同时在场。第五条:机房设备维修与改良机房设备维修指机房设备因无法正常使用需要修理或部件损坏需要更新部件的行为。机房设备改良是指为了提高机房设备的性能而增加功能或配件的行为。机房设备维修:xxx股份有限公司6/8设备管理员发现机房设备无法正常使用或部件损坏时,应将故障报告及维修方案上报机房负责人。由机房负责人核实后,交由综合管理部办理维修事宜并申请付款。机房设备改良:因业务发展,需要增加机房设备的功能或配件时,由设备管理员向机房负责人提交《计算机配件申请表》,依照《计算机配件管理制度》中相关制度执行。第六条:相关单据《设备进机房单》《设备出机房单》《计算机配件申请表》《计算机配件管理制度》第六章:应用系统管理第一条:应用系统管理指应用系统自上线至下线过程中,进行软件安装与卸载、修改配置、备份数据等运行与维护的行为。第二条:应用系统分类依照应用系统软件来源分为两类,来自外公司的软件产品和公司自主研发的软件产品。第三条:应用系统管理责任人:系统运维工程师负责应用系统管理的主要工作。第四条:软件安装与卸载软件安装:所有软件在安装前必须经过测试并具有软件测试报告。外公司软件产品由系统运维工程师负责测试,公司自主开发的软件产品由公司测试部门负责测试。系统运维工程师根据软件测试报告,向机房负责人申请,批准后方可进行安装。安装完成后,系统运维工程师负责撰写安装日志并存档。软件卸载:xxx股份有限公司7/8当软件因业务需求改变而要卸载时,先由系统维护工程师向机房负责人提出申请,批准后方可进行卸载。卸载优先级为一级的计算机设备上的软件时,需要有系统维护工程师和机房负责人同时在场。第五条:修改应用系统配置修改应用系统配置指因业务需求改变或网络环境、系统环境改变,需要修改应用系统配置参数以保证应用系统正常运行或提高性能的行为。系统运维工程师向机房负责人提出配置修改申请,申请内容包括修改内容、预期目的、方案和步骤,批准后方可执行。涉及优先级为一级的计算机设备上的应用系统配置修改,通常安排在非业务繁忙期间进行。如果修改会中断正常业务运营的,必须提前向机房负责人申请,由机房负责人向上级和应用系统使用部门汇报,协商后方能执行。系统运维工程师负责填写《日常配置修改日志》,整理存档。第六条:数据备份数据备份的内容包括系统数据备份、软件配置信息备份和业务数据备份。系统数据备份频率为每天备份一次;软件配置信息备份在每次修改配置信息之前进行;业务数据备份频率为每天备份一次。每周对所有备份数据进行一次异地备份,由专人负责保管。第七条:相关单据《日常配置修改日志》第七章:运行事故及其处理第一条:运行事故指因人为、误操作、市电异常或气温异常等外在因素造成机房内部设备或应用系统出现运行异常或停止运行,对业务运营系统、办公系统等造成直接影响,并产生相应经济损失的事件。第二条:运行事故责任人:机房负责人承担运行事故的主要责任,相关其他人员承担次要责任。xxx股份有限公司8/8第三条:运行事故等级分类:以下表格中,发生其中任意一种情况,即定义为相应的事故等级。内部设备应用系统一级事故1.市电停止供电超过3个小时2.UPS停止供电超过3个小时3.机房温度持续2小时超过40度4.办公网络全网中断持续超过30分钟5.互联网接入中断持续超过30分钟1.邮件系统中断持续超过30分钟2.电话系统中断持续超过30分钟3.50%以上办公电脑同时发生系统故障并无法工作持续超过30分钟4.机票呼叫系统故障持续超过30分钟5.增值呼叫系统故障持续超过60分钟二级事故1.市电停止供电30分钟~3小时2.UPS停止供电30分钟~3小时3.机房温度超过35度持续1个小时4.办公网络全网中断持续10~30分钟5.互联网接入中断持续10~30分钟1.邮件系统中断持续10~30分钟2.电话系统中断持续10~30分钟3.机票呼叫系统故障持续10~30分钟4.增值呼叫系统故障持续30~60分钟三级事故1.市电停止供电30分钟以内2.UPS停止供电30分钟以内3.机房温度超过35度持续1小时以内4.办公网络全网中断持续10分钟以内5.互联网接入中断持续10分钟以内1.邮件系统中断持续10分钟以内2.电话系统中断持续10分钟以内3.机票呼叫系统故障持续10分钟以内4.增值呼叫系统故障持续30分钟以内第四条:运行事故处理发生二级以上(含二级)事故时,机房负责人应及时通知直属上级、相关应用部门负责人。在事故得以解决,设备或系统恢复正常运行,机房负责人及相关人员查明事故原因之后,由机房负责人撰写《机房事故报告》。报告中应该明确事故各事件点的时间、事故等级、事故造成的影响、事故经过、事故原因、事故责任人及处理办法。《机房事故报告》提交给机房负责人直属上级,同时提交给公司高层领导及相应应用部门,由机房负责人整理备案事故报告。第五条:相关单据《机房事故报告》