机房维护方案一、维护目的保障机房设备正常运行,过对机房环境支撑系统、监控设备、计算机主机设备定期检测、维护和保养,保障机房设备运行稳定,通过保养延长设备生命周期,降低故障率。确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护人员的产品维修和技术支持,并快速解决故障。二、维护内容1、机房监控设备维护管理:供配电监测系统、空调环境检测系统、门禁设备系统、漏水检测、保安监控设备(包含摄像头、硬盘录像机)、监控主机;2、机房空调与配电设备维护管理:空调机组、新风设备;UPS及电池、主配电柜、UPS配电柜;3、机房消防设备维护管理:各种探测器、手动报警按钮和报警控制器,灭火剂的控制装置;4、机房供水水路、电路及照明线路的维护管理:水、电路管线及接口的检查维修。5、机房基础维护管理:机柜线路的整理、标签检查更换、机房除尘清洁、地板、墙面、吊顶、门窗及有关配套的维护管理6、机房主机设备维护管理:计算机服务器(包括PC服务器、存储服务器);网络设备(路由及交换设备等);7、机房运维管理体系建设:完善机房运维规范,优化机房运维体系;三、维护具体需求1、机房监控设备:1)每季度一次设备的除尘、清理,扫净监控设备显露的尘土,对摄像机、防护罩、门禁、监控采集模块等部件要卸下彻底吹风除尘,之后用无水酒精棉将各个擦干净,调整摄像头清晰度,防止由于机器运转、静电等因素将尘土吸入监控设备机体内,确保机器正常运行。同时检查监控机房通风、散热、净尘、供电等设施。室外温度应在-20℃~+60℃,相对湿度应在10%~100%;室内温度应控制在+5℃~+35℃,相对湿度应控制在10%~80%,留给机房监控设备一个良好的运行环境。2)对容易老化的监控设备部件每月一次进行全面检查,一旦发现老化现象应及时更换、维修,如视频头、采集模块等。3)对易吸尘部份每季度定期清理一次,如监视器、漏水检测主机、门禁主机等暴露在空气中,由于屏幕的静电作用,会有许多灰尘被吸附在监视器表面,影响画面的清晰度,要定期擦拭监视器,校对监视器的颜色及亮度。4)对监控系统及设备的运行情况进行监控,分析运行情况,及时发现并排除故障。如:网络设备、服务器系统、监控终端及各种终端外设。桌面系统的运行检查,网络及桌面系统的病毒防御。5)每月定期对监控系统和设备进行优化:合理安排监控中心的监控网络需求,如带宽、IP地址等限制。提供每月一次的监控系统网络性能检测,包括网络的连通性、稳定性及带宽的利用率等;实时检测所有可能影响监控网络设备的外来网络攻击,实时监控各服务器运行状态、流量及入侵监控等。对异常情况,进行核查,并进行相关的处理。根据客户需要进行监控网络的规划、优化;协助处理服务器软硬件故障及进行相关硬件软件的拆装等。6)提供每月一次的定期信息服务:每月第一个工作日,将上月抢修、维修、维护、保养记录表以电子文档的形式报送监控中心负责人。2、机房空调与配电设备2.1机房空调及新风维护2.1.1控制系统的维护对空调系统的维护人员而言,在巡视时第一步就是看空调系统是否在正常运行,因此要做以下的一些工作。1)从空调系统的显示屏上检查空调系统的各项功能及参数是否正常;2)如有报警的情况要检查报警记录,并分析报警原因;3)检查温度、湿度传感器的工作状态是否正常;2.1.2空气循环系统的巡回检查及维护对空气循环系统我们主要是考虑空调系统的过滤器、风机、隔风栅及到计算机设备的风道等因素。因此在日常维护工作中要做好以下的一些工作:1)检查空调过滤器是否干净,如脏了就应及时更换或清洗。2)检查风机的运行状况:主要是检查风机各部件的紧固情况及平衡,检查轴承、皮带、共振等情况;对风机的检查应该特别仔细,因为蒸发器的热交换过程主要是由在风机的作用下使快速流动的气流经过低温的蒸发器盘管来完成的,从而使空调达到制冷的效果,所以风机的是否正常运行是空调系统是否正常运行的最后体现;对风机而言当然最重要的就是电机了,因此在日常维护中首先就应查看其皮带的状况、主从动轮是否在同一面上等;皮带调整的松紧程度要合适,太松容易打滑,太紧对皮带的磨损太快,皮带的松紧跟外部对静压得需求也有比较大的关系,当然这种调整是在空调系统控制的范围之内进行的;现在部分比较先进的空调系统采用了一体化的风机,就解决了皮带调整的问题。3)检查电机是否是正常运转。4)检查计算机及其它需要制冷的设备进风侧的风压是否正常,因为随着计算机设备的搬迁和增加,地板下面的线缆的增加有可能就影响空调系统的风压,从而造成计算机及其它设备跟前的静压不够,这就需要专业设备维护和管理人员对空调系统的风道做出相应的调整或增加空调设备。2.2UPS及电池维护2.2.1测试及记录主机运行参数,2.2.2根据实际情况进行电池核对性容量测试;2.2.3用专用仪器对后备用蓄电池组逐个测量,进行充放电维护及调整充电电流,确保电池正常工作;2.2.4检查风机及风道情况并清洁,主机外观清洁、内部除尘;2.2.5检查记录输出波形、谐波含量、零地电压等,2.2.6清洁系统主设备及电池等,2.2.7查清各参数是否正确或切合实际,能及时发现事故隐患2.2.8UPS各项功能测试,如检查逆变器、整流器等启停、电池管理功能,有条件进行UPS同市电的切换试验。2.2.9检查主机、电池及相关配电引线及端子的接触情况是否可靠,并测量记录压降及温升,有条件地进行相关紧固工作等。2.2.10观察可能出现的元件老化或损坏现象、电容是否有膨胀或漏液迹象、磁性元件是否过热或分层迹象2.2.11并机系统进行单机运行测试,热备份系统负荷切换测试等2.3低压配电柜维护2.3.1低压配电柜带电清洗维护:2.3.2检查电气盘柜的部分触点、接线柱等有氧化锈蚀;2.3.3电气设备外壳用手触摸感觉温度异常高;2.3.4检查有些电气设备的内部有无声音异常;2.3.5清理绝缘子表面沉积了污秽物质等;2.3.6接线柱加固,标签更换,2.3.7测试输入输出频率;电流电压等3.消防设备的维护3.1检查火灾报警控制器的自检、消音、复位功能以及主备电源切换功能;3.2检查报警探测器、手动报警按钮、火灾警报装置外观;3.3气体灭火控制器工作状态;3.4储瓶间环境、气体瓶组或储罐、选择阀、驱动装置等组件外观;3.5应急灯和疏散指示标志工作状态。3.6火灾报警探测器、手动报警按钮、报警控制器、联动控制设备的试验报警功能。3.7气体灭火控制设备的试验模拟自动启动4、供水水路、电路及照明线路的维护4.1镇流器、灯管更换;灯盘校正,开关更换,4.2线头氧化处理,标签巡查更换,漏保实验4.3检查机房进出水管接头是否有液漏现象4.4水管阀门检查、加固及更换5、机房基础维护5.1吊顶表面清洁;板材松动、翘起修复,变形、损坏更换;龙骨调平等5.2墙面污迹清理,裂缝修补5.3玻璃清洗,不锈钢清洗,玻璃胶修整,地弹簧校正,拉手螺丝加固5.4静电地板清洗清洁,地面除尘;缝隙调整;平整度调整;损坏更换5.5接地电阻测试;主接地点除锈、土壤降阻、接头紧固;防雷器检测;接地线触点防氧化加固。5.6线路测试;模块、光纤配线检查;标签检查;整理凌乱线缆;对甲方所发生的故障及时排除;编写更新文档、表格和对应表来显示其物理链路5.7机柜除尘、清洁;机柜及网络设备整理,包括交换机、配线架和网线的重新整理、排序,并重新标上统一的编号6、机房主机设备维护6.1提供计算机专业知识咨询、操作;6.2网络进行全面维护、升级硬件设备建立计算机信息卡,并以标签的形式粘贴在计算机主机上。信息卡内容包括:机器名、机器编号、使用人、机器配置、IP地址、备注等。6.3安装杀毒软件、病毒防火墙,定期为计算机查杀毒和病毒库升级服务6.4服务器维护及安全:①关闭无用的端口:网络连接都是通过开放的应用端口来实现的。尽可能少地开放端口,就会大大减少了攻击者成功的机会。关闭掉不会用到的服务。telnet使用更为安全的ssh来代替。下载端口扫描程序扫描系统,如果发现有未知的开放端口,马上找到正使用它的进程,从而判断是否关闭。Windows主机可采用定义安全策略的方法关闭隐患端口;也可采用筛选tcp端口添加允许的端口,其余端口就被自动排除。②删除不用的软件包将不需要的服务一律去掉,如果服务器运行了很多的服务。但有许多服务是不需要的,很容易引起安全风险;同时可以腾出空间运行必要的服务,既节省资源又能保证服务器安全。③不设置缺省路由在服务器中,应该严格禁止设置缺省路由,建议为每一个子网或网段设置一个路由,否则其它机器就可能通过一定方式访问该服务器而造成安全隐患。④口令管理服务器登陆口令的长度一般不少于8个字符,口令的组成应以无规则的大小写字母、数字和符号相结合,严格避免用英语单词或词组等设置口令,定期更换。Windows主机可以通过组策略中的密码策略强制使用强密码并要求定期修改,还需要为administrator账号改名。⑤分区管理潜在的攻击首先就会尝试缓冲区溢出。以缓冲区溢出为类型的安全漏洞是最为常见的一种形式。更为严重的是,缓冲区溢出漏洞占了远程网络攻击的绝大多数,这种攻击可以轻易使得一个匿名的Internet用户有机会获得一台主机的部分或全部的控制权。Windows主机分区格式采用ntfs文件格式,对不同的文件夹设置不同的权限。为防止缓冲区溢出类型的网络攻击,安装相应的溢出漏洞补丁;日志文件放在非系统分区上。⑥防范网络嗅探:嗅探器能够造成很大的安全危害,主要是因为它们不容易被发现。可使用安全的拓扑结构、会话加密、使用静态的ARP地址来防范。⑦完整的日志管理日志文件记录着系统运行情况,攻击者往往在攻击时修改日志文件,来隐藏踪迹;因此需要对日志文件及目录设置严格的访问权限,禁止其他用户的读取和写入权限。Windows主机开启审核策略,对账户管理、登录事件、对象访问、策略更改、特权使用、系统事件、目录服务访问、账户登录事件的成功失败进行审核,产生日志文件,同时只有系统管理员对日志文件有访问权限。⑧使用安全工具软件:Windows主机可部署防病毒软件,安装微软基线安全分析器MBSA扫描服务器操作系统漏洞,及时下载serverpack和漏洞补丁。部署主机IDS(入侵检测系统);如免费的轻量级网络入侵检测系统snort,6.5网络设备安全①交换机的安全启用VLAN技术:在交换机的端口上定义VLAN,所有连接到这个特定端口的终端都是虚拟网络的一部分,并且整个网络可以支持多个VLAN。VLAN通过建立网络防火墙使不必要的数据流量减至最少,隔离各个VLAN间的传输和可能出现的问题,使网络吞吐量大大增加,减少了网络延迟。在虚拟网络环境中,可以通过划分不同的虚拟网络来控制处于同一物理网段中的用户之间的通信。这样一来有效的实现了数据的保密工作,而且配置起来并不麻烦,管理员可以逻辑上重新配置网络,迅速、简单、有效地平衡负载流量,增加、删除和修改用户,而不必从物理上调整网络配置。②路由器的安全:a堵住安全漏洞限制系统物理访问是确保路由器安全的最有效方法,将控制台和终端会话配置成在较短闲置时间后自动退出系统。避免将调制解调器连接至路由器的辅助端口也很重要。一旦限制了路由器的物理访问,则一定要确保路由器的安全补丁是最新的。b避免身份危机入侵者常常利用弱口令或默认口令进行攻击。加长口令、选用30到60天的口令有效期等措施有助于防止这类漏洞。另外,一旦重要的IT员工辞职,用户应该立即更换口令。用户应该启用路由器上的口令加密功能。四、维护服务质量1、提供专用电话技术咨询,如果电话技术支持不能解决问题,服务提供商将派出技术人员到现场协助解决,根据系统故障的程度提供不同的响应时间和故障排除时间:故障程度响应时间故障排除时间(工作小时)一般故障≤≤严重故障≤≤系统紧急故障立即≤2、对本项目涉及的设备进行1年4次(即每季度一次)的定期检测、保养、可预防性的对设备进行检测,并且出具检修报告及时向用户方汇报设备运行状态,报告由用户方确认,双方存底备查。任何故障的维修响应时间为全天24小时。3、在用户因其它项目建设,提出协助请求时(如长时间停