大连高部企划有限公司服务器维护管理规范第1页共6页服务器维护管理规范1.环境要求服务器机房内必须保持整洁,不得放置无关的设备、物品每日检查服务器机房的温度和湿度,一般情况下必须保持恒温、恒湿服务器机房不能放置食品和水,不得在服务器机房内就餐一般情况下,无关人员不得进入服务器机房2.软件环境去掉其它的网络文件与打印服务、QoS、终端服务、终端授权服务、SiteServerILS服务、消息队列服务(MSMQ)、远程存储、证书服务等其他目前暂时用不到的服务。为了保证该服务器的最大优化,除了安装解压缩、杀毒软件等必要的应用软件外,一般不安装其他非必要的软件,包括OFFICE等,平时最好不设置壁纸、屏幕保护等。严禁安装游戏、聊天工具。3.日志检查A.每天每隔2-3小时检查一次每台服务器的“事务日志”,发现有“严重错误”的,必须立即检查并排除故障;B.所有日志在得到“事务已经满”提示的情况下,必须立即进行备份到C:\LOGS下,文件名格式为:01XXXX日期月份年度事务日志备份完毕应立即清空;4.文件、磁盘检查A.每天检查每个服务器的磁盘情况,如果发现磁盘的使用容量超过70%以上时,应及时删除不必要的文件腾出磁盘空间,必要时提报申购新的磁盘B.个人盘、部门盘、院级盘的内容,查看是否有反动、黄色、游戏、聊天等文档,一旦发现,立即通知当事人,并要求解释,如果情节严重时,应去大连高部企划有限公司服务器维护管理规范第2页共6页除该用户的访问权限,保留现场,同时通知学院的权责部门进行下一步处理C.每隔10天做一次磁盘碎片整理5.开关机A.一般情况下,服务器不得随意关机,在以下情况下,可以关机,但尽量安排在晚上:安装必要的服务安装必要的软件正常的维护需要B.服务器在出现严重故障非重起不能解决时,应用:NETSENDDOMIAN/USER“服务器需要重启,请存盘,3分钟后恢复正常”通知网络用户,以便用户保存正在编辑的文件或中断数据库连接C.服务器在得到UPS停电通知时,必须在1个小时内关闭。此项设置必须在APC的监控软件中设置D.服务器出现严重的硬件故障时,应立即通知网络用户并立即关机,同时通知硬件供应商处理E.服务器在开机时必须确认UPS供电是否正常6.杀毒A.每天在晚间22:00让服务器进行杀毒B.设置杀毒软件为自动更新C.在得知有新病毒流行时应立即确认杀毒源库是否为最新,如果不是应立即上网下载,同时应立即上微软网站下载最新的补丁程序D.其他要求同《病毒防范》7.打补丁A.每隔7天上微软网站查看是否有最新的更新通知B.在得知有最新的安全漏洞时,应立即上网查看微软最新安全补丁C.微软一般在8-12个月内会发一次SP(目前为SP2),届时应全数下载,并立即分发各工作站大连高部企划有限公司服务器维护管理规范第3页共6页D.更新的网站为:windowsupdata.Microsoft.com或等网站8.AD管理A.AD的管理的主要工具为ACTIVTEDIRECTORY用户和组管理工具B.一般原则按组织架构(部门)建立OU(组织单元),一个部门一个OU,同时将该部门的“用户”、“计算机”建立该OU下C.所有的组建立在“锦化网络组”内D.对所建立的OU必须应用“组策略”,进行安全控制9.故障管理A.服务器的故障包括:软件故障,硬件故障,网站故障,黑客入侵与攻击,其他不可预料的未知故障等B.故障记录:建立服务器故障日志数据库,对发现的各种故障现象进行详细记录,记录内容包括:故障发生的时间,故障现象,故障位置,故障分析,故障原因,故障记录人员C.对于维护人员不能尽快处理的故障,应尽快以书面或者电话或者其他相关形式尽快通知上级主管领导并发布公告,自己保留相关记录存档,大连高部企划有限公司服务器维护管理规范第4页共6页硬件篇应了那句“夺天下难守天下更难”的话,服务器的维护就好比“守天下”!稍乱分寸即会使整个网络陷入瘫痪,维护服务器又需要对服务器的硬件系统,操作系统、应用软件系统有全面深入的认识,更是一项系统工程,其中,硬件系统的维护是服务器维护中最基础、最重要的部分,也是一项永无休止的工作。拆装篇对服务器硬件系统的维护最简单的就是修改服务器,增加或升级某些部件。为此,本文就从服务器的拆装着手。随着服务器配件价格逐渐降低,只采用其标准配置进行工作就显得有些不太划算,同时服务器自身也为用户提供了广大的升级空间,这样越来越多的用户选择对服务器配置进行升级,以获得更好的运行效率。例如为支持多芯的主板增加CPU、内存硬盘扩容、添加千兆光口网卡、安装SCSI卡提高数据读写速度、安装RAID卡以增强数据容错能力等。另外,有些服务器部件如电源和风扇由于长时间不间断运转,也可能出现老化或故障现象,这也要求我们及时对其进行更换。操作的注意事项正确关闭电源对于一台已经配置好的服务器来说,它的关闭和打开操作很简单,但如果操作方法不当,有可能对设备造成不必要的损坏。因此我们有必要对服务器的开机、关机做一详细介绍。关机操作:1.关闭操作系统。2.关闭主机电源。3.关闭外设电源(磁带库等)。4.关闭其他设备电源和机柜电源。5.关闭总电源。开机操作:1.打开总电源。大连高部企划有限公司服务器维护管理规范第5页共6页2.打开计算机机柜电源。3.打开外部设备电源(如磁盘阵列,磁带库等)。4.待外部设备自检完成后,最后打开主机电源。全面预防静电虽然计算机是靠电力工作的,但静电却会给计算机带来致命伤害,尤其是可能对主板芯片造成永久性损坏。静电产生的原因很多:各种电源设备可能产生静电,计算机CRT显示器可能产生静电,工作中的手机、对讲机也会在周围空间产生大量的静电,这就要求我们要特别小心静电的干扰,全面预防。1.尽量使服务器及其周边设备的接地良好。2.如果设备没有接地,当我们要接触里面的板卡时,应先用接地导线或其他放电设施对其进行放电。3.对设备进行操作时,应配戴防静电手套,如果没有的话,也可以用手触摸一下机箱外部的金属来放掉自身携带的静电。保证机箱内布局合理一般来说,服务器机箱内部的部件布局以及空间设计都经过科学排列,相互之间结合紧凑却不杂乱,相信购买过专业服务器的用户都应该有体会。我们在添加和卸载服务器设备的时候,一定要维持这种布局效果。注意:在机箱内部还应有相当一部分预留空间,构成合理的“风道”,这是因为CPU已经不仅仅是惟一的热源,高转速硬盘、光驱、各种芯片及板卡都在这个狭小空间里产生着热量,所以在风扇转动时,机箱内空气必须能够充分流动。操作重点小心,再小心对于服务器这种集成度和精密度都非常高的计算机设备,我们在进行安装和卸载部件操作时,一定要格外小心。1.CPU的底部(称为“桥”)是由密集的集成电路组成的核心部分,这些小针容易受到挤压变形,而且这些小针当中如果有一个弯了,CPU就无法正常工作,因此一定要小心。2.主板的CPU插槽和CPU带有小针的那一面是完全吻合的,因此只要插入时方向正确,轻轻一按就可以把CPU插到主板上。千万不要用很大的力气,如果CPU插不进去,那就是大连高部企划有限公司服务器维护管理规范第6页共6页插入的方向有问题。3.安装CPU风扇时如果方向不正确,也无法安装。因此和插入CPU一样,千万不要用太大的力气,用力过度会导致主板和CPU之间压力过大而造成损害。4.在进行电缆连接(插拔)时,通过该电缆连接(或将要连接)的设备应当是没有加电的,即应当先将设备的电源关掉,然后再进行电缆连接(插拔)操作。否则,如果带电进行电缆连接,有可能会对设备造成无法预料的损坏。5.在增加服务器板卡(如内存或PCI设备)时,插入槽位时一定要注意选准角度,力量均匀,以免损坏板卡或插槽。6.对于主板的操作更要小心,对其安装一定要稳固,同时防止主板变形,以免对主板上的电子线路造成损伤。胆大心细遇事不慌为服务器增加卸载设备时,还要沉着冷静。动手前应认真检查准备所需要的工具和设备部件,对具体的操作过程及注意事项一定要做到心中有数并能切实执行,应该不会出现大的问题。当然也不要太过紧张,毕竟就是几种板卡部件的插拔而已,“战略上要藐视”,增强自信心,“战术上要重视”,见招拆招,合理应对。1.如果打算组建RAID,最好选用同一品牌、同一型号的硬盘,这样既可以充分利用硬盘空间,又可以相对降低CPU占用率。因为一旦用户使用了不同型号的硬盘,其各自的指标不尽相同,那么CPU等部件在处理数据时就势必会耗费很多效能和时间。而且要注意,不要把两块硬盘以主从方式连接到一条硬盘线上,应该将硬盘都作为Master连接到RAID卡IDE通道上。2.许多用户在安装SCSI设备时都有这种经历,安装上设备之后,操作系统无法识别该设备,这往往是由SCSI设备ID没有设置好造成的。注意:ID(identify)作为SCSI设备在SCSI总线的惟一识别符,绝不能重复,可选范围从0到15,就是说我们可以用在设备上的ID号共有15个。3.拆卸设备时还应特别注意服务器磁盘阵列内的硬盘顺序。很多人认为磁盘阵列内的硬盘顺序不重要,这是不对的。假如您用10个硬盘做阵列,在初始化时,这10个硬盘应该是有顺序地放置在磁盘阵列中,分为第一、第二…到第十个硬盘。如果磁盘阵列有顺序的要求,硬盘取出后一定要按照原来的摆放顺序插回磁盘阵列中,否则数据可能因硬盘顺序与原来的不符,造成无法识别而丢失数据。以上介绍了服务器在添加和卸载设备时需要注意的问题,希望能帮助网管员朋友解决一些观念上和操作中的问题。当然,如果在操作时缺乏经验,笔者建议大家咨询服务器售后服务工程师,而涉及一些高难度的技术问题时,选择专业服务商也许是最好的选择。