二00四年八月系统运行进展报告苏捷系统运行LHCfarm上的用户利用交互运行作业的情况比较多。YBJfarm每天有大量的批处理作业在运行。BSRFfarm系统最忙,经常一台机器同时运行3-4个并行处理作业,还有很多交互作业在运行。HP系统运行情况良好。羊八井课题不断产生的数据磁带需要读入到数据盘里做分析用。杜国红承接的这项工作已经很长时间了。这将是今后一项长期的任务。系统管理员认真监控各系统的运行状况及系统资源使用的情况,每天查看系统日志文件,发现隐患及早解决。小灵通值班电话的开通为用户咨询提供了很大的便利。它能够及时解决用户提出问题。系统维护加速器中心的hpsr2工作站是95年购入,一直在加速器中心运行,2000年转入计算中心前,因故障已经停用,经我们维修后用到最近再次发生故障,系统频繁崩溃,经检修发现是内存故障,我们准备报废这台设备,但加速器中心的同志要我们尽量修复这套系统,因为他们正在利用于这台计算机完成加速器的改造设计任务。我将其它报废机器的部件更换到这台设备上,使它恢复了工作。与老于、张红梅一起为樊若蕻修复被烧坏主板和显卡的pc机。为李正使用的PC机更换电源。Hpsr2上的mad软件使用时出现乱码,与加速器中心秦庆联系,找来软件修复了问题。为BSRFfram挂接的raid盘组更换故障盘一块。为石京燕更换PC机的故障盘一块。与赵巧灵一起帮助理论室的同志,解决了在linux系统下usb接口的激光打印机看不到问题及文件传输问题。存在问题LHC,YBJfarm是2002年购买的,目前很难买到同种型号的CPU(amd),新型号的CPU芯片在目前的系统上是否支持?所接的raid盘组上面的wd80G(5400转速)磁盘已经停产,换其它型号的磁盘可否会影响性能?随着farm环境的不断扩充,经常发生一些意想不到的问题,系统管理员之间的信息沟通有助于提高管理水平,加强系统稳定可靠的运行。这一方面我们还有所欠缺。谢谢