中国科学院北京基因组研究所北京华大基因研究中心大型机使用指南和规范V3.0(2005-04-06)第1页共9页中国科学院北京基因组研究所北京华大基因研究中心大型机使用指南和规范V3.0(2006-04-06)一、帐号申请和使用.......................................................................................................................2二、登陆/退出大型机连接.............................................................................................................2三、属主目录使用...........................................................................................................................3四、计算任务投放...........................................................................................................................4五、项目存储空间使用...................................................................................................................5六、公用数据下载及使用服务.......................................................................................................7七、软件安装及使用规范...............................................................................................................8八、关机和启动...............................................................................................................................8九、数据备份...................................................................................................................................9十、关于曙光4000H、SGI3800......................................................................................................9十一、主机组联系方式...................................................................................................................9中国科学院北京基因组研究所北京华大基因研究中心大型机使用指南和规范V3.0(2005-04-06)第2页共9页一、帐号申请和使用1.严禁使用大型机账号及计算、存储资源进行与账号所属项目无关的任何活动和行为,违者必究并将视影响、损失轻重予以锁闭账号和罚款处理。2.《生物信息室大型机资源申请书》下载:=693,填写后,通过邮件发送至HPC@genomics.org.cn,并通过电话联系主机组。主机组联系方式见本指南和规范的“十一、主机组联系方式”。3.建议避免公用账号,避免项目移交的时候数据混乱,对于公共账号,一定要在相应项目目录下建立个人目录。4.项目人员调动时,请调动人员做好数据移交,并到主机组申请权限改动。5.项目结束或阶段性完成时,请项目组长及时通知HPC@genomics.org.cn清理/锁闭/注销prjNNNN组长账号及项目组成员账号。★逾期三个月以上不清理帐号和权限将对使用期间的相关项目负责人予以罚款10元人民币处罚。6.注销账号时请整理好用此账号建立的所有数据,做好移交及备份清理工作,并至少提前一天通知主机组。7.数据和程序文件一律存放于工作目录下(项目组目录),不得存放于自己的属主目录下。★违者将对使用期间的相关项目负责人和当事人予以罚款20元人民币处罚。8.个人账号只限个人使用,严禁将大型机帐号和密码泄露给外单位和项目组外人员,公共组账号由组长负责控制和使用分发。严禁其他项目占用申请项目的账号和存储资源。★违者将对使用期间的相关项目负责人和当事人予以罚款50元人民币处罚。9.密码应定期更换,建议8位以上并注意加强密码复杂度。二、登陆/退出大型机连接1.连接大型机主要有四种方式:A.SSH:缺省提供,该登陆方式具有一定强度的加密安全保证。2、5、6、网段目前支持通过SSH协议(端口22)和X-Win访问1网段的计算机,软件下载:支持SSH的软件:\\192.168.4.2\software\网络工具\远程登录\SecureCRT中国科学院北京基因组研究所北京华大基因研究中心大型机使用指南和规范V3.0(2005-04-06)第3页共9页支持SSH的FTP软件:\\192.168.4.2\software\网络工具\下载上传\SecureFXB.telnet:缺省提供,软件同上。C.X-win图形登陆:缺省提供,软件下载:\\192.168.4.2\software\网络工具\远程登录\X-win32只允许涉及使用大型机上图形交互的软件时使用,无图形需要时,请尽量不用x-win32等图形界面登陆,登陆过程大量占用I/O,且图形界面很消耗客户端资源。★违者将对使用期间的相关项目负责人和当事人予以罚款10元人民币处罚。严禁通过直接关闭终端(软件)的异常退出形式脱离和大型机的连接。★违者将对使用期间的相关项目负责人和当事人予以罚款10元人民币处罚。D.FTP/SFTP登陆:缺省提供,账号密码同大型机帐号密码E.SAMBA登陆:需联系HPC@genomics.org.cn特别申请。2.登陆主机后的必要操作:A.使用mail命令,检查系统发送给用户的通知和信息。B.使用命令renice20–u用户帐号设置较低的优先级(缺省正常优先级为0),防止程序出现以外抢夺过多的系统资源。如:renice20–uabc为用户abc设定自己的优先级为20。C.在属主目录下使用命令du-k|sort–n察看异常或较大的文件并作相应清理。★违者将对使用期间的相关项目负责人和当事人予以罚款10元人民币处罚。3.长时间内(4小时)无操作请结束访问,避免占用系统资源。★违者将对使用期间的相关项目负责人和当事人予以罚款10元人民币处罚。4.结束主机访问必要操作:非停电、断网等意外设备故障导致,严禁在终端上直接关闭访问窗口或直接关闭终端电源实现结束大型机连接。★违者将对使用期间的相关项目负责人和当事人予以罚款10元人民币处罚。A.telnet访问必须主动使用exit命令一到多次确保最终结束连接。B.X-win访问用户必须在关闭所有终端窗口后用logout主动结束连接。三、属主目录使用1.属主目录为登陆后缺省进入的目录:IBM:/public/home/yourid/SUN:/export/home/yourid/中国科学院北京基因组研究所北京华大基因研究中心大型机使用指南和规范V3.0(2005-04-06)第4页共9页SGI:/usr/people/yourid/曙光3000:/public/home/yourid/曙光4000(待):/home/yourid/LINUX集群:/home/yourid/2.属主目录用于系统存放管理用户的登陆和所使用软件配置文件,严禁用户随意存放与具体项目工作相关的程序和数据和非相关的文件,避免占用和耗费宝贵的系统存储资源,影响登陆连接服务。每次登陆后在属主目录下使用命令du-k|sort–n主动检查。异常或较大的文件并作相应清理。★违者将对使用期间的相关项目负责人和当事人予以罚款20元人民币处罚。3.程序异常中断崩溃或强制性退出有时会遗留core文件,如不及时清理也将导致占用和耗费宝贵的系统存储资源,应每次异常中断和登陆时主动检查。★违者将对使用期间的相关项目负责人和当事人予以罚款10元人民币处罚。四、计算任务投放1.不论任务有多紧急,请务必先检测提交程序的正确性以及资源占用的合理适度,通过小批量测试数据预估占用CPU、内存和存贮资源,强烈建议进行代码优化以减少CPU、内存、I/O资源占用,及时释放申请的内存,优化文件目录读写访问等I/O功能,避免资源和计算时间的浪费。2.大量提交计算任务前,请用top(IBM用nmon)命令察看CPU内存、I/O及内存等机器负载情况。CPU、物理内存使用率在90%以上时,严禁继续投放新的计算任务。大规模资源占用(占用大型机实际内存超过1/4)或紧急任务时务必先联系主机组HPC@genomics.org.cn协调。★违者将视损失、影响严重程度将予以使用期间的相关项目负责人和当事人予以罚款10~200元人民币处罚。3.计算任务提交后,应注意定时用命令top(IBM用nmon)查看自己进程状态以及CPU内存、I/O及内存等使用情况。,当需要杀死自己进程时可以用kill命令,默认下kill所带参数为15,如果杀不死可用kill-9processname,必要时联系主机组协助。4.计算任务完成或中断后,应及时检查属主目录和计算任务启动目录内是否生成core文件,及时检查计算结果的完整性和异常数据。★违者将对使用期间的相关项目负责人和当事人予以罚款10元人民币处罚。5.应及时清除临时文件和计算中程序设计生成的监控跟踪记录文件。临时性文件存放不要超过三个月。重要数据应打包或再压缩存放。★违者将对使用期间的相关项目负责人和当事人予以罚款20元人民币处罚。6.具体用户如投放超过8个的计算进程,需联系主机组获得批准。★违者将对使用期间的相关项目负责人和当事人予以罚款20元人民币处罚。中国科学院北京基因组研究所北京华大基因研究中心大型机使用指南和规范V3.0(2005-04-06)第5页共9页7.用户程序中如使用fork等派生调用,需在自己微机的LINUX系统下调试无误后联系主机组特别监控运行过程,运行前,应主动降低优先级(renice20–u账号)。★违者将对使用期间的相关项目负责人和当事人予以罚款20元人民币处罚。8.曙光4000任务投放:严禁在三个存储节点上进行计算,必须将任务派发给PBS系统进行调度。在各个存储节点之间传数据时,单个数据文件不得大于2G。用PBS投任务时,单个任务的执行时间不能超过12小时,否则系统会自动杀死任务。★违者将对使用期间的相关项目负责人和当事人予以罚款20元人民币处罚。9.杭州方面资源利用:北京资源紧张情况下,大规模计算任务可申请开通杭州远程访问,利用杭州计算资源。访问权限及数据传输请与HPC@genomics.org.cn联系。目前数据上传速度可达100KB~250KB/s。五、项目存储空间使用1.存储目录结构规则如下:`-teamXX+-prjYYMM|+-rawdata|+-working||+-memberA|||+-item.YYYY_MM-DD||||+-backup|||`-