软件系统运维手册Documentserialnumber【KKGB-LBS98YT-BS8CB-BSUT-BST108】系统运维手册1、目的楚天行消费卡管理系统运营支撑系统使用的服务器中,服务器均采用windowsxp操作系统,数据库版本为:sqlserver2000,随着业务的开展,sqlserver数据库中存储的数据量也不断增大,这样操作系统和数据库的日常维护就显得十分重要。本手册详细描述了程序模块,windowsxp操作系统,负载平衡及sqlserver数据库等日常检查的主要步骤,指导现场工程师对其进行监控和维护。2、适用范围使用者为网e通宽带网络运营支撑系统维护工程师3、服务器及数据库概述3.1服务器概述服务器数量:4台,基本信息如下:服务器机器型号操作系统安装的模主机名Ip地址块3.2数据库概述数据库软件分别安装在主服务器上。4、系统服务程序的详细说明4.1系统服务程序的构成DHCP主程序:所在服务器主服务器(ip:)程序名称Dhcpd所在目录/opt/dpcpDHCP从程序:所在服务器从服务器(ip:程序名称Dhcpd所在目录/opt/dpcp4.2系统服务程序的启动、关闭及维护管理4.2.1dhcp主服务4.2.1.1dhcp主服务说明所在目录程序名称程序简要说明/opt/dpcpDhcpdDhcp主程序/etc/dhcpd.conf主程序的配置文件/var/state/dhcp/dhcpd.leases租约数据库4.2.1.2dhcp启动、关闭及进程查看方法1、启动方法:输入:cd/opt/dpcp./dhcpd即可注意:请首先确认数据库服务正常,数据库监听正常。输出:[root@localhostdhcp]$./dhcpdInternetSystemsConsortiumDHCPServerV3.0.4Copyright2004-2006InternetSystemsConsortium.Allrightsreserved.Forinfo,pleasevisitWrote1leasestoleasesfile.ListeningonLPF/eth0/00:0cSendingonLPF/eth0/00:0cSendingonSocket/fallback/fallback-net说明:dhcp启动时,会启动1个进程,正常情况下,dhcp启动的进程数为1个。2、关闭方法输入:killpid说明:pid为进程号,可使用进程查看获得。如|-dhcpd(4665),则进程id为4665,则kill4665就可关闭dhcp。3、进程查看输入:[root@localhostdhcp]#pstree-p|grepdhcp输出:|-dhcpd(4665)4.2.1.3配置说明4.2.2dhcp从服务4.2.2.1dhcp从服务说明4.2.2.2dhcp启动、关闭及进程查看方法4.2.2.3配置说明4.2.3web管理模块4.2.3.1web管理模块中主要目录说明/opt/apache-为apache模块所在目录/opt/taiyuan为web程序存储目录4.2.5.2web管理模块中各程序说明命令所在目录:/opt/apache/bin命令命令说明apachectlApacheHTTP服务器控制接口httpdApache超文本传输协议服务器abApacheHTTP服务器性能测试工具apxsAPache功能扩展工具dbmmanage建立和更新DBM形式的基本认证文件htdigest建立和更新摘要认证文件htpasswd建立和更新基本认证文件logresolve将Apache日志文件中的IP地址解析为主机名rotatelogs滚动Apache日志而无须终止服务器4.2.5.3web站点启动、关闭及进程查看方法命令所在目录命令命令说明/opt/apache/bin./apachectlstart启动httpd/opt/apache/bin./apachectlstartssl启动httpd并加载SSL服务/opt/apache/bin./apachectlstop关闭apache/opt/apache/bin./apachectlstatus查看apache的状态4.2.5.4web日志说明Log存放目录为:/opt/apache/logs/opt/apache/logs/access_log为所有访问网站的日志/opt/apache/logs/error_log为错误信息日志/opt/apache/logs/httpd.pid为主进程的pid号/opt/apache/logs/ssl_engine_log为ssl引擎日志,即ssl的运行日志,可以通过查看此日志了解运行状态及错误。/opt/apache/logs/ssl_request_log为ssl请求日志即是哪个ip使用httpsssi协议登录web站点,请求的时间,内容,访问的页面等。4.2.5.5日常维护维护分为:业务维护及系统维护业务维护就是,利用系统管理员的身份,查看操作日志系统维护是:定期查看系统日志,apache日志等,看是否有运行错误,并定期备份日志。5、服务器硬件维护(略)6、windows2003系统的日常维护6.1定期检查磁盘空间这是最简单、最直接的方法。一般来说,你可以使用windows系统自身提供的磁盘碎片整理和磁盘扫描程序来对磁盘文件进行优化。这两个工具都非常简单。如果你是一位对windows系统有一定了解的用户,建议你使用nortonutilities3.05提供的nortondiskdoctor和nortonspeeddisk,这都是由symantec于1998年最新推出的磁盘维护工具,其显着特点是运行速度快,功能强大。而值得称道的是,nortonspeeddisk的磁盘碎片整理速度比windows内建的同类工具要快出十几倍,而且程序提供了非常多的优化控制,是一个非常值得使用的工具。这两个工具的使用方法都非常简单,你只需要选择好需要进行磁盘扫描或优化的驱动器,并执行相应程序界面中的命令即可开始操作。此外,除了进行磁盘文件排列的优化和错误扫描。我们还可以使用windows自身提供的磁盘清理工具或nortonutilities提供的spacewizard对磁盘中的各种无用文件扫描。它们都可以非常安全地删除系统各路径下存放的临时文件、无用文件、备份文件等等,完全释放磁盘空间。6.2维护系统注册表我们知道,windows的注册表是控制系统启动、运行的最底层设置,其文件为windows安装路径下的system.dat和user.dat。这两个文件并不是以明码方式显示系统设置的,普通用户根本无从修改。而我们知道,如果你经常地安装/卸载应用程序,这些应用程序在系统注册表中添加的设置通常并不能够彻底删除,时间长了会导致注册表变得非常大,系统的运行速度就会受到影响。目前市面上流行的专门针对windows注册表的自动除错、压缩、优化工具也非常多,可以说nortonutilities提供的windowsdoctor是最好的,它不但提供了强大的系统注册表错误设置的自动检测功能,而且提供了自动修复功能。使用该工具,即使你对系统注册表一无所知,也可以非常方便进行操作,因为你只需使用鼠标单击程序界面中的next按钮,就可完成系统错误修复。6.3定期备份系统注册表对系统注册表进行备份是保证windows系统可以稳定运行、维护系统、恢复系统的最简单、最有效的方法。我们知道,系统的注册表信息保存在windows文件夹下的,其文件名是system.dat和user.dat。这两文件具有隐含和系统属性,现在你需要做的就是对这两个文件进行备份,你可以使用regedit的导出功能直接将这两个文件复制到备份文件路径下,当系统出错时再将备份文件导人到windows路径下,覆盖源文件即可恢复系统。此外,如果你使用的是windows98,可以使用它提供的scanreg.exe进行系统备份与恢复,这样更简单一些。你在dos提示符下直接键入scanreg/backup即可对当前的系统注册表快速备份。当需要恢复注册表时,可在dos提示符下键人scanreg/restore即可。对于这个工具,应该在dos环境下使用。6.4清理system路径下的无用的dll文件这项维护工作大家可能并不熟悉,但它也是影响系统能否快速运行的一个至关重要的因素。我们知道,应用程序安装到windows中后,通常会在windows的安装路径下的system文件夹中复制一些dll文件。而当你将相应的应用程序的删除后,其中的某些dll文件通常会保留下来;当该路径下的dll文件不断增加时,将在很大程度上影响系统整体的运行速度。而对于普通用户来讲,进行dll文件的手工删除是非常困难的。针对这种情况,建议使用clean驱动器,然后单击界面中的startscanning按钮就可以了,程序会自动分析相应磁盘中的文件与system路径下的dll文件的关联,然后给出与所有文件都没有关联的dll文件列表,此时你可单击界面中的ok按钮进行删除和自动备份。曾使用它安全删除了7m之多的dll文件,没有引起系统中的应用程序错,效果非常好。7、备份策略7.1备份方式为了保证数据库的高安全性,目前我们采用的数据库备份方式为物理备份和逻辑备份相结合的方式,数据库归档模式为自动归档模式。这样当数据库出现故障时,我们就可以利用备份文件与归档方法相结合,作数据库“最新状态”的恢复。7.2备份计划通过SQLserver2000的企业管理器,数据库维护计划来自动备份数据库,或者采用自动备份脚本实现每天进行一次热备份及逻辑备份,每周进行一次冷备份。所备份的数据文件存储于磁阵上的硬盘。7.3常见故障恢复我们首先sqlserver事务日志可以通过这个文件,排除故障故障一:服务器意外关闭造成的损失。数据库服务器如果因为突然断电或者其他一些原因意外当机时,再重新启动服务器后会出现一些数据的损失。这主要是因为数据库中的数据发生更改后,并不会在第一时间就把数据写入到硬盘中。为了提高数据库的运行效率,往往是先把数据写入到数据高速缓存中;同时把更改的情况写入到事务日志中。等到一定的情况数据库系统才会把数据写入到硬盘文件中。此时,如果数据库服务器系统突然发生故障,数据库系统就有可能还没有把缓存中的修改后的数据写入到硬盘中,即数据文件内有未完成事务所做的修改。如果确实有这种情况,则当启动SQLServer实例时,如果没有事务日志或者事务日志损坏时,修改后的数据就无法恢复过来了。但是,如果当事务日志可用的话,则当实例启动时,系统会丢每个数据库执行恢复操作。前滚日至中记录的、可能尚未写入数据文件的每个修改。在事务日志中找到的每个未完成的事务都将回滚,以确保数据库数据的完整性。所以当数据库服务器意外故障时,数据库管理员最好能够确认一下事务日志是否可用。如果事务日志已经损坏,那么就需要先恢复事务日志然后再重新启动数据库实例。否则的话,数据库实例在重新启动时不能够正常恢复数据。这一点在遇到服务器突发行的故障时一定要注意。否则的话,很可能破坏数据库数据的完整性。故障二:解决服务器意外关闭造成的损失。有时候出于数据库高可用性的目的,需要在生产服务器之外的地方再部署一台数据库服务器。当生产服务器出现故障不可用时,则可以马上启用这个备用的服务器。故就需要保证生产服务器与备用服务器之间数据的同步。那么SQLServer数据库是通过什么技术来达到这个生产服务器与备份服务器之间的数据同步的呢?简单的说,就是通过这个事务日志的复制来实现数据同步的。具体的来说,SQLServer数据库提供了两种解决方案,分别为数据镜像与日志传送。这两个方案都是在事务日志复制的基础上来实现的。在日志传送方案中,生产服务器将生产数据库的活动事务日志发送到一个或多个目标服务器。每个辅助服务器将该日志还原为其本地的辅助数据库,从而实现备用服务器与生产服务器之间数据的一致性。使用日志传送,您可以自动将“主服务器”实例上“主数据库”内