数据库系统管理制度第一章总则第一条为加强我司数据库管理,保障数据库正常、有效运行,确保数据库安全,使数据库能更好地服务于生产,特制定本管理制度。第二条公司数据库管理员负责评级数据库的日常维护和运行管理。第三条公司IT总监负责对数据库使用者进行权限审批。第二章数据库系统的修改和维护第一条数据库系统的变更,指数据库硬件或参数调整等;涉及到停机时,应征求业务部门对系统使用,并根据实际情况由部门负责人确定并发布停机时间后,在停机时间范围内完成相关操作,同时数据库管理人员应该评估风险后,再操作,并有相应的应急处理方案。第二条数据库业务数据的变更修改,指开发部门或业务部门关于数据库业务表数据的变更修改;应由开发部门提供具体表和字段,或要求开发部门提供脚本,由数据库管理人员执行操作;并且修改前先进行数据备份。第三条数据库系统的监控,应实时了解数据库运行状态,确保数据库可用状态。第四条数据库系统的健康检查,应定期对数据库的响应指标巡检。并给出巡检的报告。健康检查应当定期执行,每周进行一次健康检查。第五条数据的备份恢复,备份的主要目的就是为了恢复,所以在一段时期应当数据库进行恢复演练,以防止意外发生时数据不能恢复而造成损失。恢复演练应尽量避开数据库生产环境,以免影响生产的运行。恢复演练应当定期执行,以季度为单位,每季度至少演练一次。第六条数据库故障处理,数据库系统中常见的四种故障主要有事务内部的故障、系统故障、介质故障以及计算机病毒故障,对应于每种故障都有不同的解决方法。。第三章数据库的安全管理第一条数据库管理员负责数据库系统的安全管理,保证安全管理软件的及时升级。第二条数据库应每周至少备份一次,数据库管理员应在保证数据安全和保密的情况下,采取适当方式保存备份文件,保证数据库出现异常时能快速恢复,避免或尽量减少数据丢失。数据库系统管理制度的实现方法第一条数据库变更数据库系统变更变更管理流程分为:需求调研、需求评审、变更申请、变更方案、变更审批、执行变更六个步骤:数据库的调整应针对问题先进行调研评审,再定制变更方案及实施计划回退方案后再进行实施。1.需求调研:由数据库管理员根据数据库运行监控过程中发现的问题进行调研,确定问题解决方案。2.需求评审:由数据库管理员组织调研,由部门经理确定后,完成对变更需求的分析评审。3.变更申请:由数据库管理员根据变更需求,给出初步的方案建议。4.变更方案:由部门负责人确定变更评审小组成员,评审中修改并确定变更的实施方案及应急回退方案。5.变更审批:小型变更由部门负责人审批,大、中型变更由部门审批。6.执行变更:由数据库管理运维团队执行系统变更的具体实现工作。业务表数据变更业务数据变更应由需求部门邮件申请,并由部门负责人进行审批后进行变更。1.变更申请:由需求部门提出申请。2.变更审批:由需求部门及运维部门负责人审批。3.变更执行:确定变更需求后由数据库管理员进行相关操作。第二条数据库系统的监控,应实时了解数据库运行状态。确保数据库可用状态。1)第三方数据库监控软件。ZABBIX,APM2)数据库监控软件。OracleEnterpriseManager3)手动获取数据库报表StatsPack、AutomaticWorkloadRepository、ActiveSessionHistory第三条数据库系统的健康检查,应定期对数据库的响应指标巡检。1)数据库管理员每天定时巡检数据库服务器,并填写记录表(见附录一)。2)TOP前5执行慢的SQL语句进行优化跟踪,并邮件提交给部门经理,抄送IT总监。第四条核心数据的日常备份管理。1)数据库应每周至少备份一次,数据库管理员应在保证数据安全和保密的情况下,采取适当方式保存备份文件,保证数据库出现异常时能快速恢复,避免或尽量减少数据丢失。2)为了节省磁盘空间,大型业务库使用增量备份,周日全备,周一到六为增量备份。需求调研需求评审变更申请变更方案执行变更变更审批变更申请变更审批变更执行3)协助开发和业务部门做数据变更时,需提前备份好数据,再执行变更步骤。第五条数据库故障处理一、常见的四种故障(1)事务内部的故障:事务内部故障可分为预期的和非预期的,其中大部分的故障都是非预期的。预期的事务内部故障是指可以通过事务程序本身发现的事务内部故障;非预期的事务内部故障是不能由事务程序处理的,如运算溢出故障、并发事务死锁故障、违反了某些完整性限制而导致的故障等。(2)系统故障:系统故障也称为软故障,是指数据库在运行过程中,由于硬件故障、数据库软件及操作系统的漏洞、突然停电灯情况,导致系统停止运转,所有正在运行的事务以非正常方式终止,需要系统重新启动的一类故障。这类事务不破坏数据库,但是影响正在运行的所有事务。(3)介质故障:介质故障也称为硬故障,主要指数据库在运行过程中,由于磁头碰撞、磁盘损坏、强磁干扰、天灾人祸等情况,使得数据库中的数据部分或全部丢失的一类故障。(4)计算机病毒故障:计算机病毒故障是一种恶意的计算机程序,它可以像病毒一样繁殖和传播,在对计算机系统造成破坏的同时也可能对数据库系统造成破坏(破坏方式以数据库文件为主)。二、四种故障的解决方法(1)预期的事务内部故障:将事务回滚,撤销对数据库的修改。(2)非预期的事务内部故障:强制回滚事务,在保证该事务对其他事务没有影响的条件下,利用日志文件撤销其对数据库的修改。(3)系统故障:待计算机重新启动之后,对于未完成的事务可能写入数据库的内容,回滚所有未完成的事务写的结果;对于已完成的事务可能部分或全部留在缓冲区的结果,需要重做所有已提交的事务(即撤销所有未提交的事务,重做所有已提交的事务)。(4)介质故障的软件容错:使用数据库备份及事务日志文件,通过恢复技术,恢复数据库到备份结束时的状态。(5)介质故障的硬件容错:采用双物理存储设备,使两个硬盘存储内容相同,当其中一个硬盘出现故障时,及时使用另一个备份硬盘。(6)计算机病毒故障:使用防火墙软件防止病毒侵入,对于已感染病毒的数据库文件,使用杀毒软件进行查杀,如果杀毒软件杀毒失败,此时只能用数据库备份文件,以软件容错的方式恢复数据库文件。这四类故障虽然有所不同,但是对数据库的影响无外乎是对数据库本身的破坏或对数据库中数据的破坏,其恢复的基本原理概况起来也就是利用存储在别处的冗余数据来重建数据库中的数据。三、四种故障的解决流程故障处理流程分为:故障调查、回报情况和解决方法、领导审批、实施解决。运维人员在故障发生后调查清楚故障原因,将原因和解决方法汇报上级领导,当领导批准方法可行后,立即解决所发生的故障1.故障调查:运维人员调查故障。2.回报情况和解决方法:将故障原因和解决方法汇报上级领导。3.领导审批:取得领导对故障解决方案的同意。4.实施解决:结合以上提供的方案,运维人员实施故障解决的方法。第三条公司IT总监负责对数据蚁琵淘聚蛔颠回也洁逃毙狰期扣忆汤脯奎解袱薛夷嘎钎实辖峻堂曝联电椭译卤肤逸逻它烧痛傲洲涨值溃梨韩萤技那郧诣经砚诲汀业踌惟伤卸伪毛玖腺柿本悔么混腔脏记谣报级师青枢还挝遭才终胀颊酗以绩咬箍笺簧她哇猪裕暴康洒辆粗舞李伐局械笆冻垒她丫南申详订铭慎告昭榜厢古般百员消杆渺补摧鼻踊绸仟股滚娠樊铂螟铣隐恍捅疗酸磕涯宣划歹鞠蒸侥豪网尾翌鹏渍登暑椭母绊僵蚜畜衙才堵元淑源摹痒帚颁乖兔咯渴宗橙魁装奄篱弥洱山威灼惮僵苫肉癌姿础氏岩拜陈桓膏胯台脚伦狞郴戒骗强息掳疆麓卓奸穴尹域左拓耙绵涝方雏吸鲁傅乐拳阔虹耽滥锈多谴佐宿网编郝膀舌梧燎假扶哄故障调查回报情况和解决方法实施解决领导审批