AnIntroductiontoDatabaseSystem数据库系统概论AnIntroductiontoDatabaseSystem第六章关系数据理论AnIntroductiontoDatabaseSystem第六章关系数据理论6.1问题的提出6.2规范化6.3数据依赖的公理系统6.4模式的分解6.5小结AnIntroductiontoDatabaseSystem6.1问题的提出问题:针对一个具体的数据库应用系统,如何构造一个适合于它的数据模式,即应该构造几个关系模式,每个关系模式由哪些属性组成?解决方法:数据库逻辑设计的工具──关系数据库的规范化理论AnIntroductiontoDatabaseSystem概念回顾关系:描述实体、属性、实体间的联系。从形式上看,它是一张二维表,是所涉及属性的笛卡尔积的一个子集。关系模式:关系的定义。关系数据库:基于关系模型的数据库,利用关系来描述现实世界。从形式上看,它由一组关系组成。关系数据库的模式:定义这组关系的关系模式的全体。AnIntroductiontoDatabaseSystem关系模式的形式化定义关系模式由五部分组成,即它是一个五元组:R(U,D,DOM,F)R:关系名U:组成该关系的属性名集合D:属性组U中属性所来自的域DOM:属性向域的映象集合F:属性组U上的一组数据依赖通常直接说明为属性的类型、长度AnIntroductiontoDatabaseSystem关系模式的简化表示在关系模式:R(U,D,DOM,F)中,影响数据库模式设计的主要是U和F,D和DOM对其影响不大。为了方便讨论,将关系模式简化为一个三元组:R(U,F)AnIntroductiontoDatabaseSystem什么是数据依赖数据依赖:是一个关系内部属性与属性之间的一种约束关系。是现实世界属性间相互联系的抽象是数据内在的性质是语义的体现AnIntroductiontoDatabaseSystem什么是数据依赖(续)数据依赖的类型:函数依赖(FunctionalDependency,简记为FD)多值依赖(MultivaluedDependency,简记为MVD)AnIntroductiontoDatabaseSystem数据依赖对关系模式的影响例:描述学校教务的数据库:学生的学号(Sno)、所在系(Sdept)系主任姓名(Mname)、课程名(Cname)成绩(Grade)若建立单一的关系模式:StudentU、FU={Sno,Sdept,Mname,Cname,Grade}AnIntroductiontoDatabaseSystem数据依赖对关系模式的影响(由常识可知)学校数据库的语义:⒈一个系有若干学生,一个学生只属于一个系;⒉一个系只有一名主任;⒊一个学生可以选修多门课程,每门课程有若干学生选修;⒋每个学生所学的每门课程都有一个成绩。AnIntroductiontoDatabaseSystem数据依赖对关系模式的影响从上述语义可以得到属性组U上的一组函数依赖F:F={Sno→Sdept,Sdept→Mname,(Sno,Cname)→Grade}SnoCnameSdeptMnameGradeAnIntroductiontoDatabaseSystem数据依赖对关系模式的影响某一时刻关系模式Student的一个实例SnoSdeptMnameCnoGradeS1计算机系张明C195S1计算机系张明C290S1计算机系张明C388S2计算机系王莉C189S2计算机系王莉C270…………………………AnIntroductiontoDatabaseSystem关系模式StudentU,F中存在的问题:1.数据冗余太大:浪费大量的存储空间。例:每一个系名和系主任的姓名重复出现2.更新异常:数据冗余,更新数据时,系统要付出很大的代价来维护数据库的完整性。例:某系更换系主任后,系统必须修改与该系学生有关的每一个元组AnIntroductiontoDatabaseSystem关系模式StudentU,F中存在的问题:3.插入异常:该插的数据插不进去如果一个系刚成立,没有学生,就无法把这个系及其系主任的信息存入数据库。4.删除异常:不该删除的数据被删除例,如果一个系的学生全毕业了,则删除该系学生信息的同时,该系及其系主任的信息也将丢失。AnIntroductiontoDatabaseSystem数据依赖对关系模式的影响结论:Student关系模式不是一个好的模式。“好”的模式:不会发生插入异常、删除异常、更新异常,数据冗余应尽可能少原因:由存在于模式中的某些数据依赖引起的方法:通过分解关系模式来消除其中不合适的数据依赖AnIntroductiontoDatabaseSystem第六章关系数据理论6.1问题的提出6.2规范化6.3数据依赖的公理系统6.4模式的分解6.5小结AnIntroductiontoDatabaseSystem6.2规范化规范化理论:用来改造和优化关系模式,通过分解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。AnIntroductiontoDatabaseSystem6.2规范化6.2.1函数依赖的概念6.2.2码的定义与概念6.2.3关系模型的范式6.2.42NF6.2.53NF6.2.6BCNF6.2.7多值依赖6.2.84NF6.2.9关系模式规范化的步骤AnIntroductiontoDatabaseSystem函数依赖的定义定义6.1设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称“X函数确定Y”或“Y函数依赖于X”,记作X→Y。若X→Y,则X称为这个函数依赖的决定属性组,也称为决定因素。Y=f(x)若X→Y,Y→X,则记作X←→Y。若Y不函数依赖于X,则记作XY。AnIntroductiontoDatabaseSystem说明:1.函数依赖不是指关系模式R的某个或某些关系实例满足的约束条件,而是指R的所有关系实例均要满足的约束条件。2.函数依赖是语义范畴的概念。只能根据数据的语义来确定函数依赖。例如“姓名→年龄”这个函数依赖只有在不允许有同名人的条件下成立。AnIntroductiontoDatabaseSystem平凡函数依赖与非平凡函数依赖在关系模式R(U)中,对于U的子集X和Y,若X→Y,但YX,则称X→Y是非平凡的函数依赖若X→Y,但YX,则称X→Y是平凡的函数依赖例:在关系SC(Sno,Cno,Grade)中,非平凡函数依赖:(Sno,Cno)→Grade平凡函数依赖:(Sno,Cno)→Sno(Sno,Cno)→CnoAnIntroductiontoDatabaseSystem平凡函数依赖与非平凡函数依赖对于任一关系模式,平凡函数依赖都是必然成立的,它不反映新的语义,因此若不特别声明,我们总是讨论非平凡函数依赖。AnIntroductiontoDatabaseSystem完全函数依赖与部分函数依赖定义6.2在R(U)中,如果X→Y,并且对于X的任何一个真子集X’,都有X’Y,则称Y对X完全函数依赖,记作XFY。若X→Y,但Y不完全函数依赖于X,则称Y对X部分函数依赖,记作XPY。AnIntroductiontoDatabaseSystem完全函数依赖与部分函数依赖(续)例:在下述关系中,Student(Sno,Sdept,Mname,Cno,Grade)F={Sno→Sdept,Sdept→Mname,(Sno,Cname)→Grade}由于:SnoGrade,CnoGrade,因此:(Sno,Cno)→Grade是完全函数依赖由于:Sno→Sdept,且Sno是(Sno,Cno)的真子集因此:(Sno,Cno)→Sdept是部分函数依赖FPAnIntroductiontoDatabaseSystem传递函数依赖定义6.3在R(U)中,如果X→Y(YX且Y→X),Y→Z,,则称Z对X传递函数依赖。记为:X→Z注:如果X→Y且Y→X,即X←→Y,则Z直接依赖于X。例:在关系Std(Sno,Sdept,Mname)中,有:Sno→Sdept,Sdept→MnameMname传递函数依赖于Sno传递AnIntroductiontoDatabaseSystem6.2规范化6.2.1函数依赖的概念6.2.2码的定义与概念6.2.3关系模型的范式6.2.42NF6.2.53NF6.2.6BCNF6.2.7多值依赖6.2.84NF6.2.9关系模式规范化的步骤AnIntroductiontoDatabaseSystem6.2.2码的定义与概念前面章节中曾给出了关系模式的码的非形式化定义:若关系中的某一属性或属性组的值能唯一地标识一个元组,则称该属性或属性组为候选码。这里使用函数依赖的概念来严格定义关系模式的码。AnIntroductiontoDatabaseSystem码的定义与概念定义6.4设K为RU,F中的属性或属性组合。若KU,则K称为R的侯选码。若候选码多于一个,则选定其中的一个做为主码。主属性:包含在任何一个候选码中的属性非主属性:不包含在任何码中的属性全码:整个属性组是码,称为全码(All-key)FAnIntroductiontoDatabaseSystem外部码定义6.5关系模式R中的属性或属性组X并非R的码,但X是另一个关系模式的码,则称X是R的外部码,也称外码如在SC(Sno,Cno,Grade)中,Sno不是码,但Sno是关系模式S(Sno,Sdept,Sage)的码,则Sno是关系模式SC的外部码主码与外部码一起提供了表示关系间联系的手段AnIntroductiontoDatabaseSystem6.2规范化6.2.1函数依赖的概念6.2.2码的定义与概念6.2.3关系模型的范式6.2.42NF6.2.53NF6.2.6BCNF6.2.7多值依赖6.2.84NF6.2.9关系模式规范化的步骤AnIntroductiontoDatabaseSystem6.2.3关系模型的范式范式是符合某一种级别的关系模式的集合。关系数据库中的关系必须满足一定的要求,满足不同程度要求的为不同范式。范式的种类:第一范式(1NF)第二范式(2NF)第三范式(3NF)BC范式(BCNF)第四范式(4NF)第五范式(5NF)低高AnIntroductiontoDatabaseSystem6.2.3关系模型的范式各种范式之间存在联系:某一关系模式R为第n范式,可简记为R∈nNF。一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式的集合,这种过程就叫关系模式的规范化。NF5NF4BCNFNF3NF2NF1AnIntroductiontoDatabaseSystem1NF1NF的定义:如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库但是满足第一范式的关系模式并不一定是一个好的关系模式AnIntroductiontoDatabaseSystem6.2规范化6.2.1函数依赖的概念6.2.2码的定义与概念6.2.3关系模型的范式6.2.42NF6.2.53NF6.2.6BCNF6.2.7多值依赖6.2.84NF6.2.9关系模式规范化的步骤AnIntroductiontoDatabaseSystem6.2.42NF2NF的定义:定义6.6若关系模式R∈1NF,且每一个非主属性都完全函数依赖于关系的码,则R∈2NF。AnIntroductiontoDatabaseSystem2NF(续)例:有关系模式S-L-C(Sno,Sdept,Sloc,Cno,Grade)语义为: