第8章关系数据理论第8章关系数据理论8.1引言8.2基本知识8.3关系规范化设计理论-范式8.4关系规范化的步骤8.5模式的分解8.1引言一、概念回顾二、关系模式的形式化定义三、什么是数据约束四、关系模式的简化定义一、概念回顾•关系–从形式上看,它是一张二维表,是所涉及属性的笛卡尔积的一个子集。•关系模式:对关系的描述。•关系数据库:基于关系模型的数据库,利用关系来描述现实世界。–从形式上看,它由一组关系组成。•关系数据库的模式:定义这组关系的关系模式的全体。二、关系模式的形式化定义关系模式由五部分组成,即它是一个五元组:R(U,D,DOM,F)R:关系名U:组成该关系的属性名集合D:属性组U中属性所来自的域DOM:属性向域的映象集合F:属性间数据的约束条件的集合三、什么是数据约束一种是通过对数据的取值范围来实现。另一种是通过数据之间的各种联系来实现,四、关系模式的简化表示●关系模式R(U,D,DOM,F)简化为一个三元组:R(U,F)●当且仅当U上的一个关系r满足F时,r称为关系模式R(U,F)的一个关系第8章关系数据理论•8.1引言•8.2基本知识•8.3关系规范化设计理论-范式•8.4关系规范化的步骤•8.5模式的分解8.2基本知识8.2.1函数依赖8.2.2码8.2.3函数依赖的推理规则8.2.1函数依赖一、函数依赖二、平凡函数依赖与非平凡函数依赖三、完全函数依赖与部分函数依赖四、传递函数依赖一、函数依赖定义8.1设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称“X函数确定Y”或“Y函数依赖于X”,记作X→Y。X称为这个函数依赖的决定属性集(Determinant)。Y=f(x)说明1.函数依赖不是指关系模式R的某个或某些关系实例满足的约束条件,而是指R的所有关系实例均要满足的约束条件。2.函数依赖是语义范畴的概念。只能根据数据的语义来确定函数依赖。例如“姓名→年龄”这个函数依赖只有在不允许有同名人的条件下成立3.数据库设计者可以对现实世界作强制的规定。例如规定不允许同名人出现,函数依赖“姓名→年龄”成立。所插入的元组必须满足规定的函数依赖,若发现有同名人存在,则拒绝装入该元组。函数依赖(续)例:Student(Sno,Sname,Ssex,Sage,Sdept)假设不允许重名,则有:Sno→Ssex,Sno→Sage,Sno→Sdept,Sno←→Sname,Sname→Ssex,Sname→SageSname→Sdept但Ssex→Sage若X→Y,并且Y→X,则记为X←→Y。若Y不函数依赖于X,则记为X─→Y。二、平凡函数依赖与非平凡函数依赖在关系模式R(U)中,对于U的子集X和Y,如果X→Y,但YX,则称X→Y是非平凡的函数依赖若X→Y,但YX,则称X→Y是平凡的函数依赖例:在关系SC(Sno,Cno,Grade)中,非平凡函数依赖:(Sno,Cno)→Grade平凡函数依赖:(Sno,Cno)→Sno(Sno,Cno)→Cno平凡函数依赖与非平凡函数依赖(续)–对于任一关系模式,平凡函数依赖都是必然成立的,它不反映新的语义,因此若不特别声明,我们总是讨论非平凡函数依赖。三、完全函数依赖与部分函数依赖定义8.2在关系模式R(U)中,如果X→Y,并且对于X的任何一个真子集X’,都有X’Y,则称Y完全函数依赖于X,记作XfY。若X→Y,但Y不完全函数依赖于X,则称Y部分函数依赖于X,记作XPY。完全函数依赖与部分函数依赖(续)例:在关系SC(Sno,Cno,Grade)中,由于:Sno→Grade,Cno→Grade,因此:(Sno,Cno)fGrade四、传递函数依赖定义8.3在关系模式R(U)中,如果X→Y,Y→Z,且YX,Y→X,则称Z传递函数依赖于X。注:如果Y→X,即X←→Y,则Z直接依赖于X。例:在关系Std(Sno,Sdept,Mname)中,有:Sno→Sdept,Sdept→MnameMname传递函数依赖于Sno8.2.2码定义8.4设K为关系模式RU,F中的属性或属性组合。若KfU,则K称为R的一个侯选码(CandidateKey)。若关系模式R有多个候选码,则选定其中的一个做为主码(Primarykey)。•主属性与非主属性•ALLKEY外部码定义8.5关系模式R中属性或属性组X并非R的码,但X是另一个关系模式的码,则称X是R的外部码(Foreignkey)也称外码•主码又和外部码一起提供了表示关系间联系的手段。8.2.3函数依赖的推理规则1.自反律:若YXU,则X→Y。2.增广律:若XU,YU,ZU且X→Y,则XZ→YZ。3.传递律:若X→Y及Y→Z,则X→Z。8.2.3函数依赖的推理规则根据1,2,3这三条推理规则可以得到下面三条推理规则:4.合并规则:由X→Y,X→Z,有X→YZ。(2,3)5.伪传递规则:由X→Y,WY→Z,有XW→Z。(2,3)6.分解规则:由X→Y及ZY,有X→Z。(1,A3)8.2.3函数依赖的推理规则根据合并规则和分解规则,可得引理引理X→A1A2…Ak成立的充分必要条件是X→Ai成立(i=l,2,…,k)。8.3关系规范化设计理论-范式8.3.1概述8.3.21NF8.3.32NF8.3.43NF8.3.5BCNF8.3.6这几种范式的关系8.3.1概述任何一个关系模式都可能有多个表(关系)组成,一个关系模式到底需要有多少个表呢?而一个表到底需要有哪些属性呢?这是我们学习范式以后就可以确定的。8.3.1概述(续)•范式是符合某一种级别的关系模式的集合。•关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。•范式的种类:第一范式(1NF)第二范式(2NF)第三范式(3NF)BC范式(BCNF)第四范式(4NF)第五范式(5NF)8.3.1概述(续)•各种范式之间存在联系:•某一关系模式R为第n范式,可简记为R∈nNF。8.3.21NF•1NF的定义如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF。•第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库。•若一个关系模式中的所有关系是属于1NF,则称该关系模式也属于1NF8.3.21NF(续)如何把不属于1NF的关系转化为属于1NF8.3.21NF(续)但是满足第一范式的关系模式并不一定是一个好的关系模式。8.3.21NF(续)例:关系模式SLC(Sno,Sdept,Sloc,Cno,Grade)Sloc为学生住处,假设每个系的学生住在同一个地方。•函数依赖包括:(Sno,Cno)fGradeSno→Sdept(Sno,Cno)PSdeptSno→Sloc(Sno,Cno)PSlocSdept→Sloc8.3.21NF(续)8.3.21NF(续)•SLC的码为(Sno,Cno)•SLC满足第一范式。•非主属性Sdept和Sloc部分函数依赖于码(Sno,Cno)SLC不是一个好的关系模式(1)插入异常假设Sno=005,Sdept=SC,Sloc=A的学生还未选课,因课程号是主属性,因此该学生的信息无法插入SLC。(2)删除异常假定某个学生本来只选修了103号课程这一门课。现在因身体不适,他连103号课程也不选修了。因课程号是主属性,此操作将导致该学生信息的整个元组都要删除。SLC不是一个好的关系模式(3)数据冗余度大如果一个学生选修了10门课程,那么他的Sdept和Sloc值就要重复存储了10次。(4)修改复杂例如学生转系,在修改此学生元组的Sdept值的同时,还可能需要修改住处(Sloc)。如果这个学生选修了K门课,则必须无遗漏地修改K个元组中全部Sdept、Sloc信息。8.3.21NF(续)•原因非主属性(Sdept、Sloc)部分函数依赖于码。•解决方法SLC分解为两个关系模式,以消除非主属性对码的部分函数依赖SC(Sno,Cno,Grade)SL(Sno,Sdept,Sloc)8.3.21NF(续)8.3.21NF(续)通过分解得到的SC,SL可使原本存在的问题得到一定程度的解决。•插入异常解决•删除异常解决•修改复杂解决•数据冗余减小8.3.21NF(续)函数依赖图:8.3关系规范化设计理论-范式•8.3.1概述•8.3.21NF•8.3.32NF•8.3.43NF•8.3.5BCNF•8.3.6这几种范式的关系8.3.32NF一、2NF的定义定义5.6若关系模式R∈1NF,并且每一个非主属性都完全函数依赖于R的码,则R∈2NF。例:SLC(Sno,Sdept,Sloc,Cno,Grade)∈1NFSLC(Sno,Sdept,Sloc,Cno,Grade)∈2NFSC(Sno,Cno,Grade)∈2NFSL(Sno,Sdept,Sloc)∈2NF8.3.32NF(续)二、定理:若关系模式R∈1NF,且候选码只有一个属性,则R∈2NF。8.3.32NF(续)•采用投影分解法将一个1NF的关系分解为多个2NF的关系,可以在一定程度上减轻原1NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。•但并不能完全消除关系模式中的各种异常情况和数据冗余,还存在一定的问题。三、还存在的问题8.3.32NF(续)四、存在问题的原因函数依赖:Sno→SdeptSdept→SlocSno→SlocSloc传递函数依赖于Sno,即SL中存在非主属性对码的传递函数依赖。8.3.32NF(续)函数依赖图:8.3.32NF(续)五、解决方法采用投影分解法,把SL分解为两个关系模式,以消除非主属性对码的传递函数依赖:SD(Sno,Sdept)DL(Sdept,Sloc)SD的码为Sno,DL的码为Sdept。8.3.32NF(续)8.3.32NF(续)通过分解得到的关系模式,既没有非主属性对码的部分函数依赖,也没有非主属性对码的传递函数依赖,使原本存在的问题得到一定程度的解决。•插入异常解决•删除异常解决•修改复杂解决•数据冗余减小8.3.32NF(续)SD的码为Sno,DL的码为Sdept。8.3关系规范化设计理论-范式•8.3.1概述•8.3.21NF•8.3.32NF•8.3.43NF•8.3.5BCNF•8.3.6这几种范式的关系8.3.43NF一、3NF的定义定义5.8若关系模式∈2NF,且不存在非主属性对码的传递函数依赖,则R∈3NF。例,SL(Sno,Sdept,Sloc)∈2NFSL(Sno,Sdept,Sloc)∈3NFSD(Sno,Sdept)∈3NFDL(Sdept,Sloc)∈3NF8.3.43NF(续)二、定理若R∈2NF,且非主属性至多有一个,则R∈3NF8.3.43NF(续)三、说明•若R∈3NF,则R的每一个非主属性既不部分函数依赖于候选码也不传递函数依赖于候选码。•如果R∈3NF,则R也是2NF。•采用投影分解法将一个2NF的关系分解为多个3NF的关系,可以在一定程度上解决原2NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。8.3.43NF(续)四、存在问题将一个2NF关系分解为多个3NF的关系后,并不能完全消除关系模式中的各种异常情况和数据冗余。假定一个教师只教一门课程,但一门课程可以由多个老师分担。四、存在问题(续)1.插入异常:教师的课没人选,则相应信息插入不进来。2.删除异常:若全部学生毕业,则课程和教师信息也被删除。3.修改复杂:若教师改变,则要修改多次(选该老师的学生人数)4.数据冗余。8.3.43NF(续)五、存在问题的原因Sno,Cno→Tno,Tno→CnoSno,Cno→GradeSno,Tno→Cno,Tno→CnoSno,Tno→Grade存在着候选码中的主属性对不包括该主属性的其它候选码的部分函数依赖问题。8.3.43NF(续)六、解决的方法消除候选码中的主属性对不包括该主属性的其它候选码的部分函数依赖问题。8.3.43NF(续