郑州轻工业学院计算机与通信工程学院、软件学院第三章关系数据库郑州轻工业学院软件职业技术学院1-2数据库原理上一章介绍了三种主要的数据模型:–层次模型–网状模型–关系模型–其中关系模型简单灵活,并有着坚实的理论基础,已成为当前最流行的数据模型。本章主要讲述:–关系模型的数据结构–关系的定义和性质–关系数据库的基本概念–关系运算–关系完整性郑州轻工业学院软件职业技术学院1-3数据库原理关系数据库系统–是支持关系模型的数据库系统关系模型的组成–关系数据结构–关系操作集合–关系完整性约束郑州轻工业学院软件职业技术学院1-4数据库原理3.1关系数据结构及形式化定义单一的数据结构----关系–现实世界的实体以及实体间的各种联系均用关系来表示数据的逻辑结构----二维表–从用户角度,关系模型中数据的逻辑结构是一张二维表。郑州轻工业学院软件职业技术学院1-5数据库原理3.1.1关系3.1.2关系模式3.1.3关系数据库郑州轻工业学院软件职业技术学院1-6数据库原理在关系模型中,数据是以二维表的形式存在的,这个二维表就叫做关系。关系理论是以集合代数理论为基础的,因此,我们可以用集合代数给出二维表的“关系”定义。为了从集合论的角度给出关系的定义,我们先引入域和笛卡尔积的概念。关系的定义郑州轻工业学院软件职业技术学院1-7数据库原理3.1.1关系⒈域(Domain)2.笛卡尔积(CartesianProduct)3.关系(Relation)郑州轻工业学院软件职业技术学院1-8数据库原理域(Domain)域是一组具有相同数据类型的值的集合,又称为值域。(用D表示)–例如整数、实数、字符串的集合。域中所包含的值的个数称为域的基数(用m表示)。关系中用域表示属性的取值范围。例如:–D1={李力,王平,刘伟}m1=3–D2={男,女}m2=2–D3={47,28,30}m3=3–其中,D1,D2,D3为域名,分别表示教师关系中姓名、性别、年龄的集合。域名无排列次序,如D2={男,女}={女,男}郑州轻工业学院软件职业技术学院1-9数据库原理笛卡尔积(CartesianProduct)给定一组域D1,D2,…,Dn(它们可以包含相同的元素,即可以完全不同,也可以部分或全部相同)。D1,D2,…,Dn的笛卡尔积为D1×D2×……×Dn={(d1,d2,…,dn)|di∈Di,i=1,2,…,n}。由定义可以看出,笛卡尔积也是一个集合。其中:–1.元素中的每一个di叫做一个分量(Component),来自相应的域(di∈Di)–2.每一个元素(d1,d2,d3,…,dn)叫做一个n元组(n-tuple),简称元组(Tuple)。但元组不是di的集合,元组的每个分量(di)是按序排列的。如:–(1,2,3)≠(2,3,1)≠(1,3,2);–而集合中的元素是没有排序次序的,如(1,2,3)=(2,3,1)=(1,3,2)。郑州轻工业学院软件职业技术学院1-10数据库原理–3.若Di(i=1,2,……n)为有限集,Di中的集合元素个数称为Di的基数,用mi(i=1,2,……n)表示,则笛卡尔积D1×D2×……×Dn的基数M(即元素(d1,d2,……dn)的个数)为所有域的基数的累乘之积,即–M=–例如:上述表示教师关系中姓名、性别两个域的笛卡尔积为:–D1×D2={(李力,男),(李力,女),(王平,男),(王平,女),(刘伟,男),(刘伟,女)}–其中:–李力、王平、刘伟、男、女都是分量–(李力,男),(李力,女)等是元组–其基数M=m1×m2=3*2=6–元组的个数为6郑州轻工业学院软件职业技术学院1-11数据库原理–4.笛卡尔积可用二维表的形式表示。–例如,上述的6个元组可表示成表2.1。表3.1D1和D2的笛卡尔积–由上例可以看出,笛卡尔积实际是一个二维表,表的框架由域构成,表的任意一行就是一个元组,表中的每一列来自同一域,如第一个分量来自D1,第二个分量来自D2。姓名性别李力男李力女王平男王平女刘伟男刘伟女郑州轻工业学院软件职业技术学院1-12数据库原理关系(Relation)笛卡尔积D1×D2×…×Dn的任一子集称为定义在域D1,D2,…Dn上的n元关系(Relation),可用R(D1,D2……Dn)表示–如上例D1×D2笛卡尔积的子集可以构成教师关系T1,如下表:姓名性别李力男王平女刘伟男郑州轻工业学院软件职业技术学院1-13数据库原理几点说明:1.R为关系名,n称为关系的目或度(Degree)。–当n=1时,称为单元关系。–当n=2时,称为二元关系。–…–当n=n时,称为n元关系。如上例为二元关系,关系名为T。郑州轻工业学院软件职业技术学院1-14数据库原理2.该子集中的元素是关系中的元组,用r表示,关系中元组个数是关系的基数。如(李力,男),(王平,女),(刘伟,男)为三个元组,关系T的基数为3。–如果一个关系的元组个数是无限的,则称为无限关系;–如果一个关系的元组个数是有限的,则称为有限关系。–由于计算机存储系统的限制,我们一般不去处理无限关系,而只考虑有限关系。3.同样可以把关系看成一个二维表。其中,–(1)表的框架由域Di(i=1,2,……n)构成;–(2)表的任意一行对应一个元组;–(3)表的每一列来自同一域;–(4)域可以相同,为了加以区别,每列起一个名字,称为属性,n目关系有n个属性,属性的名字唯一。–(5)具有相同关系框架的关系成为同关系,例如,有另一个关系T2,如表所示:–T1和T2是同类关系。姓名性别张雪女张兰女郑州轻工业学院软件职业技术学院1-15数据库原理4.数学上关系是笛卡尔积的任意子集,但在实际应用中关系是笛卡尔积中所取的有意义的子集。例如在表2.1中选取一个子集构成如下关系,显然不符合实际情况。姓名性别李力男李力女郑州轻工业学院软件职业技术学院1-16数据库原理码候选码(Candidatekey)若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码在最简单的情况下,候选码只包含一个属性。全码(All-key)在最极端的情况下,关系模式的所有属性组是这个关系模式的候选码,称为全码(All-key)相关定义郑州轻工业学院软件职业技术学院1-17数据库原理相关定义主码若一个关系有多个候选码,则选定其中一个为主码(Primarykey)主码的诸属性称为主属性(Primeattribute)。不包含在任何侯选码中的属性称为非码属性(Non-keyattribute)郑州轻工业学院软件职业技术学院1-18数据库原理三类关系基本关系(基本表或基表)实际存在的表,是实际存储数据的逻辑表示查询表查询结果对应的表视图表由基本表或其他视图表导出的表,是虚表,不对应实际存储的数据关系的分类郑州轻工业学院软件职业技术学院1-19数据库原理基本关系的性质①列是同质的(Homogeneous)每一列中的分量是同一类型的数据,来自同一个域②不同的列可出自同一个域其中的每一列称为一个属性不同的属性要给予不同的属性名郑州轻工业学院软件职业技术学院1-20数据库原理例p41中也可以只给出两个域:人(PERSON)=张清玫,刘逸,李勇,刘晨,王敏专业(SPECIALITY)=计算机专业,信息专业SAP关系的导师属性和研究生属性都从PERSON域中取值为了避免混淆,必须给这两个属性取不同的属性名,而不能直接使用域名。例如定义:导师属性名为SUPERVISOR-PERSON(或SUPERVISOR)研究生属性名为POSTGRADUATE-PERSON(或POSTGRADUATE)郑州轻工业学院软件职业技术学院1-21数据库原理③列的顺序无所谓,即列的次序可以任意交换遵循这一性质的数据库产品(如ORACLE),增加新属性时,永远是插至最后一列,但也有许多关系数据库产品没有遵循这一性质,例如FoxPro仍然区分了属性顺序④任意两个元组不能完全相同由笛卡尔积的性质决定,但许多关系数据库产品没有遵循这一性质。例如:Oracle,FoxPro等都允许关系表中存在两个完全相同的元组,除非用户特别定义了相应的约束条件。郑州轻工业学院软件职业技术学院1-22数据库原理⑤行的顺序无所谓,即行的次序可以任意交换遵循这一性质的数据库产品(如ORACLE),插入一个元组时永远插至最后一行,但也有许多关系数据库产品没有遵循这一性质,例如FoxPro仍然区分了元组的顺序⑥分量必须取原子值每一个分量都必须是不可分的数据项。这是规范条件中最基本的一条,即不可“表中有表”。满足此条件的关系称为规范化关系,否则称为非规范化关系。表2.3非规范化关系POSTGRADUATESUPERVISORSPECIALITYPG1PG2张清玫信息专业李勇刘晨刘逸信息专业王敏郑州轻工业学院软件职业技术学院1-23数据库原理3.1.2关系模式1.什么是关系模式2.定义关系模式3.关系模式与关系郑州轻工业学院软件职业技术学院1-24数据库原理1.什么是关系模式关系模式(RelationSchema)是型关系是值关系模式是对关系的描述元组集合的结构属性构成属性来自的域属性与域之间的映象关系元组语义以及完整性约束条件属性间的数据依赖关系集合郑州轻工业学院软件职业技术学院1-25数据库原理关系模式可以形式化地表示为:R(U,D,dom,F)R关系名U组成该关系的属性名集合D属性组U中属性所来自的域dom属性向域的映象集合F属性间的数据依赖关系集合2.定义关系模式郑州轻工业学院软件职业技术学院1-26数据库原理例:导师和研究生出自同一个域——人,取不同的属性名,并在模式中定义属性向域的映象,即说明它们分别出自哪个域:dom(SUPERVISOR-PERSON)=dom(POSTGRADUATE-PERSON)=PERSON郑州轻工业学院软件职业技术学院1-27数据库原理关系模式通常可以简记为R(U)或R(A1,A2,…,An)R关系名A1,A2,…,An属性名注:域名及属性向域的映象常常直接说明为属性的类型、长度郑州轻工业学院软件职业技术学院1-28数据库原理3.关系模式与关系关系模式对关系的描述静态的、稳定的关系关系模式在某一时刻的状态或内容动态的、随时间不断变化的关系模式和关系往往统称为关系通过上下文加以区别郑州轻工业学院软件职业技术学院1-29数据库原理3.1.3关系数据库在一个给定的应用领域中,所有实体及实体之间联系的关系的集合构成一个关系数据库。关系数据库也有型和值之分关系数据库的型称为关系数据库模式,是对关系数据库的描述若干域的定义在这些域上定义的若干关系模式关系数据库的值是这些关系模式在某一时刻对应的关系的集合,通常简称为关系数据库郑州轻工业学院软件职业技术学院1-30数据库原理3.2关系操作(简单介绍)3.2.1基本的关系操作-选择、投影、连接、除、并、差、交、笛卡尔积等特点:操作的对象和结果都是集合3.2.2关系数据语言的分类关系代数语言关系数据语言关系演算语言具有两种特点的语言(SQL)郑州轻工业学院软件职业技术学院1-31数据库原理3.3关系的完整性3.3.1关系的三类完整性约束3.3.2实体完整性3.3.3参照完整性3.3.4用户定义的完整性郑州轻工业学院软件职业技术学院1-32数据库原理关系模型的完整性规则是对关系的某种约束条件。关系模型中三类完整性约束:实体完整性参照完整性用户定义的完整性实体完整性和参照完整性是关系模型必须满足的完整性约束条件,被称作是关系的两个不变性,应该由关系系统自动支持。郑州轻工业学院软件职业技术学院1-33数据库原理3.3.2实体完整性实体完整性规则(EntityIntegrity)若属性A是基本关系R的主属性,则属性A不能取空值例SAP(SUPERVISOR,SPECIALITY,POSTGRADUATE)POSTGRADUATE属性为主码(假设研究生不会重名),则其不能取空值郑州轻工业学院软件职业技术学院1-34数据库原理关系模型必须遵守实体完整性规则的原因(1)实体完整性规则是针对基本关系