第七章数据库设计和E-R模型第七章数据库设计和E-R模型设计过程实体-联系模型约束设计问题扩展的E-R特性银行数据库的设计转换为关系模式数据库设计UML7.1设计过程设计阶段:1.概念设计阶段2.逻辑设计阶段3.物理设计阶段设计问题:冗余不完整实体-联系模型实体-联系(Entity-Relationship)模型:E-R模型是一种语义模型。在将现实世界事实的含义和相互关联映射到概念模式方面非常有用。采用三个基本概念:实体集、联系集、属性一个数据库可以被建模为:实体的集合实体间的联系实体集实体是现实世界可区别于所有其他对象的一个“事物”或“对象”。例子:张三,公司,事件,计划实体集是相同类型即具有相同性质(或属性)的一个实体集合。例子:所有人的集合,公司的集合,树的集合,假日的集合实体集的外延是指属于实体集的实体的实际集合。实体有属性,它是实体集中每个成员所拥有的描述性性质。例子:人有姓名和地址每个实体的每个属性都有一个值。实体集instructor和studentinstructor_IDinstructor_namestudent-IDstudent_name联系集联系是指多个实体间的相互关联例子:44553(Peltier)advisor22222(Einstein)studententityrelationshipsetinstructorentity联系集是相同类型联系的集合(44553,22222)advisor联系集Advisor联系集(续)联系集也可以有属性。比如,实体集instructor和student之间的联系集advisor,可以有属性date,以表示教师成为学生的导师的日期联系集中实体的角色实体在联系中扮演的功能称为实体的角色角色是隐含的,通常不指定当同样的实体集参与一个联系集多于一次,这类联系集称作是自环的。此时需用角色指明实体是如何参与联系实例的联系集的度参与联系集的实体集的数目称为联系集的度。二元联系集涉及两个实体集(度为2)。数据库系统中大多数联系集都是二元的。涉及两个实体集以上的联系是很少的。students在instructor的指导下完成projects。proj_guide是instructor,student和project之间的三元联系。属性实体通过一组属性来表示,属性是实体集中每个成员所拥有的描述性性质instructor=(ID,name,street,city,salary)course=(course_id,title,credits)域–每个属性可取值的集合,也称值域实体集的属性是将实体集映射到域的函数属性类型:简单和复合属性单值和多值属性举例:多值属性:phone_numbers派生属性和基属性派生属性可以从别的属性派生出来。派生属性值不存储,而是在需要时计算出来。复合属性映射基数约束映射基数,或基数比率,表示一个实体通过一个联系集能关联的实体的个数。在描述二元联系集时非常有用对二元联系集来说,映射基数必然是以下情况之一:一对一一对多多对一多对多映射基数一对一一对多注意:A和B中的某些元素可能并不映射到另一集合中的任一元素映射基数多对一多对多注意:A和B中的某些元素可能并不映射到另一集合中的任一元素参与约束如果实体集E中的每个实体都参与到联系集R的至少一个联系中,实体集E在联系集R中的参与称为全部(total)的。如果实体集E中只有部分实体参与到R的联系中,实体集E在联系集R中的参与称为部分(partial)的。码一个实体集的超码是一个或多个可以用来唯一地标识实体的属性。一个实体集的候选码是最小的超码ID是instructor的候选码course_id是course的候选码主码是被选择用来区分实体的候选码,主码只有一个,但候选码可以有多个。联系集的码如果联系集R没有属性与之相关联,那么属性集合primary-key(E1)∪primary-key(E2)∪…∪primary-key(En)描述了集合R中的一个联系。如果联系集R有属性a1,a2,…,am与之相关联,那么属性集合primary-key(E1)∪primary-key(E2)∪…∪primary-key(En)∪{a1,a2,…,am}描述了集合R中的一个联系。相关的实体集的主码的集合形成了联系集的超码。在以上的两种情况下,属性集合primary-key(E1)∪primary-key(E2)∪…∪primary-key(En)总是构成联系集的一个超码。联系集的码(s_id,i_id)是advisor的超码。表示一对实体集在一个特定的联系集中只能有一个联系。假如我们想知道学生和导师之间的多次会议日期,我们不能为每个会议建立联系。可以使用多值属性决定候选码时必须考虑联系集的映射基数。在有多个候选码的情况下,选择主码是要考虑联系集的语义。7.4冗余属性假设有实体集instructor,有dept_name属性department及联系集inst_dept,联系instructor和departmentinstructor中的dept_name属性是冗余的,因为有一个明确的关系inst_dept来联系instructors和departments属性重复了联系中的信息,应该从instructor中除去去除冗余属性后的,大学模式见P1567.5E-R图矩形代表实体集。属性在实体矩阵中列出。构成主码的属性以下划线标明。菱形代表联系集。参与联系集中的实体集全部参与(用两条线标识):实体集中的每个实体都参与到联系集的至少一个联系中例:section全部参与sec_course每个section都有一个course部分参与:某些实体不参与到联系集中的任何一个联系例:部分instructor参与到advisor中具有属性的联系集基数约束我们在联系集和实体集之间画一个箭头()代表“一”或者一条线段(—)代表“多”来表示基数约束。一对一联系instructor与student之间的一对一联系一个instructor通过advisor至多与一个student相联系一个student通过advisor至多与一个instructor相联系一对多联系instructor与student之间的一对多联系一个instructor通过advisor与多个student(包括0个)相联系一个student通过advisor至多与一个instructor相联系多对一联系instructor与student之间的多对一联系一个instructor通过advisor至多与一个student相联系一个student通过advisor与多个instructor(包括0个)相联系多对多联系一个instructor通过advisor与多个student(包括0个)相联系一个student通过advisor与多个instructor(包括0个)相联系基数限制的另一种方法基数限制也可以用参与约束来表示具有复合,多值,派生属性的实体角色一个联系的实体集不需要唯一一个实体集中的元素每次出现都在关系中代表一个“角色”“course_id”和“prereq_id”被称为角色.有三元联系的E-R图三元关系上的基数约束我们只允许在一个三元(或三元以上)联系集外有一个箭头来表示基数约束。例,从proj_guide到instructor的箭头表示每个学生在每个项目上至多有一个导师来指导如果有多于一个的箭头,那就会有两种解释。例,R是A,B和C之间的三元联系集,并且有两个箭头指向B和C,这可以表示为每个在A中的实体都与来自B和C的至多一个实体相关联每个来自(A,B)的实体对都与来自C的至多一个实体相关联,而每个来自(A,C)的实体对都与来自B的至多一个实体相关联为了避免混淆,在联系集外我们只允许有一个箭头弱实体集一个没有足够的属性形成主码的实体集叫做弱实体集。弱实体集必须与标识或属主实体集(ownerentityset)关联才有意义。弱实体集存在依赖于标识实体集将弱实体集与其标识实体集相连的联系称为标识性联系。标识联系集以双边框的菱形表示弱实体集通过一个全部参与的,多对一的联系集与标识实体集联系。弱实体集的分辨符是使得我们区分弱实体集中实体的属性集合。也称为该弱实体集的部分码。弱实体集的主码由标识实体集的主码和该弱实体集的分辨符共同组成。弱实体集(续)弱实体集的分辨符用虚下划线表示。标识联系集以双边框的菱形表示。section的主码–(course_id,sec_id,semester,year)弱实体集(续)注意:强实体集的主码并不存储于弱实体集。如果course_id被隐含的存储,section会是一个强实体集,这样section和course之间的联系集将会重复存储course_id属性弱实体集可以参与标识性联系以外的其他联系。也可能与不止一个标识实体集关联。在某些情况下,数据库设计者会选择将一个弱实体集表示为属主实体集的一个多值复合属性:如果弱实体集只参与标识性联系,而且其属性不多,建模时更适合将其作为属性反之,更适合将其表示为弱实体集大学的E-R图