第2章 关系模型与关系数据库

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

LOGO第1部分数据库系统基础第2章关系模型与关系数据库高级数据库系统及其应用2020/2/232第2章关系模型与关系数据库关系数据模型2.1关系操作与关系查询语言2.2SQL语言2.3应用关系数据库2.42020/2/2332.1关系数据模型2.1.1关系模型基础2.1.2关系模型的约束及其表达2.1.3关系数据库2020/2/2342.1.1关系模型基础关系(表)关系模型将数据库表示为一组“关系(relation)”的集合。每个关系好比一个具有多个行(row)和多个列(column)的二维值表(table)。每个关系含两部分信息:关系模式(relationschema)和关系实例(relationinstance)。在正式的关系模型术语中•表行:被称为记录(record)或元组(tuple)•表列标题:被称为属性(attribute)或字段(field)。2020/2/235一个简单关系表的关系模式和关系实例示例(图2.1)2020/2/236其它几个重要的关系模型概念(1)属性域在关系模型中,必须为每个属性指定一个域(domain)。关系模式(relationschema)指一个关系的基本模式结构定义。形式上,名为R的关系模式可表示为:•R(A1[:dom(A1)],…,An[:dom(An)])关系实例(关系状态)关系的每个数据行称为一个元组,可形式表示为•t=v1,v2,…,vn,关系的实例(状态)是一个元组集或记录集,可形式表示为:•r(R)={t1,t2,…,tn}2020/2/237其它几个重要的关系模型概念(2)关系数据库模式(Schema,S)指由一个关系模式集{R1,R2,…,Rn}和一个关系约束集ICs构成的定义集;S={R1,R2,…,Rn}+ICs。关系数据库状态指特定时刻DB中所有关系状态的集合,即DB={r1,r2,…,rn},其中,ri是关系Ri的状态。关系数据库关系数据库(RDB),是采用关系模型来表示数据的数据库。RDB的一个状态也称为一个RDB实例。2020/2/2382.1.2关系模型的约束及其表达完整性约束(IntegrityConstraints,ICs)DBMS必须能强制实施与DB模式有关的所有约束,以限制允许存储到DB的数据,确保DB中只有满足约束的合法数据。ICs的主要类型包括域约束、主键约束和外键约束,它们常被统称为基于模式的约束。键约束超键(superkey,SK)的概念•能唯一标识关系R中每个元组的一个属性子集•超键中可能会有冗余属性候选键(CandidateKey)•没有冗余属性的超键2020/2/239引用完整性约束引用完整性约束(referentialintegrityconstraint)指要在两不同关系之间指定,用来维护两关系元组间一致性的一种关系模型约束。该约束指定:当某关系元组引用另一个关系中元组时,只能引用已经存在的元组。外键(ForeignKey,FK)定义外键条件指定了两个关系模式R1和R2之间的一个引用完整性约束,或简称为外键约束。2020/2/2310约束指定--应用实例2020/2/23112.2关系操作与关系查询语言2.2.1关系代数2.2.2关系演算本章查询表达说明用例模式(“水手值勤服务”)Sailors(sid:integer,sname:string,rating:integer,age:integer);Boats(bid:integer,bname:string,color:string);Reserves(sid:integer,bid:integer,day:date);关系查询语言的两种属性引用方法:(1)属性名(2)属性在关系模式中的位置或顺序号关系模型中除了引入描述DB结构和约束的概念外,还引用了一组可操纵DB的操作----通过基于模型的专门语言,来表达模型操作。本节介绍:基于关系模型的两种模型语言--关系代数/关系演算。下节介绍:以这两种形式语言为基础的关系模型标准化语言(SQL)2020/2/2312“水手值勤服务”的一个简单模式实例2020/2/23132.2.1关系代数关系代数由一组操作符构成。每个操作符接受1或2个关系实例作为参数,返回一个关系实例作为结果。以下三个方面因素,可突显关系代数在RDBMS中的重要性和地位:它为关系模型操作提供了一个形式化的基础;是RDBMS查询实现和优化的基础;SQL结合并保留了很多关系代数的基本概念关系代数操作符的两种主要类型:基于集合论的操作,包括并、交、差和叉积等,这些操作的适用性源于“关系”本质上是元组集合;另一类操作则是专门为RDBMS开发的操作,包括选择、投影、连接,以及为聚合运算引入的相关操作。2020/2/23141.并、交、差运算并、交、差这三个运算操作都可对应到集合论操作,它们都属于二元操作符,要求有两个被操作对象,且要求这两个关系是相容的。并(R∪S):R∪S={t|t∊Rt∊S}交(R∩S):R∩S={t|t∊R∧t∊S}差(R-S):R-S={t|t∊R∧t∉S}2020/2/23152.叉积操作叉积,也称为笛卡儿积(cartesianproduct),操作符用表示,属于二元关系操作符,代数表达式为RS。2020/2/23163.选择操作与投影操作选择操作符表示为σc(R),其中,c为条件表达式。投影操作符表示为πL(R),其中,L为投影输出的属性子集列表A1’,…,Am’。2020/2/23174.重命名操作在许多场合,输出列名可以直接使用输入关系的属性名。但当输出列为表达式,或二元操作两个输入关系中含同名属性,或希望改善原属性名的可读性等,都需要重命名机制。关系代数中引入了一个重命名操作符(ρ),其代数表达形式为:ρ(R’(A1A1’,…,AiAi’,…),E)例2.6基于图2.4(d)的S1×R1,写出表达式ρ(R’(1sid1,5sid2),S1×R1)返回的R’模式。2020/2/23185.连接操作连接操作(⋈c),用来合并两个关系中的信息――将两关系中相关的“元组对”合并成一个元组输出。虽然在概念上,R⋈cS=L(σc(RS));但按这种方法实现连接操作的效率很低。在RDBMS中,连接操作通常以独立于叉积结果的方法实现。2020/2/23196.消除重复与排序运算消除重复运算的表达式为(RB),其操作对象可以是包型关系或集合型关系。消除重复是一个代价较大的操作,故在很多实际系统中,默认情况下的投影输出都不自动消除重复。排序操作的代数符号表达式为TL(R)。该操作用来将关系R的所有元组,按L所指定方式排序输出。L是一个属性表达列表,具有形如A1[asc|desc],A2[asc|desc],…的形式2020/2/23207.分组与聚合操作分组(grouping)与聚合(aggregating)操作的代数表达式为γL(R),该操作将关系R的所有元组按L指定方式进行分组。L是一个列表表达式。聚合关系与原关系R一般具有不同的模式结构。聚合关系中的属性,必须或者是出现L中的属性,或是一个聚合函数表达式。很多DB书籍或文献中,都将aggregating运算译为聚集。本书中,考虑到已将clustering译为聚簇、聚集。为避免混淆,同时也考虑到合计汇总运算这个语义,故采用‘聚合’这个译法。2020/2/23212.2.2关系演算(relationalcalculus)关系演算为关系DB查询提供了一种高级描述性表示法。它是一种形式化语言,其基础是被称为谓词(predicate)演算的数理逻辑分支――一阶谓词逻辑(FirstOrderLogic,FOL)。在演算表达式中,不需给出如何应获取结果的操作次序指示信息,只描述了结果中应当包括的信息。关系演算表达式描述了一个新的关系,这个新关系以变量形式来指定,变量取值范围可是是新关系中的元组(元组演算),或是新关系中的属性域(域演算)。元组演算对商业化关系查询语言SQL发展有重要影响;域演算则是QBE(Query-By-Example语言)的基础。2020/2/2322元组关系演算(TupleRelationalCalculus,TRC)元组变量是取值范围限为特定关系元组的变量。TRC查询的基本表达形式{t|p(t)},•t代表一个元组变量,而p(t)则是t应当满足的逻辑公式。查询结果是能使逻辑公式p(t)为真值的所有元组t集合。构造TRC查询表达的核心任务是给出逻辑公式p(t),本质上TRC逻辑公式是FOL公式的一个子集。应用举例要检索职级超过7的水手,•TRC表达为:{S|S∊Sailors∧S.rating7}2020/2/2323TRC原子公式,是下面形式之一:R∊Rel是最基本原子公式,表达元组变量R的取值。R.aopS.b或R.aopconst或constopR.a是比较型原子公式,表达R在其指定属性上的取值限定。任何TRC公式可由如下任一方法递归地构造产生:任何一个原子公式。┐p(取反),p∧q(‘与’连接构造),p∨q(‘或’连接构造),p⇒q(蕴涵:若p为真,q必为真)。∃R(p(R)),R是元组变量。∀R(p(R)),R是元组变量。TRC查询的语法与语义令Rel是关系名;逻辑操作符op∊{,,=,≤,≥,≠};R和S是元组变量,a与b分别是R与S的一个属性;p和q是一个TRC公式。•该表达语义是:对p(R)中的每个自由变量(包括R),至少存在一个能使公式p(R)为真的元组赋值。(绑定到变量R的存在量词)通常一个公式p(R)中会包含一个R∊Rel条件,以及一些关于R的量词限定表达。为简洁起见,常用∃R∊Rel(p(R))替代∃R(R∊Rel∧p(R))常用∀R∊Rel(p(R))替代∀R(R∊Rel⇒p(R)2020/2/2324域关系演算(DomainRelationalCalculus,DRC)DRC公式可按类似TRC公式的方式进行形式定义。这两类公式定义的主要差别是变量的取值范围。令X和Y是域变量。DRC原子公式是下面形式之一:x1,x2,…,xn∊RelRel是含有n个属性的关系名,每个xi,1≤i≤n,或是一个变量,或是一个常数。XopY或Xopconstant或constantopX任何DRC公式可由如下任一方法递归地构造产生。任何一个DRC原子公式;┐p(取反),p∧q(与连接构造),p∨q(或连接构造),p⇒q(蕴涵:若p为真,q必为真)∃X(p(X)),X是x1,x2,…,xn。∀X(p(X)),X是x1,x2,…,xn。2020/2/2325DRC查询示例(Q3)查询被指派到103号船值勤的水手名{N|∃I,T,A(I,N,T,A∊Sailors∧∃Ir,Br,D(Ir,Br,D∊Reserves∧Ir=I∧Br=103))}若引入简记法,也可改写为:{N|∃I,T,A(I,N,T,A∊Sailors∧∃Ir,Br,D∊Reserves(Ir=I∧Br=103))}该式还可用如下更简洁的写法:•{N|∃I,T,A(I,N,T,A∊Sailors∧∃D(I,103,D∊Reserves))}(Q4)查询曾在一个红船上值勤过的所有水手名字{N|∃I,T,A(I,N,T,A∊Sailors∧∃I,Br,D∊Reserves∧∃Br,Bn,’red’∊Boats}2020/2/23262.3SQL语言2.3.1用DDL定义数据库2.3.2用DML操纵数据库2.3.3视图2020/2/2327SQL语言简介SQL是结构化查询语言(StructuredQueryLanguage)的缩写。SQL发展简史最初由IBM研究院设计实现,并作为IBM早期数据库系统SYSTEMR的接口

1 / 53
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功