1关系数据库的发展历程u1962年,CODASYL“信息代数”。u1968年,DavidChild在IBM7090机上实现的集合论数据结构。u1970年,E.F.Codd发表多篇论文,严格地、系统地提出关系模型。u20世纪70年代末,IBM的SanJose实验室研制出关系数据库实验模型SystemR(原型)u1981年,IBM研制出SQL/DS。2关系数据库的发展历程•典型实验系统–SystemR--SQL/DS–UniversityINGRES--INGRES•典型商用系统–ORACLE–SYBASE–DB2–SQLServer–INFORMIX–INGRES3关系数据库简介•提出关系模型的是美国IBM公司的E.F.Codd–1970年提出关系数据模型E.F.Codd,“ARelationalModelofDataforLargeSharedDataBanks”,《CommunicationoftheACM》,1970–之后,提出了关系代数和关系演算的概念–1972年提出了关系的第一、第二、第三范式–1974年提出了关系的BC范式4集合论关系代数(信息代数)用数学的方法来处理数据数学方法集合论关系代数关系数据库的数学理论基础5第二章关系数据库2.1关系数据结构及形式化定义2.2关系操作2.3关系的完整性2.4关系代数2.5关系演算2.6小结62.1关系数据结构及形式化定义•2.1.1关系•2.1.2关系模式•2.1.3关系数据库72.1.1关系•单一的数据结构----关系现实世界的实体以及实体间的各种联系均用关系来表示•逻辑结构----二维表从用户角度,关系模型中数据的逻辑结构是一张二维表•建立在集合代数的基础上8关系(续)⒈域(Domain)2.笛卡尔积(CartesianProduct)3.关系(Relation)9⒈域(Domain)•域是一组具有相同数据类型的值的集合。例:整数实数介于某个取值范围的整数长度指定长度的字符串集合{‘男’,‘女’}……………..10⒈域(Domain)--例子例给出三个域:D1=SUPERVISOR={张清玫,刘逸}D2=SPECIALITY={计算机专业,信息专业}D3=POSTGRADUATE={李勇,刘晨,王敏}112.笛卡尔积(CartesianProduct)•笛卡尔积–给定一组域D1,D2,…,Dn,这些域中可以有相同的。D1,D2,…,Dn的笛卡尔积为:D1×D2×…×Dn={(d1,d2,…,dn)|diDi,i=1,2,…,n}–所有域的所有取值的一个组合–不能重复12笛卡尔积例1表2.1D1,D2,D3的笛卡尔积SUPERVISORSPECIALITYPOSTGRADUATE张清玫计算机专业李勇张清玫计算机专业刘晨张清玫计算机专业王敏张清玫信息专业李勇张清玫信息专业刘晨张清玫信息专业王敏刘逸计算机专业李勇刘逸计算机专业刘晨刘逸计算机专业王敏刘逸信息专业李勇刘逸信息专业刘晨刘逸信息专业王敏13–例2:教师关系中:姓名D1={李力,王平,刘伟}、性别D2={男,女}两个域的笛卡尔积为:–D1×D2={(李力,男),(李力,女),(王平,男),(王平,女),(刘伟,男),(刘伟,女)}–其中:•李力、王平、刘伟、男、女都是分量•(李力,男),(李力,女)等是元组•其基数M=m1×m2=3*2=6•元组的个数为6–上述的6个元组可表示成右表。姓名性别李力男李力女王平男王平女刘伟男刘伟女表2.1D1和D2的笛卡尔积由上例可以看出,笛卡尔积实际是一个二维表,表的框架由域构成,表的任意一行就是一个元组,表中的每一列来自同一域(例如:第一个分量来自D1,第二个分量来自D2)。笛卡尔积例214笛卡尔积(续)•元组(Tuple)–笛卡尔积中每一个元素(d1,d2,…,dn)叫作一个n元组(n-tuple)或简称元组(Tuple)–(张清玫,计算机专业,李勇)、(张清玫,计算机专业,刘晨)等都是元组•分量(Component)–笛卡尔积元素(d1,d2,…,dn)中的每一个值di叫作一个分量–张清玫、计算机专业、李勇、刘晨等都是分量15笛卡尔积(续)•基数(Cardinalnumber)–若Di(i=1,2,…,n)为有限集,其基数为mi(i=1,2,…,n),则D1×D2×…×Dn的基数M为:•笛卡尔积的表示方法–笛卡尔积可表示为一个二维表–表中的每行对应一个元组,表中的每列对应一个域mMin1i基数:2×2×3=12,即D1×D2×D3共有2×2×3=12个元组163.关系(Relation)1)关系D1×D2×…×Dn的子集叫作在域D1,D2,…,Dn上的关系,表示为R(D1,D2,…,Dn)R:关系名n:关系的目或度(Degree)17例1:关系是笛卡尔积的有效组合•D1,D2,…,Dn的笛卡尔积的某个子集才有实际含义例:表2.1的笛卡尔积没有实际意义,取出有实际意义的元组来构造关系:SAP(SUPERVISOR,SPECIALITY,POSTGRADUATE)假设:导师与专业:1:n,导师与研究生:1:n,主码为POSTGRADUATE(假设研究生不会重名)。SAP关系可以包含三个元组{(张清玫,计算机专业,李勇),(张清玫,计算机专业,刘晨),(刘逸,信息专业,王敏)}18例2:关系是笛卡尔积的有效组合姓名性别李力男王平女刘伟男姓名性别李力男李力女王平男王平女刘伟男刘伟女D1={李力,王平,刘伟}、性别D2={男,女}19若有一个家庭成员集合:父亲(王兵,李平),母亲(丁梅,吴芳),孩子(王一,李一,李二)。关系模式为R(父亲,母亲,孩子)笛卡尔积:2×2×3=12个元组。父亲母亲孩子王兵丁梅王一李平吴芳李一李平吴芳李二例3:关系是笛卡尔积的有效组合20关系(续)2)元组关系中每个元素是关系中的元组,通常用t表示。3)单元关系与二元关系当n=1时,称该关系为单元关系(Unaryrelation)或一元关系当n=2时,称该关系为二元关系(Binaryrelation)21关系(续)4)关系的表示关系也是一个二维表,表的每行对应一个元组,表的每列对应一个域表2.2SAP关系SUPERVISORSPECIALITYPOSTGRADUATE张清玫信息专业李勇张清玫信息专业刘晨刘逸信息专业王敏22关系(续)-属性关系中不同列可以对应相同的域为了加以区分,必须对每列起一个名字,称为属性(Attribute)n目关系必有n个属性23关系(续)-码候选码(Candidatekey)–若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码。简单的情况:候选码只包含一个属性。–“学生关系”中的学号能唯一标识每一个学生,则属性学号是学生关系的候选键。如果姓名不重名,则姓名也是候选码。–在“选课关系”中,只有属性的组合“学号+课程号”才能唯一地区分每一条选课记录,则属性集“学号+课程号”是选课关系的候选码。全码(All-key)最极端的情况:关系模式的所有属性组是这个关系模式的候选码,称为全码(All-key)Paper(paperid,title)author(authorid,name)writes(authorid,paperid)cites(paperid,paperid)24又一个全码例子•假设有教师、课程、参考书关系TCB,分别有三个属性教师号(T)、课程号(C)和参考书号(B)。一个教师可以讲授多门课程;一门课程可有多个教师讲授,他们使用相同的一套参考书;同样每种参考书可以供多门课程使用。•在这种情况下,T,C,B三者之间是多对多关系,(T,C,B)三个属性的组合是关系TCB的候选码,称为全码,T,C,B都是主属性。25关系(续)主码若一个关系有多个候选码,则选定其中一个为主码(Primarykey)主属性候选码的诸属性称为主属性(Primeattribute)不包含在任何侯选码中的属性称为非主属性(Non-Primeattribute)或非码属性(Non-keyattribute)26关系(续)7)三类关系基本关系(基本表或基表)实际存在的表,是实际存储数据的逻辑表示特点:原子性、演绎性、稳定性、规范性、客观性查询表查询结果对应的表视图表由基本表或其他视图表导出的表,是虚表,不对应实际存储的数据27关系(续)8)基本关系的性质①列是同质的(Homogeneous)②不同的列可出自同一个域其中的每一列称为一个属性不同的属性要给予不同的属性名③列的顺序无所谓,,列的次序可以任意交换④任意两个元组的候选码不能相同⑤行的顺序无所谓,行的次序可以任意交换28基本关系的性质(续)⑥分量必须取原子值这是规范条件中最基本的一条表2.3非规范化关系292.1关系数据结构2.1.1关系2.1.2关系模式2.1.3关系数据库302.1.2关系模式1.什么是关系模式2.定义关系模式3.关系模式与关系311.什么是关系模式•关系模式(RelationSchema)是型•关系是值•关系模式是对关系的描述–元组集合的结构属性构成属性来自的域属性与域之间的映象关系–元组语义以及完整性约束条件–属性间的数据依赖关系集合322.定义关系模式关系模式可以形式化地表示为:R(U,D,DOM,F)R关系名U组成该关系的属性名集合D属性组U中属性所来自的域DOM属性向域的映象集合F属性间的数据依赖关系集合33定义关系模式(续)例:导师和研究生出自同一个域——人,取不同的属性名,并在模式中定义属性向域的映象,即说明它们分别出自哪个域:DOM(SUPERVISOR-PERSON)=DOM(POSTGRADUATE-PERSON)=PERSON34定义关系模式(续)关系模式通常可以简记为R(U)或R(A1,A2,…,An)R:关系名A1,A2,…,An:属性名注:域名及属性向域的映象常常直接说明为属性的类型、长度353.关系模式与关系•关系模式对关系的描述静态的、稳定的•关系关系模式在某一时刻的状态或内容动态的、随时间不断变化的•关系模式和关系往往统称为关系通过上下文加以区别362.1关系数据结构2.1.1关系2.1.2关系模式2.1.3关系数据库372.1.3关系数据库•关系数据库在一个给定的应用领域中,所有关系的集合构成一个关系数据库•关系数据库的型与值382.关系数据库的型与值•关系数据库的型:关系数据库模式对关系数据库的描述。•关系数据库模式包括若干域的定义在这些域上定义的若干关系模式•关系数据库的值:关系模式在某一时刻对应的关系的集合,简称为关系数据库39第二章关系数据库2.1关系模型概述2.2关系操作2.3关系的完整性2.4关系代数2.5关系演算2.6小结402.2.1基本关系操作•常用的关系操作–查询:选择、投影、连接、除、并、交、差–数据更新:插入、删除、修改–查询的表达能力是其中最主要的部分–选择、投影、并、差、笛卡尔积是5种基本操作•关系操作的特点–集合操作方式:操作的对象和结果都是集合,一次一集合(set-at-a-time)的方式412.2.2关系数据库语言的分类关系模型与其他模型相比,最有特色的是它的数据库语言。这种语言灵活方便、表达能力和功能都很强。目前关系数据库所使用的语言一般都具有定义、查询、更新和控制一体化的特点,而查询是最主要的部分。关系数据库的核心部分是查询,故又称为查询语言,而查询的条件要使用关系运算表达式来表示。因此,关系运算是设计关系数据语言的基础。按表达查询的方法不同,关系运算可分为关系代数和关系演算两大类。422.2.2关系数据库语言的分类•关系代数语言–用对关系的运算来表达查询要求–代表:ISBL(InformationSystemBaseLanguage)–由IBMUnitedKingdom研究中心研制,–用于PRTV(PeterleeRelationalTestVehicle)实验系统1关系代数语言例如ISBL2关系演算语言1.元组关系演算语言例如APLHA,QUE