中国科学院大学数据库新技术期末复习(提纲+答案整理)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第1章关系数据库模型和关系运算要求掌握的基本概念和理论1.与网状和层次数据库相比,关系数据库有哪些优点?(1)数据结构单一,不管实体还是实体之间的联系都用关系来表示;(2)建立在严格的数学概念基础上,具有坚实的理论基础;(3)将数据定义和数据操纵统一在一种语言中,使用方便,易学易用。2.试述关系模型的完整性规则答:关系模型的完整性规则包括:实体完整性、参照完整性、用户定义的完整性。实体完整性规则是指若属性A是基本关系R的主属性,则属性A不能取空值。参照完整性:若属性(或属性组)F是基本关系R的外键,它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中每个元组在F上的值必须为:或者取空值(F的每个属性值均为空值);或者等于S中某个元组的主码值。用户定义的完整性指数据间应满足的语义约束关系,由用户定义,由系统检查。3.试述等值连接与自然连接的区别和联系答:连接运算符是“=”的连接运算称为等值连接。它是从关系R与S的广义笛卡尔积中选取A,B属性值相等的那些元组自然连接是一种特殊的等值连接,它要求两个关系中进行比较的分量必须是相同的属性组,并且在结果中把重复的属性列去掉。4.函数依赖、部分依赖、完全依赖、传递依赖、平凡依赖函数依赖:对X中的任一值x,ΠY(σX=x(r))的值仅有一个元组,则有X→Y。设FDX→Y,如果对任意的XX,X→Y都不成立,则称X→Y是完全函数依赖;若对X的真子集X有XX,而X→Y成立,则称FDX→Y是部分函数依赖。设关系模式R,X、Y、Z是R的属性子集,若FDX→Y,Y!→X,Y→Z,则有FDX→Z,称FDX→Z为传递函数依赖。设FDX→Y,如果YX,则称FDX→Y为非平凡的函数依赖;否则,若YX,称FDX→Y为平凡的函数依赖。5.函数依赖公理和推论Armstrong公理:设r是R(U)上的一个关系,X、Y、Z、WU。1.自反律:若YXU,则X→Y;2.增广律:若X→Y且ZU,则XZ→YZ;3.传递律:若X→Y,Y→Z,则X→Z。推论1:若X→Y,X→Z,则X→YZ推论2:若X→Y且ZY,则X→Z推论3:若X→Y,YZ→W,则XZ→W。6.函数依赖的覆盖和等价对于在模式R上的函数依赖集F和G,如果对G中的每一个函数依赖X→Y,都有F|=X→Y,称F是G的一个覆盖。记为:F|=G。在模式R上的函数依赖集F和G,若F+=G+,则称F和G等价,记作FG。如果函数依赖集F不存在真子集F使FF成立,则F是无冗余的。如果F是G的一个覆盖且F是无冗余的,则F是G的一个无冗余覆盖。如果函数依赖集F是G的一个覆盖,F中的每个FD都具有X→A形式而且F是左化简的和无冗余的,称F是G的一个规范覆盖。要求掌握的基本算法1.求关系的并、差、交、连接、选择、投影、除运算。除法:2.关系运算在查询中的应用。3.属性集X关于F的闭包X+的基本算法4.函数依赖集的成员测试算法(MEMBER(F,X→Y)).5.检验分解是无损算法6.检验分解算法是否保持函数依赖7.生成3NF的分解算法8.规范化关系模式为BCNF算法练习1.R(A,B,C),其函数依赖集为F={B→C,AC→B};该关系模式是否第2范式,并说明理由练习2:R(A,B,C,D),其函数依赖集为F={A→C,AD→B};该关系模式是否第2范式,并说明理由练习3.R(A,B,C),其函数依赖集为F={B→C,AC→B};该关系模式是否第3范式,并说明理由练习4:R(A,B,C,D),其函数依赖集为F={AB→C,C→D};该关系模式是否第3范式,并说明理由练习5:假定一门课只有一个系来开,找出选课关系elective的键和和基本函数依赖,它是否是第2范式?练习6:假定一门课只有一个系开,一个系只有一个地址?该关系中有哪些函数依赖?该关系的键是什么?是几范式?1.是第三范式,不是BCNF。主键为AC,非主属性为B,B完全依赖于AC,而C传递依赖AC。2.不是主键为AD,非主属性为B和C,对于C,C部分依赖于AD(A-C)3.是3NF.主键为AC,非主属性为B,不存在传递依赖4.不是3NF,是2NF.主键为AB,非主属性为CD,D传递依赖与AB??5.SNAME、COURSE→DEPTCOURSE→DEPT不是2NF,为1NF。主键为SNAMECOURSE,非主属性为DEPT,DEPT部分依赖于COURSE6.COURSE→DEPT,DEPT→BUILDING为第二范式,主键为COURSE,非主属性为DEPT,BUILDING,存在非主属性的传递依赖,不符合3NF。7.指出下列关系模式是第几范式,并说明理由(1)R(A,B,C),其函数依赖集为F={B→C,AC→B};(2)R(A,B,C),其函数依赖集为F={AB→C};(3)R(A,B,C),其函数依赖集为F={A→B,A→C};(4)R(A,B,C,D),其函数依赖集为F={A→C,AD→B};(5)R(A,B,C),其函数依赖集为F={B→C,B→A,A→BC}7.(1)第三范式,存在主属性的传递依赖,主属性为AC,非主属性B,AC→B→C,不满足BCNF。而满足3NF,即不存在非主属性的传递依赖。(2)BCNF范式,主属性AB,非主属性C,不存在传递依赖和部分依赖,故为BCNF范式。(3)BCNF范式,主属性A,非主属性BC,不存在传递依赖和部分依赖,故为BCNF范式。(4)1NF,主属性AD,非主属性BC,存在非主属性的部分依赖A→C,则为第一范式。(5)BCNF范式,主键A(或B),非主属性为BC(或AC),不存在传递依赖和部分依赖,故为BCNF范式。这里没有传递依赖,虽然A→B→C,但是由于B→A,这就违背了传递依赖的条件。第2章关系数据库设计和数据库管理系统要求掌握的基本概念和理论1.试述数据库设计过程,及每个阶段的任务。答:各阶段的设计要点如下:(l)需求分析:准确了解与分析用户需求(包括数据与处理)。(2)概念结构设计:通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型。(3)逻辑结构设计:将概念结构转换为某个DBMS所支持的数据模型,并对其进行优化。(4)数据库物理设计:为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)。(5)数据库实施:设计人员运用DBMS提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果建立数据库,编制与调试应用程序,组织数据入库,并进行试运行。(6)数据库运行和维护:在数据库系统运行过程中对其进行评价、调整与修改。这是一个完整的实际数据库及其应用系统的设计过程。不仅包括设计数据库本身,还包括数据库的实施、运行和维护。设计一个完善的数据库应用系统往往是上述六个阶段的不断反复。2.什么是数据库的逻辑结构设计?试述其设计步骤。答:数据库的逻辑结构设计就是把概念结构设计阶段设计好的基本E一R图转换为与选用的DBMS产品所支持的数据模型相符合的逻辑结构。设计步骤为(l)将概念结构转换为一般的关系、网状、层次模型;(2)将转换来的关系、网状、层次模型向特定DBMS支持下的数据模型转换;(3)对数据模型进行优化。3.试述数据库物理设计的内容和步骤。答:数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖于给定的DBMS。为一个给定的逻辑数据模型选取一个最适合应用要求的物理结构,就是数据库的物理设计的主要内容。数据库的物理设计步骤通常分为两步:(l)确定数据库的物理结构,在关系数据库中主要指存取方法和存储结构;(2)对物理结构进行评价,评价的重点是时间效率和空间效率。4.数据库管理系统的主要功能有哪些?(1)数据库定义(2)数据操纵(3)数据库控制(4)数据库维护5.数据库管理系统有哪几部分组成?(1)数据和元数据存储(2)存储管理器(3)查询处理器(4)事务管理器(5)输入模块---模式修改、查询和修改6.开发一个数据库管理系统的主要技术难点在哪里?对中国如何尽快开发自己的数据库管理系统,给出你的建议。1、综合统一SQL语言将数据定义语言DDL、数据操纵语言DML、数据控制语言DCL的功能集于一体,语言风格统一,可以独立完成数据库生命周期中的全部活动.高度非过程化2.对用户的透明性:用SQL语言进行数据操作时,只要提出“做什么”,而无需指明“怎么做”。3、面向集合的操作方式SQL语言操作的对象和操作的结果都用关系表示。4、一种语法,两种使用方式SQL语言既是自含式语言,又是嵌入式语言。5、语言简捷,易学易用完成核心功能只用9个动词,SQL语言接近英语句子。6、支持三级模式结构数据库设计要求:给出E---R图,将其转换为关系模型、指出转换结果中每个关系的候选键。第3-4章分布式数据库和面向对象数据库要求掌握的基本概念和理论1.分布式数据库的有哪些特点?特点:1.数据是分布的2.数据是逻辑相关的3.结点自治性2.分布式数据库管理系统有哪几部分组成?组成:局部数据库管理系统LDBMS;全局数据库管理系统GDBMS;全局数据字典GDD;网络通信管理CM3.分布式数据库系统能够提供哪些分布透明性?不同透明性对应用程序的编程有什么影响?分片透明性:关系如何分片对用户是透明的,指用户不必关心数据是如何分片的。其应用程序的编写与集中式数据库相同。位置透明性:用户需知道数据在哪个片段,而不必知道所操作的数据放在哪个节点。数据在结点间的转移不会影响应用程序。局部映象透明性:该透明性提供数据到局部数据库的映象。在编程时不但需要了解全局关系的分片模式,还需要了解各片段存放的站点。4.半连接在分布式查询优化中的作用?会计算简单的半连接。在分布式数据库的查询中半连接的作用:减少传送的数据量,提高查询效率。半连接把笛卡尔乘积和其后的选择运算合并成为连接运算,以避免扫描笛卡尔乘积的中间结果。535862861532)(CBASR386953653)(DCBRS386614695653)(DCBTS983966)(IEDST5.试述事务的概念及事务的4个特性。事务是用户定义的一个数据库操作序列,这些操作要么全做要么全不做,是一个不可分割的工作单位。事务具有4个特性:原子性(Atomicity)、一致性(consistency)、隔离性(Isolation)和持续性(Durability)。这4个特性也简称为ACID特性。原子性:事务是数据库的逻辑工作单位,事务中包括的诸操作要么都做,要么都不做。一致性:事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。隔离性:一个事务的执行不能被其他事务干扰。即一个事务内部的操作及使用的数据对其他并发事务是隔离的,并发执行的各个事务之间不能互相干扰。持续性也称永久性(Perfnanence),指一个事务一旦提交,它对数据库中数据的改变就应该是永久性的。接下来的其他操作或故障不应该对其执行结果有任何影响。6.在数据库管理系统中为什么要采用并发控制技术?常用并发控制技术有哪些?答:数据库是共享资源,通常有许多个事务同时在运行。当多个事务并发地存取数据库时就会产生同时读取和/或修改同一数据的情况。若对并发操作不加控制就可能会存取和存储不正确的数据,破坏数据库的一致性。所以数据库管理系统必须提供并发控制机制。封锁技术使一组事务的并发执行(即交叉执行)同步,使它等价于这些事务的某一种串行操作;时戳技术也使一组事务的交叉执行同步,但它等价于这些事务的一个特定的串行操作,即由时戳的时序所确定的一个串行操作执行。7.什么是两段封锁协议?两段锁协议是指所有事务必须分两个阶段对数据项加锁和解锁。在对任何数据进行读、写操作之前,首先要申请并获得对该数据的封锁;在释放一个封锁之后,事务不再申请和获得任何其他封锁。“两段”的含义是,事务分为两个阶段:第一阶段是获得封锁,也称为扩展阶段。在这阶段,事务可以申请获得任何数据项上的任何类型的锁,但是不能释放任何锁。第二阶段是释放封锁,也称为收缩阶段。在这阶段,事务释放已经获得的锁,但是不能再申请任何锁。8.

1 / 14
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功