第一二章数据:是指对客观事物的特征进行的一种抽象化、符号化表示。数据可以是具体的数字,也可以是文字、图形、图像、声音等。信息:是指有一定含义的、经过加工的、对决策有价值的数据。数据是信息的符号表示,或称作载体;信息是数据的内涵,是数据的语义解释。数据库:是一组存储在计算机硬件设备上逻辑上相关数据集合。这些数据主要用来描述一个或多个组织的相关活动。数据库管理系统:是位于用户与操作系统之间的一层数据管理软件,其作用是科学、有效地组织和存储数据,高效地获取和维护数据。数据库管理系统的主要功能包括:数据定义功能数据操纵功能数据控制功能数据库的建立和维护功能数据库系统:是指在计算机系统中引入数据库后的系统构成,一般由硬件系统、数据库集合、数据库管理系统及相关软件、数据库管理员和用户构成。数据模型:通常是由数据结构、数据操作和完整性约束三个要素组成。模式:是数据库中全体数据的逻辑结构和特征的描述。实例:模式的一个具体值称为模式的一个实例。模式是相对稳定的,它反映的是数据的结构及其联系;而实例是相对变动的,反映的是数据库某一时刻的状态。外模式:也称用户模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。外模式通常是逻辑模式的子集。一个数据库可以有多个外模式。逻辑模式:是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。它是数据库系统模式结构的中间层,与数据的物理存储细节和硬件环境无关,也与具体的应用程序无关。一个数据库只有一个逻辑模式。数据的逻辑独立性:当逻辑模式改变时,则数据库管理员对各个外模式/逻辑模式的映象作相应改变,可以使外模式保持不变,由于应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。数据的物理独立性:当数据库的存储结构发生改变时,由数据库管理员对逻辑模式/内模式映象作相应改变,可以使逻辑模式保持不变,从而应用程序也不必改变,保证了数据与程序的物理独立性,简称数据的物理独立性。关系模型:由关系数据结构、关系操作集合和关系完整性约束三部分组成。外键:如果一个关系中的属性或属性组并非该关系的关键字,但却是另外一个关系的关键字,则称其为该关系的外关键字,又称为外键。关系操作语言:代数语言,演算语言,具有关系代数和关系演算双重特点的语言。关系代数语言:用对关系的运算来表达查询要求的方式。关系演算语言:用谓词来表达查询要求的方式。关系演算又可按谓词变量的基本对是元组变量还是域变量分为元组关系演算和域关系演算。具有关系代数和关系演算双重特点的语言:如SQL语言是集查询、定义、操纵、和控制于一体的关系数据语言,它充分体现了关系数据语言的特点和优点,是关系数据库的标准语言。关系操作语言的特点:语言具有完备的表达能力;非过程化的集合操作语言;功能强,能够嵌入高级语言中使用。关系完整性约束:实体完整性参照完整性用户定义完整性关系模型的特点:关系必须规范化;模型概念单一;操作集合化。关系的概念:笛卡尔积D1×D2×…×Dn的子集称作在域D1×D2×…×Dn上的关系,表示为:R(d1,d2,…dn)这里R表示关系的名字,n是关系的度,关系中的元素是元组。关系是笛卡尔积的有限子集,所以关系也是一个二维表,表的每行对应一个元组,表的列对应一个域。关系的三种类型:基本表,查询表,视图表。基本表:是实际存在的表,它是实际存储数据的逻辑表示。查询表:是查询结果对应的表。视图表:是基本表或其他视图表导出的表,是虚表,不对应实际存储的数据。关系运算:并,交,差,广义笛卡尔积,选择,投影,连接,除。传统的集合运算是两个关系的集合运算,包括并、交、差、广义笛卡尔积四种运算。(注:分清楚并,交,差,广义笛卡尔积)专门的关系运算:仅依靠传统的集合运算,还不能灵活地实现多样的查询操作,一个关系数据库管理系统还应具有一些专门的关系运算,包括选择(SELECT)、投影(PROJECT)与连接(JOIN)、除(division)等操作。第五章1、数据库设计:数据库设计是指对于给定的软硬件环境,针对现实问题,设计一个较优的数据模型,依据此模型建立数据库中表的结构并以此为基础构建数据库信息管理系统。2、需求分析:简单地说就是分析用户的要求。需求分析的重点是调查、收集和分析用户在数据管理中的信息要求、处理要求、安全性与完整性要求。(1)信息要求:指用户需要从数据库中获得信息的内容与性质。由用户的信息要求可以导出数据要求,即在数据库中需要存储哪些数据。(2)处理要求:指用户要求完成什么处理功能,对处理的响应时间有什么要求,处理方式是批处理还是联机处理。(3)安全性与完整性要求3、数据字典:对数据库设计来讲,数据字典是进行数据收集和数据分析所获得的主要结果,是各类数据描述的集合。4、概念结构设计:将需求分析得到的用户需求抽象为概念模型的过程就是概念结构设计。5、实体:实体是现实世界中各种事物的抽象。实体可以是物理存在的事物,如人、汽车;也可以是抽象的概念,如学校、课程等6、属性:每一个实体都有一组特征或性质,称为实体的属性。(1)基本属性和复合属性:基本属性不可再分,而复合属性可以进一步分解为几个子属性。(2)单值属性和多值属性:对于同一个实体只能取一个值的属性是单值属性,可能取多个值的属性是多值属性。(3)实体属性之间可能存在某种关系。例如:人的年龄属性和生日属性就具有一种相互依赖关系,这样的属性称之为导出属性。7、实体型:实体型是一个具有相同属性的实体的集合,由一个实体型名字和一组属性来定义。8、简单键和复合键:由一个属性组成的键称为简单键,由多个属性组成的键称为复合键。9、实体关联约束:设R中有关联实体型E1、E2,若E1中的实体必须出现在R的实例中,那么我们认为在E1上存在一个与联系R有关的实体关联约束,我们称这类约束做全域关联约束。如果E1中的实体不必出现在R的实例中,那么我们称在E1上存在一个与联系R无关的实体关联约束,我们称这类约束为部分关联约束。10、弱实体:实际领域中经常存在一些实体型,没有自己的键,即不能唯一地表示自己。11、数据模型的优化:数据库逻辑设计的结果不是唯一的。为了进一步提高数据库应用系统的性能,通常以规范化理论为指导,还应该适当地修改、调整数据模型的结构,这就是数据模型的优化。12、物理结构设计:数据库最终是要存储在物理设备上的。为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构(存储结构与存取方法)的过程,就是数据库的物理结构设计。13、数据库的重构造:当数据库应用环境发生变化,会导致实体及实体间的联系也发生相应的变化,使原有的数据库设计不能很好地满足新的需求,从而不得不适当调整数据库的模式和内模式,这就是数据库的重构造。第六章1、数据库的安全性:数据库的安全性主要是指保护数据库,防止由于非法使用数据库造成数据泄露、更改或破坏。2、自主存取控制:用户对于不同的数据对象有不同的存取权限,不同的用户对同一对象也有不同的权限,而且用户还可将其拥有的存取权限转授给其他用户。因此自主存取控制非常灵活。3、强制存取控制:每一个数据对象被标以一定的密级,每一个用户也被授予某一个级别的许可证。对于任意一个对象,只有具有合法许可证的用户才可以存取。强制存取控制因此相对比较严格。4、MAC:强制存取控制是指系统为保证更高程度的安全性,所采取的强制存取检查手段。它不是用户能直接感知或进行控制的。5、审计:审计是一种事后监视的措施,即跟踪数据库的访问活动,以发现数据库的非法访问,达到安全防范的目的。6、数据库的完整性:数据库的完整性是指数据的正确性、一致性和相容性。7、静态列级约束:静态列级约束是对一个列的取值域的说明,这是最常见最简单同时也最容易实现的一类完整性约束。动态列级约束:动态列级约束是修改列定义或列值时应满足的约束条件。8、静态元组约束:一个元组是由若干个列值组成的,静态元组约束就是规定组成一个元组的各个列之间的约束关系。动态元组约束:动态元组约束是指修改某个元组的值时需要参照其旧值,并且新旧值之间需要满足某种约束条件。9、静态关系约束:完整性约束。动态关系约束:动态关系约束是加在关系变化前后状态上的限制条件。第七章事务:所谓事务是用户定义的一个操作序列,这些操作要么全做要么全不做,是一个不可分割的工作单位。数据库的恢复:数据库管理系统(恢复子系统)必须具有把数据库从错误状态恢复到某一已知的正确状态(亦称为一致状态或完整状态)的功能,这就是数据库的恢复。事务撤消(UNDO):恢复程序要在不影响其它事务运行的情况下,强行回滚(ROLLBACK)故障的事务,即撤消该事务已经作出的任何对数据库的修改,使得该事务好象根本没有启动一样。这类恢复操作称为事务撤消(UNDO)。系统故障:是指造成系统停止运转的任何事件,使得系统要重新启动。转储:DBA定期地将整个数据库复制到磁带或另一个磁盘上保存起来的过程。这些备用的数据文本称为后备副本或后援副本。静态转储:是在系统中无运行事务时进行的转储操作。即转储操作开始的时刻,数据库处于一致性状态,而转储期间不允许(或不存在)对数据库的任何存取、修改活动。动态转储:是指转储期间允许对数据库进行存取或修改。即转储和用户事务可以并发执行。日志文件:是用来记录事务对数据库的更新操作的文件。可以用来进行事务故障恢复和系统故障恢复,并协助后备副本进行介质故障恢复。第八章:单用户数据库系统:在任何一个时刻只允许一个用户使用的数据库系统称为单用户数据库系统。一般限于微型计算机系统。多用户系数据库系统:允许多个用户同时使用的数据库系统称为多用户系数据库系统。大多数用户数据库系统都是多用户数据库系统。串行访问:如果事务顺序执行,即每个时刻只有一个事务运行,其他事物必须等到这个事务结束以后方能运行,这种执行方式为串行访问。并发访问:如果DBMS可以同时接纳多个事务,事务可以在时间上重叠执行,则称这种执行方式为并发访问。交叉并发方式:在单处理机系统中,同一时间只能有一个事务占用CPU,各个事务交叉地使用CPU,这种并发方式称为交叉并发方式。同时并发方式:在多处理机系统中,每个处理机可以运行一个事务,多个处理机可以同时运行多个事务,实现多个事务真正的并行运行,这种方式称为同时并发方式。丢失修改:两个事务T1和T2读入同一数据并修改,T2提交的结果破坏了T1提交的结果,导致T1的修改被丢失。不可重复读:是指事务T1读取数据后,事务T2执行更新操作,使T1无法再现前一次读取结果。读“脏”数据:是指事务T1修改某一数据,并将其写回磁盘,事务T2读取同一数据后,T1由于某种原因被撤消,这时T1已修改过的数据恢复原值,T2读到的数据就与数据库中的数据不一致,则T2读到的数据就为“脏”数据即不正确的数据。封锁:封锁就是事务T在对某个数据对象(例如表、记录等)操作之前,先向系统发出请求,对其加锁。加锁后事务T就对该数据对象有了一定的控制,在事务T释放它的锁之前,其它的事务不能更新此数据对象。排它锁:排它锁又称为写锁。若事务T对数据对象A加上X锁,则只允许T读取和修改A,其它任何事务都不能再对A加任何类型的锁,直到T释放A上的锁。这就保证了其它事务在T释放A上的锁之前不能再修改A。共享锁:共享锁又称为读锁。若事务T对数据对象A加上S锁,则事务T可以读A,但不能修改A,其它事务只能再对A加S锁,而不能加X锁,直到T释放A上的S锁。这就保证了其它事务可以读A,但在T释放A上的S锁之前不能对A做任何修改。一级封锁协议:事务T在修改数据R之前必须先对其加X锁,直到事务结束才释放。事务结束包括正常结束和非正常结束。一级封锁协议可防止丢失修改,并保证事务T是可恢复的。二级封锁协议:一级封锁协议加上事务T在读取数据R之前必须先对其加S锁,读完后即可释放S锁。二级封锁协议除防止了丢失修改,还可进一步防止读“脏”数据。三级封锁协议:一级封锁协议加上事务T在读取数据R之前必须先对其加S锁,直到事务结束才释放。三级封锁协议除防止了丢