事务:是构成单一逻辑工作单元的操作集合,要么完整地执行,要么完全不执行。DBS运行的最小逻辑工作单位是“事务”,所有对数据库的操作,都要以事务作为一个整体单位来执行或撤销。函数依赖(FD)的定义:设有关系模式R(U),X和Y是属性集U的子集,函数依赖是形成X→Y的一个命题,只要r是R的当前关系,对r中任意两个元组t和s,都有t[X]=s[X]蕴涵t[Y]=s[Y],那么称FDX→Y在关系模式R(U)中成立。数据库管理系统(DBMS):是位于用户与操作系统之间的一层数据管理软件,它为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。候选键:不含有多余属性的超键。(超键:在关系中能惟一标识元组的属性集称为关系模式的超键。)第三范式(3NF):如果关系模式R是2NF,且每个非主属性都不传递依赖于R的候选键,那么称R是第三范式(3NF)的模式。数据库(DB):是长期存储在计算机内、有组织的、统一管理的相关数据的集合数据库系统(DBS):是实现有组织地、动态地存储大量关联数据、方便多用户访问的计算机硬件、软件和数据资源组成的系统,即它是采用数据库技术的计算机系统。传递函数依赖:在关系模式R(U)中,设X,Y,Z是U的不同的属性子集,如果X确定Y、Y确定Z,且有X不包含Y,Y不确定X,(X∪Y)∩Z=空集合,则称Z传递函数依赖于X。关系:关系是一个属性数目相同的集合,关系中每一个属性值都是不可分解的,关系中部润徐出现重复的元组,关系是一个集合,不考虑元组间的顺序没有行序列序触发器:是一个特殊存储过程,是一个能由系统自动执行对数据库修改的语句有时也称为事件-条件动作规则笛卡儿积:设关系R和S的元数分别为r和s,R和S的笛卡儿积是一个(r+s)元的元组集合,每个元组的前r个分量(属性值)来自R的一个元组,后s个分量来自S的一个元组。若R有m个元组,S有n个元组,则R×S有m×n个元组。第一范式(1NF):如果关系模式R的每个关系r的属性值都是不可分的原子值,那么称R是第一范式的模式。满足1NF的关系称为规范化的关系,否则称为非规范化的关系。1NF是关系模式应具备的最起码的条件。第二范式(2NF):如果关系模式是1NF,且每个非主属性完全函数依赖于候选键,那么称R是第二范式(2NF)的模式。第三范式(3NF):如果关系模式R是2NF,且每个非主属性都不传递依赖于R的候选键,那么称R是第三范式(3NF)的模式。BC范式(BCNF):如果关系模式R是1NF,且每个属性都不传递依赖于R的候选键,那么称R是BCNF的模式。主键:用户选作元组标识的候选键。一般如不加说明,键是指主键。外键:如果模式R中属性集K是其他模式的主键,那么K在模式R中称为外键。主属性和非主属性:如果A是关系模式R的候选键中的属性,那么称A是R的主属性;否则称A是R的非主属性。文件系统和数据库系统之间的区别和联系。区别是:(1)文件系统用文件将数据长期保存在外存上,数据库系统用数据库统一存储数据;(2)文件系统中的程序和数据有一定的联系,数据库系统中的程序和数据分离;(3)文件系统用操作系统中的存取方法对数据进行管理,数据库系统用DBMS统一管理和控制数据(4)文件系统实现以文件为单位的数据共享,数据库系统实现以记录和字段为单位的数据共享。联系:(1)均为数据组织的管理技术;(2)均由数据管理软件管理数据,程序与数据之间用存取方法进行转换;(3)数据库系统是在文件系统的基础上发展而来等值连接与自然连接的区别与联系:1)等值连接中不要求相等属性值的属性名相同,而自然连接要求相等属性值的属性名必须相同,即两关系只有在同名属性才能进行自然连接。2)等值连接不将重复属性去掉,而自然连接去掉重复属性,也可以说,自然连接是去掉重复列的等值连接。笛卡尔积对两个关系R和S进行操作,产生的关系中元组个数为两个关系中元组个数之积。在数据库中为什么要并发控制?答:数据库是共享资源,通常有许多个事务同时在运行。当多个事务并发地存取数据库时就会产生同时读取和/或修改同一数据的情况。若对并发操作不加控制就可能会存取和存储不正确的数据,破坏数据库的一致性。所以数据库管理系统必须提供并发控制机制。简述数据库系统生存期数据库应用系统从开始规划、设计、实现、维护、到最后被新的系统取代而停止使用的整个期间称为数据库系统生存期SELECT语句中,何时使用分组字句,何时不必使用分组字句?查询的结果需要以组来统计的时候,例如:查询所有人的平均成绩,这个就不用,但如果有聚集函数就必须分组数据管理技术经历了人工管理、文件系统、数据库系统三个阶段。人工管理阶段特点:(1)数据不保存(2)应用程序管理数据,数据需要由应用程序自己管理,没有相应的软件系统负责数据的管理工作。(3)数据不共享:数据是面向应用的,一组数据只能对应一个程序。(4)数据不具有独立性数据的逻辑结构或物理结构发生变化后,必须对应用程序做相应的修改。文件系统阶段特点:(1)数据可长期保存(2)由文件系统管理数据相互独立的数据文件;“按文件名访问,按记录进行存取”的管理技术;记录内的结构性而整体无结构;存取方法转换使应用程序与数据之间有了一定的独立性;数据在存储上的改变不一定反映在程序上。(3)数据共享性差,冗余度大文件仍然是面向应用的;数据的冗余度大;数据的修改和维护困难(4)数据独立性差不容易扩充;数据与程序之间仍缺乏独立性;是一个无弹性的无结构的数据集合数据库系统的特点数据结构化,数据共享性高、冗余度低、易扩充,数据独立性高,数据由DBMS统一管理和控制。数据库系统(DBS):是实现有组织地、动态地存储大量关联数据、方便多用户访问的计算机硬件、软件和数据资源组成的系统,即它是采用数据库技术的计算机系统。关系代数的五个基本操作:并、差、笛卡儿积、投影和选择数据产生不一致现象原因及怎样处理产生数据不一致的原因主要有以下三种:一是由于数据冗余造成的;二是由于并发控制不当造成的;三是由于各种故障、错误造成的。第一种情况的出现往往是由于重复存放的数据未能进行一致性地更新造成的。第二种情况是并发操作带来的数据不一致性包括三类:丢失修改、不可重复读和读“脏”数据。避免不一致性的方法就是并发控制。最常用的并发控制技术是封锁技术。也可以用其他技术,例如在分布式数据库系统中可以采用时间戳方法来进行并发控制。第三种情况下,当由于某种原因(如硬件故障或软件故障)而造成数据丢失或数据损坏要根据各种数据库维护手段和数据恢复措施将数据库恢复到某个正确的、完整的、一致性的状态下。需求分析的工作主要由下面四步组成:分析用户活动,产生业务流程图;确定系统范围,产生系统关联图;分析用户活动涉及的数据,产生数据流图;分析系统数据,产生数据字典事务的ACID性质:1)原子性(Atomicity):一个事务对数据库的所有操作,是一个不可分割的工作单元。这些操作要么全部执行,要么什么也不做。2)一致性(Consistency):一个事务独立执行的结果,应保持数据库的一致性,即数据不会因事务的执行而遭受破坏。3)隔离性(Isolation):在多个事务并发执行时,系统应保证与这些事务先后单独执行时的结果一样。4)持久性(Durability):一个事务一旦完成全部操作后,它对数据库的所有关系数据库中的数据与更新操作必须遵循三类完整性规则:实体完整性规则、参照完整性规则、用户定义的完整性规则。实体完整性规则:要求关系中元组在组成主键的属性上不能有空值。参照完整性规则:如果属性集K是关系模式R1的主键,K也是关系模式R2的外键,那么在R2关系中,K的取值只允许两种可能,或者为空值,或者等于R1关系中某个主键值。这条规则的实质是“不允许引用不存在的实体”。其中,R1称为参照关系;R2称为依赖关系。用户定义的完整性规则:用户针对具体的数据约束,设置的完整性规则,由系统来检验实施。数据库设计的套路各阶段的设计要点如下:1)需求分析:准确了解与分析用户需求(包括数据与处理)。2)概念结构设计:通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型。3)逻辑结构设计:将概念结构转换为某个DBMS所支持的数据模型,并对其进行优化。4)数据库物理设计:为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)。5)数据库实施:设计人员运用DBMS提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果建立数据库,编制与调试应用程序,组织数据入库,并进行试运行。6)数据库运行和维护:在数据库系统运行过程中对其进行评价、调整与修改。数据库三级模式及特点从用户(或应用程序)到数据库之间,DB的数据结构描述有三个层次:1)外模式:用户与数据库系统的接口,是用户用到的那部分数据的描述。外模式由若干个记录类型组成。2)逻辑模式:是数据库中全部数据的整体逻辑结构的描述。3)内模式:是数据库在物理存储方面的描述。注意:外模式是逻辑模式的子集。数据独立性的好处(1)减轻了应用程序的维护工作量;(2)对同一数据库的逻辑模式,可以建立不同的用户模式,从而提高数据共享性,使数据库系统有较好的可扩充性,给DBA维护、改变数据库的物理存储提供了方便。查询优化的一般准则:①选择运算应尽可能先做。②在执行连接前对关系适当地预处理。③把投影运算和选择运算同时进行④把投影同其前或其后的双目运算结合起来。⑤把某些选择同在它前面要执行的笛卡尔积结合起来成为一个连接运算。⑥找出公共子表达式。规范化范式、目的、及好处规范化理论是将一个不合理的关系模式如何转化为合理的关系模式理论,规范化理论是围绕范式而建立的。规范化理论把关系应满足的规范要求分为几级,满足最低要求的一级叫做第一范式(1NF),在第一范式的基础上提出了第二范式(2NF),在第二范式的基础上又提出了第三范式(3NF),以后又提出了BCNF范式,4NF,5NF。范式的等级越高,应满足的约束条件也越严格。规范化目的是使结构更合理,消除插入、修改、删除异常,使数据冗余尽量小,便于插入、删除和更新。网状模式,,之间的特点(逻辑模型的分类)数据库实现时,要根据逻辑模型设计其内部模型。通常分为概念设计、逻辑设计和物理设计三个阶段。逻辑模型的分类:层次模型、网状模型、关系模型等。层次模型:用树型(层次)结构表示实体及实体间联系的数据模型。网状模型:用有向图结构表示实体及实体间联系的数据模型。关系模型:是由若干个关系模式组成的集合。关系模式即记录类型,它的实例称为关系,每个关系实际上是一张二维表格。数据库系统结构:数据库系统分为单用户结构、主从式结构、分布式结构、客户机/服务器结构。数据库管理系统主要功能1.数据定义功能:数据定义语言(DDL)2.数据操纵功能:数据操纵语言(DML)3.数据库的运行管理:统一管理、统—控制,以保证数据的安全性、完整性、多用户对数据的并发使用及发生故障后的系统恢复。4.数据库的建立和维护功能:数据库初始数据的输入、转换功能,重组织、性能监视、分析功能等数据库系统功能特性1数据独立性也就是数据能独立于应用程序之外2数据安全性能防止无关人员得到他不应该知道的数据,这是由用户自己负责的。3数据完整性指数据的正确性、客观性和真实性。因为破坏数据完整性的因素很多,所以应尽可能减少这类情况的发生。4数据一致性指同一事物的数据,不管出现在何时何处都是一致的。5数据共享是数据库系统的主要功能特色之一。它指多个应用程序可以使用同一数据文件;多个用户可存取同一数据;可为社会开放,成为社会的一种信息资源。6控制冗余它对于节省空间和减少开销及防止数据不一致有重要的作用。7集中管理指不仅对文件的结构、数据的装入和文件的各种操作要集中管理,而且对文件的内容、数据的类型、长度、大小等都要检查。8并发控制因数据库系统实现了多个用户共享数据,所以就可能在同一时刻多个用户要存取数据,这时就需要对这种并发操作施行控制。9故障恢复当数据库系统运行时出现故障,如何尽快将它恢复正常,就是数据系统的故障恢复功能。