1名词解释部分空间数据库:空间数据库指的是地理信息系统在计算机物理存储介质上存储的与应用相关的地理空间数据的总和,一般是以一系列特定结构的文件的形式组织在存储介质之上的。地理数据库:地理数据库是应用计算机数据库技术对地理数据进行科学的组织和管理的硬件与软件系统,自然地理和人文地理诸要素文件的集合,是地理信息系统的核心部分。数据仓库:数据仓库(DataWarehouse)是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。E-R图:E-R模型是直接从现实世界中抽象出实体类型及实体间的联系,是对现实世界的一种抽象,它的主要成分是实体、联系和属性。E-R模型的图形表示称为E-R图。概念模型:概念模型是现实世界的抽象反映,它表示实体类型及实体间的联系,是独立于计算机系统的模型,是现实世界到机器世界的一个中间层次。关系数据模型:用二维表格结构表示实体以及实体之间的联系的数据模型称为关系模型,其操作对象和操作结果都是二维表。关系模式:对关系的信息结构及语义限制的描述称为关系模式,用关系名和包含的属性名的集合表示。例如,职工信息表的关系模式是:职工(职工号,姓名,性别,年龄,工资)。数据依赖:数据依赖是通过一个关系中属性间值的相等与否体现出来的数据间的相互关系,是现实世界属性间相互联系的抽象,是语义(数据的含义)的体现,包括函数依赖、多值依赖和连接依赖。函数依赖:函数依赖是指在关系R中,X、Y为R的两个属性或属性组,如果对于R的所有关系r都存在:对于X的每一个具体值,Y都只有一个具体值与之对应,则称属性Y函数依赖于属性X,记作X→Y。(函数依赖简单表述:如果属性X的值决定属性Y的值,那么属性Y函数依赖于属性X。换一种说法是,如果知道X的值,就可以获得Y的值。)非平凡函数依赖和平凡函数依赖:设关系模式R(U),U是R上的属性集,X、Y⊆U;如果X→Y,且Y⊆X,则称X→Y为平凡的函数依赖。如果X→Y,且Y不是X的子集,则称X→Y为非平凡的函数依赖。完全函数依赖和部分函数依赖:设关系模式R(U),U是R上的属性集,X、Y⊆U;如果X→Y,并且对于X的任何一个真子集Z,Z→Y都不成立,则称Y完全函数依赖于X。若X→Y,但对于X的某一个真子集Z,有Z→Y成立,则称Y部分函数依赖于X。传递函数依赖:设关系模式R(U),X⊆U,Y⊆U,Z⊆U。如果X→Y,Y→Z成立,但Y→X不成立,则称X→Z为传递函数依赖。1NF:设R是一个关系模式,如果R的每个属性的值域(更确切地说是R的每一个关系r的属性值域)都是不可分的简单数据项(即是原子)的集合,则称这个关系模式属于第一范式,简记作R∈1NF。2NF:如果关系模式R是第一范式,且每个非主属性都完全依赖于码,则称R为满足第二范式的模式,记为:R∈2NF。3NF:如果关系模式R是第二范式,且没有一个非主属性是传递函数依赖于码,则称R为满足第三范式的模式,记为:R∈3NF。BCNF:关系模式R∈1NF,对任何非平凡的函数依赖X→Y,X均包含码,则R∈BCNF。数据流程图:数据流图(DFD,DataFlowDiagram)表达了数据和处理过程的关系,反映的是对事务处理所需的原始数据及经处理后的数据及其流向,包括数据流、处理、数据存储、外部实体四个组成部分。并发控制:并发控制指的是当多个用户同时更新行时,用于保护数据库完整性的各种技术,目的是保证一个用户的工作不会对另一个用户的工作产生不合理的影响。2问答题部分1.绘制实体联系E-R图。2.简述层次数据模型、网状数据模型、关系数据模型各自的特点。层次模型用树形结构来表示各类实体以及实体间的联系。每个结点表示一个记录类型,结点之间的连线表示记录类型间的联系,这种联系只能是父子联系。层次模型存在如下特点:(1)只有一个结点没有双亲结点,称为根结点。(2)根结点以外的其他结点有且只有一个双亲结点。网状数据模型是一种比层次模型更具普遍性的结构,它去掉了层次模型的两个限制,允许多个结点没有双亲结点,也允许一个结点有多个双亲结点。因此,网状模型可以方便地表示各种类型的联系。网状模型是一种较为通用的模型,从图论的观点看,它是一个不加任何条件的无向图。一般来说,层次模型是网状模型的特殊形式,网状模型是层次模型的一般形式。网状模型与层次模型相比,提供了更大的灵活性,能更直接地描述现实世界,性能和效率也比较好。但其缺点是结构复杂,用户不易掌握,扩充和维护都比较复杂。关系模型指用二维表格结构表示实体以及实体之间的联系的数据模型。在用户看来,关系模型中数据的逻辑结构是一张二维表。关系模型存在如下特点:(1)数据结构单一。关系模型中,不管是实体还是实体之间的联系,都用关系来表示,而关系都对应一张二维数据表,数据结构简单、清晰。3(2)关系规范化,并建立在严格的理论基础上。构成关系的基本规范要求关系中每个属性不可再分割,同时关系建立在具有坚实的理论基础的严格数学概念基础上。(3)概念简单,操作方便。关系模型最大的优点就是简单,用户容易理解和掌握,一个关系就是一张二维表格,用户只需用简单的查询语言就能对数据库进行操作。3.什么是关系数据库?它有什么特点?关系数据库是支持关系模型的数据库。关系数据模型由关系数据结构、关系操作集合和关系完整性约束三部分组成。在关系数据模型中,现实世界的实体以及实体间的各种联系均用关系来表示。在用户看来,关系模型中的逻辑结构是一张二维表。关系数据库要求其中的关系必须是具有以下性质的:(1)在同一个关系中,同一个列的数据必须是同一种数据类型(2)在同一个关系中,不同的列的数据可以是同一种数据类型,但各属性的名称都必须是互不相同(3)同一个关系中,任意两个元组都不能完全相同(4)在一个关系中,列的次序无关紧要。即列的排列顺序是不分先后的(5)在一个关系中,元组的位置无关紧要。即排行不分先后,可以任意交换两行的位置(6)关系中的每个属性必须是单值,即不可再分,这就要求关系的结构不能嵌套。这是关系应满足的最基本的条件4.请简述关系数据库中有哪些关系运算操作。关系代数是以关系为运算对象的一组高级运算的集合。关系代数的运算对象是关系,运算结果也是关系。关系代数中的操作可以分为两类:传统的集合操作:并、差、交、笛卡儿积专门的关系操作:投影(对关系进行垂直分割)、选择(水平分割)、连接(关系的结合)、除法(笛卡儿积的逆运算)等。在两类集合运算中,还将用到两类辅助操作符:(1)比较运算符:>、≥、<、≤、=、≠。(2)逻辑运算符:∨(或)、∧(与)、┐(非)。5.请举例说明什么是笛卡尔积(CartesianProduct)?设关系R和S的元数(属性个数)分别为r和s,定义R和S的笛卡儿积是一个(r+s)元的元组集合,每个元组的前r个分量(属性值)来自R的一个元组,后s个分量来自S的一个元组,记为R×S。形式化定义为:R×S={t|t=tr,ts∧tr∈R∧ts∈S}。其中tr、ts中r,s为上标。若R有m个元组,S有n个元组,则R×S有m×n个元组。举例如下:46.简述数据库标准化有什么意义?数据库标准化,又称数据库或资料库的正规化、规范化,是数据库设计中的一系列原理和技术,以减少数据库中数据冗余,增进数据的一致性。一般而言,数据库规范化可分为六个阶段,即1NF、2NF、3NF、BCNF、4NF、5NF。在一般情况下大多数数据库用到前三阶规范化就已足够应付绝大部分数据库的需求。1NF不可有重复的数据项,2NF不可有部分函数依赖,3NF规范化不可有传递函数依赖。关系模式规范化可以解决关系模式中存在的数据冗余、插入和删除异常以及更新异常等问题。其基本思想是消除数据依赖中的不合适部分,使各关系模式达到某种程度的分离,使一个关系描述一个概念、一个实体或实体间的一种联系。因此,规范化的实质是概念的单一化。7.请举例说明关系规范化过程中的常见异常。以关系模式学生信息表中存在的问题为例:(1)数据冗余:数据在数据库中的重复存放称为数据冗余。冗余度大,不浪费存储空间,重要的是在对数据进行修改时,又易造成数据的不一致性。例如:系名和学生姓名等都要重复存储多次,当它们发生改变时,就要修改多次,一旦遗漏就会使数据不一致。(2)更新异常:数据冗余,更新数据时,维护数据完整性代价大。例如:如果某学生改名,则该学生的所有记录都要逐一修改NAME的值;稍有不慎,就有可能漏改某些记录。(3)插入异常:该插入的数据插不进去。例如:如果一个系刚成立,尚无学生,我们就无法把这个系及其系主任的信息存入数据库。因为学号和课程号是主键,主键不能为空。(4)删除异常:不该删除的数据不得不删除。例如:如果某个系的学生全部毕业了,我们在删除该系学生信息的同时,把这个系及其系主任的信息也丢掉了。8.请简述数据库设计的内容/主要步骤。按照规范设计的方法,考虑数据库及其应用系统开发全过程,数据库设计可分为以下六个阶段:需求分析、概念结构设计、逻辑结构设计、数据库物理设计、数据库实施、数据5库运行和维护。(1)需求分析:需求分析就是通过详细调查现实世界要处理的对象(组织、部门、企业等),充分了解原系统(手工系统或计算机系统)工作概况,明确用户的各种需求,并在此基础上确定新系统的功能。新系统必须充分考虑今后可能的扩充和改变,不能仅仅按当前应用需求来设计数据库。通过调查、收集与分析,获得用户对数据库的信息要求、处理要求、安全性与完整性要求。该阶段收集的基础数据(用数据字典来表达)和一组数据流程图(DadaFlowDiagram,简称DFD)是下一步进行概念设计的基础。(2)概念结构设计:概念设计阶段要做的是将需求分析得到的用户需求抽象为反映用户观点的概念模型,将其转换为计算机能够识别的信息世界的结构。在概念结构设计时,可以分为两步。进行数据抽象,设计局部E-R模型,即设计用户视图;集成各局部E-R模型,形成全局E-R模型,即视图的集成。(3)逻辑结构设计:逻辑设计的主要目标是产生一个DBMS可处理的数据模型和数据库模式。该模型必须满足数据库的存取、一致性及运行等各方面的用户需求。其逻辑结构设计阶段一般要分为三步进行:将E-R图转化为关系数据模型,关系模式的优化,设计用户外模式。(4)物理结构设计:数据库最终要存储在物理设备上。将逻辑设计中产生的数据库逻辑模型结合指定的DBMS,设计出最适合应用环境的物理结构的过程,称为数据库的物理结构设计。数据库的物理结构设计分为两个步骤:确定数据库的物理结构,对所设计的物理结构进行评价。(5)数据库实施:根据逻辑和物理设计的结果,在计算机上建立起实际的数据库结构,并加载数据,进行试运行和评价的过程,叫做数据库的实施或实现,包括建立实际的数据库结构、数据加载、数据库试运行和评价。(6)数据库运行与维护:数据库试运行结果符合设计目标后,数据库就可以真正投入运行了。数据库投入运行标着开发任务的基本完成和维护工作的开始。维护工作包括以下内容:数据库的转储和恢复,数据库的安全性和完整性控制,数据库性能的监督、分析和改造,数据库的重组织和重构造。9.将E-R图转化为关系模式。610.并发控制的机理/原理是什么?简述并发可能带来的问题及解决办法。并发控制指的是当多个用户同时更新行时,用于保护数据库完整性的各种技术,目的是保证一个用户的工作不会对另一个用户的工作产生不合理的影响,是用来解决多个用户对同一数据进行操作时的问题。在某些情况下,这些措施保证了当用户和其他用户一起操作时,所得的结果和他单独操作时的结果是一样的。并发带来的问题:(1)丢失修改:指在一个事务读取一个数据时,另外一个事务也访问该同一数据。那么,在第一个事务中修改了这个数据后,第二个事务也修改了这个数据。这样第一个事务内的修改结果就被丢失,称为丢失修改。(2)脏读:指当一个事务正在访问数据,并且对数据进行了修改,而这种修改还没有提交到数据库中,这时,另外一个事务也访问这个数据,然后使用了这个数据。因为这个数据是还没有提交的数据,那么另外一个事务读到的这个数据是“脏数据”,依据“脏数据”所做的操作可能是不正确的。(3