5.数据库管理阶段:(1)数据结构化。(2)数据共享性高、冗余度小、易扩充。(3)数据独立性高。(4)统一的数据管理和控制:数据的安全性保护、数据的完整性控制、数据库恢复和并发控制。(5)数据的最小存取单位是数据项。1.人工管理阶段数据管理的特点:(1)数据不保存在机器中(2)无专用的软件对数据进行管理(3)只有程序的概念,没有文件的概念(4)数据面向程序2.文件系统阶段数据管理的特点:(1)数据可长期保存在外存的磁盘上(2)数据的逻辑结构和物理结构有了区别(3)文件组织已呈多样化。有索引、链接和散列文件(4)数据不再属于某个特定的程序,可重复使用。3.文件系统显露出三个缺陷:(1)数据冗余性(2)数据不一致性(3)数据联系弱4.数据库阶段的管理方式具有以下特点:(1)采用复杂的数据模型表示数据结构(2)有较高的数据独立性(3)数据库系统为用户提供方便的用户接口(4)系统提供四方面的数据控制功能(5)对数据的操作既可以以记录为单位,又可以以数据项为单位5.数据描述三个领域之间的关系:从事物的特性到计算机中的数据表示,经历了三个领域:现实世界、信息世界、机器世界。(1)现实世界:存在于人们头脑之外的客观世界,称为现实世界。(2)信息世界:是现实世界在人们头脑中的反映。(3)机器世界:信息世界的信息在机器世界中以数据形式存储。信息世界中数据描述的术语有:实体、实体集、属性、实体标识符机器世界中数据描述的术语有:字段、记录、文件、关键码它们的对应关系是:在数据库中每个概念都有类型和值之区分,类型是概念的内涵,值是概念的外延6.数数据描述的两种形式:数据描述有物理描述和逻辑描述两种形式。物理数据描述指数据在存储设备上的存储方式,物理数据是实际存放在存储设备上的数据。逻辑数据描述指程序员或用户用以操作的数据形式,是抽象的概念化数据。数据管理软件的功能之一,就是要把逻辑数据转换成物理数据,以及把物理数据转换成逻辑数据。8.数据模型的种类:目前广泛使用的数据模型可分为两种类型:概念数据模型、结构数据模型概念数据模型:是独立于计算机系统的模型,完全不涉及信息在系统中的表示,只是用来描述某个特定组织所关心的信息结构;它是现实世界的第一层抽象,是用户和数据库设计人员之间进行交流的工具;这一类中著名的模型是“实体联系模型”,简称“ER”模型。结构数据模型:是直接面向数据库的逻辑结构;它是现实世界的第二层抽象,涉及到计算机系统和数据库管理系统;这一类中的例子有层次、网状、关系、面向对象等模型。数据模型{数据模型是现实世界数据特征的抽象。是数据库系统的核心和基础。数据模型应满足三方面要求:一是能比较真实地模拟现实世界;二是容易为人所理解;三是便于在计算机上实现。根据模型应用目的分为:⑴概念模型,也称信息模型,它是按用户的观点对数据和信息建模。⑵数据模型,主要包括层次模型、网状模型、关系模型和面向对象数据模型,它是按计算机系统的观点对数据建模。数据模型三个要素:⑴数据结构描述系统的静态特性⑵数据操作描述系统的动态特性⑶数据的约束条件是一组完整性规则的集合数据模型:层次模型、网状模型、关系模型和面向对象数据模型。其中层次模型和网状模型统称为非关系模型。层次模型:用树型结构表示实体间联系的数据模型层次模型有以下两个限制:⑴只有一个结点没有双亲结点,称之为根结点;⑵根以外的其他结点有且只有一个双亲结点。层次数据模型可以直接表示一对多(包括一对一)的联系;层次模型表示多对多联系,必须首先将其分解成一对多联系。分解方法有两种:冗余结点法和虚拟结点法。网状模型:用有向图结构表示实体类型及实体间联系的数据模型。(1)允许一个以上的结点无双亲;(2)一个结点可以有多于一个的双亲。关系模型:是由若干个关系模式组成的集合,其主要特征是用二维表格结构表达实体集,用外键表示实体间联系。关系模型要求关系必须是规范化的,即要求关系模式必须满足一定的规范条件,这些规范条件中最基本的一条就是,关系的每一个分量必须是一个不可分的数据项,也就是说,不允许表中还有表。}概念模型{数据描述的三个领域:现实世界、信息世界和机器世界数据描述的两种形式:物理描述和逻辑描述。前者是指数据在存储设备上的存取方式,后者是指程序员或用户以用以操作的数据形式。两个实体型之间的联系可以分为三类:一对一联系(1∶1);一对多联系(1∶n);多对多联系(m∶n)E-R图提供了表示实体型、属性和联系的方法。实体-联系方法(E-R方法)是抽象和描述现实世界的有力工具。实体型:用矩形表示,矩形框内写明实体名。属性:用椭圆形表示,并用无向边将其与相应的实体连接起来。联系:用菱形表示,菱形框内写明联系名,并用无向边分别志有关实体连接起来,同时在无向边旁标上联系的类型(1∶1,1∶n或m∶n)。}9.结构数据模型的三个组成部分:数据结构、数据操作、数据完整性约束是结构数据模型的三个组成部分。数据结构:是指对实体类型和实体间联系的表达和实现数据操作:是指对数据库的检索和更新(插、删、改)两类操作的实现数据完整性约束:给出数据及其联系应具有的制约和依赖规则。10.层次模型的特点:用树型结构表示实体类型及实体间联系的数据模型称为层次模型。层次模型的特点是:记录之间的联系通过指针实现,查询效率较高。缺点是:(1)只能表示1:N联系(2)由于树型结构层次顺序的严格复杂,引起数据的查询和更新操作也很复杂,因此编写应用程序也很复杂。11.网状模型的特点:用有向图结构表示实体类型及实体间联系的数据模型称为网状模型。网状模型的特点是:记录之间联系通过指针实现,M:N联系也容易实现,查询效率较高。缺点是:编写应用程序比较复杂,程序员必须熟悉数据库的逻辑结构。12.关系模型的特点:关系模型的主要特征是用二维表格结构表达实体集,用外键表示实体间联系。特点是:关系模型与层次、网状的最大差别是用关键码而不是用指针导航数据,表格简单,用户易懂,编程时不涉及存储结构、访问技术等细节。13.数据库体系结构中的三级结构、两级映象:数据库的体系结构分为三级:内部级、概念级、外部级。外部级:最接近用户,是单个用户所能看到的数据特性。单个用户使用的数据视图的描述称为“外模式”。概念级:涉及到所有用户的数据定义,是全局的数据视图。全局数据视图的描述称为“概念模式”。内部级:最接于物理存储设备,涉及到实际数据存储的结构。物理存储数据视图的描述称为“内模式”。为实现这三个抽象级别的联系和转换,DBMS在级级结构之间提供两个层次的映象:外模式/模式映象,模式/内模式映象。两级映象:外模式/模式映象一般在外模式中描述。模式/内模式映象一般在内模式中描述。两层映象保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。14.二级数据独立性:数据独立性是指:应用程序和数据之间相互独立,不受影响。分为物理独立性和逻辑独立性。(1)物理数据独立性:如果数据库的内模式要进行修改,即数据库的存储设备和存储方法有所变化,那么模式/内模式映象也要进行相应的修改,使概念模式尽可能保持不变。也就是对内模式的修改尽量不影响概念模式。(2)逻辑数据独立性:如果数据库的概念模式要进行修改,如增加记录类型或增加数据项,那么外模式/模式映象也要进行相应的修改,使外模式尽可能保持不变。也就是概念模式的修改尽量不影响外模式和应用程序。15.DBMS的主要功能:(1)数据库的定义功能:DBMS提供数据定义语言(DDL)定义数据库的三级结构及其相互之间的映象、完整性、安全控制等约束。(2)数据库的操纵功能:DBMS提供数据操纵语言(DML)实现对数据库中数据的操作。(3)数据库的保护功能:DBMS对数据库的保护主要通过数据库的恢复、数据库的并发控制、数据库的完整性控制、数据库的安全性控制等四个方面实现。(4)数据库的存储管理:DBMS的存储管理子系统提供了数据库中数据和应用程序的一个界面,其职责是把各种DML语句转换成低层的文件系统命令,起到数据的存储、检索和更新的作用。(5)数据库的维护功能:DBMS中实现功能的实用程序主要有数据装载程序、备份程序、文件重组织程序、性能监控程序。(6)数据字典(DD):数据库系统中存放三级结构定义的数据库称为数据字典,对数据库的操作都要通过访问DD才能实现。16.DBMS的组成:DBMS是由两大部分组成:查询处理器和存储管理器。(1)查询处理器有四个主要成分:DDL编译器、DML编译器、嵌入型DML的预编译器、查询运行核心程序。(2)存储管理器有四个主要成分:授权和完整性管理器、事务管理器、文件管理器、缓冲区管理器。17.DBS的组成:DBS:数据库系统(DatabaseSystem),DBS是实现有组织地、动态地存储大量关联数据,方便多用户访问的计算机软件、硬件和数据资源组成的系统,即采用了数据库技术的计算机系统。DBS是一个实际可运行的,按照数据库方法存储、维护和向应用系统提供数据支持的系统,它是数据库、硬件、软件、数据库管理员(DBA)的集合体。(1)数据库(DB):是与一个特定组织各项应用有关的全部数据的集合,由应用数据的集合(物理数据库)、关于各级数据结构的描述(描述数据库)两部分组成。(2)硬件:包括中央处理机、内存、输入输出设备、数据通道等硬件设备。(3)软件:包括DBMS、OS、各种宿主语言和应用开发支持软件等程序。(4)DBA:DBA是控制数据整体结构的人,负责DBS的正常运行。18.DBS的全局结构:(1)数据库用户。可分为四类:DBA、专业用户、应用程序员、终端用户(2)DBMS的查询处理器。包括四部分:DML编译器、嵌入型DML的预编译器、DLL编译器、查询运行核心程序。(3)DBMS的存储管理器。包括四部分:授权和完整性管理器、事务管理器、文件管理器、缓冲区管理器。(4)磁盘存储器中的数据结构。包括四种形式:数据文件、数据字典、索引文件、统计数据组织。DBMS:数据库管理系统(DatabaseManagementSystem),DBMS是位于用户与操作系统之间的一层数据管理软件,为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型、面向对象型DBMS。数据库技术:是一门研究数据库结构、存储、管理和使用的软件学科。第一代数据库系统,即层次数据库系统和网状数据库系统第二代数据库系统,即关系数据库系统第三代数据库系统,即面向对象数据库系统数据库学科的研究范围:数据库管理系统软件的研制;数据库设计;数据库理论数据系统的三级模式结构:外模式(物理模式)、模式(逻辑模式)和内模式数据库管理系统的功能:⑴数据定义⑵数据操纵⑶数据库运行管理⑷数据组织、存储和管理⑸数据库的建立和维护⑹数据通信接口数据库管理系统组成:⑴数据定义语言及其翻译处理程序⑵数据操纵语言及其编译(或解释)程序⑶数据库运行控制程序⑷实用程序一个设计优良的DBMS⑴友好的用户界面⑵比较完备的功能⑶较高的运行效率⑷清晰的系统结构和开放性第二章关系数据库系统与非关系数据库系统的区别是,关系系统只有表这一种数据结构;而非关系数据库系统还有其他数据结构,对这些数据结构有其他的操作。关系模型的组成:关系数据结构、关系操作集合、关系完整性约束关系数据语言{关系代数语言例如ISBL元组关系演算语言例如ALPHA,QUEL}关系演算语言{域关系演算语言例如QBE具有关系代数和关系演算双重特点的语言例如SQL}关系的三类完整性约束:实体完整性、参照完整性和用户定义的完整性{实体完整性规则:要求关系中组成主键的属性上不能有空值。参照完整性规则:要求不引用不存在的实体。用户定义完整性规则:由具体应用环境决定,系统提供定义和检验这类完整性的机制。}关系数据语言的共同特点是:语言具有完备的表达能力,是非过程化的集合操作语言,功能强,能够嵌入高级语言中使用。基本关系具有以下六条性质:①列是同质的(Homogeneous),即每一列中的分量同一类型的数据,来自同一个域。②不同的列可出自同一个域,称其中的每列为一个属性,不同的