第1章数据库概论1.1基本内容分析1.1.1本章的重要概念(1)DB、DBMS和DBS的定义(2)数据管理技术的发展阶段人工管理阶段、文件系统阶段、数据库系统阶段和高级数据库技术阶段等各阶段的特点。(3)数据描述概念设计、逻辑设计和物理设计等各阶段中数据描述的术语,概念设计中实体间二元联系的描述(1:1,1:N,M:N)。(4)数据模型数据模型的定义,两类数据模型,逻辑模型的形式定义,ER模型,层次模型、网状模型、关系模型和面向对象模型的数据结构以及联系的实现方式。(5)DB的体系结构三级结构,两级映像,两级数据独立性,体系结构各个层次中记录的联系。(6)DBMSDBMS的工作模式、主要功能和模块组成。(7)DBSDBS的组成,DBA,DBS的全局结构,DBS结构的分类。1.1.2本章的重点篇幅(1)教材P23的图1.24(四种逻辑数据模型的比较)。(2)教材P25的图1.27(DB的体系结构)。(3)教材P28的图1.29(DBMS的工作模式)。(4)教材P33的图1.31(DBS的全局结构)。1.2教材中习题1的解答1.1名词解释·逻辑数据:指程序员或用户用以操作的数据形式。·物理数据:指存储设备上存储的数据。·联系的元数:与一个联系有关的实体集个数,称为联系的元数。·1:1联系:如果实体集E1中每个实体至多和实体集E2中的一个实体有联系,反之亦然,那么E1和E2的联系称为“1:1联系”。·1:N联系:如果实体集E1中每个实体可以与实体集E2中任意个(零个或多个)实体有联系,而E2中每个实体至多和E1中一个实体有联系,那么E1和E2的联系是“1:N联系”。·M:N联系:如果实体集E1中每个实体可以与实体集E2中任意个(零个或多个)实体有联系,反之亦然,那么E1和E2的联系称为“M:N联系”。·数据模型:能表示实体类型及实体间联系的模型称为“数据模型”。·概念数据模型:独立于计算机系统、完全不涉及信息在计算机中的表示、反映企业组织所关心的信息结构的数据模型。·结构数据模型(或逻辑数据模型):与DBMS有关的,直接面向DB的逻辑结构、从计算机观点对数据建模的数据模型。·层次模型:用树型(层次)结构表示实体类型及实体间联系的数据模型称为层次模型。·网状模型:用有向图结构表示实体类型及实体间联系的数据模型称为网状模型。·关系模型:用二维表格表达实体集的数据模型。·外模式:是用户用到的那部分数据的描述。·概念模式:数据库中全部数据的整体逻辑结构的描述。·内模式:DB在物理存储方面的描述。·外模式/模式映象:用于定义外模式和概念模式之间数据结构的对应性。·模式/内模式映象:用于定义概念模式和内模式之间数据结构的对应性。·数据独立性:应用程序和DB的数据结构之间相互独立,不受影响。·物理数据独立性:在DB的物理结构改变时,尽量不影响应用程序。·逻辑数据独立性:在DB的逻辑结构改变时,尽量不影响应用程序。·主语言:编写应用程序的语言(如C一类高级程序设计语言),称为主语言。·DDL:定义DB三级结构的语言,称为DDL。·DML:对DB进行查询和更新操作的语言,称为DML。·过程性语言:用户编程时,不仅需要指出“做什么”,还需要指出“怎么做”的语言。·非过程性语言:用户编程时,只需指出“做什么”,不需要指出“怎么做”的语言。·DD(数据字典):存放三级结构定义的DB,称为DD。·DD系统:管理DD的软件系统,称为DD系统。1.2试解释DB、DBMS和DBS三个概念。答:DB是长期存储在计算机内、有组织的、统一管理的相关数据的集合。DBMS是位于用户与OS之间的一层数据管理软件,它为用户或应用程序提供访问DB的方法。DBS是实现有组织地、动态地存储大量关联数据、方便多用户访问的计算机硬件、软件和数据资源组成的系统,即采用数据库技术的计算机系统。1.3人工管理阶段和文件系统阶段的数据管理各有哪些特点?答:人工管理阶段主要有四个特点:数据不保存在计算机内;没有专用的软件对数据进行管理;只有程序的概念,没有文件的概念;数据面向程序。文件系统阶段主要有五个特点:数据以“文件”形式长期保存;数据的逻辑结构与物理结构有了区别;文件组织已多样化;数据面向应用;对数据的操作以记录为单位。1.4文件系统阶段的数据管理有些什么缺陷?试举例说明。答:主要有三个缺陷:数据冗余;数据不一致性;数据联系弱。例如学校里教务处、财务处、保健处建立的文件中都有学生详细资料,譬如联系电话,家庭住址等。这就是“数据”冗余;如果某个学生搬家,就要修改三个部门文件中的数据,否则会引起同一数据在三个部门中不一致;产生上述问题的原因是这三个部门的文件中数据没有联系。1.5数据管理的数据库阶段产生的标志是哪三件事情?答:进入数据库阶段的标志是20世纪60年代末发生的三件事件:·1968年IBM公司研制的IMS系统是一个典型的层次DBS;·1969年美国CODASYL组织DBTG报告,提出网状DBS的概念;·1970年美国IBM公司的E.F.Codd发表论文,提出关系模型的思想。1.6数据库阶段的数据管理有哪些特点?答:主要有五个特点:采用数据模型表示复杂的数据结构;有较高的数据独立性;为用户提供了方便的用户接口;提供了四个方面的数据控制功能;对数据的操作以数据项为单位,增加了系统的灵活性。1.7与“文件”结构相比,“数据库”结构有些什么不同?答:与文件结构相比,数据库结构主要有下面三点不同:·数据的结构化。文件由记录组成,但各文件之间缺乏联系。数据库中数据在磁盘中仍以文件形式组织,但这些文件之间有着广泛的联系。数据库的逻辑结构用数据模型来描述,整体结构化。数据模型不仅描述数据本身的特点,还要描述数据之间的联系。·数据独立性。文件只有设备独立性,而数据库还具有逻辑独立性和物理独立性。·访问数据的单位。访问文件中的数据,以记录为单位。访问数据库中的数据,以数据项(字段)为单位,增加了系统的灵活性。1.8什么是数据独立性?在数据库中有哪两级独立性?答:数据独立性是指应用程序与DB的数据结构之间相互独立。在物理结构改变时,尽量不影响应用程序,称为物理数据独立性;在逻辑结构改变时,尽量不影响应用程序,称为逻辑数据独立性。1.9分布式数据库系统和面向对象数据库系统各有哪些特点?答:DDBS主要有三个特点:·数据物理上分布在各地,但逻辑上是一个整体;·每个场地既可以执行局部应用,也可以执行全局应用;·各地的计算机由数据通信网络相连接。面向对象数据系统主要有两个特点:·面向对象数据模型能完整地描述现实世界的数据结构,能表达数据间嵌套、递归的联系。·具有面向对象技术的封装性和继承性的特点,提高了软件的可重用性。1.10逻辑记录与物理记录,逻辑文件与物理文件有些什么联系和区别?答:逻辑数据是用户用以操作的数据形式,是抽象的概念化数据。物理数据是实际存放在存储设备上的数据。逻辑数据与物理数据在结构上可以差别很大,需通过两级映象来进行数据传输和格式转换。从以上的解释可以看出,逻辑记录和逻辑文件是用户在程序中使用的记录和文件,而物理记录和物理文件是指磁盘上的记录和文件。逻辑记录、文件与物理记录、文件在结构、组成上有很大的差异,而数据管理软件就是通过三级结构两级映象来实现逻辑数据与物理数据之间的转换。1.11试述ER模型、层次模型、网状模型、关系模型和面向对象模型的主要特点。答:ER模型直接表示实体类型及实体间联系,与计算机系统无关,充分反映用户的需求,用户容易理解。层次模型的数据结构为树结构,记录之间联系通过指针实现,查询较快,但DML属于过程化的,操作复杂。网状模型的数据结构为有向图,记录之间联系通过指针实现,查询较快,并且容易实现M:N联系,但DML属于过程化的语言,编程较复杂。关系模型的数据结构为二维表格,容易为初学者理解。记录之间联系通过关键码实现。DML属于非过程化语言,编程较简单。面向对象模型能完整描述现实世界的数据结构,具有丰富的表达能力,能表达嵌套、递归的数据结构。但涉及的知识面较广,用户较难理解,这种模型尚未普及。1.12数据之间联系在各种结构数据模型中是怎么实现的?答:在层次、网状模型中,数据之间的联系通过指针实现的;在关系模型中,数据之间联系通过外键和主键间联系实现的;在面向对象模型中,数据之间嵌套、递归联系通过对象标识符(OID)实现的(见第8章)。1.13DB的三级模式结构描述了什么问题?试详细解释。答:DB的三级模式结构是对数据的三个抽象级别,分别从外部(用户)级、概念级和内部级去观察数据库。外部级是用户使用的局部数据库的逻辑结构,其描述称为外模式。概念级是DB的整体逻辑结构,其描述称为概念模式。内部级是DB的物理结构,其描述称为内模式。1.14试述概念模式在数据库结构中的重要地位。答:数据按外模式的描述提供给用户,按内模式的描述存储在磁盘中,而概念模式提供了连接这两级的相对稳定的中间观点,并使得两级的任何一级的改变都不受另一级的牵制。1.15试叙述用户、DB的三级模式结构、磁盘上的物理文件之间有些什么联系和不同?答:用户、外模式、概念模式、内模式和物理文件中的记录分别称为用户记录、外部记录、概念记录、内部记录和物理记录。用户记录与外部记录的结构是一致的,它们之间只是数据传输问题。而外部记录、概念记录和内部记录之间的结构可能是不一致的,除了数据传输问题,还有格式转换问题。内部记录与物理记录的结构是一致的,它们之间只是数据传输问题。1.16数据独立性与数据联系这两个概念有什么区别?答:数据独立性是指应用程序和DB的数据之间相互独立,不受影响,对系统的要求是“数据独立性要高”,而数据联系是指记录之间的联系,对系统的要求是“数据联系密切”。1.17试述DBMS的工作模式和主要功能。答:DBMS的工作模式有六点:·接受应用程序的数据请求和处理请求;·将用户的数据请求转换成低层指令;·实现对DB的操作;·从对DB的操作中接受查询结果;·对查询结构进行处理;·将处理结果返回给用户。DBMS的主要功能有DB的定义、操纵、保护、维护和数据字典等五个功能。1.18试叙述DBMS对数据库的维护功能。答:包括DB的数据载入、转换、转储、DB的改组以及性能监控等功能。这些功能分别由各个实用程序完成。1.19从模块结构观察,DBMS由哪些部分组成?答:DBMS由两大部分组成:查询处理器和存储管理器。(解释略)1.20DBS有哪几部分组成?其中DD有什么作用?答:DBS由DB、硬件、软件和DBA等四个部分组成。(解释略)在DBS中,DD是存储三级结构描述(即元数据)的DB。DBMS的所有工作都要以DD中的元数据为依据,也就是所有工作都要通过DD访问DB。1.21“元数据”与“数据”之间有些什么联系与区别?答:元数据(metadata)是指“数据的数据”,即数据的描述。DB中的元数据是指三级模式结构的详细描述。数据(data),一般是指用户使用的具体值。1.22什么是DBA?DBA应具有什么素质?DBA的职责是什么?答:DBA是控制数据整体结构的一组人员,负责DBS的正常运行,承担创建、监控和维护DB结构的责任。DBA必须具备下列4条素质:熟悉企业全部数据的性质和用途;对所有用户的需求有充分的了解;对系统的性能非常熟悉;兼有系统分析员和运筹学专家的品质和知识。DBA的主要职责有6点:定义模式;定义内模式;与用户的联络;定义安全性规则;定义完整性规则;DB的转储与恢复。1.23试对DBS的全局结构作详细解释。答:从四个方面解释:·数据库用户有四类:DBA,专业用户,应用程序员,终端用户。·DBMS的查询处理器有四个模块:DML编译器,嵌入型DML预编译器,DDL编译器,查询运行核心程序。·DBMS的存储管理器有四个模块:授权和完整性管理器,事务管理器,文件管理器,缓冲区管理器。·磁盘存储器中有五种数据结构:数据文件,数据字典,索引文件,统计数据组织和日志。1.24使用DBS的用户有哪几类?答:(略,见习题1.23)1.25DBMS的查询处理器和存储管理器各有哪些功能?答:(略,见习题1.23)1.26