第一章关系数据库基础报告

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

ACCESS数据库程序设计主编:李京文随着计算机技术和网络技术的结合,人们每天都可以浏览到大量的信息。为了快速、有效、方便的利用这些资源,数据库技术应运而生,经过长期的发展,最终形成了数据库管理系统。第1章数据库概述1.1数据库基础知识1.2关系数据库1.3Access简介1.1数据库基础知识数据库是20世纪60年代末发展起来的一项重要的技术,它的出现使得计算机对数据的处理和维护进入了一个崭新的时代。本节介绍数据库的基本概念及数据管理的发展史。1.1.1基本概念1.数据数据是描述物理事务的符号记录。在计算机中,数据既可以是数字、也可以是文字、图形、图像、声音等,数据可以有多种表现形式,它们都可以经过数字化后存入计算机。数据的含义可以抽象为两方面的内容:一是描述事物特性的数据内容;二是存储在某种介质上的数据形式。2.数据库数据库即存放数据的仓库,只是这里的数据并不是任意存放在计算机的磁盘上,而是按照一定的组织形式存放在计算机内,以便用户可以长期的使用。3.数据库管理系统数据库管理系统在计算机系统中是位于用户与操作系统之间的一层数据管理软件;用于对数据库进行管理和维护,属于系统软件的范畴。一个功能较完全的数据库管理系统应至少具备以下功能:(1)数据定义功能(2)数据操纵功能(3)数据控制功能(4)数据库的运行和维护功能4.数据库系统数据库系统是引入数据库技术后的计算机系统,一般包括数据库、数据库管理系统、应用系统、数据库管理员和用户。其中数据库管理系统是数据库系统的核心。一个数据库的建立、使用和维护等工作仅仅靠一个数据库管理系统是不够的,还需要有专门的人员来完成,这些人就是数据库管理员。1.1.2数据管理的发展历史数据管理技术的发展可以大体归为如下几个阶段:一、人工管理这一阶段(20世纪50年代中期以前),计算机主要用于科学计算。外部存储器只有磁带、卡片和纸带等,还没有磁盘等直接存取存储设备。软件只有汇编语言,尚无数据管理方面的软件。数据处理方式基本是批处理。这个阶段有如下几个特点:1.计算机系统不提供对用户数据的管理功能。用户编制程序时,必须全面考虑好相关的数据,包括数据的定义、存储结构以及存取方法等。2.程序和数据是一个不可分割的整体。数据脱离了程序就无任何存在的价值,数据无独立性。3.数据不能共享。二、文件系统在这一阶段(20世纪50年代后期至60年代中期)计算机不仅用于科学计算,还用于信息管理方面。随着数据量的增加,数据的存储、检索和维护问题成为紧迫的需要,数据结构和数据管理技术迅速发展起来。此时,外部存储器已有磁盘、磁鼓等直接存取的存储设备。软件领域出现了操作系统和高级软件。操作系统中的文件系统是专门管理外存的数据管理软件,文件是操作系统管理的重要资源之一。数据处理方式有批处理,也有联机实时处理。这个阶段有如下几个特点:1.数据以“文件”形式可长期保存在外部存储器的磁盘上。2.数据的逻辑结构与物理结构有了区别,但比较简单。3.对数据的操作以记录为单位。4.由于文件之间缺乏联系,造成每个应用程序都有对应的文件,有可能同样的数据在多个文件中重复存储。三、数据库系统这一阶段(60年代后期),数据管理技术进入数据库系统阶段。数据库系统克服了文件系统的缺陷,提供了对数据更高级、更有效的管理。这个阶段的程序和数据的联系通过数据库管理系统来实现(DBMS),如图1-1所示。图1-1用数据库管理系统连接程序和数据数据库系统阶段的数据管理具有以下特点:1.采用数据模型表示复杂的数据结构。2.数据冗余明显减少,实现了数据共享。3.有较高的数据独立性。数据库系统为用户提供了方便的用户接口。用户可以使用查询语言或终端命令操作数据库,也可以用程序方式(如用C一类高级语言和数据库语言联合编制的程序)操作数据库。数据库系统提供了数据控制功能。包括:1.数据库的并发控制2.数据库的恢复3.数据完整性4.数据安全性四、分布式数据库系统分布式数据库系统是由若干个站集合而成。这些站又称为节点,它们在通讯网络中联接在一起,每个节点都是一个独立的数据库系统,它们都拥有各自的数据库、中央处理机、终端以及各自的局部数据库管理系统。因此分布式数据库系统可以看作是一系列集中式数据库系统的联合。它们在逻辑上属于同一系统,但在物理结构上是分布式的。分布式数据库系统的特点如下:1.在分布式数据库系统里不强调集中控制概念,它具有一个以全局数据库管理员为基础的分层控制结构,但是每个局部数据库管理员都具有高度的自主权。2.在分布式数据库系统中数据独立性概念也同样重要,然而增加了一个新的概念,就是分布式透明性。3.集中式数据库系统不同于分布式数据库系统,数据冗余在分布式系统中被看作是所需要的特性。1.1.3数据模型一、概念模型概念模型可以看成是现实世界到机器世界的一个过渡的中间层次。在设计数据库系统时,要把现实世界的事物通过认识和抽象转换为信息世界的概念模型,再把概念模型转换为机器世界的数据模型。对概念模型的要求,主要有以下要点:1.有丰富的语义表达能力,能表达用户的各种需求;2.简洁、明晰、独立于机器、容易理解;3.易于变动;4.易于向各种数据模型转换。概念模型是对现实世界建模,所以概念模型应该能够方便准确地表示出上述现实世界中的常用概念。概念模型的表示方法很多,其中最著名的就是实体-联系方法(Entity-RelationshipApproach)。该方法用E-R图来描述现实世界的概念模型,E-R方法也称为E-R模型。1.基本概念实体:我们把客观存在并且可以相互区别的事物称为实体。实体可以是实际事物,也可以是抽象事件。如一个职工、一场比赛等。实体型:具有相同属性的实体必然具有相同的特征和性质。用实体名及其属性名集合来表示,称为实体型。如成绩表(学号,课程号,分数)就是一个实体型。实体集:同一类实体的集合称为实体集。如全体职工。注意区分型与值的概念。如每个职工是职工实体型的一个具体值。属性:描述实体的特性称为属性。如职工的职工号,姓名,性别,出生日期,职称等。域:属性取值的范围称为该属性的域。如人的性别的域为(男,女),年龄的取值一般在0~100之间等。关键字:如果某个属性或属性组合的值能唯一地标识出实体集中的每一个实体,可以选作关键字。用作标识的关键字,也称为码。如职工号就可作为关键字。联系:实体集之间的对应关系称为联系,它反映现实世界事物之间的相互关联。联系分为两种,一种是实体内部各属性之间的联系;另一种是实体之间的联系。2.实体间的联系联系可以归结为三种类型:①一对一联系;②一对多联系;③多对多联系。2.E-R模型E-R模型(实体联系模型)简称E-R图。它是描述概念世界,建立概念模型的实用工具。E-R图包括三个要素:实体(型):用矩形框表示,框内标注实体名称。属性:用椭圆形表示,并用连线与实体连接起来。实体之间的联系:用菱形框表示,框内标注联系名称,并用连线将菱形框分别与有关实体相连,并在连线上注明联系类型。职工制造商部门产品销售生产拥有所在部门多种地址姓名职工号价格型号编号产品名地址价格制造商多种产品号部门名经理销售的产品多名职工3.将E-R图转化为表E-R图的设计属于数据库的概念设计。设计完E-R图后,再将其转换为对应的表,这个过程称为逻辑数据库设计。逻辑数据库的设计中主要任务是将概念数据库转化为逻辑数据库及关系模式的规范化。将E-R图转化为表,一般应遵循以下两个原则:①对实体,直接按属性转化成关系表。②对联系,属性包含以下两个部分:一是联系本身的属性,二是与联系有关的实体的主关键字。二、数据模型一般来说,数据模型是严格定义的一组概念的集合,这些概念精确地描述了系统的静态特向、动态特性和完整性约束条件。构成数据模型的三个组成要素:1.数据结构数据结构用于描述系统的静态特性。在数据库系统中,通常按照其数据结构的类型来命名数据模型。2.数据操作数据操作用于描述系统的动态特征。数据操作是指对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则。操作有检索、插入、删除、修改。按照数据模型的不同将数据库系统划分为三类:层次模型、网状模型和关系模型。1.层次模型层次型数据库管理系统是紧随网状数据库而出现的。现实世界中很多事物是按层次组织起来的。层次数据模型的提出,首先是为了模拟这种按层次组织起来的事物。层次数据库也是按记录来存取数据的。层次数据模型中最基本的数据关系是基本层次关系,它代表两个记录型之间一对多的关系,也叫做双亲子女关系(PCR)。2.网状模型处理以记录类型为结点的网状数据模型的数据库。处理方法是将网状结构分解成若干棵二级树结构,称为系。系类型是二个或二个以上的记录类型之间联系的一种描述。在一个系类型中,有一个记录类型处于主导地位,称为系主记录类型,其它称为成员记录类型。3.关系模型用二维表来描述实体间的联系。能反映实体间的三种联系,结构简单,概念清楚,理论严密,符合习惯。1.2关系数据库1.2.1关系数据库概述关系数据库系统是支持关系数据模型的数据库系统,即以关系模型为基础而构建起来的数据库系统。关系数据模型由关系数据结构、关系操作集合和关系完整性约束三部分组成。1.关系数据结构在关系数据库中,现实世界中的实体和实体之间的联系都用单一的关系来描述,这些关系的逻辑结构非常简单,就像人们日常所熟悉的二维表。2.关系操作关系数据库中采用的是集合操作方式,操作的对象和结果都是集合,称为“一次一集合”。3.关系的完整性约束数据的完整性约束是指在给定的数据模型中,数据及其联系所遵守的一组通用的完整性规则,以确保数据库中数据的一致性和正确性。在关系模型中允许定义三类完整性约束:实体完整性、参照完整性和用户自定义完整性。1.2.2关系模型的基本概念1.关系一个关系就是一张二维表,每个关系都有一个关系名。一张二维表可以存储为一个文件。2.元组二维表中的行称为元组,每一行是一个元组。一个元组就是文件中的一条记录。3.属性和属性值二维表的列称为属性,每一列有一个属性名,且属性不能重名。属性值是属性的具体值。属性对应文件中的一个字段。4.域属性的取值范围称为域。5.关键字(码)在关系的诸属性中,能够用来唯一标识元组的属性或属性组合称为关键字或码。在一个关系中,关键字(码)的取值不能为空。6.候选关键字(选码)如果在一个关系中,存在多个属性(或属性组合)都能用来唯一标识元组,这些属性(或属性组合)都可以作为候选关键字(候选码)7.主关键字(主码)在一个关系的若干候选关键字中,被指定作为关键字的候选关键字称为该关系的主关键字或主码。8.基本关系具有6条性质:①列是同质的,即每一列中的数据值是同一类型的数据,来自同一个域。②不同列可出自同一个域。③列的顺序无所谓。④任意两个元组不能完全相同。⑤行的顺序无所谓。⑥分量必须是原子值。1.2.3关系运算关系操作能力通常用代数方式或逻辑方式表示,分别称为关系代数和关系演算。用关系的运算来表达查询的方式称为关系代数。关系代数的运算分为传统集合运算和专门关系运算两类。传统的集合运算包括并、交、差和广义笛卡儿积,专门关系运算包括选择、投影、连接等操作。其中并、差、投影、笛卡儿积和选择五种操作为基本操作,而其它操作均可以用这五个基本操作表示。1.传统的关系运算并(∪):R∪S={t|t∈R∨t∈S},由属于R或属于S的元组组成,结果为n目关系RSR∪SABCa1b1c1a1b2c2a2b2c1ABCa1b2c2a1b3c2a2b2c1ABCa1b1c1a1b2c2a2b2c1a1b3c21.传统的关系运算交(∩):R∩S={t|t∈R∧t∈S},由既属于R又属于S的元组组成,结果为n目关系RSR∩SABCa1b1c1a1b2c2a2b2c1ABCa1b2c2a1b3c2a2b2c1ABCa1b2c2a2b2c12.专门的关系

1 / 66
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功