1第1章Access2003入门1.1数据库基础1.2Acess2003基础1.1数据库基础1.1.1信息与数据1.1.1.1数据(Data)数据是指存储在某种媒体上能够识别的物理符号。数据的概念包括两个方面:描述事物特性的数据内容;存储在某一种媒体上的数据形式。1.1.1.2数据库(DataBase,DB)数据库是与特定的主题或目的相关的数据的集合,它具有一定的组织形式并存储于计算机存储器上,具有多种表现形式并可被各种用户所共享。数据库是被长期存放在计算机内、有组织的、可以表现为多种形式的可共享的数据集合。数据库技术使数据能按一定格式组织、描述和存储,且具有较小的冗余度,较高的数据独立性和易扩展性,并可为多个用户所共享。数据库基本概念数据库:能将大量的数据按照一定的方式组织并存储起来,能够快速方便的管理与维护数据的方法与技术,大大地方便了数据共享。数据库概述1.数据与数据处理•数据处理并不是计算机特有的概念,计算机没有引进我们的工作中时,财务部门所处理的单据、报表等属于数据处理。•计算机中的数据是存储在某一种媒介上能够识别的物理符号。•有两个含义:描写事物的特性:例某人生日是“1980年12月21日”–数据在计算机中的表示形式:同一种意义的数据可能用多种不同形式表示例:生日是“1980年12月21日”,也可以“1980.12.21”•明天天气是“阴有雨”,也可以用图形符号:•用数据符号表示信息通常有三种:•数值型:如年龄、体重、价格、温度•字符型:姓名、单位、地址•特殊型:照片(图像)、刮风、下雨(图形符号),还有声音、视频(多媒体数据)数据处理•也称信息处理,是利用计算机对各种类型的数据进行处理。包括数据的采集、整理、存储、分类、排序、检索、维护、加工、统计和传输等一系列操作过程。•数据处理的目的是从大量数据中,通过分析、归纳、推理等科学方法,利用计算机技术、数据库技术等技术手段,提取有效的信息资源,为进一步分析、管理、决策提供依据。2.数据库(DataBase,DB)•孤立的数据不能代表确切的信息,为反映某一方面的信息往往需要若干数据。•例学生基本信息:姓名、性别、出生年月、籍贯、专业……这些数据需组织起来。•最初的数据以文件形式组织,处理数据时,更多的是涉及对文件的操作(读、写),带来了数据处理不便、数据共享困难等一系列问题。数据库技术的产生有效地克服了这类问题。原始数据编码表示形式计算机表示形式信息(结果数据)搜集输出编码转换数据输入计算机处理用户2•数据库是存储在计算机系统中的存储介质上,按一定的方式组织起来的相关数据的集合。数据库是结构化的,不仅仅描述数据本身,而且数据之间的关系进行描述。•数据库中的数据具有高度的共享性。数据不是面向某一种应用,而是面向多种应用,可以被多个应用程序共享。3.数据库管理系统(DataBaseManagementSystem,DBMS)•DBMS是数据管理软件,它需要操作系统的支持,向用户提供了一系列的数据管理功能。•组成:数据定义语言、数据操纵语言、数据库运行控制程序、实用程序•功能:数据定义、数据操纵、数据库运行管理、数据组织、存储与管理、数据库的建立与维护、数据通信接口。4.数据库系统(DataBaseSystem,DBS)•是运行数据库系统的计算机系统。包括:–计算机硬件环境和操作系统环境–DBMS–数据库–数据库应用系统–用户1.1.2数据管理技术•数据管理:是数据处理的中心问题,指如何对数据分类、组织、编码、存储、检索和维护。•数据管理的发展历史可以分为四个阶段第一阶段:人工管理阶段•(50年代中期以前):人工管理阶段•特点:数据与程序不具有独立性,一组数据对应一组程序。程序与程序之间存在大量数据冗余。第二阶段:文件系统阶段•(50年代后期至60年代中期):•特点:程序和数据分开存储,形成程序文件和数据文件,程序可以按名访问数据文件。但是,同一个数据项可能重复出现在多个文件中,导致数据冗余度较大,浪费空间,没有形成数据共享,又不易统一修改容易造成数据的不一致。第三阶段:数据库系统阶段•(60年代后期至今)•特点:为了解决多用户、多应用共享数据的要求,由数据库管理系统DBMS管理数据,提高数据共享,减少数据冗余,提供数据与应用程序独立,达到有效的管理和存取大量的数据资源。第四阶段:分布式数据库系统与面向对象数据库系统•(70年代后期至今)•分布式数据库系统阶段:与网络技术紧密结合•特点:合理分布数据在系统的相关节点上,实现节点共享,逻辑上属于同一系统,但在物理结构上是分布式,因此用户不感觉到数据的分布。•由若干个节点集合而成,在通讯网络中联接在一起,每个节点都是一个独立的数据库系统,都拥有各自的数据库、中央处理机、终端以及各自的局部数据库管理系统。3•面向对象数据库系统:是数据库技术与面向对象程序设计技术结合•优点:它克服了传统数据库的局限性,能够自然地存储复杂的数据对象及它们之间的复杂关系,大幅提高了数据库管理效率、降低了用户使用的复杂性。1.1.2.1数据库管理系统(DBMS)数据库管理系统(DataBaseManagementSystem,简称DBMS)是对数据库进行管理的系统软件,它的职能是有效地组织和存储数据、获取和管理数据,接受和完成用户提出的访问数据的各种请求。数据库管理系统主要功能包括以下几个方面:(1)数据定义功能DBMS提供了数据定义语言DDL(DataDefinitionLanguage),用户通过它可以方便地对数据库中的相关内容进行定义。例如,对数据库、表、索引进行定义。(2)数据操纵功能DBMS提供了数据操纵语言DML(DataManipulationLanguage),用户通过它可以实现对数据库的基本操作。例如,对表中数据的查询、插入、删除和修改。(3)数据库运行控制功能这是DBMS的核心部分,它包括并发控制(即处理多个用户同时使用某些数据时可能产生的问题)、安全性检查、完整性约束条件的检查和执行、数据库的内部维护(例如,索引的自动维护)等。所有数据库的操作都要在这些控制程序的统一管理下进行,以保证数据的安全性、完整性以及多个用户对数据库的并发使用。(4)数据库的建立和维护功能数据库的建立和维护功能包括数据库初始数据的输入、转换功能,数据库的转储、恢复功能,数据库的重新组织功能和性能监视、分析功能等。这些功能通常是由一些实用程序完成的。它是数据库管理系统的一个重要组成部分。1.1.2.2数据库系统(DataBaseSystem,DBS)数据库系统是指引进数据库技术后的计算机系统,它一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员和用户组成。1.1.3数据模型1.三个世界•计算机信息管理的对象是现实生活中的客观事物,但这些事物是无法直接送入计算机的,必须进一步整理和归类,进行信息的规范化,然后才能将规范信息数据化并送入计算机的数据库中保存起来。•这一过程经历了三个领域──现实世界、信息世界和数据世界。(1)现实世界:存在于人脑之外的客观世界,包括事物及事物之间的联系。(2)信息世界:是现实世界在人们头脑中的反映。(3)数据世界:将信息世界中的实体进行数据化,事物及事物之间的联系用数据模型来描述。术语的对照例子:学生借阅图书•现实世界中:学生借阅图书•在信息世界中将抽象为学生和书籍两个实体集,两个实体集间的联系为“借阅”。•用关系模型表示为学生、书籍和借阅三个关系。•用ACCESS中建立学生、书籍和借阅三个数据表,并为学生和借阅两个表建立联系,为书籍和借阅两个表建立联系。这样,就完成了从现实世界到数据世界的转换。2.数据模型•数据库的数据结构形式,叫数据模型,它是对数据库如何组织的一种模型化表示。•如果这个模型只能表示存储什么信息,那么它是简单的,是文件系统早已解决了的问题,更重要的是要以一定数据结构方式表示各种信息的联系。•数据模型表示的是数据库框架。打个比方,建设一幢楼房,首先要有建筑结构图,根据这个结构图先搭好架子,然后才能堆砖砌瓦,使建筑物符合要求,数据模型就相当于这个建筑结构图,根据这个结构图组织装填数据。4数据模型的形式•概念模型(抽象的)–概念模型是数据库设计人员在认识现实世界中实体与实体间联系后进行的一种抽象。•实现模型(具体的)–有三种:层次型、网络型和关系型概念模型•最常用的描述概念模型的方法,称为实体—联系方法(Entity-RelationshipApproach),简称E-R方法。•实体:指客观存在并可相互区别的物体。实体可以是实在的物体,如学生、图书等,也可以是抽象的事件,如订货、借书等。•属性:实体具有的某一种特性。如学生实体具有的姓名、性别等属性。•实体集:性质相同的同类实体的集合称为。如一个班的学生、图书馆的所有图书、皇马球队的所有场比赛等。•实体型:属性的集合,例学生实体型描述为:学生(学号、姓名、性别、出生年月)实体之间的联系•一对一:工厂——厂长•一对多:系——教师•多对多:商店——顾客•例教师讲课E——R图2.概念模型(实现模型)•目前有三种常用的实现模型形式:①层次型-----IMS②网状型-----DBTG③关系型-----Access、vfp、oracle、DB2、sybase等。(1)层次模型有且仅有一个结点无双亲,称之为“根”。除根结点外,其他子结点,有且仅有一个双亲。各实体型由上向下是一对多关系网络模型能够表示实体间的多种复杂联系和实体类型之间的多对多的联系。网络模型的特点:l可以有一个以上的结点无父结点;l至少有一个子结点有一个以上的父结点;在两个结点之间有两个或两个以上的联系。(3)关系型数据模型用二维表结构来表示实体以及实体之间联系的模型称为关系数据模型。无论实体本身还是实体间的联系均用称为“关系”的二维表来表示。能自然地反映实体间的联系。与前两者区别:数据描述的一致性,模型概念单一。1.1.4关系数据库1.1.4.1、关系术语•①关系:一个关系就是一张二维表,每个关系有一个关系名。如:纳税登记(税号,姓名,联系电话)。•②元组:一个二维表中,水平方向的一行成为一个元组,元组对应表中的一个具体记录。Access中表示为记录。•③属性:二维表中垂直方向的列。Access中表示为字段名。5•④域:属性的取值范围。•⑤关键字:其值能唯一地标识一个元组的属性或属性的组合。•如:学生关系中的“学号”属性、选课成绩关系中的“学号”与“课程号”属性组合。•⑥外部关键字:如果表中一个字段不是本表的主关键字,而是另外一个表的关键字和候选关键字,这个字段就称为外关键字。通过外部关键字使表与表建立联系。关系数据库及其特点关系规范化关系规范化理论认为,关系数据库中的每一个关系都需要进行规范化,使之达到一定的规范化程度,从而提高数据的结构化、共享性、一致性和可操作性。根据满足规范条件的不同,可划分为六个等级,分别称为第一范式(1NF),第二范式(2NF),第三范式(3NF),BC范式,第四范式(4NF)和第五范式(5NF)。关系规范化的基本思想是逐步消除数据依赖关系中不合适的部分,从而使依赖于同一个数据模型的数据达到有效的分离。需要特别指出的是,在实际操作中,并不是关系规范的等级越高就越好,通常情况下,只要把关系规范到第三范式标准就可以满足需要。(1)第一范式(1NF)(2)第二范式(2NF)(3)第三范式(3NF)第一范式(1NF)属于第一范式的关系应满足的基本条件是元组中的每一个分量都必须是不可分割的数据项。例如,表1-2所示的关系不符合第一范式,表1-3则是经过规范化处理,去掉了重复项而符合第一范式的关系。第二范式(2NF)所谓第二范式,指的是这种关系不仅满足第一范式,而且所有非主属性完全依赖于其主关键字。例如表1-4所示的关系虽满足1NF,但不满足2NF.解决的方法是将一个非2NF的关系模式分解为多个2NF的关系模式。表1-4不符合第二范式的学生与课程关系在本例中,可将表1.4所示关系分解为如下三个关系:学生关系:学号、姓名、班级;课程关系:课程号、课程名;学生选课关系: