程序员培训(基础部_数据库技术)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

数据库基础知识程序员考试大纲一、数据库系统(DBSDataBaseSystem)数据库(DB)DB是长期存放在计算机系统内部的一个相互关联的、通用的、综合的(顺序组织、索引、聚集方法组织)、有结构的、可共享的数据集合。它具有较小数据的冗余和较高数据独立性(数据的组织和存储方式与应用程序是密切相关的)、安全性和完整性,在DBMS控制和管理之下的实现的,可以为用户共享。1、数据库系统定义数据库系统是由数据库(DB)、数据库管理系统(DBMS)、数据管理员(DBA)、应用程序、用户和计算机软件/硬件系统等组成的一个集合。(1)数据库一、数据库系统(DBSDataBaseSystem)(2)数据库管理系统(DBMS)是一个数据管理软件,是数据库系统的核心,提供用户与数据之间的接口,并具有数据库的定义和管理功能。USERDBMSOSDB一、数据库系统(DBSDataBaseSystem)(2)数据库管理系统(DBMS)功能1)数据库定义包括外部模式、内部模式、概念模式、模式间映像、数据库完整性、安全性、存取路径定义。这些定义存放在数据字典中,是DBMS运行的依据。2)数据控制功能数据库访问的安全性、完整性、并发控制。以保证数据可靠性和可用性。3)数据操纵功能DBMS接收用户的操作需求,完成对数据库的查询、插入、删除等操作、数据备份与恢复等。4、查询功能:5、通信功能:一、数据库系统(DBSDataBaseSystem)DBA、系统分析员、程序员、用户A、DBA:专门负责整个数据库的建立、查询、维护、协调工作的专门人员。其主要职责有:1)参与数据库的设计与建立。参与数据库系统的外模式、概念模式、内部模式的建立。2)对系统进行监控。3)定义数据的安全性和完整性约束条件。4)负责数据库性能的改进和数据的重组及重构工作。监视系统统性能、对数据库中数据进行重组,根据用户对数据库的需求对数据库进行重构,当数据库出现了故障时,对数据库系统的进行恢复。B、系统分析员:负责应用系统的需求分析和规范说明。C、程序设计员D、用户。一、数据库系统(DBSDataBaseSystem)DBS=DB+DBMS+OS+DBAA、人工管理阶段:20世纪50年代,操作系统还末出现,数据管理是人工管理方式来实现的。此时数据的逻辑结构和物理结构完全需要用户自己设计,程序依赖于数据,不具独立性;数据面向特定的应用,不能共享;数据并且不需要长期保存。B、文件系统阶段:20世纪60年代,出现了操作系统,数据管理通过操作系统来管理(文件系统),数据组织成为若干文件。它具有如下优点:文件系统可以通过“按名存取”,可以长期保存。其不足之处:数据独立性差(文件逻辑结构改变对应的程序也需要修改,反之亦然。);数据冗余度大且不一致性(因为文件是面向某个或某组用户,不同用户需要不同的文件);文件内部记录之间无联系;安全性较低;一般不支持应用程序对文件的并发访问。(3)数据库的发展C、数据库系统阶段:20世纪60年代后期,出现了快速的大容量的磁盘存储设备,提供了数据管理的物质基础。随着多用户、多应用对数据的共享的需求,出现了数据库管理系统(DBMS),1、数据库中数据集中化控制1)将系统中所有要使用的数据按照一定结构集中存放。2)数据库管理员(DBA)数据库系统设有DBA,对数据库专门进行管理和维护。2、数据冗余度小数据集中存放的结果是数据冗余小。3、采用一定的数据模型实现数据结构化数据库中数据是按照一定的数据模型来组织、描述和存放的。数据模型能够描述各种现实数据和之间的联系。数据同是面向系统而不再面向某个具体应用。数据模型有:网状、层次、关系三种,对应于三种不同数据库。4、避免了数据的不一致性数据的不一致性是指数据不相容性或矛盾性,即同一数据在同一数据库内重复出现,且具有不同的值。例如:职工的工资在职工工资单或职工档案中具有不同的值。是由于数据重复存放(冗余)造成的。5、实现数据共享数据库中一组数据集合可为多种语言和多个用户共同使用。1)当前所有用户(批处理、联机用户)2)能够新的应用需求。(由于数据与应用独立)3)具有多种接口(C/C++、VF、PL/SQL等)6、提供数据保护提供一系列数据保护功能、如数据安全、数据完整约束、迸发控制等。7、数据独立性数据库中的数据独立于应用程序,即数据的逻辑结构、存储结构与存取方式的改变不影响应用程序。1)逻辑独立性:数据的总体逻辑结构发生改变(如:修改数据定义、新增数据类型等),不影响应用程序。2)物理独立性:数据的物理结构(存储结构、存取方式)改变不影响数据的逻辑结构。因为数据模型中有三个层次。8、数据由DBMS统一管理和控制数据库的共享是并发式的共享,即多个用户同时访问数据库中的数据。在DBMS中提供了以下机制保证此操作能实现:1)数据安全性:2)数据完整性:3)并发控制:4)数据库恢复:2、数据模型1)数据的范畴:数据从现实世界进入数据库实际经历可分为三个阶段:现实世界、信息世界、机器世界。现实世界:客观存在并可以相互区分的事物,称为实体,用E-R模型表示;信息世界:客观事务物头脑中的反应;机器世界:对信息世界的数据化,数据化后的信息称为数据;2、数据模型2)E-R图:E-R(Entity-Relationship):实体联系方法。是描述现实世界的描述方法。三个要素:实体、属性、联系。实体(ENTITY)实体是客观存在且可以区分的事物。如学生、职工等具体的;也可以是梦、文化艺术等抽象。具有相同性质的实体的集合称为实体集。如全体职工。实体用方框表示。2、数据模型2)E-R图:E-R(Entity-Relationship):实体联系方法。是描述现实世界的描述方法。三个要素:实体、属性、联系。属性(ATTRIBUTE)实体或联系所具有的特征。实体之间通过特征来区分。用椭圆表示。属性具有如下特征:属性是不能再分的原子属性属性有型与值之分。型是属性名,值是具体的数据。实体相应也有型与值的区别。实体型是属性名的总称。实体中各个属性的值集是实体的一个值。每个属性都有一个取值范围称为域(DOMAIN)。有能唯一标识一个实体的属性或属性集的关键字。(KEY)2、数据模型2)E-R图:E-R(Entity-Relationship):实体联系方法。是描述现实世界的描述方法。三个要素:实体、属性、联系。联系(RELATIONSHIP)联系是实体集之间关系的抽象描述,即对现实世界中事物之间关系的描述。如“读者”与“图书”之间通过借书来联系。“教师”实体和“学生”实体通过“授课”联系。一般有三种类型:一对一(1:1)、一对多(1:n)、多对多(n:m)用菱形表示。2)E-R图E-R图是E-R数据模型的图形表示方法。A、E-R图的表示方法矩形表示实体;菱开形表示联系(内有联系名,无向边表示实体之间的接连,边上标明联系的类型);属性用椭圆表示。负责校长学校聘任系部教师借阅图书读者1:11:nm:n111nnm3)数据库系统的结构分为:集中式结构:将数据及数据管理集中在一台计算机上,效率高、可靠性好、数据冗余少,独立性高;客户/服务器网络结构:客户端通过用户界面或接口提出请求,服务端响应请求,将执行结果传递给客户端;分布式结构:数据库的数据分布在不同的计算机上,逻辑上是一个整体,对用户而言是透明的;3)数据模型表示数据与数据之间联系的方法称为数据模型,有三种方法:层次模型、关系模型、网状模型。层次模型:层次模型是按照层次结构的形式来组织数据库的数据模型,即用树型结构表示实体集与实集之间的联系。特点1:每棵树有且仅有一个结点无双亲,此结点为根(Root)2:除根以外,每个结点仅有一个双亲结点。例如:家族关系、行政关系等。次模型数据结构的型与值型是指层次型数据模型数据结构对实体集及实体集之间的联系的描述。值是型的一个实例,具体的一个记录。层次型模型:1、用树的前序遍历(从上到下,从左到右)的次序作为数据的存储次序。2:层次路径:指明从根结点到目标结点的一条查询路径。数据约束:1、除根结点以外,任何结点都不能离开双亲结点而孤立存在。插入,删除受限制。2只限于二元1:n或1:n的联系。其代表有:IBM公司的IMS系统。网状数据模型的数据结构用网状数据结构表示实体集和实体之间联系的模型称为网状数据模型。其表现为一个双亲记录允许多个子女记录,而且一个子女记录型也允许有多个双亲记录型。(1)网状模型数据结构的特点A、允许有一个以上结点无双亲,且至少有一个结点有多于一个双亲。班级社团学生1NS11NS2B、网状模型允许有重复链。教师计算机使用维护其代表有:CODASYL关系数据模型是以集合论中的关系概念为基础发展起来的一种数据模型,用二维表格来描述实体集及实体间的联系。关系数据模型的数据结构二维表称为关系,表中列称为属性,列中取值所有集合称为域,表中一行称为元组。每个元组用关键字标识。系数据模型的描述功能1)用二维表描述实体集及其属性。A1A2…An关系R用二维表描述实体间的联系。借书证号姓名单位实体-读者关系总编号分类号书名作者…实体-图书关系借书证号总编号日期联系-借阅关系实体与联系的表示统一起来。关系的性质1)关系是一个二维有,一行称为一个元组,一列称为一个属性,有一个域。2)每一列具有相同的值域。通过属性名来区别。3)关系中属性不能分解,必须是原子属性。4)关系中任意两个元组不能完全相同。5)关系中列、元组的顺序是无关紧要的。6)每个元组都有一个关键字来标识每个元组。其代表有:sysbase、oracle、sqlserver、foxpro、access、informixR(U,D,DOM,I,Σ)关系名组成关系全部属性集属性值域属性域到列的映射一组完整性约束属性集间的一组数据依赖。关系模式关系中内容信息的描述。包括关系名、属性名、值域、数据完整性约束、属性间的函数据依赖。记为:在数据模型中有关数据结构及其相互关系的描述称为数据模式(DATASCHEMA)数据库系统的三级模式结构数据库从逻辑结构上可以划分三个层次:外部模式(EXTERNALSCHEMA)、概念模式(CONCEPTUALSCHEMA)和内部模式(INTERNALSCHEMA),称为数据库系统的三级模式结构。用户11外部模式1外部模式2外部模式n概念模式内部模式DB用户12用户21用户22用N1用户Ni……外部模式/概念模式的映像概念模式/内部模式的映像概念模式:概念模式(简称模式,也称逻辑模式)是对数据库全局逻辑结构的描述,是对数据库所有用户的公共数据视图。一个数据库只有一个概念模式,是三级模式的中间层,不涉及数据的物理存储细节和硬件环境,也与具体的应用程序及程序设计语言无关。概念模式由DBMS提供的模式DDL语言,字义了数据的逻辑结构(如字段名称、类型、域等,数据之间的联系、安全性、完整性等内容)。是全体数据的描述,本身并不是数据库,只是装配数据的一个框架。外部模式(EXTENALSCHEMA)外部模式(也称子模式或用户模式或外模式)是用户观念下的局部数据结构的逻辑描述,是数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述。是概念模式的一个逻辑子集。外部模式由DBMS提供的外部模式语言(外部DD)来定义和描述。其优点如下:A、方便用户使用,简化了用户接口。用户不必了解数据的存储结构便可在终端上操作数据。B、保证数据的独立性。通过模式间的映像数据库的独立性。C、有利于数据共享。多个用户的外模式都可来自于同一概念模式。D、有利于数据的安全和保密。用户只能操作其外模式范围内的数据,对于其它的数据用户是看不见的,从而保证了数据安全性。内部模式(INTERNALSCHEMA)内部模式(也称存储模式)是地数据库中数据物理结构和存储方式的描述。是数据在数据库内部的表现形式,一个数据库只有一个内部模式。它规定了数据项、记录、键、数据集、指针、索引和存取路径、数据是否加密、压缩以及优化性能。它由DBMS提供的内部模式语言(内部模式DDL)来定义和描述。总结:1)数据库的整体逻辑结构和特征

1 / 54
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功