数据库系统原理重点小抄

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

数据:符号记录下来的可以识别的信息,数据是信息的符号表示或载体,而信息则是数据的载体。信息:为关于现实世界存在方式或运行状态的反映,信息只有通过数据形式的表示才能被人们理解和接受;数据库(DB):指长期储存在计算机内、有组织的、可共享的数据集合。数据库管理系统(DBMS):是位于用户和操作系统之间的一层数据管理软件。数据库系统(DBS):指在计算机系统中引入数据库后的系统构成,一般由数据库、数据库管理系统、应用系统、数据库管理员和用户构成。1.数据库技术的研究领域:数据库管理软件的研制,数据库设计,数据库理论。2.数据模型:是容易被人理解、便于在计算机上实现、比较真实的现实世界的模拟。数据模型的组成要素:数据结构、数据操作、数据的约束条件。概念模型:是现实世界到机器世界的一个中间层次,具有较强的语义表达能力,简单、清晰、易于用户理解。前者是实体—联系模式,后者是网状层次关系3.数据模型的要素:数据结构,数据操作和完整性约束,分别描述静态特性,动态特性和完整性约束条件;常用的数据结构模型有层次数据模型,网状数据模型,关系数据模型。前两者统称非关系模型4.模式:是数据库中全体数据的逻辑结构和特征的描述,它仅仅涉及到型的描述,不涉及到具体的值。三级模式结构:是数据库系统是由外模式、模式、内模式三级构成。二级映像功能:外模式/模式映像和模式/内模式映像,保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。5.数据库管理系统的基本功能:数据定义;数据操纵;数据库运行管理;数据组织、存储和管理;数据库的建立和维护;数据通信接口。从最终用户角度来看,数据系统分为单用户,主从式,分布式,客户/服务器结构6.DBMS的结构:数据定义语言及其翻译处理程序,数据操纵语言及其编译程序,数据库运行控制程序,实用程序。7.关系数据库系统是支持关系模型的数据库系统。关系模型由关系数据结构、关系的操作集合和完整性约束三部分组成。8.模式描述的是数据的全局逻辑结构,外模式描述的是数据的局部逻辑结构,对应同一个模式可以有任意多个外模式,对于每一个外模式,数据库系统都有一个外模式/模式映像。数据只有一个模式,也只有一个内模式,所以模式/内模式映像是唯一的,它定义了数据全局逻辑结构与存储结构之间的对应关系,保证了数据的物理独立性。9.数据库设计的核心与关键是逻辑/物理数据库设计。数据库设计分为:需求分析,概念设计,逻辑设计,物理设计。数据库设计的方法是规范化设计,都是运用软件工程的思想和方法。数据库设计的指标为:结构合理,使用方便,效率较高。存储结构:邻接法和链接发。10.关系模式的数据结构是二维表格。关系模式中的关系操作称为关系代数和关系演算。关系代数是对关系的运算来表达查询的方式,关系演算是用谓词来表达查询要求的方式。关系有三种类型:基本关系,查询表示和视图表。关系的本质是一张二维表。11.视图是一个或几个基本表导出的表,它与基本表不同,是一个虚标。视图的消解:DBMS执行对视图的查询时,首先进行有效性检查,检查查询涉及的表、视图等是否在数据库中存在,存在后则从数据字典中取出查询,设计对视图的定义,把设计视图的定义,把定义中的子查询和用户视图的查询结合起来,转换为对基本表的查询,将对视图的查询转换为对基本表的查询,然后再执行这个经过修正的查询,将对视图的查询转换为对基本表的查询称为视图的消解。12.嵌入式SQL对宿主型数据库语言SQLDBMS采用两种方法处理:预编译;修正和扩充主语句语言使之能处理SQL语言。SQL语言输出数据主要用主变量和游标实现。13..支持层次和网状这两种格式化数据模型的数据系统为第一代数据库系统。关系数据库是第二代数据库系统,特点是将用户从编程数据库记录的导航式检索中解脱出来,大大减小了用户编程的难度。第三代数据库系统是支持面向对象数据模型的数据库系统。分布式数据库是集中式数据库技术与网络技术相结合的产物。14.分布式数据库系统的特点:数据的物理分布性,数据的逻辑整体性,数据的分布独立性,场地自制和协调,数据的冗余及冗余透明性。优点:分布式控制,数据共享,可靠性和可用性得到加强,性能得到改善,可扩充性好。分布式数据库的体系结构:全局外模式,全局概念模式,分片模式。分布时不使数据库语义发生改变,则遵循:完全性,可重构性,不相交性。分布透明性从高到低依次为:分片透明性,位置透明性,局部数据模型透明性,分别又映像2、3、4保证。15..体系化环境由操作化环境和分析化环境构成。16.空间数据库是以描述空间位置和点线面体特征和拓扑结构的位置数据及描述这些特征的性能的属性数据为对像的数据库。17.事务应具有的4个属性:1.原子性2.一致性3.隔离性4.持续性18.分析工具:联机分析处理技术及工具和数据挖掘技术和工具19.基于数据库技术的DSS解决方案:DW(数据仓库)+OLAP(联机分析处理)+DM(数据挖掘)——DSS的可行方案20.安全性控制的一般方法:用户标识和鉴定、存取控制和密码存储21.并发操作带来的数据不一致性包括三类:丢失修改,不可重复性和读“脏”数据;产生上述三类数据不一致性的主要原因是并发操作破坏了事务的隔离性22.数据依赖是通过一个关系中属性间值的相等与否体现出来的数据间的相互关系,是现实世界属性间相互联系的抽象,是数据的内在性质,是语义的体现23.范式是符合某一级别的关系模式的集合;第一范式(1NF)如果一个关系模式R的所有属性都是不可分的基本数据项,则R属于1NF24.关系模式的规范化:一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式集合25.数据的完整性与安全性是数据库保护的两个不同的方面。安全性是防止用户非法使用数据库,包括恶意破坏数据和越权存取数据。完整性则是防止合法用户使用数据库时向数据库加入不合语义的数据。也就是说,安全性措施的防范对象是非法用户和非法操作,完整性措施的防范对象是不和语义的数据26.数据库保护DBMS必须提供数据的安全性、完整性、并发控制和数据库恢复等数据保护能力;数据库的安全性是指保护数据库,防止因用户使用非法使用数据库造成数据泄漏、更改或破坏27.ORACLE采用封锁技术保证并发操作的可串行性;ORACLE的锁可分为数据锁和字典锁,五种数据锁为共享锁,排它锁,行级共享锁,行级排它锁,共享行级排它锁28.数据库的三个阶段:1.人工管理阶段,数据处理方式是批处理2.文件系统阶段,处理方式:联机实时处理。批处理3.数据库系统阶段:联机实时处理,分布处理,批处理;数据库系统来管理数据的特点:1.数据结构化2.数据的共享性好,冗余度低3.数据独立性高3.数据由DBMS统一管理和控制29.关系的三类完整性约束:实体完整性,参照完整性,用户定义的完整性。实体完整性规则:若属性A是基本关系R的主属性,则属性A不能取空值。参照完整性规则:若属性F是基本关系R的外码,它与基本关系S的主码Ks相对应,则对于R中的每个元组在F上的值必须为空值或等于S中某个元组的主码值。30.结构化查询语言(SQL)是一种介于关系代数与关系演算之间的语言,其功能包括查询、操纵、定义和控制4个方面。SQL的特点:综合统一,高度非过程化,面向集合的操作方式,以同一种语法结构提供两种使用方式,语言简洁、易学易用。31.数据库设计的步骤:1.需求分析阶段:通过调查组织机构总体情况,熟悉业务活动,从而明确用户需求,然后确定系统边界;2.概念结构设计阶段:根据需求分析的结果对数据进行抽象,设计局部视图即E-R图,再将它们进行合并,集成视图即总E-R图;3.逻辑结构设计阶段:进一步转化为一般数据模型,再转化为特定DBMS支持下的数据模型,然后优化模型;4.数据库物理设计阶段:确定数据库的物理结构,再评价数据库的物理结构,重点是时间和空间效率;5.数据库实施阶段:用DDL定义数据库结构,数据装载入库,编制与调试应用程序,再进行数据库试运行;6.数据库运行和维护阶段:数据库的转储和恢复,数据库的安全性、完整性控制,数据库性能的监督、分析和改进,数据库的重组织和重构造32.数据模型及数据库系统的发展:1.第一代数据库系统:支持层次和网状这两种格式化数据模型的数据库系统,他们从体系结构、数据库语言到数据存储管理均均有共同特征,支持三级模式的体系结构,用存取路径表示数据之间的联系,独立的数据定义语言和导航的数据操纵语言;2.第二代数据库系统:支持关系数据模式的关系数据库系统,关系模式不仅简单、清晰,而且有关系代数作为语言模型,有关系数据理论作为理论基础。因此关系数据库系统具有形式基础好、数据独立性强、数据库语言非过程化等特色,但仍不能捕捉和表达数据对象所具有的丰富而重要的语义,因此尚只能属于语法模型‘第三代数据库系统:支持面向对象数据模型的数据库系统,面向对象的数据模型吸收了面向对象程序设计方法的核心概念和基本思想,相比传统的数据库,具有许多优点,如包含更多的数据语义信息,对复杂数据对象的表达能力更强等,但作为一种新兴的技术,有待于进一步发展33.数据库管理系统的功能与组成:功能:1.数据定义2.数据操纵3.数据库运行管理4.数据组织、存储和管理5数据库的建立和维护6.数据通信接口;组成:1.数据定义语言及其翻译处理程序2.数据操纵语言及其编译程序3.数据库运行控制程序4.实用程序34.保证数据一致性的封锁协议—三级封锁协议:1级封锁协议可防止丢失修改,并保证事务T是可恢复的;2级封锁协议除防止丢失修改,还可以进一步防止读“脏”数据;3级封锁协议除防止丢失修改和不读“脏”数据外,还进一步防止了不可重复读35.可串行性是并行事务正确性的唯一准则,两段锁协议是保证并行调度可串行的封锁协议;两段锁含义:第一阶段是获得封锁,也称为扩展阶段,第二阶段是释放封锁,也称为收缩阶段36.数据仓库定义和特征:定义:数据仓库是面向主题的,集成的,稳定的,不同时间的数据集合,用以支持经营管理中的决策制定过程,面向主题、集成、稳定和随时间变化时数据仓库四个最主要的特征37.并行数据库系统与分布式数据库系统的区别:1.应用目标不同:并的目的是充分发挥并行计算机的优势,利用系统中的各个结点并行地完成数据库任务,提高数据库系统的整体性能。而分主要目的在于实现场地自治和数据的全局透明共享,而不要求利用网络中的各个结点来提高系统处理性能;2.实现方式不同:在并中,各结点间采用高速网络互连,结点间的数据传输代价相对较低,工作负载过大的结点上的部分任务通过高速网传给空闲结点处理,从而实现系统的负载平衡。在分中,各结点一般采用局域网或广域网相连,网络带宽较低,点到点的通信开销较大,因此在查询处理时一般应尽量减少结点间的数据传输量;3.各结点的地位不同:在并中,不存在全局应用和局部应用的概念。各结点是完全非独立的,在数据处理中只能发挥协同作用,而不可能有局部应用。在分中,各结点除了能通过网络协同完全成全局事务,更重要的一点还在于,各结点具有场地自治性38.DBMS的完整性控制机制应具有三个方面的功能:1.定义功能,即提供定义完整性约束条件的机制;2.检查功能,即检查用户发出的操作请求是否违背了完整性约束条件;3.如果发现用户的操作请求使数据违背了完整性约束条件,则采取一定的动作来保证数据的完整性·39.完整性约束条件作用的对象和分类:作用对象:列级、元组级和关系级三种粒度,其状态;分类:1.静态列级约束2.静态元组约束3.静态关系约束4.动态列级约束5.动态元组约束6.动态关系约束40.封锁的定义、类型和封锁粒度:封锁时实现并发控制的一个非常重要的技术。所谓封锁就是事务T在对某个数据对象操作之前,先向系统发出请求,对其加锁。加锁后事务T在对该数据对象有了一定的控制,在事务T书房它之前,其他的事务不能更新次数据对象;基本封锁类型:排它锁和共享锁;封锁粒度与系统的并发度和并发控制的开销密切相关。封锁的粒度越大,系统中能够被封锁的对象就越少,并发度也就越小,但同时系统开销也越小;反之亦然41.避免活锁方法和死锁预防解除:避免活锁的简单方法是采用先来先服务

1 / 4
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功