第二部分信息系统的技术基础第六章数据库和数据库管理系统工商学院信管系杨韬内容框架•6.1传统的数据组织方式•6.2数据库系统•6.3数据库管理系统•6.4专用和通用数据库系统•6.5数据库中的知识发现6.1传统的数据组织方式6.1.1文件和文件夹•文件:相关记录的集合。可以是电子表格、文档、数据集合、或事实的集合。•文件夹:相关文件的集合。6.1传统的数据组织方式6.1.2文件的结构•文件结构:指在磁介质上存储记录的方式。其中包括:(1)顺序文件结构:按主键顺序存储。(2)直接文件结构:随机存储。(3)索引顺序文件结构:既可顺序存储,也可随机存储。索引是用来跟踪每条记录的硬盘地址的。•文件系统对数据的处理方式不仅有批处理,而且能够联机实时处理。•用文件系统管理数据,可以使文件长期保存,并且利用“按文件名访问,按记录进行存取”管理技术对文件进行修改、插入、删除操作。•程序和数据之间由文件系统提供存取方法进行转换。6.1传统的数据组织方式6.1.3传统文件系统的局限性(1)文件实现了记录内的结构性,但整体无结构。(2)文件是面向应用的。一个文件基本对应一个应用程序。(3)数据冗余度大,浪费存储空间。(4)数据不一致,修改和维护困难。6.2数据库系统•数据库:长期存储在计算机内,有组织的、可共享的、大量数据的集合。•数据独立性:指在对数据结构进行修改时,不必修改处理该数据的应用程序。(1)物理独立性:指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。当数据的物理存储改变了,应用程序不用改变。(2)逻辑独立性:指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变了,用户程序也可以不变。•常见的数据库结构有:(1)层次数据库结构(2)网状数据库结构(3)关系数据库结构(4)面向对象数据库结构层次数据库结构R1根结点R2兄弟结点R3叶结点R4兄弟结点R5叶结点叶结点层次模型的优缺点•优点•层次数据模型简单,对具有一对多的层次关系的部门描述自然、直观,容易理解•性能优于关系模型,不低于网状模型•层次数据模型提供了良好的完整性支持•缺点•多对多联系表示不自然•对插入和删除操作的限制多•查询子女结点必须通过双亲结点•层次命令趋于程序化网状数据库结构R1R2R3L1L2R1R2L3L1L2R3L4R4R5R1L1L2R2学生宿舍学生教研室系教师父母人子女树种植砍伐养育赡养网状模型的优缺点•优点•能够更为直接地描述现实世界,如一个结点可以有多个双亲•具有良好的性能,存取效率较高•缺点•结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握•DDL、DML语言复杂,用户不容易使用网状模型与层次模型的区别•网状模型允许多个结点没有双亲结点•网状模型允许结点有多个双亲结点•网状模型允许两个结点之间有多种联系(复合联系)•网状模型可以更直接地去描述现实世界•层次模型实际上是网状模型的一个特例关系数据库结构•最重要的一种数据模型,也是目前主要采用的数据模型。•1970年由美国IBM公司SanJose研究室的研究员E.F.Codd提出。•在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。关系模型的优缺点•优点•建立在严格的数学概念的基础上•概念单一。数据结构简单、清晰,用户易懂易用•实体和各类联系都用关系来表示。•对数据的检索结果也是关系。•关系模型的存取路径对用户透明•具有更高的数据独立性,更好的安全保密性•简化了程序员的工作和数据库开发建立的工作•缺点(1)存取路径对用户透明导致查询效率往往不如非关系数据模型。(2)为提高性能,必须对用户的查询请求进行优化,增加了开发数据库管理系统的难度。面向对象数据库结构•应管理活动中复杂数据类型的需求而产生。•在面向对象的数据库中,每个对象的数据、描述对象的行为、属性的说明三者是封装在一起的。其中对象之间通过消息互相作用,且每个对象都由一组属性来描述。数据库软件的发展(1)商业企业使用的数据库管理系统随着业务需求和业务过程的变化不断进步。(2)使DBMS易于使用。6.3数据库管理系统•数据库管理系统(DatabaseManagementSystem,简称DBMS)是位于用户与操作系统之间的一层数据管理软件。•用途:科学地组织和存储数据、高效地获取和维护数据。•数据字典/目录•外模式、模式和内模式•SQL•多平台数据库•Web服务软件数据库管理系统的优点(1)减少数据冗余(2)提高了数据的一致性(3)保证了数据独立性(4)从多个文件中集成数据(5)快速检索数据和信息(6)改进安全控制6.4专用和通用数据库系统(1)超媒体数据库(2)在线数据库(3)图像数据库(4)文档数据库(5)通用数据库6.5数据库中的知识发现•知识发现:指分析理解大型复杂数据库中数据的所有方法。•近年来常见的方法有:(1)数据仓库(2)数据集市(3)在线分析处理(4)数据挖掘(1)数据仓库•数据仓库:面向某一主题。•建立数据仓库的目的是使组织中的人员获得大量数据,以支持决策。•一个数据仓库的主要组成部件是:(1)数据(2)硬件及网络环境(3)数据转化软件(4)图表查询工具(5)图形工具(6)管理软件(2)数据集市•数据集市(DataMarket)是一个数据库,由组织中某一个部门所需要的数据组成。即集中了组织所需要的数据的子集。(3)在线分析处理•在线分析处理(OnlineAnalysis&Process,OLAP)是从许多信息源(包括外部信息源)为数据库提供多维视图的一组技术,以支持战略和战术决策。•OLAP数据的有用与否取决于信息系统专家了解与预测用户信息需求的能力。(4)数据挖掘•数据挖掘(DataMining):帮助用户发现以前没有认识到的关系并以可理解的方式提供给用户,为决策服务。•验证驱动数据挖掘•发现驱动数据挖掘•验证和发现数据挖掘的结合思考题P952,3