第四讲数据资源管理技术教学计划•教学进度表授课主题学时状态备注1:MIS的基本概念(6)2:MIS的技术基础(4)3:数据资源管理(6)No.14:MIS的应用(6)6:MIS的开发方法(6)7:MIS的分析与设计(6)8:MIS的实施(4)9:实验项目(10)10:课程评价(2)教学目标•理解并掌握–数据资源的管理观–数据资源的管理技术教学内容•本讲共计4学时–第十章4学时第十章数据资源管理技术•主要内容–文件组织–数据库技术10.引言•企业的重要资源–劳动力、原材料、资金、设备、信息•广义的数据资源管理包括:–文件组织–数据库–数据规划–数据管理10.1文件组织•数据组织的层次–人们需要用数据来进行决策和采取行动•如果这些数据能够在限定的时间内被检索处理,这些数据就产生了价值,成为信息。因此需要将数据有序的组织起来,才能对数据进行有效的处理。–数据的逻辑组织有四个基本的逻辑元素:•数据项•记录•文件•数据库10.1续•数据组织的层次数据库文件1文件2文件n文件n-1记录1记录2记录n-1记录n数据项1数据项2数据项n-1数据项n…...…...…...姓名、性别等若干学生学生文件学生数据库10.1续•数据组织的相关概念–数据项•是组成数据系统的有意义的最小基本单位。它的作用是描述一个数据处理对象的某些属性。–记录•与数据处理的某一对象有关的一切数据项构成了该对象的一条记录。标识记录的数据项称为关键项。–文件•相关(同类)记录的集合称为文件。–数据库•按一定方式组织起来的逻辑相关的文件集合形成数据库。10.1续•文件的管理观–大量的企业数据不可能存放在主存中–某一时刻,企业只使用其中的一部分数据–企业的数据一般以文件形式组织起来•分类–按存储介质•光盘文件•磁盘文件•打印文件–按文件在信息系统中所执行的功能•主文件•事务文件•报告文件•工作文件•程序文件10.1续•数据的物理储存与传送–自学问题•磁盘与磁带在数据存储方面各有什么特点?•什么是数据的逻辑组织?•什么是数据的物理组织?•如何实现逻辑组织与物理组织之间的数据传送?10.1续•文件组织形式–建立并确定数据记录的物理顺序和逻辑顺序之间的对立关系。逻辑数据记录物理存储方式顺序文件索引文件链表文件倒排文件顺序映射关系10.1续•顺序文件–文件中数据记录的物理顺序与逻辑顺序一致,文件记录按关键字值的递增(或递减)次序排序,形成其逻辑顺序。870001张三456870002李四645870003王五587870004孙六676870005钱七565………………12345……文件记录物理设备关键字值相对磁道10.1续•索引文件–具有索引表的文件称为索引文件。索引文件主文件索引表数据记录区索引区记录原始信息记录关键字+记录地址组成映射加工10.1续•举例记录地址学号姓名成绩A870005张三456B870002李四645C870001王五587D870004孙六676E870003钱七565主关键字(学号)记录地址870001C870002B870003E870004D870005A主文件索引表关键字学号与学生记录地址的对应表10.1续•链表文件•倒排文件–带有辅索引或倒排索引的文件称为倒排文件记录记录记录记录^入口10.2数据库技术•传统文件处理系统•存在问题–数据冗余与数据不一致性–数据结构的不一致,数据联系弱–缺少数据字典,缺少灵活性应用程序1数据文件1应用程序2应用程序3数据文件2数据文件3用户用户用户10.2续•银行文件处理系统客户财务报表分期贷款程序帐户核对处理存款处理分期贷款处理贷款分析报告客户票据存款文件修改文件修改核对帐户核对程序分期贷款文件修改存款程序客户交易客户交易10.2续•数据库处理系统•优点–完善的数据字典和数据模型–数据独立性–方便的接口–完整的数据控制功能–提高了系统的灵活性应用程序1应用程序2应用程序3DBMS数据库中央数据库用户用户用户10.2续•银行数据库处理系统客户交易处理数据库管理系统核对帐户程序存款帐目程序分期贷款程序客户数据库..查询10.2续•数据库管理系统(DBMS)功能–DBMS是一组计算机程序,控制组织和用户的数据库的生成、维护和使用。具有以下功能:–数据库开发–数据库查询–数据库维护–应用与开发..操作系统数据库管理系统应用程序数据库数据字典用户10.2续•数据库管理系统(DBMS)–数据库开发:•利用数据定义语言(DDL)开发与说明数据内容、相互关系及每个数据库的结构。并把这些信息存储在一个专用的数据定义和说明的数据库中,称为数据字典。数据字典由数据库管理员控制、管理和维护。–数据库查询:•用户使用DBMS的查询语言询问数据库中的数据。最常用的查询语言是结构化查询语言(SQL)。–数据库维护–应用开发10.2续•数据库有哪些类型?–企业数据库的种类•操作数据库•管理数据库•信息仓库•分布式数据库•外部数据库–文本数据库–多媒体数据库10.2续•数据库模型–模型功能•使数据以记录的形式组织在一起,综合反映各种业务信息,既综合又没有冗余。•模型能反映用户各业务信息所存在的内在联系,而且与DBMS数据模型一致。–模型的类型•网状型•层次型•关系型(目前最流行的是关系型数据库)10.2续•数据库系统的三级模式–模式•即逻辑模式。是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。–外模式•用户模式或者子模式。是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述。–内模式•物理模式或者存储模式。是数据物理结构和存储方式的描述,是数据在数据库内部的表示方法。–参见159页图10.1110.2续•数据库系统的三级模式(图)物理模型内模式用户A用户B用户D用户E外模式1(子模式1)外模式2(子模式2)概念模型(模式)DBMSOS子模式/概念模式映射A子模式/概念模式映射B模式/内模式映射10.2续•数据库的二级映射–外模式/模式映射:•当模式改变时,使外模式保持不变,从而应用程序不变,保证了数据与程序的逻辑独立性。–模式/内模式映射:•当数据库存储结构改变,使模式保持不变,从而应用程序不变,保证了数据与程序的物理独立性10.2续•数据库数据的存取过程应用程序A用户工作区状态码系统缓冲区数据库OSDBMS物理数据库描述概念模式应用程序A的子模式10.2续•信息的转换客观事物类:事物相关性质集合人实体实体集合及实体联系相关属性集合加工、转换数文件据记录库相关数据项集合加工转换存储二进制数据集合结构计算机世界DBMS数据世界DBMS的数据模型信息世界认识选择描述现实世界E-R模型10.2续•三个不同世界术语–客观世界信息世界数据世界组织(事物及其联系)实体及其联系数据库(概念模型)事物类(总体)实体集文件事物(对象、个体)实体记录特征(性质)属性数据项实体及其联系概念模型E—R图10.3E-R信息模型的设计与应用•E-R图描述现实世界的概念模型–实体:–属性:–联系:•一对一联系•一对多联系•多对多联系实体集属性联系集线段10.3续•E—R图设计原则–真实性原则–避免冗余原则–简单性原则–合适性原则(用实体或属性或联系集)–注意对客观对象的约束•映射约束、键码约束、参照完整性约束10.3续•实体(Entity):–是一个有着一系列显著的、易辨认的属性的对象。–实体可以是具体的(物体、人物等。)–实体也可以抽象的(事、概念、事物之间的联系)•确定实体的指导–找出问题中的大模块–问题陈述中的名词10.3续•属性(Attribute)–实体的特性,它描述了实体的一个部分。–一个实体可由若干个属性来刻画。•如学生(学号,姓名,性别,……)•码(Key):–唯一标识实体的属性集。•如:学号为学生的码。•确定属性的指导–可能将名词当作属性,但不应将其和实体混淆.10.3续•E—R图绘制图书作者写作出版社类别页数ISBN书名姓名出生地身份证号定稿时间价格包含实体集“图书”和“作者”的E—R图10.3续•E—R图向关系数据模型的转换–1、E—R图中每个实体,相应转换为一个关系,该关系包括对应实体的全部属性,并确定出该关系的关键字。–2、对于“联系集”,根据联系方式不同,采取不同手段以使被它联系的实体所对应的关系彼此实现某种联系。10.3续•E—R图向关系数据模型的转换转换过程示意图E-R图关系模型DBMS10.3续•E—R图的转换–将E-R图转换成相应的表•表是行和列的集合,实体被表示成表的形式。•用列标题表示实体的属性•用行表示关于实体的实际数据•关于表和属性的命名规则–属性名和表名中不能包含空格–表名对实体的描述应该是有意义的。•如student(cStuID,cStuName,nStuAge,……)–表名只能描述一个主题10.3续•转换举例一厂长号姓名年龄厂长厂号厂名地点工厂管理11厂长(厂长号,厂号,姓名,年龄)工厂(厂号,厂名,地点)10.3续•转换举例二仓库号地点面积仓库货号品名价格产品存放1n仓库(仓库号,地点,面积)产品(货号,品名,价格,仓库号,数量)数量10.3续•转换举例三学号姓名年龄学生课程号课程名学时数课程学习nn学生(学号,姓名,年龄)课程(课程号,课程名,学时数)成绩学习(学号,课程号,成绩)10.4数据库设计规范化•数据库设计规范化——范式理论篇(P345)–必要性:解决在关系模式设计时,存在的数据存储异常现象:数据冗余、修改异常、插入异常、删除异常等。ISBN书名页数价格出版社作者7-04-001968-O.719概率论4035.8高教出版社盛聚7-04-001968-O.719概率论4035.8高教出版社谢式千7-111-06887-4可靠性模型与应用27019.0机械工业出版社蒋仁言7-111-06887-4可靠性模型与应用27019.0机械工业出版社左明健7-5327-1224.9/1.717基督山伯爵142818.0止海译文出版社大仲马7-5237-1224-9/1.321三个火枪手98216.7上海译文出版社大仲马10.4续•第一规范型:–如果一个关系模式中的属性都是单纯的(即不可再分为更小的属性),则称该模式是属于第一规范型(FirstNormalForm,即1NF)。姓名地址省市街道邮编甲江苏南京卫岗21009510.4续•第二规范型:–如果一个关系模式属于1NF,并且所有的非关键字都完全地依赖于关键字(即不存在部分依赖),则称该关系模式属于第二规范型,即2NF。A零件号B仓库号C零件数量D仓库地址12341112100150200150北区1号北区1号北区1号南区1号10.4续•第三规范型:–如果一个关系模式属于2NF,并且不存在非关键字传递地依赖于关键字,则称该关系模式属于第三规范型(3NF)。职工号职工职务工资1001张三工程师2001002李四技术员1201005王五高工35010.4续•适当的规范化规范化程度越高数据冗余更新异常连接运算时间查询时间效率自学任务再见Doyouhavemadeaprogresstoday?