第三章管理信息系统的技术基础主讲人:田占伟邮箱:tianzhanwei@gmail.com本章内容•第一节数据处理•第二节数据组织•第三节数据库技术•第四节计算机网络•第五节云计算技术第三章管理信息系统的技术基础22020/1/22数据处理的概念32020/1/22数据处理的概念数据处理指把来自科学研究、生产实践和社会经济活动等领域中的原始数据,用一定的设备和手段,按一定的使用要求,加工成另一种形式的数据。第三章管理信息系统的技术基础数据处理的主要目的42020/1/221.把数据转换成便于观察分析、传送或进一步处理的形式。2.从大量的原始数据中抽取,推导出对人们有价值的信息以作为行动和决策的依据。3.利用计算机科学地保存和管理已经过处理(如校验、整理等)的大量数据,以便人们能方便而充分地利用这些宝贵的信息资源。第三章管理信息系统的技术基础数据处理的基本内容52020/1/221.数据收集2.数据转换3.数据的筛选、分组和排序4.数据的组织5.数据的运算6.数据存储7.数据检索8.数据输出第三章管理信息系统的技术基础数据处理时需要考虑的问题62020/1/22第三章管理信息系统的技术基础1.数据以何种方式存储在计算机中。2.采用何种数据结构能有利于数据的存储和取用。3.采用何种方法从已组织好的数据中检索数据。本章内容•第一节数据处理•第二节数据组织•第三节数据库技术•第四节计算机网络•第五节云计算技术72020/1/22第三章管理信息系统的技术基础2.1数据结构82020/1/22数据结构包括数据的存储结构及结构上的运算或操作。第三章管理信息系统的技术基础数据结构逻辑结构线性结构非线性结构物理结构(存贮结构)顺序存储链接存储索引存储散列存储同一种逻辑结构采用不同存储方式可以得到不同的数据结构。如线性表以顺序存储方式存储时得到顺序表数据结构,而以链接存储方式存储则得到链表数据结构。指针与链92020/1/22在数据结构中,表征某一数据结构特点及其连接方式的基本单位称为结构的结点(Node)。一个结点可以是一个字符、一个数字,也可以是一个记录、一个集合。第三章管理信息系统的技术基础一个结点通常有几个域,用来存放与结点有关的信息,存放结点本身信息的域数据域存放结点与其他结点关系信息的域指针域或链域存放有与结点有关的结点的地址指针若干带指针的结点组成的集合链LLINK左指针INFO信息RLINK右指针图3.1结点的结构前趋结点:与本结点邻接的前一结点后继结点:指针指向的下一结点指针与链102020/1/22第三章管理信息系统的技术基础No.NAMEAGE0152王一220256王二281234王三252345李一310001李二19表3.1职工登记表采用链接存储方式——则数据域为:每个结点标志职工基本情况的No.、NAME、AGE;指针域为:指向下一个职工记录NEXT。图3.2结点示意图图3.3链表的逻辑结构NO.NAMEAGENEXT线性表112020/1/22第三章管理信息系统的技术基础顺序存储方式•对于任何一个结点的检索都很方便:对于顺序表,若开始结点的存放位置为LOC(k1),每个结点占用空间大小为L,则第i个结点ki的存放位置可由下式直接计算得到LOC(ki)=LOC(k1)+L*(i-1)•如果要在顺序表中插入或删除一个结点时,特别是数据量很大时,就比较麻烦。•因此,线性表仅适用于经常进行索,但数据不经常变动的情况。•顺序表:把线性表的结点按逻辑次序依次存放在一组连续的存贮单元里,结点在计算机内的存放位置完全由结点在线性表中的顺序号决定。链接存储方式结点之间的逻辑关系由指针表示,所以,在插入和删除操作中,只需改变前后结点的指针,而不需要进行大量的数据移动。•将链接方式存储的线性表称为链表。•链表结构在每个结点设有链指针,用来指示下一个结点的位置,结点本身则可以存放在任意一组存贮单元中,这些存贮单元可以是连续的,也可以是分散的。图3.5链表中的操作树122020/1/22树是结点之间有分支的、层次关系的结构。树结构在数据处理中应用最广泛,也是最重要的一类非线性结构。第三章管理信息系统的技术基础图3.6树结构实例它反映了不同规格的钢材的库存情况。队列、图等,也是重要的数据结构。采用树形结构,可以把复杂的数据联系表示成固定长度的记录,从而大大方便了数据的处理。代码直径指针1直径指针2直径长度指针1长度指针2直径长度指针1长度指针2长度单价库存量长度单价库存量长度单价库存量长度单价库存量2.2数据文件132020/1/22第三章管理信息系统的技术基础在信息系统中,数据组织一般采用文件组织和数据库组织。把数据按某种数据结构组织起来存放在外部设备上,就构成数据文件。为某一目的而形成的同类记录的集合数据文件文件中数据组织的基本单位,由若干个数据项组成记录数据处理的最小单位数据项如工资单如每个职工的工资情况如姓名、职工代码、基本工资等主键副键鉴别键如在工资主文件中,可以把“职工代码”作为主键,而把“姓名”用做副键。文件系统是数据处理的主要方式,建造容易,使用灵活,处理速度快,特别适合单项业务系统使用(如财务、库存等管理系统)。2.3数据库142020/1/22第三章管理信息系统的技术基础图3.7组织的全局数据结构示例数据库是比文件系统更高级的一种数据组织方式。为了实现整个组织数据的结构化,要求在数据组织结构中不仅能够描述数据本身,而且要能描述数据之间的关系。因而在复杂的应用中,应采用数据库组织数据。组织中各部门子系统都要使用的职工记录以及人事部门关心的人事记录、政治历史和社会关系记录;财务部门关心的工资记录;业务部门需要的业务记录、学历、科研经历和教学经历等记录。出身职工姓名职务性别年龄工资级别成分政治面貌年月工资级别年代事件姓名状况与职工关系子部门最后学历专长年月学校学位年月项目年月课程授课对象职工记录人事记录政治历史社会关系记录工资记录业务记录学历科研经历教学经历本章内容•第一节数据处理•第二节数据组织•第三节数据库技术•第四节计算机网络•第五节云计算技术152020/1/22第三章管理信息系统的技术基础3.1数据库系统的构成162020/1/22第三章管理信息系统的技术基础数据库是以一定的组织方式存贮在一起的相关数据的集合,它能以最佳的方式,最少的数据冗余为多种应用服务,程序与数据具有较高的独立性。计算机系统•用于数据库管理的计算机硬软件及网络系统。•需要大容量的主存以存放和运行操作系统、数据库管理系统程序、应用程序以及数据库、目录、系统缓冲区等,辅存方面,则需要大容量的直接存取设备。此外,系统应具有较高的网络功能。数据库•既有存放实际数据的物理数据库,也有存放数据逻辑结构的描述数据库。数据库管理系统(DBMS)•一组对数据库进行管理的软件,通常包括数据定义语言及其编译程序数据操纵语言及其编译程序以及数据管理例行程序。人员•数据库管理员•系统程序员•用户:应用程序员、专门用户、参数用户3.2数据模型172020/1/22第三章管理信息系统的技术基础概念模型(也称信息模型)如网状、层次及关系模型数据模型3.3数据库操作182020/1/22数据库操作主要有基本表的建立与删除、数据查询及更改等.下面介绍如何使用关系数据库标准语言——结构化查询语言SQL(StructuredQueryLanguage)来完成上述操作。第三章管理信息系统的技术基础建立基本表例1.建立一个“学生”表Student,它由学号(sno)、姓名(sname)、性别(gender)、所在系别(department)、年龄(age)五个属性组成,其中学号为主码。建立该表的语句如下:CREATETABLEStudent(snoCHAR(9)PRIMARYKEY,snameCHAR(20),genderCHAR(2),departmentCHAR(20),ageSMALLINT);其中snameCHAR(20)表示属性姓名是字符型数据,最多有20位字符组成。•语句格式为:CREATETABLE表名(列名1类型[,列名2类型……]);•常用的类型有CHAR(字符型),INT(整型),NUMERIC(数值型),DATETIME(日期时间型),BIT(逻辑型),VARCHAR(变长字符型)等。•修改:ALTERTABLE表名ADD列名类型;•删除:DROPTABLE表名;3.3数据库操作192020/1/22第三章管理信息系统的技术基础SQL的核心语句是数据库查询语句,其一般格式为:SELECT目标列FROM表名[WHERE条件表达式][GROUPBY列名1][ORDERBY列名2[ASC/DESC]]建立基本表语句含义:根据WHERE子句中的条件表达式,从指定表中找出满足条件的元组(如二维表中的记录),按目标列选出元组分量形成结果表。ORDER子句确定结果表按指定的列名2按升序(ACS)或降序(DESC)排序。GROUP子句将结果按列名1分组,每个组(所有列名1值相同的为一组)产生结果表中一个元组。3.3数据库操作202020/1/22第三章管理信息系统的技术基础1.数据修改(UPDATE)。UPDATE表名SET列名1=表达式1[,列名2=表达式2……][WHERE逻辑表达式]功能:修改指定表中满足条件的元组,将指定的列名1的值用表达式1的值替换,将指定的列名2的值用表达式2的值替换……2.数据删除(DELETE)。DELETEFROM表名[WHERE逻辑表达式]功能:删除指定表中满足条件的元组。3.数据插入(INSERT)。INSERTINTO表名(列名1[,列名2……])VALUES(常量1[,常量2……])功能:向指定表中插入一个元组且使得列名1的值为常量1,列名2的值为常量2……数据更新Test:在系统中有一个包括以下三个表的学生-课程数据库,进行查询和实现增、删、改功能。1.“学生”表student由学号(sno)、姓名(sname)、性别(gender)、所在系别(department)、年龄(age)5个属性组成;2.“课程”表course由课程号(cno)、课程名(cname)、学分(credit)3个属性组成3.“学生选课”表sc由学号(sno)、课程号(cno)、成绩(grade)3个属性组成。3.4数据库保护212020/1/22第三章管理信息系统的技术基础主要包括数据的安全性、完整性、并发控制和数据库恢复等内容。数据库保护数据的安全性是指保护数据库以防止不合法的使用所造成的数据泄露、更改和破坏。可通过对用户进行标识和鉴定、存取控制、OS级安全保护等措施得到一定的保障。数据的完整性是指数据的正确性、有效性与相容性。关系模型的完整性有实体完整性、参照完整性及用户定义的完整性。并发控制是指当多个用户同时存取、修改数据库时,可能会发生互相干扰而得到错误的结果并使数据库的完整性遭到破坏,因此必须对多用户的并发操作加以控制、协调。数据库恢复是指当计算机软、硬件或网络通信线路发生故障而破坏了数据或对数据库的操作失败使数据本章内容•第一节数据处理•第二节数据组织•第三节数据库技术•第四节计算机网络•第五节云计算技术222020/1/22第三章管理信息系统的技术基础4.1计算机网络的概念与分类232020/1/22计算机网络是管理信息系统的基本使能技术:由于企业或组织中的信息处理都是分布式的,把分布式信息按其本来面目由分布在不同位置的计算机进行处理,并通过通信网络把分布式信息集成起来,是管理信息系统的主要运行方式。第三章管理信息系统的技术基础网络介质数据传输的物理通道,有同轴电缆、双绞线、光纤、微波、卫星信道等。协议网络设备间进行通信的一组约定。如IEEE802.3,802.4,FDDI,ATM等。节点网络中某分支的端点或网络中若干条分支的公共汇交点。链路两个相邻节点之间的通信线路。计算机网络是用通信介质把分布在不同地理位置的计算机和其他网络设备连接起来,实现信息互通