第三章管理信息系统的技术基础第一节数据处理第二节数据库技术第三节计算机网络第一节数据处理本节内容:一、数据处理的概念和发展阶段二、数据组织一、数据处理的概念和发展阶段-1数据处理的概念数据处理指把来自科学研究、生产实践和社会经济活动等领域中的原始数据,用一定的设备和手段,按一定的使用要求,加工成另一种形式的数据。数据处理的目的1.把数据转换成便于观察分析、传送或进一步处理的形式。2.从大量的原始数据中抽取,推导出对人们有价值的信息以作为行动和决策的依据。3.利用计算机科学地保存和管理已经过处理(如校验、整理等)的大量数据,以便人们能方便而充分地利用这些宝贵的信息资源。一、数据处理的概念和发展阶段-2数据处理的基本内容1.数据收集2.数据转换3.数据的筛选、分组和排序4.数据的组织5.数据的运算:指算术运算和逻辑运算6.数据存储7.数据检索8.数据输出一、数据处理的概念和发展阶段-3(一)数据结构数据结构是计算机信息处理中的一个重要概念,包括数据的存诸结构及结构上的运算或操作。包括:逻辑结构物理结构映象二、数据组织-1逻辑结构数据间的逻辑关系,逻辑结构包括两大类:线性结构和非线性结构,线性表、栈、队列及串为线性结构,而树和图则为非线性结构;物理结构又称存贮结构,指数据元素在计算机存贮器中的存储方式,存储方式一般有四种:顺序存储、链接存储、索引存储及散列存储。映象对于给定的逻辑结构需要寻找一种对应的存储结构,以便在计算机中存储。通常把这种对应关系称为映象。二、数据组织-2指针与链在数据结构中,表征某一数据结构特点及其连接方式的基本单位称为结构的结点(Node)。一个结点通常有几个域,用来存放与结点有关的信息。存放结点本身信息的域称为数据域,存放结点与其他结点关系信息的域,称为指针域或链域,其中存放有与结点有关的结点的地址称为指针。若干带指针的结点组成的集合,称为链。结点的结构如下图:NO.NAMEAGENEXT二、数据组织-3线性表线性表是指数据的结构形式本质上是一维的线性关系,其中的每个结点都是同一类型的数据结构。二、数据组织-4线性表的顺序存贮线性表的结点按逻辑次序依次存放在一组连续的存贮单元里,用这种方法存储的线性表称为顺序表。对于顺序表,若开始结点的存放位置为LOC(k1),每个结点占用空间大小为L,则第i个结点ki的存放位置可由下式直接计算得到LOC(ki)=LOC(k1)+L*(i-1)顺序表对于任何一个结点的检索都很方便。二、数据组织-5线性表的插入与删除要在线性表中插入一个元素,由于插入后的线性表仍要求有序,必须将插入位置以后的元素依次向后移动一个单元。同样,若要删除元素,则需把后面的元素依次向前移动一个单元。二、数据组织-6序号结点内容序号结点内容19192152153173174254235395256639插入前插入后序号结点内容序号结点内容19192152153173174234255255396396删除前删除后二、数据组织-7链表链接方式存储的线性表称为链表。链表结构在每个结点设有链指针,用来指示下一个结点的位置,结点本身则可以存放在任意一组存贮单元中,这些存贮单元可以是连续的,也可以是分散的。结点之间的逻辑关系由指针表示。二、数据组织-8链表的插入与删除在链表的插入和删除操作中,只需改变前后结点的指针,而不需要进行大量的数据移动。HAB.CD∧H.A.B×CD∧(b)插入结点C.D∧.H.ABC.D∧.H.A(a)删除结点二、数据组织-9树树是结点之间有分支的、层次关系的结构,类似于自然界中的树。是最重要的一类非线性结构。反映不同规格的钢材的库存情况的树结构如下图代码直径指针1直径指针2直径长度指针1长度指针2直径长度指针1长度指针2长度单价库存量长度单价库存量长度单价库存量长度单价库存量二、数据组织-10(二)数据文件把数据按某种数据结构组织起来存放在外部设备上,就构成数据文件。常用的文件的组织方式:顺序文件索引文件二、数据组织-11本节内容:一、数据库系统的产生和构成二、数据库设计的主要内容三、实体联系模型四、数据模型五、关系的规范化六、数据库操作七、数据库保护第二节数据库技术数据库系统的构成计算机系统数据库数据库管理系统(DBMS)人员数据库管理员系统程序员用户一、数据库系统的产生和构成按用户的观点对数据和信息建模。常常首先将现实世界的客观对象抽象为某一种不依赖于计算机系统和某一个DBMS的信息结构即概念模型,然后再把概念模型转换为计算机上某一DBMS支持的数据模型。如E-R模型二、数据库设计的主要内容概念实体(Entity)属性联系一对一联系(1:1)一对多联系(1:n)多对多联系(m:n)三、实体联系模型数据模型是对客观事物及其联系的数据化描述。在数据库系统中,对现实世界中数据的抽象、描述以及处理等都是通过数据模型来实现的。数据模型在数据库系统设计中是用来提供信息表示和操作手段的形式构架,是数据库系统实现的基础。目前,主要的数据模型是关系模型(RelationalModel)。四、数据模型-1关系模型每一个关系为一张二维表,相当于一个文件。实体间的联系均通过关系进行描述。下表用m行n列的二维表表示了具有n元组(n-Tuple)的付款关系。每一行即一个n元组,相当于一个记录,用来描述一个实体。结算编码合同号数量金额J0012HT1008100030000J0024HT110760012000J0036HT111520004000四、数据模型-2关系必须是规范化的关系,满足一定的约束条件。称为范式(NormalForm)第一范式(1NF)元组中的每一个分量都必须是不可分割的数据项。第二范式(2NF)关系不仅满足第一范式,而且所有非主属性完全依赖于其主码第三范式不仅满足第二范式,而且它的任何一个非主属性都不传递依赖于任何主关键字。五、关系的规范化数据库操作主要有基本表的建立与删除、数据查询及更改等。一般使用关系数据库标准语言——结构化查询语言SQL(StructuredQueryLanguage)来完成上述操作。如:SQL的核心语句是数据库查询语句,其一般格式为:SELECT目标列FROM表名[WHERE条件表达式][GROUPBY列名1][ORDERBY列名2[ASC/DESC]]其功能是根据WHERE子句中的条件表达式,从指定表中找出满足条件的元组。六、数据库操作为了保证数据的安全可靠和正确有效,DBMS必须提供统一的数据保护功能,主要包括数据的安全性、完整性、并发控制和数据库恢复等内容。七、数据库保护第三节计算机网络本节内容:一、计算机网络的概念与分类二、局域网技术三、网际互连-INTERNET技术四、IP地址和域名系统(一)基本概念计算机网络用通信介质把分布在不同地理位置的计算机和其他网络设备连接起来,实现信息互通和资源共享的系统。网络介质数据传输的物理通道,有同轴电缆、双绞线、光纤、微波、卫星信道等。协议网络设备间进行通信的一组约定。如TCP/IP,IEEE802.3,802.4,FDDI,ATM等。网络协议具体规定了设备间通信的电气性能、数据组织方式等。节点网络中某分支的端点或网络中若干条分支的公共汇交点。链路是指两个相邻节点之间的通信线路。一、计算机网络的概念与分类-1主机主机主机主机主机主机通信子网通信链路通信设备通信子网资源子网网络拓扑结构是指网络的链路和节点在地理上所形成的几何构形。计算机网络从功能上可分为两部分,资源子网和通信子网。一、计算机网络的概念与分类-2(二)计算机网络的分类局域网(LAN)传输距离0.1~10km,传送速率在1Mbps~10Mbps。广域网(WAN)相距较远的局域网经由公共电信网络互连而成,数据传输速率一般在1.2kbps~1.554Mbps,传输距离可遍及全球。Internet(因特网)是国际最大的互连网。Internet已形成覆盖全球的网络,成为远程网的代名词。我国的CHINANET、CERNET等都是该网的一部分。综合业务数字网(ISDN)综合业务数字网是一种能在一个网络内传送多种业务信息的网络,包括数据、图象、语音、文字等,能够满足一个单位日常业务中网络应用的需要。一、计算机网络的概念与分类-3二、局域网技术(一)网络体系结构文件服务器/工作站客户机/服务器分布式处理Intranet/Extranet(二)网络操作系统管理网络资源的软件(三)几种典型的局域网以太网、令牌环网、快速以太网、FDDI、ATM网际互连即通过主干网络把不同标准、不同结构甚至不同协议类型的局域网在一定的网络协议的支持下联系起来,从而实现更大范围的信息资源共享。ISO(国际标准化组织)提出了网络互连协议的基本框架,称为开放系统互连(OSI)参考模型。该模型把网络功能分为七个层次:1.物理层2.数据链路层3.网络层4.传输层5.会话层6.表示层7.应用层三、网际互连-INTERNET技术-1Internet/Intranet/ExtranetInternet(因特网)在TCP/IP协议下实现的全球性的互连网络,称为“Internet网际”,我国称之为“因特网”。Intranet(企业内部网)把Internet技术应用到企业内部建立的基于开放技术的新型网络体系结构。Extranet即扩展的Intranet(ExtendedIntranet)通过Internet网络把分散在不同地理位置的Intranet联系起来,采用通道技术提高通信两端的安全性级别。虚拟专网采用加密、认证和通道技术,提供了Internet上两点间的安全通信。这样,对采用Internet技术的企业而言,好象是一个专用的广域网一样。三、网际互连-INTERNET技术-2四、IP地址和域名系统(一)IP地址在使用TCP/IP通信协议的网络上,每一台计算机(主机)都有一个唯一的地址。这个IP地址在网络中的作用就像住户的地址,根据这个地址,可以找到该计算机所在的路径信息,以及这台计算机在网络上的编号。TCP/IP协议规定,IP地址由32位比特位组成,一般由相对应的4个部分的十进制数字组成,每部分用“.”分隔,如202.112.144.111。由于在使用TCP/IP协议的网络上是利用IP地址来表示网络中的每一台计算机的,因此对于网络中的每一台TCP/IP主机都必须分配一个唯一的32位地址。每一个IP地址都由两部分组成:网络ID和主机ID。·网络标识ID网络ID用于辨认子网,同一子网上的所有TCP/IP主机的网络ID都相同。主机ID主机ID用于辨认网络中的每一个主机。.(1)IP地址的划分每台运行TCP/IP协议的主机都需要有一个唯一的IP地址,否则会发生IP地址的冲突,导致计算机之间不能很好通信。根据网络的大小,Internet委员会定义了五种IP地址的类型,以适应不同规模的网络。在局域网中我们仍沿用这个分类方法,但是MicrosoftWindowsNT只支持其中的3类,即A、B和C类网络。A类地址分配给拥有大量主机的网络。A类地址的“W”字段内的高端总为“0”,接下来的7位表示网络ID。剩余的24位(即X、Y、Z字段)表示主机的ID。它允许有126个网络和每个网络大约1700万个主机。B类地址分配给中等规模的网络。B类地址的“W”字段内的高端的前两位为“10”,接下来的14位表示网络ID。其余的16位(即Y、Z字段)表示主机的ID。它允许有16384个网络和每个网络大约65000个主机。C类地址通常用于小规模的局域网(LAN)。C类地址的“W”字段内的高端的前三位为“110”,接下来的21位表示网络ID。其余的8位(即Z字段)表示主机的ID。它允许约有200万个网络,每个网络有254个主机。IP地址的类型定义了网络ID使用哪些位,主机ID使用哪些位,同时也定义了每类网络中包含的网络数目和每类网络中可能包含的主机数目。下表表明了各类IP地址的定义及网络ID和主机ID字段的取值范围。表中归纳了A、B、C三类网络的IP地址取值范围。网络类别IP地址网络ID主机ID网络编号(W)的取值范围A