第5章信息系统集成技术第5章信息系统集成技术2/51信息系统集成技术体系数据流集成技术信息流集成技术信息管理集成技术流程重组与业务流程集成信息服务集成技术本章内容第5章信息系统集成技术3/511.信息系统集成技术体系支撑建设依据、依赖信息空间与个性化信息服务业务流程重组技术工作流技术分布式对象互操作与应用接口集成技术对象化数据操作技术语义互操作技术XML技术数据库及数据仓库技术数据流集成技术信息流集成技术信息管理集成技术业务流集成技术信息服务集成技术信息系统集成技术第5章信息系统集成技术4/512.数据流集成技术数据流集成内容与技术集成目的:以网络为基础条件,实现不同应用程序对数据的跨平台、跨系统访问,使各业务系统、子系统之间的数据实现共享。集成层面:数据通信层面、数据管理层面第5章信息系统集成技术5/512.数据流集成技术数据流集成内容与技术集成内容建立面向全局的统一数据模型。建立局部数据模型与全局数据模型之间的转换机制(比如可以通过建立元数据库来实现数据模型的映射)。整理分散、异构数据源中的数据,使得数据在全局模型下的一致,即解决数据结构、格式不一致问题(需要对数据进行梳理、清洗、整理)。建立中心数据库,即建立全局统一的数据库,完成分散数据的集中。建立全系统统一的数据表达及数据访问(交换)机制。第5章信息系统集成技术6/512.数据流集成技术数据流集成内容与技术数据流集成的主要技术数据库技术数据仓库技术数据库接口技术XML技术等第5章信息系统集成技术7/512.数据流集成技术数据库技术数据模型:数据模型主要是指数据的表示方法和组织方法,即如何存放数据、数据之间的关系、获取数据的方法与途径。需求阶段:概念模型,用E-R(Entity-Relationship)图描述。实体是对客观事物的抽象,联系是实体之间的关联性。学生课程选课nm学号姓名……课程号课程名课程号学号第5章信息系统集成技术8/512.数据流集成技术数据库技术设计阶段:逻辑模型(结构化数据模型),一般由3部分内容组成——数据结构、数据操作、数据完整性约束。关系模型:一个实体、一个多对多联系都可映射成一张二维表(关系),表与表之间通过关键字字段进行关联。学号姓名……7200981张三……………………学号课程号7200981C0102…………课程号课程名……C0102C语言……………………学生课程选课第5章信息系统集成技术9/512.数据流集成技术数据库技术详细设计或实现阶段:物理模型,与具体DBMS相关的数据库描述。采用DDL(DataDefineLanguage)进行描述,一般包括:库结构、表结构、相关映射、相关约束等。字段名数据类型字段长度是否主键是否允许空初始值说明xhchar12是否无学号xmchar8否否无姓名csnydatetime否是1990-01-01出生年月……………………………………学生表第5章信息系统集成技术10/512.数据流集成技术数据库技术DBMS:数据库管理系统,DataBaseManagementSystemDBMS功能:数据结构定义、数据操纵、安全性控制、完整性控制、并发控制、数据库维护DBMS产品:Oracle,SQLServer,DB2,Sybase,MySQL等第5章信息系统集成技术11/512.数据流集成技术数据仓库技术数据仓库(DataWarehouse,DW):为决策提供支持服务的面向主题的、集成的、随时间变化而又相对稳定的数据集合。主题(Subject):是用户关心的领域问题,比如税收收入、欠税、年产量等。DW按主题组织数据,数据库则往往按照功能来组织数据。集成(Integrated):对异构、分散数据进行抽取、清洗(E)、转换(T)、归并、加载(L)、汇总等一系列加工,形成表示一致、内容准确的数据,而不是从各个业务系统中简单抽取出来的数据。因此数据仓库中的数据是一种全局性数据。随时间变化(Time-variant)而又相对稳定(nonvolatile):数据仓库的数据会随着业务系统数据的变化而变化,但变化周期长于业务系统,且数据一般只追加,而不能修改和删除。第5章信息系统集成技术12/512.数据流集成技术数据仓库技术DW数据模型DW中的“维”:观察数据的角度。例如:水平维可以是相同级别数据的归类、垂直维可以是数据的逐步细化和深入。数据粒度由粗到细税收收入重点纳税人纳税一般纳税人纳税个人所得税行政事业单位国有企业人员个体工商户自由职业者党政机关学校研究机构其他第5章信息系统集成技术13/512.数据流集成技术数据仓库技术DW数据模型数据粒度:数据的综合程度。粒度越小越接近事实数据。数据组织结构(多维数据模型,如星型模型、雪花模型)。OLAP(联机分析处理)。数据粒度由粗到细……高度综合数据轻度综合数据事实数据历史业务数据抽取上卷下钻OLAP第5章信息系统集成技术14/512.数据流集成技术数据仓库技术元数据:关于数据的数据,数据字典就是一种元数据。数据字典:关系数据库中用来描述数据结构、数据约束、数据关联等的数据。在数据仓库中,元数据是用来描述数据及环境的数据,比如数据仓库主题描述、外部数据描述、系统定义、数据抽取历史、粒度定义等等。第5章信息系统集成技术15/512.数据流集成技术数据仓库技术数据仓库体系结构查询分析:面向主题、多维度、多角度信息分析和展现数据获取:抽取、转换、清洗、整理、归并、装载等加工和处理管理:元数据及数据仓库建模、数据存取与检索、概括聚集、模式映射等应用系统OLAP工具数据挖掘工具数据仓库访问接口数据仓库数据元数据数据源访问接口业务数据业务数据业务数据第5章信息系统集成技术16/512.数据流集成技术数据仓库技术数据库、数据仓库用途数据仓库适用于分析型应用数据库适用于业务型应用第5章信息系统集成技术17/512.数据流集成技术数据库操作接口开放数据库连接ODBC(Opendatabaseconnectivity):应用系统与数据库系统之间进行交互的接口(桥梁)。对应用而言,ODBC是与具体DBMS无关的API接口。驱动程序由具体DBMS提供。ODBC接口接收并传递SQL命令到数据源,返回操作结果。应用程序1应用程序nODBC接口(API)ODBC驱动程序管理驱动程序1驱动程序m数据源1数据源m………………本地或网络平台管理应用程序与数据库之间的连接、装载特定数据源驱动程序、数据源参数管理、传递SQL命令到驱动程序、返回结果到ODBC接口第5章信息系统集成技术18/512.数据流集成技术数据库操作接口Java数据库连接JDBC(Javadatabaseconnectivity):也是应用系统与数据库系统之间交互的接口。对应用而言,JDBC是与具体DBMS无关的API接口,在Java.sql包中提供。应用程序1应用程序nJDBCAPIJDBC驱动程序管理JDBC-ODBC桥虚拟驱动程序数据源……应用程序2纯Java驱动网络驱动协议DBMS相关的驱动程序中间层访问仅支持ODBC的DBMS访问本地(本机)数据库借助中间层访问异地、本地数据库直接与DBMS引擎交互中间层专门负责与数据库交互第5章信息系统集成技术19/512.数据流集成技术XML(eXtensibleMarkupLanguage)技术概念W3C、纯文本、跨平台、简单易用、可扩展、支持结构半结构化数据、查询方便用途:结构化数据、非结构化数据的存储和交换XML文档结构形式化描述Document∷=prologelementMiscprolog:文件头,文件类型声明element:元素,定义为:标签名内容/标签名标签名:可以是中英文字符串Misc:注释、字符引用、处理指令等XML文档示例第5章信息系统集成技术20/512.数据流集成技术员工信息个人资料姓名职务=“科长”张涛/姓名性别男/性别出生年月1988年8月/出生年月政治面貌中共党员/政治面貌所属部门政工科/所属部门联系电话13303456789/联系电话/个人资料个人资料姓名钱梅/姓名性别女/性别出生年月1994年3月/出生年月政治面貌群众/政治面貌所属部门办公室/所属部门/个人资料/员工信息标签属性根标签必须匹配元素第5章信息系统集成技术21/513.信息流集成技术信息流集成的任务实现系统内部、外部信息流的畅通:解决语义级的交互问题基于元数据技术、语义互操作技术,解决信息资源的语义描述问题基于对象化数据操作,使系统内部信息的交互在数据对象层面进行,屏蔽底层数据模型的差异第5章信息系统集成技术22/513.信息流集成技术元数据与语义描述系统集成中的元数据是描述数据语义的数据。并可分为两类:系统元数据和领域元数据系统元数据:数据源以及各数据源逻辑结构、与全局数据的映射、数据源的位置、数据源连接方式的描述等。领域元数据:行业术语、业务数据命名空间、业务数据的结构、业务数据的逻辑关系、业务数据使用约束及控制规则,数据仓库主题结构、主题与表的关系、局部信息结构、面向角色的信息空间结构等。描述工具:XML、RDF(资源描述框架)等。第5章信息系统集成技术23/513.信息流集成技术对象数据操作技术对象-关系映射(Object-relationalmapping,ORM)目的:把关系数据库中的数据转变成应用系统中的数据对象,屏蔽数据库细节,提高可移植性、可维护性。映射结构:映射内容:数据结构及类型映射;对象的继承、多态、类间关系等与关系模型进行相互映射。映射工具:TOPlink,JavaBlend,Hibernate,OJB等关系数据库对象模型与关系模型之间的映射数据对象数据对象……业务对象业务对象……第5章信息系统集成技术24/513.信息流集成技术对象数据操作技术数据对象的持久化持久性:磁盘上的数据不因断电而丢失,称为持久性数据;数据对象在内存中运行,是非持久的。数据对象持久化:使数据对象不因系统故障等原因失去运行状态和现场数据,是保证对象化数据与数据库中的数据始终一致的技术。J2EE数据对象持久化:Hibernate,J2EE中的数据-对象映射和持久化框架。–主要使用步骤:创建Hibernate配置文件、创建持久化类、创建对象-关系映射文件、通过HibernateAPI编写数据库访问代码等。.NET数据对象持久化:Nhibernate,.Net中针对关系型数据库的对象持久化类库,持久化步骤与Hibernate相似。第5章信息系统集成技术25/513.信息流集成技术对象数据操作技术EJB(EnterpriseJavaBean)概念及类型按照EJB规范、用Java语言编写的分布式对象,即逻辑组件,部署在应用服务器上。采用EJB容器部署、管理、发布对象,控制对象实例的创建、执行和销毁。EJB有三类:-会话Bean(SessionBean):处理业务逻辑的组件。-实体Bean(EntityBean):业务逻辑与数据库的交互,用于构造持久化数据对象。实体可以是一张表、主题等-消息Bean(MessagedrivenBean):业务活动中的协作消息传递,是一种可滞后的服务。第5章信息系统集成技术26/513.信息流集成技术对象数据操作技术基于EJB(EnterpriseJavaBean)的对象数据操作客户程序EJB容器数据库JNDI远程Home接口远程对象接口EJBHomeEJBObjectEJB实例EJB实例EJB实例EJB容器:部署、发布、管理EJB组件,创建、执行、销毁EJB对象实例,使开发者专注于业务逻辑,减少分布式应用建设的复杂性。提供EJB生命周期操作(创建,删除,查找)的对象。为客户程序提供EJBHOME对象查找服务。完成与数据库的交互,对外隐