PowerCente8 控件使用说明

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

®InformaticaPowerCenter开发培训12PowerCenter8架构PowerCenterConnectsCoreServicesClientToolsRepositoryDatabasePowerExchangeRepositoryManagerDesignerWorkflowMangerWorkflowMonitorAdministrationConsoleApplicationServicesIntegrationServiceWebServicesHubRepositoryServiceSAPBWServiceLogServiceRepositoryServiceDomain/GatewayServices•Administration&Authorization•Configuration•Domain•Licensing*3PowerCenter8工作原理4培训内容常用控件场景以及属性ETL开发和部署步骤PowerCenter开发规范PowerCenter性能监控及调优Workflow设计及控制应用迁移和维护元数据管理5Designer常用控件介绍1-SourceQulalifier场景:根据查询SQL从关系表或数据文件查出所要记录用法:创建好SourceQualifier(下简称SQ)后,将需要的用的字段从来源表拖拽到SQ,双击SQ,对SQ的属性进行设置。命名方式:SQ_Name6Designer常用控件介绍1-SourceQulalifier常用属性SelectDistinct属性:选中的话表明结果记录将去除重复值;TracingLevel属性:共有四级,表示log的复杂程度;NumberOfSortedPorts属性:排序的字段个数,值大于0时SqlQuery中的sql文将出现orderby从句;SqlFilter属性:属性值将出现在SqlQuery属性值的where表达式中;UserDefinedJoin属性:定义连接或者外连接7Designer常用控件2—UpdateStrategy场景:决定该行进行插入,删除,更新,忽略中的哪一种操作用法:创建好UpdateStrategy(下简称US)后,将需要的用的字段从transformation拖拽到US,双击US,对US的属性进行设置。UpdateStrategyExpression属性的设置,这个表达式使用IIF或DECODE函数对记录的每一行进行判断,为每一行赋予DD_INSERT,DD_UPDATE,DD_DELETE,DD_REJECT(这四个是常量,值分别为0,1,2,3)中任意一个值,表明该行在数据库中将进行何种操作。命名方式:UPD_Name8Designer常用控件2—UpdateStrategyUpdateStrategyExpression属性的设置,这个表达式使用IIF或DECODE函数对记录的每一行进行判断,为每一行赋予DD_INSERT,DD_UPDATE,DD_DELETE,DD_REJECT(这四个是常量,值分别为0,1,2,3)中任意一个值,表明该行在数据库中将进行何种操作。9Designer常用控件3—Expression场景:计算一个值,数据转换用法:创建好Expression(下简称EXP)后,将需要的用的字段从来源表拖拽到EXP,双击EXP,新增输出端口,编辑该端口的表达式。命名方式:EXP_Name10Designer常用控件3—Expression常用属性11Designer常用控件3—Expression常用函数--Character(字符函数)Ascii(charaschar):返回字符第一个字节的Ascii码。Concat(char1aschar,char2aschar):字符串连接函数。Length(charasexpression):返回字符串的长的。LTrim(charasexpression):删除字符串左边的空格。RTrim(charaschar):删除字符串右边的空格。Substr(charaschar,masmumeric,[nasmumeric]):截取字符串。Upper(charaschar):将字符串中的小写转换为大写。12Designer常用控件3—Expression常用函数--Conversion(转换函数)To_Char(Numeric):将数字表达式转换为字符串。To_Char(Date,fmt):将日期表达式转换为字符串。To_Date(charaschar,[fmtaschar]):将字符串转换为日期型。To_Decimal(exprasexpression,[scasinteger]):将表达式转换为小数型,sc为精度。To_Float(exprasexpression):将表达式转换为浮点型。To_Integer(exprasexpression,[flagasinteger]):将表达式转换为整型,缺省时四舍五入,如果flag为真时,返回整数部分。13Designer常用控件3—Expression常用函数--DataCleansing(数据清洗函数)Is_Date(saschar,[fmtaschar]):判断字符串是否为日期。Is_Number(saschar):判断字符串是否为数字。Is_Spaces(exprasexpression):判断表达式是否为空格。IsNull(exprasexpression):判断表达式是否为空。14Designer常用控件3—Expression常用函数--Date(日期函数)Date_Compare(date1asdate,date2asdate):日期比较,返回较早的日期。Date_Diff(date1asdate,date2asdate,formateaschar):返回两日期间隔,返回值为double型。Last_day(nasexpression):返回包含该日期的那个月的最后一天。常用函数--Encoding(编码函数)Compress(valueaschar):返回输入字符的二进制编码。常用函数--Numerical(数学函数)常用函数--Special(专用函数)IFF(condasexpression,expr1asexpression,[expr2asexpression]):条件判断函数。15Designer常用控件4—Aggregator场景:分组聚合计算,sum、max、min、count、avg用法:创建好Aggregator(下简称AGG)后,将需要的用的字段从其他transformation拖拽到AGG,双击AGG,在端口tab中每个端口有groupby选项。钩上想要分组的列,新增端口,编写聚合表达式实现分组聚合运算。与sort控件联合使用可提高性能。命名方式:AGG_Name16Designer常用控件4—Aggregator常用属性17Designer常用控件5—Filter场景:过滤记录用法:创建好Filter(下简称FIL)后,将需要的用的字段从transformation拖拽到FIL,双击FIL,对FIL的属性进行设置。FIL的配置主要是对FilterCondition的配置,FilterCondition写入类似where条件的表达式即可。命名方式:FIL_Name18Designer常用控件6—Lookup场景:查询值,常用于事实表外健的查找。用法:创建Lookup(下简称:LKP)的时候选择要查询的表。连接到数据流方式将要关联查询的字段从其他的transformation拖拽过来,然后双击LKP进行属性的配置。命名方式:LKP_Name19Designer常用控件6—Lookup常用属性20Designer常用控件7—Joiner场景:连接查询来自不同数据库的表或平坦文件用法:创建好Joiner(下简称JNR)后,将需要的用的字段从transformation拖拽到JNR,双击JNR,对JNR的属性进行设置。命名方式:JNR_Name21Designer常用控件7—Joiner常用属性22Designer常用控件8—Union场景:合并不同数据源到一个结果集用法:创建好Union后,连接不同的数据源,合并导出到一个结果集中命名方式:UNI_Name23Designer常用控件8—Union常用属性:24Designer常用控件9—Router场景:根据一组表达式将记录分类路由到多个transformation用法:创建好Router(下简称RTR)后,将需要的用的字段从transformation拖拽到RTR,双击RTR,对RTR的属性进行设置。在Grouptab中添加组,为每组编辑该组的过滤条件。命名方式:RTR_Name25Designer常用控件10—Rank作用:排序记录,只输出最顶层或最低层的n个记录用法:创建好Rank(下简称RNK)后,将需要的用的字段从transformation拖拽到RNK,双击RNK,对RNK的属性进行设置。在Portstab中有一个名为‘R’的列,选择你要排序的列。命名方式:RNK_Name类型:Active/Connected26Designer常用控件11—Normalizer场景:27Designer常用控件11—Normalizer用法:创建好Normalizer(下简称Nml)后,定义Normalizer输出列命名方式:Nml_Name28Designer常用控件问题解答:没有固定搭配的使用组件一说。关于优化:informatic会根据资源情况自己分配,基本不用设定。如果出现效率问题,可根据具体问题查找效率瓶颈,单个设定。代理健的使用,根据业务要求和逻辑模型来设定。一般认为:如果pk为字符串的或者联合pk的话,建议使用数字的代理健,会提高装载和查询的效率。增量抽取:按照时间戳、lookup\update、union\update方式。如果不保留历史数据的话或者数据量较小的话,可以全表删除数据。不存在作业单元划分的说法,一般以一个目的表为一个mapping。建议转换不要太复杂。关于关联表:比如有主外健约束的维表和事实表。先处理维表数据,根据维表数据清洗或者转化事实表数据。装载有先后。不存在中间文件复用说法。装载数据前是否删除索引,视情况而定。全量装载数据可删索引或主外健,增量的话不必考虑。29Workflow设计以及控制30Workflow--workletWorklet:小的工作流,单个处理单元把功能相关的session集合成worklet可以采取:并行、串行、混合的方式组合session31Workflow--Demo32Workflow—问题解答Informatica在ETL过程中,出错处理及数据回滚处理,请详细说明各种出错情况的处理方法。例如:数据装载过程中出现问题后对余下数据的处理方法,另外ETL的事物管理机制。(1)session过程中出现问题,数据不会回滚的。(2)通过设定presql,预删除重复数据。也可以采用session中定义RecoveryStrategy的方式来处理,支持断点功能。Informaticaworkflow封装策略,例如:调度,资源分配,执行顺序及容错机制。(1)INFA根据配置自动调度workflow。(2)INFA自动充分利用操作系统资源。(3)执行顺序按照工作流的定义并行或串行进行。(4)根据业务需求使用工作流组件实现容错。Informaticaworkflow/mapping在开发过程中,常用的参数使用及封装方法。例如:数据源路径参数(1)connection不支持参数化。(2)参数分为:mapping级、session级、workflow级、global级。33Informatica安装配置问题Informatica针对db2、ora

1 / 53
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功