1目录1.Kettle工具的组成....................................................................................................................22.kettle工具的运行....................................................................................................................23.资源库的设置...........................................................................................................................34.转换的创建与使用...................................................................................................................84.1创建一个新的装换.......................................................................................................84.2DataGird........................................................................................................................94.3Writetolog控件........................................................................................................104.4表输入控件.................................................................................................................134.5字段选择控件.............................................................................................................144.6表输出控件.................................................................................................................154.7插入/更新控件...........................................................................................................174.8转换中变量的设置.....................................................................................................184.9变量的使用.................................................................................................................194.10步骤的错误处理.....................................................................................................194.11flow控件的使用.........................................................................................................204.11.1Switch/Case控件............................................................................................204.11.2BlockingStep控件..........................................................................................214.11.3Indentifylastrowinastream控件.................................................................224.11.4过滤记录控件.................................................................................................234.11.5空操作控件.....................................................................................................234.11.6Abort控件......................................................................................................245.作业(job)的创建及使用....................................................................................................245.1创建一个新的作业.....................................................................................................245.2START控件.................................................................................................................255.3Success控件...............................................................................................................255.4Transformation控件..................................................................................................255.5变量设置.....................................................................................................................265.6Js脚本使用.................................................................................................................275.7空操作控件.................................................................................................................2721.Kettle工具的组成Kettle主要由资源库、数据库、作业(job)、转换、步骤五部分组成,资源库是用来存储用户所编写的作业和转换(即kjb文件和ktr文件),一般是在数据库中存储,方便用户的查找和使用。数据库就是处理数据是需要的数据库。作业是用来确定一个工程中需要使用的转换和转换的执行顺序。转换是数据在ktr文件中的具体转换过程,类似于Java的一个方法,而作业就类似于java的一个类,它可以调用各种不同的方法(转换)。步骤是kettle最小的执行单位。2.kettle工具的运行1)在电脑中安装jdk并配置java运行环境(jdk版本建议是1.6或以上版本)2)Kettle工具的下载:可以在中下载最新的版本,此文档所使用的是kettel-4.1.0的版本3)Kettle工具的运行:在Windows系统下运行,只需要解压kettle文件后,双击data-integration文件夹中的Spoon.bat文件3在Linux下运行则双击data-integration文件夹中的Spoon.sh文件3.资源库的设置打开kettle工具后会出现如下界面:在这里我们可以设置kjb文件和ktr文件存放的资源库,也可以不设置但是在保存的时候就需要手动设置文件的保存路径。4加号按钮是添加新的资源库,铅笔按钮是对已有的资源库进行编辑,叉叉按钮是删除选定的资源库按下添加按钮后会进入一下界面,双击红色选定框内的文字将弹出新建一个新的资源库双击红色选定框内的文字将弹出资源库新建窗口,点击上面一行文字是在数据库中创建资源库,下面的文字是在本地中创建资源库(与数据库类似,不作展示)点击新建按钮将弹出数据库连接窗口ConnectionName:数据库连接名称(随意填写,不能为空)ConnectionType:连接的数据库类型5Access:数据库的连接方式(本文档只选择了Native的连接方式,其他方式请读者自行摸索)HostName:数据库具体的Ip地址DatabaseName:指定连接的数据库名称InstanceName:(可不填写)PortNumber:数据库监听的tcp/ip端口号UserName:指定连接数据库登录时的用户名Password:指定连接数据库登录时的密码填写完数据库连接的基本信息后,点解界面中的Test按钮进行数据库连接测试,如成功连接会弹出如下信息,反之则会弹出出错信息,出错后根据相关的出错信息进行修改,不需要添加相关的数据库连接jar包,kettle工具中已经把其包含进去了。6连接成功后点击ok按钮,并在一下界面输入Id和名称(id和名称都可以随意填写)填写完成后点击创建或更新按钮,进行资源库的创建。如果只点击确定按钮是不会创建资源库的。点击创建或更新按钮后会弹出一下界面,是在数据库中创建资源库的sql执行语句,点击执行执行完后会弹出一下界面,执行完后直接关闭SQL语句的运行结果窗口和简单SQL编辑器窗口(运行成功后不要再次点击执行按钮,否则会报错)7确定资源库信息后返回资源库连接界面,进行资源库登录,新建的资源库密码默认为admin,再次登录后可以对其进行密码的修改(输入密码后按下enter键登录)8探索资源库可以查看资源库中的具体信息Browse:查看资源库中所存放的ktr文件和kjb文件Connections:数据库连接管理Security:资源库登录用户管理4.转换的创建与使用4.1创建一个新的装换9下图为一个普通的转换流程,下面介绍一些常用的转换控件4.2DataGird核心对象—输入—DataGird中选取D