基于SSIS定制ETL解决方案内容提要•产品定位及工作原理•增强的功能•灵活的配置•定制开发SSIS的定位•企业级–全面、可靠、易管理–高起点、高性能、易扩充•平台特征–高效的IDE–易于定制的嵌入式体系•不仅是ETL–集成多种异类数据源并在同一过程中处理–高性能的数据移动–大规模数据的处理与转换–集成了数据清洗,数据挖掘,报表与在线分析系统整合BI平台的粘合剂SSIS是…更多更细的功能更多更细的功能更多更细的功能Package任务包的调试LoopTaskTaskLoopTaskTaskTaskTaskDataFlowTransformTransformTaskTaskDataFlowTransformTransform•从错误中止的点重新执行•相关设定–CheckpointFileName:路径\文件名–CheckpointUsage:IfExists或Always–SaveCheckpoints:True–FailPackageOnFailure:True(Task一级)•当前Package可调整CheckpointUsage属性,设置其执行是否遵照前次设置可重新启动的边界灵活的设置•修改Package属性、执行方式,不需要重新打开设计器来编辑(例如源文件的路径设置)•相关设定可存放于SQLServer表、XML文件、系统注册表、环境变量、或Parentpackage•每个Package都可以有多个配置(configurationsets)回顾:SSIS的API体系结构PackageLoops&SequencesStandardtransformsCustomtransformsDataDestinationAdaptersDataSourceAdaptersXMLPackageXMLPackageCommandLineTasksDTSDesignerWizardsEventHandlersSSIS定制开发•定制工作流任务(Tasks)–脚本任务–.net开发•定制数据流任务(Pipeline)–脚本任务–.net开发深入数据处理流程—Pipeline•流水线缓存机制•企业级数据整合工具–高性能–支持复杂数据流程设计–支持各类复杂数据源•设计开发特性–可视化数据流程设计–动态调试、断点–自定义任务、转换、数据源•集成特性–与数据挖掘紧密集成–支持WebServices,XML,–与BI应用紧密集成–自身能够作为数据源再度利用CallcenterbinaryfilesAppssemi-structuredLegacydatabaseWarehouseReportsMobileETL参考资源•msdn.microsoft.com/sql/community/webcasts/default.aspx•www.microsoft.com/events/series/msdnsqlserver2005.mspx•www.SQLIS.com•www.SQLDTS.com•www.microsoftelearning.com•www.microsoft.com/sql/bi/ProjectREAL•www.microsoft.com/events/series/sqlserverbi.mspx©2005MicrosoftCorporation.Allrightsreserved.Thispresentationisforinformationalpurposesonly.Microsoftmakesnowarranties,expressorimplied,inthissummary.HOL•Lesson1:创建简单的ETL包–创建新的IntegrationServices项目–添加和配置平面文件连接管理器–添加和培训OLEDB连接管理器–在包中添加数据流任务–添加并配置平面文件源–添加并配置查找转换–添加和配置OLEDB目标–测试包HOL•Lesson2:添加循环–复制Lesson1包–添加和配置foreach循环容器–修改平面文件连接管理器–测试包HOL•Lesson3:添加包配置–复制Lesson2包–启用并配置包配置–修改目录属性配置值–测试包HOL•Lesson4:添加日志记录–复制Lesson3包–添加和配置日志记录–测试包HOL•Lesson5:添加错误流重定向–复制Lesson4包–创建用于测试的bad文件–添加错误流重定向–测试包