数据仓库与数据挖掘实验指导ByTMS目录第1课:创建SQLserver2005的DT项目和基本包.................................................................31.1创建新的IntegrationServices项目.......................................................................51.2添加和配置平面文件连接管理器....................................................................................61.3添加和配置OLEDB连接管理器..................................................................................81.4在包中添加数据流任务.....................................................................................................81.5添加并配置平面文件源.....................................................................................................91.6添加并配置查找转换.........................................................................................................91.7添加和配置OLEDB目标............................................................................................101.8测试Lesson1教程包.................................................................................................11第2课:添加循环.......................................................................................................................122.1创建Lesson2包........................................................................................................132.2添加和配置Foreach循环容器......................................................................................13一、添加Foreach循环容器......................................................................................13三、将枚举器映射为用户定义的变量.........................................................................14四、将数据流任务添加到循环中.................................................................................142.3修改平面文件连接管理器............................................................................................142.4测试Lesson2教程包...................................................................................................15第3课:在AnalysisServices项目中定义数据源视图及多维数据集...................................16一、创建AnalysisServices项目................................................................................16二、定义新的数据源.............................................................................................................18三、定义数据源视图.............................................................................................................22四、修改表的默认名称.........................................................................................................25五、定义多维数据集.............................................................................................................27五、检查多维数据集和维度属性.........................................................................................32六、部署AnalysisServices项目........................................................................................40第1课:创建SQLserver2005的DT项目和基本包在本课中,您将创建一个简单ETL包,该包可以从单个平面文件源提取数据,使用两个查找转换组件转换该数据,然后将该数据写入AdventureWorksDW中的FactCurrencyRate事实数据表。在本课中,您还将学习如何创建新包、添加和配置数据源和目标连接以及使用新的控制流和数据流组件。重要事项:本教程需要AdventureWorksDW示例数据库。有关安装和部署AdventureWorksDW的详细信息,请参阅:了解包要求在创建包之前,需要充分了解在源数据和目标数据中使用的格式。了解了这些数据格式后,便可定义将源数据映射到目标数据所需的转换。查看源对于本教程,源数据是平面文件SampleCurrencyData.txt中包含的一组历史货币数据。源数据包括以下四列:平均汇率、货币键、日期键和当天汇率。下面是SampleCurrencyData.txt文件中所包含的源数据示例:1.00010001ARS9/3/20010:000.999600161.00010001ARS9/4/20010:001.0010010011.00020004ARS9/5/20010:000.999900011.00020004ARS9/6/20010:001.000400161.00050025ARS9/7/20010:000.999900011.00050025ARS9/8/20010:001.0010010011.00050025ARS9/9/20010:0011.00010001ARS9/10/20010:001.000400161.00020004ARS9/11/20010:000.999900011.00020004ARS9/12/20010:001.001101211在使用平面文件源数据时,需要了解平面文件连接管理器如何解释平面文件数据,这一点很重要。如果平面文件源是Unicode编码的,则平面文件连接管理将所有列定义为[DT_WSTR],默认列宽为50。如果平面文件源是ANSI编码的,则将列定义为[DT_STR],默认列宽为50。您可能必须更改这些默认设置,才能使字符串列类型与所使用的数据更相符。为此,您需要查看将写入数据的目标的数据类型,然后在平面文件连接管理器中选择正确的类型。查看目标源数据的最终目标是AdventureWorksDW中的FactCurrencyRate事实数据表。FactCurrencyRate事实数据表有四列,并且与两个维度表有关系,如下表所示。列名称数据类型查找表查找列AverageRatefloat无无CurrencyKeyint(FK)DimCurrencyCurrencyKey(PK)TimeKeyInt(FK)DimTimeTimeKey(PK)EndOfDayRatefloat无无将源数据映射为与目标兼容对源数据和目标数据的分析指出需要查找CurrencyKey和TimeKey值。将执行这些查找的转换通过使用DimCurrency和DimTime维度表中的备用键来获取CurrencyKey和TimeKey值。平面文件表名列名称数据类型列0FactCurrencyRateAverageRateFloat1DimCurrencyCurrencyAlternateKeynchar(3)2DimTimeFullDateAlternateKeyDatetime3FactCurrencyRateEndOfDayRateFloat本课程包含以下任务:·创建新的IntegrationServices项目·添加和配置平面文件连接管理器·添加和配置OLEDB连接管理器·在包中添加数据流任务·添加并配置平面文件源·添加并配置查找转换·添加和配置OLEDB目标·使Lesson1包更易理解·测试Lesson1教程包1.1创建新的IntegrationServices项目创建新的IntegrationServices项目2在“开始”菜单中,依次指向“所有程序”、“MicrosoftSQLServer2005”,再单击SQLServerBusinessIntelligenceDevelopmentStudio。3在“文件”菜单中,指向“新建”,再单击“项目”,以创建一个新的IntegrationServices项目。4在“新建项目”对话框的“模板”窗格中,选择“IntegrationServices项目”。5在“名称”框中,将默认名称更改为SSISTutorial。或者,清除“创建解决方案的目录”复选框。6接受默认位置,或单击“浏览”,以浏览并找到要使用的文件夹。7在“项目位置”对话框中,单击文件夹,再单击“打开”。8单击“确定”。默认情况下,将创建一个名为Package.dtsx的空包,并将该包添加到项目中。9在解决方案资源管理器工具栏中,右键单击Package.dtsx,再单击“重命名”,将默认包重命名为Lesson1.dtsx。10当系统提示重命名包对象时,单击“是”。设置受区域设置影响的属性1.在“视图”菜单中,单击“属性窗口”。2.在“属性”窗口中,将LocaleID属性设置为“英语(美国)“。1.2添加和配置平面文件连接管理器添加一个平面文件连接管理器1.右键单击“连接管理器”区域中的任意位置,再单击“新建平面文件连接”。2.在“平面文件连接管理器编辑器”对话框的“连接管理器名称”字段中,