实验报告学院:理学院系:数学系专业:应用数学实验名称:计算实验年级:姓名:学号:组号:实验时间:2010.12.1成绩:指导教师签字:实验题目:实验四回归分析与逐步回归目的和要求:1.学会对实际问题进行数学抽象。2.熟悉用MINITAB软件中进行方差分析和回归分析的基本命令的操作;3.学会用MINITAB进行多因素试验的回归分析的程序设计。主要仪器设备:多媒体计算机实验内容:牙膏的销售量问题:某大型牙膏制造企业为了更好的拓展产品市场,有效地管理库存,公司董事会要求销售部门根据市场调查,找出公司生产的牙膏销售量价格,广告投入等之间的关系,从而预测出在不同价格和广告费用下的销售量。为此,销售部的研究人员收集了过去30个销售周期(每个销售周期为4周)公司生产的牙膏销量,销售价格,投入的广告费用,以及同期其他厂家生产的同类牙膏的平均销售价格,见表1。试根据这些数据建立一个数学模型,分析牙膏销售量与其他因素的关系,为制定价格策略和广告投入策略提供数据依据。销售周期公司销售价格(元)其他厂家平均价格(元)广告费用(百万元)价格差(元)销售量(百万支)1234567891011121314151617183.853.753.703.703.603.603.603.803.803.853.903.903.703.753.753.803.703.803.804.004.303.703.853.803.753.853.654.004.104.004.104.204.104.104.204.305.506.757.255.507.006.506.755.255.256.006.506.257.006.906.806.807.107.00-0.050.250.6000.250.200.150.05-0.150.150.200.100.400.450.350.300.500.507.388.519.527.509.338.288.757.877.108.007.898.159.108.868.908.879.269.001920212223242526272829303.703.803.803.753.703.553.603.653.703.753.803.704.103.753.753.653.903.654.104.253.653.753.854.256.806.506.256.006.507.006.806.806.505.755.806.800.40-0.05-0.05-0.100.200.100.500.60-0.0500.050.558.757.957.657.278.008.508.759.218.277.677.939.26表1牙膏销售量与销售价格,广告费用等数据(其中价格差指其他厂家平均价格与公司销售价格之差)1.实验设计方案1)前期分析:牙膏的销售量受到多种因素影响,例如:产品销售价格、同类产品销售价格、广告费用投入量、产品质量等因素。但是我们只考虑两个对结果有显著性影响的因素,广告费用投入量及同类价格产品。在考虑同类产品价格时不好处理,在这里我们仅考虑其他产品同本公司产品的价格差2)模型假设:1在一定时期内假设市场总需求量没有太大的变化。2同类产品在一定时期内价格无明显变化。3通过调节本公司的价格调整都能够达到理想的价格差3)建立模型:22322110xxxy4)编写程序:[b,bint,r,rint,stats]=regress(y,x,alpha)5)对结果进行分析,讨论诸如:结果的合理性、正确性,算法的收敛性,模型的适用性和通用性,算法效率与误差等。2.基本模型为了大致分析y与1x和2x的关系,首先利用散点图观察销售量y与价格差1x及y与广告投入量2x之间的关系。Y与1x的关系:-0.2-0.100.10.20.30.40.50.677.588.599.510data1linear图1Y对1x散点图(1)从图(1)发现,随着1x增加,y的值有明显的线性增加趋势,图中直线用线性模型011yx(1)Y与2x的关系:55.566.577.577.588.599.51010.5data2quadratic图2y对2x的散点图拟合的(其中是随机误差)在图2中,当2x增大时,y有向上弯曲增加的趋势,图中的曲线用二次函数模型:201122yxx(2)拟合。综上分析,结合模型(1)和(2)建立如下回归模型20112232yxxx(3)其中,y是建立的模型,我们用y22322110xxx对y进行估计,其中3210,,,是我们待估计的参数。3.模型求解利用MATLAB统计工具箱中的命令regress求解,使用格式为:[b,bint,r,rint,stats]=regress(y,x,alpha)具体实验操作过程如下:x1=[-0.050.250.600.250.20.150.05-0.150.150.20.10.40.450.350.30.50.50.4-0.05-0.05-0.10.20.10.50.6-0.0500.050.55]';x2=[5.56.757.255.576.56.755.255.2566.56.2576.96.86.87.176.86.56.2566.576.86.86.55.755.86.8]';x3=[30.2545.562552.562530.254942.2545.562527.562527.56253642.2539.06254947.6146.2446.2450.414946.2442.2539.06253642.254946.2446.2442.2533.062533.6446.24]';Y=[7.388.519.527.59.338.288.757.877.187.898.159.18.868.98.879.2698.757.957.657.2788.58.759.218.277.677.939.26]';X=[ones(30,1)x1x2x3];[b,bint,r,rint,stats]=regress(Y,X)rcoplot(r,rint)结果如下:b=17.32441.3070-3.69560.3486bint=5.728228.92060.68291.9311-7.49890.10770.03790.6594r=-0.0988-0.0795-0.1195-0.04410.4660-0.01330.29120.2735-0.23510.1031-0.40330.17470.0400-0.15040.12840.1637-0.0527-0.1907-0.0870-0.0165-0.1292-0.3002-0.2933-0.1679-0.21770.11160.30350.06930.24740.2270rint=-0.52700.3294-0.53090.3718-0.51060.2716-0.47310.38480.08130.8507-0.46090.4343-0.13740.7197-0.08700.6340-0.59600.1258-0.32800.5341-0.81900.0125-0.26180.6112-0.40320.4832-0.59330.2925-0.32070.5775-0.28410.6116-0.48300.3776-0.62480.2434-0.53480.3609-0.44230.4092-0.56090.3024-0.71810.1177-0.72430.1377-0.55480.2190-0.64490.2095-0.29940.5226-0.10370.7106-0.37140.5099-0.18070.6755-0.18900.6430stats=0.905482.94090.00000.0490得到模型(3)的回归系数的估计值及其置信区间(置信水平05.0)、检验统计量PFR,,2的结果见下表1参数参数估计参数置信区间017.3244[5.728228.9206]11.3070[0.68291.9311]2-3.6956[-7.49890.1077]30.3486[0.03790.6594]2R=0.9054F=82.9409p0.0001表14.结果分析y为模型(3)中的数据,x为对应与回归系数),,,(3210的数据矩阵[11x2x22x],alpha为置信水平,缺省时=0.05;输出b为的估计值,常记作,bint为b的置信区间,r为残差向量,rint为r的置信区间,stats为回归模型的检验统计量,有3个值回归方程决定系数2R、F统计量、F统计量对应的概率值P。由表中的数据显示,2R=0.9054指因变量的y的90.54%可由模型确定,F值远远超过F检验的临界值,p远远小于,因而模型(3)可用。表2的回归系数给出了模型(3)中0,1,2,3的估计值0=17.3244,1=1.3070,2=-3.6956,3=0.3486。检查它们的置信区间发现,只有2的置信区间包含零点(但区间右端点距零点很近),表明回归变量2x(对因变量y的影响)不是太显著的,但由于22x是显著的,我们仍将变量2x保留在模型中。5.销售量预测经回归系数的估计值代入模型(3),即可预测公司未来某个销售周期牙膏的销售量y,将预测值记为y,得到模型(3)的预测方程:y=20123122xxx(4)只需知道该销售周期的价格差1x和投入的广告费用2x,就可以计算预测值y。公司无法直接确定价格差1x,只能制定公司的牙膏销售价格4x,但是其它厂家的平均价格一般可以通过根据市场情况及原材料的价格变化等估计。模型中用价格差做为回归变量的好处在于公司可以更灵活地来预测产品的销售量或市场需求量,因为其它厂家的平均价格不是公司所能控制的。预测时只要调整公司的牙膏销售价格达到设定的回归变量价格差1x的值。回归模型的一个重要应用是,对于给定的回归变量的取值,可以以一定的置信度预测因变量的取值范围,即预测区间。6.模型改进模型(3)中回归变量1x,2x对因变量y的影响是相互独立的,即牙膏销售量y的均值和广告费用2x的二次关系由回归系数2,3确定,而不依赖与价格差1x,同样,y的均值与1x的线性关系由回归系数1确定,不依赖于2x。根据经验可参想,1x和2x之间的交互作用会对y有影响,简单的用1x,2x的乘积代表他们的交互作用,将模型(3)增加一项,得到:20112232412yxxxxx(5)在这个模型中,y的均值与2x的二次关系为22232412xxxx,由系数2,3,4确定,并依赖与价格差1x。讨论:对实验中存在的问题、进一步的想法等进行讨论。