§5化妆品销售量的预测某公司在各地销售一种化妆品,观测15个城市在某月内对该化妆品的销售量Y及适合使用该化妆品的人数1x和人均收入2x。数据见下表:要求通过以上数据建立预测模型,当已知任一个城市的适用人数和人均收入),(21xx时,能够预测在这个城市的销售量。城市销售量(箱)iy适用人数(千人)1ix人均收入(元)2ix116227424502120180325432233753802413120528385678623476169265378278198300881923302450911619521371055532560112524304020122323724427131442362660141031572088152123702605这个问题本质上就是多元线性回归模型,如果随机变量Y与固定变量mxxx,,,21之间有显著的线性相关关系,即),0(~,222110NxbxbxbbYmm称为m元线性回归模型。一、模型中的参数估计设通过实验或历史资料得到观测数据),,2,1(),,,,,(21nixxxyimiii。令mnmnnmmnbbbBxxxxxxxxxXyyyY1021222211121121,111,由最小二乘估计,得YXXXBTT1)(ˆ称mmxbxbxbbyˆˆˆˆˆ22110为变量Y关于变量mxxx,,,21的线性回归方程。同样还可以得到2的估计量为niiiyymn122)ˆ(11ˆ这里),,2,1(ˆˆˆˆˆ22110nixbxbxbbyimmiii。二、回归模型的显著性检验1、检验回归模型的显著性即检验假设不全为零imbHbbbH:,0:1210令niiieniiRyySyyS1212)ˆ(,)ˆ(检验统计量)1,(~)1/(/mnmFmnSmSFeR对一个小概率,若)1,(mnmFF,则认为所建的回归方程有意义。2、各自变量的显著性检验,剔除变量计算即检验假设),,2,1(0:,0:10mjbHbHjjjj检验统计量),,2,1()1(~)1/(ˆmjmntmnScbtejjjj这里jjc是矩阵1)(XXCT中相应位置的元素。对一个小概率,若)1(2mnttj,则应保留变量jx,否则应剔除变量jx。剔除变量时,从jt最小的开始,直到不显著的变量全部剔除为止。设jkttmin,则剔除kx,重新建立回归方程如下:mmkkkkxbxbxbxbby*1*11*11*1*0ˆˆˆˆˆˆ其中),,,2,1(,ˆˆˆ*kjmjbccbbkkkkjjj,jkjjxbyb**0ˆˆ三、利用回归方程进行预报当),,,(),,,(0020121mmxxxxxx时,对Y进行预测。1、点预测mmxbxbxbby002201100ˆˆˆˆˆ2、区间预测Y的置信度为1的置信区间))(ˆ),(ˆ(0000xyxy,其中mimjijjjiicxxxxnmntx110020))((11ˆ)1()(现在用上面的回归模型来解决前面提出的问题:260537013254180124502741,212120162XY得到TB)0092.0,4960.0,4526.3(ˆ所求回归方程是210092.0496.04526.3ˆxxy又求得88.56,72.53844eRSS从而89.3)12,2(5680)1/(/05.0FmnSmSFeR故认为所建的回归方程有意义。776441109772.1100303.7107329.7101567.4101297.22463.1)(XXCT又可求出179.2)12(93.81107329.774.44960.0025.061tt179.2)12(50.9109772.174.40092.0025.072tt说明21,xx对Y均有显著的线性影响,均不能剔除。下面给出预测方法:例如当某城市的数据)2500,220(),(21xx时,有57.13525000092.0220496.04526.3ˆ0y又972.4))((11ˆ)12()(1100025.00mimjijjjiicxxxxntx可以95%的把握认为这种化妆品在该城市的销售量在))(ˆ),(ˆ(0000xyxy,即在130到140箱之间。