统计实验6回归分析和方差分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

实验6回归分析与方差分析一、实验目的通过本次实验,掌握回归分析和方差分析的功能及如何进行回归分析和方差分析。二、上机作业1、线性回归分析某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm2)资料如下。试用多元回归方法确定以身高、体重为自变量,体表面积为应变量的回归方程并分析所得模型。儿童编号体表面积(Y)身高(X1)体重(X2)123456789105.3825.2995.3585.2925.6026.0145.8306.1026.0756.41188.087.688.589.087.789.588.890.490.691.211.011.812.012.313.113.714.414.915.216.0答:(1)首先我们对以上变量做散点图分析,结果如下:由图,我们可以直观推测体表面积与体重有很好的相关关系,而体表面积与身高的相关关系较弱一点儿。(2)我们对相关系数做分析:Correlations体表面积身高体重体表面积PearsonCorrelation1.869**.943**Sig.(2-tailed).001.000N101010身高PearsonCorrelation.869**1.863**Sig.(2-tailed).001.001N101010体重PearsonCorrelation.943**.863**1Sig.(2-tailed).000.001N101010**.Correlationissignificantatthe0.01level(2-tailed).由上表,我们可以看出,体重与体表面积比身高与体表面积确实有更好的相关性。(3)下面我们用多元回归方法做线性回归,其相关数据如下:VariablesEntered/RemovedbModelVariablesEnteredVariablesRemovedMethod1体重,身高a.Enter2.身高Backward(criterion:ProbabilityofF-to-remove=.100).a.Allrequestedvariablesentered.b.DependentVariable:体表面积ModelSummaryModelRRSquareAdjustedRSquareStd.ErroroftheEstimate1.950a.902.874.1433462.943b.890.876.141945a.Predictors:(Constant),体重,身高b.Predictors:(Constant),体重ANOVAcModelSumofSquaresdfMeanSquareFSig.1Regression1.3212.66132.145.000aResidual.1447.021Total1.46592Regression1.30411.30464.705.000bResidual.1618.020Total1.4659a.Predictors:(Constant),体重,身高b.Predictors:(Constant),体重c.DependentVariable:体表面积如果将体表面积(Y1)回归为关于身高(X1)和体重(X2)的线性组合。由以上数据我们知道,有关身高(X2)的显著度为0.389。即将它们回归为:Y1=-2.856+0.069X1+0.184X2不是很合适,所以我们将体表面积(Y1)回归为仅CoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.CollinearityStatisticsBStd.ErrorBetaToleranceVIF1(Constant)-2.8566.018-.475.649身高.069.075.215.919.389.2563.912体重.184.057.7583.234.014.2563.9122(Constant)2.661.3856.915.000体重.229.028.9438.044.0001.0001.000a.DependentVariable:体表面积与体重(X2)有关的线性方程较为合适。因为我们由以上数据知道它们的显著度更好,仅为0.000。所以我们它们的关系回归为:Y1=2.661+0.229X2。2、非线性回归分析柯布-道格拉斯回归,详细见教材p195,15题柯布-道格拉斯生产函数。.0,0,0,LKAtLtAKtQ认为生产总值tQ同劳力tL及资本tK有关,同技术进步A的贡献也有关。某地制造业记录了n=12个年份的数据资料:年份序号ttQ/万元tK/万元tL/个1144336477293739221763974617240818324191146850482224311551579295477353710247447561045647974412299563128756836614969460087864623518625161570992799925022076248101028315295506780701111354663274646898012128038936583581845记,2,1,ln.,.....,2,1,ln2,ln1,lnAnttLtxtKtxtQty。则有:2,1,).,0(,2211。试求服从。Ntttxtxty的最小二乘估计。答:ModelSummarybModelRRSquareAdjustedRSquareStd.ErroroftheEstimate1.995a.990.988.082512a.Predictors:(Constant),lnL,lnKb.DependentVariable:lnQ由上表,我们可以看出调整判断系数为0.988,与1非常接近,认为拟合优度较高。ANOVAbModelSumofSquaresdfMeanSquareFSig.1Regression5.94222.971436.346.000aResidual.0619.007Total6.00311a.Predictors:(Constant),lnL,lnKb.DependentVariable:lnQ由上表,我们看到Sig=0.000,回归方程显著。CoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.CollinearityStatisticsBStd.ErrorBetaToleranceVIF1(Constant)-7.3421.823-4.028.003lnK.537.070.5907.664.000.1925.220lnL1.286.230.4315.596.000.1925.220a.DependentVariable:lnQ由上表,我们看到,所有变元的显著度都比较高,都0.05。所以我们可以把他们的关系表示为lnQ=-7.342+0.537lnK+1.286lnL。B0=-7.342,B1=0.537,B2=1.286即为相关的最小二乘估计。3.单因素方差分析粮食贮藏,p192,11题粮食加工厂用四种不同的方法贮藏粮食,贮藏一段时间后,分别抽样化验,得到粮食含水率如下:贮藏方法含水率%A7.38.37.68.48.3B5.87.47.1C8.16.47.0D7.99.0检验这四种不同的贮藏方法对粮食的含水率是否有显著影响。答:ANOVA含水率SumofSquaresdfMeanSquareFSig.BetweenGroups4.81131.6043.188.077WithinGroups4.5269.503Total9.33712从上表可以看到,含水率的离差平方总和为9.337,在考虑贮藏方法单个因素的影响,则含水率总变差中,不同贮藏方式可解释的变差为4.811,抽样误差引起的变差为4.526,它们均方差分别为1.604和0.503,相除所得的F统计量的观测值为3.188,对应的概率P值近似为.077.如果显著度水平为0.05,由于概率值P大于0.05,应拒绝零假设,不认为不同的贮藏方式有显著影响,但是0.077与0.05很接近,所以我们可以粗略的认为这四种不同的贮藏方法对粮食的含水率是没有显著影响。4.多因素方差分析某城市从4个排污口取水,经两种不同方法处理后,检测大肠杆菌数量,单位面积内大肠杆菌数量如下表所示,请检验它们是否有差别。排污口1234处理方法19,12,7,520,14,18,1212,7,6,1023,13,16,21处理方法213,7,10,817,10,9,1511,5,7,618,14,19,11答:Between-SubjectsFactorsN处理方法116216排污口18283848TestsofBetween-SubjectsEffectsDependentVariable:大肠杆菌数量SourceTypeIIISumofSquaresdfMeanSquareFSig.CorrectedModel485.219a769.3175.947.000Intercept4632.03114632.031397.386.000clff19.531119.5311.676.208pwk441.3443147.11512.621.000clff*pwk24.34438.115.696.563Error279.7502411.656Total5397.00032CorrectedTotal764.96931a.RSquared=.634(AdjustedRSquared=.528)我们从上表可以看到,在clff(处理方法)栏目中可以看到Sig.=0.2080.05,所以我们认为有较高的显著度,即是不同的处理方法对大肠杆菌的数量还是有无显著的差别。我们又单独看pwk(排污口)对大肠杆菌数量的影响,在表中我们可以看到它的显著度接近0.000,故我们认为不同的排污口对大肠杆菌的数量有显著差别。下面我们考察二者的交互作用对大肠杆菌数量的影响:我们由表中看到clff*pwk栏目中Sig.=0.563,所以我们认为二者的相互作用对大肠杆菌的数量无显著差别。

1 / 7
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功