表1自动咖啡售货机数量与咖啡销售量数据《建模与R软件》课程作业学号:13062227姓名:江俊逸成绩:1.一位饮食公司的分析人员想调查自助餐馆中的自动咖啡售货机数量与咖啡销售量的关系,他选择了14家餐馆来进行实验。这14家餐馆在营业额、顾客类型和地理位置方面都是相近的。放在试验餐馆的自动售货机数量从0(这里咖啡由服务员端来)到6不等,并且是随机分配到每个餐馆的。表1所示的是关于试验结果的数据。(1)作线性回归模型;(2)作多项式回归模型(3)画出数据的散点图和拟合曲线。餐馆售货机数量咖啡销售量(/杯)餐馆售货机数量咖啡销售量(/杯)10508.183697.520498.494755.331568.2104758.941577.3115787.652651.7125792.162657.0136841.473713.4146831.8[提示:参考《统计建模与R软件》第6章的相关内容。]解:####输入数据,作线性回归模型X-data.frame(x=c(0,0,1,1,2,2,3,3,4,4,5,5,6,6),y=c(508.1,498.4,568.2,577.3,651.7,657.0,713.4,697.5,755.3,758.9,787.6,792.1,841.4,831.8))lm.sol-lm(y~x,data=X)summary(lm.sol)显示结果Call:lm(formula=y~x,data=X)Residuals:Min1QMedian3QMax-25.400-11.484-3.77914.62924.921Coefficients:EstimateStd.ErrortvaluePr(|t|)(Intercept)523.8008.47461.812e-16***x54.8932.35023.362.26e-11***---Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1Residualstandarderror:17.59on12degreesoffreedomMultipleR-squared:0.9785,AdjustedR-squared:0.9767F-statistic:545.5on1and12DF,p-value:2.265e-11回归系数与回归方的检验都是显著的,故回归方程为:####画散点图及拟合曲线plot(X$x,X$y)abline(lm.sol)结果如下:####作多项式拟合lm.sol_1-lm(y~x+I(x^2),data=X)summary(lm.sol_1)显示结果Call:lm(formula=y~x+I(x^2),data=X)Residuals:Min1QMedian3QMax-10.6643-5.6622-0.46555.500010.6679Coefficients:EstimateStd.ErrortvaluePr(|t|)(Intercept)502.55604.8500103.6192e-16***x80.38573.786121.2322.81e-10***I(x^2)-4.24880.6063-7.0082.25e-05***---Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1Residualstandarderror:7.858on11degreesoffreedomMultipleR-squared:0.9961,AdjustedR-squared:0.9953F-statistic:1391on2and11DF,p-value:5.948e-14回归系数与回归方的检验都是显著的,故回归方程为:####画散点图及拟合曲线xfit-seq(0,6,len=200);yfit-predict(lm.sol_1,data.frame(x=xfit))plot(X$x,X$y)lines(xfit,yfit)结果如下2.为考查学生的学习情况。学校随机地抽取12名学生的5门课程期末考试成绩,其中数据见表2,试用因子分析的方法对这种数据进行分析。(1)找出5门课程的公共因子,并进行合理的解释;(2)用回归方法或Bartlett方法计算样本的因子得分,画出因子得分的第1第2公共因子的散点图,通过散点图来分析这12名学生的学习情况。[提示:参考《统计建模与R软件》第9章的相关内容。]解:####输入数据X-data.frame(x1=c(99,99,100,93,100,90,75,93,87,95,76,85),x2=c(94,88,98,88,91,78,73,84,73,82,72,75),x3=c(93,96,81,88,72,82,88,83,60,90,43,50),x4=c(100,99,96,99,96,75,97,68,76,62,67,34),序号政治(X1)语文(X2)外语(X3)数学(X4)物理(X5)19994931001002998896999731009881961004938888999651009172967869078827597775738897898938483688898773607684109582906239117672436778128575503437x5=c(100,97,100,96,78,97,89,88,84,39,78,37))fa-factanal(X,factors=2);fa显示结果Call:factanal(x=X,factors=2)Uniquenesses:x1x2x3x4x50.0050.1410.4940.0050.346Loadings:Factor1Factor2x10.9920.104x20.8540.360x30.4970.509x40.2840.956x50.1320.798Factor1Factor2SSloadings2.0591.950ProportionVar0.4120.390CumulativeVar0.4120.802Testofthehypothesisthat2factorsaresufficient.Thechisquarestatisticis0.28on1degreeoffreedom.Thep-valueis0.598#相关矩阵r=cor(X)fa-factanal(factors=2,covmat=r);fa显示结果Call:factanal(factors=2,covmat=r)Uniquenesses:x1x2x3x4x50.0050.1410.4940.0050.346Loadings:Factor1Factor2x10.9920.104x20.8540.360x30.4970.509x40.2840.956x50.1320.798Factor1Factor2SSloadings2.0591.950ProportionVar0.4120.390CumulativeVar0.4120.802Thedegreesoffreedomforthemodelis1andthefitwas0.0387由以上两种方法可得相关系数矩阵和用原矩阵所得到的结果是一致的,在计算结果中,因子f1前两个变量(x1,x2)的载荷因子接近于1,这类归为“文科类”,因此称之为文科因子;因子f2后两个变量(x4,x5)的载荷因子接近于1,这类归为“理科类”,因此称之为理科因子。fa-factanal(X,factors=2,scores='regression')plot(fa$scores[,1:2],type='n')text(fa$scores[,1],fa$scores[,2])结果如下由图可以看出,1、2、3、5的综合成绩更好,7号学生的理科强,文科弱,有明显的偏科,12号学生成绩平均,不是十分突出。