统计学一元线性回归课后习题答案(课堂PPT)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

一元线性回归课后习题讲解--------第九组111.1从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:企业编号产量(台)生产费用140130242150350155455140565150678154784165810017091161671012518011130175121401852产量与生产费用020406080100120140160180200020406080100120140160产量费用系列1产量和费用存在正的线性相关系数(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。3r=0.92022222yynxxnyxxynr222222212(40*13042*150...140*185)(4042...140)*(130150...185)12*(4042...140)20162212*(130150...185)(130150...185)r2)计算产量与生产费用之间的线性相关系数。41、提出假设:H0:;H1:02、计算检验的统计量)2(~122ntrnrt根据显著性水平=0.05,查t分布表得t(n-2)=2.2281由于t=7.435453t(12-2)=2.2281,拒绝H0,产量与生产费用之间存在着显著的正线性相关关系21220.92027.43545310.9202t(3)对相关系数的显著性进行检验(=0.05),并说明二者之间的关系强度。t(12-2)=2.2281511.2学生在期末考试之前用于复习的时间(单位:小时)和考试分数(单位:分)之间是否有关系?为研究这一问题,一位研究者抽取了由8名学生构成的一个随机样本,取得的数据如下:复习时间X2016342327321822考试分数Y6461847088927277601020304050607080901000510152025303540复习时间分数系列1复习时间和考试分数存在正的线性相关关系复习时间和考试分数存在正的线性相关关系复习时间和考试分数存在正的线性相关关系要求:(1)绘制复习时间和考试分数的散点图,判断二者之间的关系形态。7r=0.86212222yynxxnyxxynr(2)计算相关系数,说明两个变量之间的关系强度。222222228(20*6416*61...22*77)(2016...22)*(6461...77)8*(2016...22)2016...228*(6461...77)(6461...77)r811.3、根据一组数据建立的线性回归方程要求:1)解释截距的意义。1)解释斜率的意义。2)当=6时的E(y)1)表示在没有自变量X的影响时其他各种因素对因变量Y的影响为102)斜率的意义在于:自变量X变化对Y影响程度。回归方程中,当x增加一个单位时,y将减少0.5个单位。3)x=6时,代入方程,则,y=10-0.56=7ˆˆ100.5yx1ˆ0ˆ911.4设SSR=36,SSE=4,n=18要求:1)计算判定系数R^2并解释其意义回归直线对观测值的拟合程度为0.9,说明变量Y的变异性中有90%是由自变量x引起的。2)计算估计标准误差并解释其意义es21ˆ40.5218216niiieyySSEsn2360.940SSRSSRRSSTSSTSSE表示实际值与估计值之间的差异程度是0.51011.5一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,他抽出了公司最近10个卡车的运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天)的数据如下表:运送距离x825215107055048092013503256701215运送时间y3.51.04.02.01.03.04.51.53.05.0(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态(2)计算线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。11根据图表显示,二者可能存在正线性相关关系0.01.02.03.04.05.06.002004006008001000120014001600运送距离(公里)运送时间(天)(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态12x与y的简单相关系数是0.9489,两变量之间呈现高度正相关关系运送距离x运送时间y运送距离x1运送时间y0.948941(2)计算线性相关系数,说明两个变量之间的关系强度13最小二乘估计:y=0+1x将表中数据代入公式得:{=0.118129=0.003585∴y=0.118129+0.003585x(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。^^^y关于x的回归方程为y=0.118129+0.003585x表示运输距离每增加1公里,运送时间平均增加0.003585天。14•11.6下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区人均GDP(元)人均消费水平(元)北京辽宁上海江西河南贵州陕西22460112263454748515444266245497326449011546239622081608203515要求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。02000400060008000100001200014000010000200003000040000人均GDP人均消费水平系列1产量和生产费用之间存在着正的线性相关关系16(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。2222yynxxnyxxynr227*65100742127101240510.9981237*1904918867857397*134690076631609说明两个变量之间高度相关17(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。0ˆ4515.5714290.308683*12248.428127*6510074212710124051ˆ=0.3086837*190491886785739=734.6928y=734.6928+0.308683x回归系数的含义:人均GDP每增加1元,人均消费增加0.309元。18(4)计算判定系数,并解释其意义。人均GDP对人均消费的影响达到99.6%。81444968.68==0.996381750763.7119(5)检验回归方程线性关系的显著性(a=0.05)。181444968.6811331.6921(2)305795.03(72)SSRFSSEn提出假设H0:1=0人均消费水平与人均GDP之间的线性关系不显著计算检验统计量F确定显著性水平=0.05,并根据分子自由度1和分母自由度7-2找出临界值F=6.61作出决策:若FF,拒绝H0,线性关系显著20y=734.6928+0.308683xy=734.6928+0.308683*5000=2278.1078(6)如果某地区的人均GDP为5000元,预测其人均消费水平。某地区的人均GDP为5000元,预测其人均消费水平为2278.1078元。21(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。解:已知n=7,t(7-2)=2.5706置信区间为21ˆ305795.034361159.007225niiieyySSEsnnniiexxxxnsnty1220201)2(ˆ250004515.571412278.10782.5706*61159.007713625127.29人均GDP为5000元时,人均消费水平95%的置信区间为[1990.74915,2565.46399]1990.74915E(y)2565.4639922解:根据前面的计算结果,已知n=7,t(7-2)=2.5706预测区间为21ˆ305795.034361159.007225niiieyySSEsnn250004515.571412278.10782.5706*61159.0071+713625127.29人均GDP为5000元时,人均消费水平95%的预测区间为[1580.46315,2975.74999]。01580.46315()2975.74999Ey23航空公司编号航班正点率顾客投诉次数181.121276.658376.685475.768573.874672.293771.272870.8122991.4181068.512511.7随机抽取10家航空公司,对其近一年的航班正点率和顾客投诉次数进行调查,所得数据如下24020406080100120140020406080100航班正点率顾客投诉次数系列1二者之间为负的线性相关关系1)绘制散点图,说明二者之间的股息形态25Coefficients标准误差tStatP-valueIntercept429.898635274.973373315.7340180.000437航班正点率-4.70112990.985891202-4.768410.001411回归系数=-4.7表示航班正点率每增加1%顾客投诉次数平均下降4.7次。1ˆˆ=429.897-4.7*yx2)用航班正点率作自变量,建立估计的回归方程,并解释回归系数的意义2621ˆ3035.96519.449228niiieyySSEsnn1ˆ2221119.4490.985891157830.39*757.910enniiiissxxn11ˆˆ4.74.76840.98589tst=4.7684t=2.201,拒绝H0,回归系数显著11ˆˆ~(8)tts提出假设H0:b1=0H1:b10计算检验的统计量3)检验回归系数的显著性(a=0.05)=2.20127解:已知n=10,t(10-2)=2.306置信区间为21ˆ3035.96519.449228niiieyySSEsnn20802211ˆ(8)10eniixxytsxx037.66()70.619Ey计算得4)如果航班正点率为80%,估计顾客投诉次数80ˆ=429.897-4.7*80=54.2y5)求航班正点率为80%,顾客投诉次数95%的置信区间和预测区间28已知n=10,t(10-2)=2.306预测区间为21ˆ3035.96519.449228niiieyySSEsnn20802211ˆ(8)110eniixxytsxx07.572()100.707Ey计算得2911.8下面是20个城市写字楼出租率和每平方米月租金的数据。设月租金为自变量,出租率为因变量,用excel进行回归,并对结果进行解释和分析。地区编号出租率(%)每平方米月租金(元)170.699269.874373.483467.170570.184668.765763.467873.5105971.4951080.71071171.2861262861378.71061469.5701568.7811669.5751767.7821868.4941972922067.97630回归统计MultipleR0.79508RSquare0.632151AdjustedRSquare0.611715标准误差8.568399观测值20方差析dfSSMSFSignificanceF回归

1 / 53
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功