成教2010级《应用回归分析》练习题一、问答题:1.变量之间的关系主要有哪些?在回归分析中研究变量间的什么关系?(教材P3)2.相关分析和回归分析的区别是什么?(教材P3)3.简述“回归”一词的来历。(教材P4~5)4.回归模型的一般形式是什么?(教材P5~6)5.叙述一元线性回归需要满足的基本条件。6.一元线性回归方程bxayˆ的两个回归系数ba,的最小二乘回归估计怎么求?求出的结果是什么?7.一元线性回归的基本步骤是什么?8.怎么判断一元线性回归方程是显著的?9.如何用回归方程进行预测?10.什么是决定系数2r?计算公式是什么?表达了什么意思?11.对于非线性函数bxaey如何线性化?12.写出多元线性回归模型的一般形式。13.多元回归方程显著与偏回归系数显著是一回事吗?关系如何?怎么判断?14.在一元线性回归分析中,可能会出现哪些违背基本假设的情形?15.什么是异方差?可以用什么方法检验?16.什么是自相关?自相关会带来什么问题?17.什么是逐步回归?18.什么是多重共线性?消除多重共线性常用的手段。19.六西格玛改进的五阶段DMAIC分别指的是什么?20.QC七大手法分别是什么?21.在六西格玛管理过程中,主要用到的统计方法有哪些?22.什么是帕累托图?通常用于什么时候?23.什么是重复性?什么是再现性?24.什么是潜在的过程能力指数pC?什么是实际过程能力指数pkC?写出计算公式。25.常用计量型控制图的种类有哪些?如何画计量型数据RX控制图?二、为调查某广告对销售收入的影响,某商店记录了5个月的销售收入(万元)和广告费用(万元),数据见表:月份12345X(万元)12345Y(万元)1010202040(1)画出散点图;(2)x与y之间是否大致呈现线性关系?(3)使用Excel或JMP软件进行线性回归;(4)写出回归方程;给出回归系数的95%置信区间;(5)决定系数2r是多少?表达了什么意思?(6)回归方程是否显著?为什么?(7)求当广告费用为4.2万元时,销售收入将达到多少?三、某公司付给具有x年工作经历机械师的薪酬y(小时工资)如下:X(年)1.251.502.002.002.754.005.006.008.0012.00Y(美元)8.098.709.109.009.799.4510.0010.6511.1011.05描出散点图:根据散点图,你认为工作年限x和薪酬y之间的关系用什么函数刻画比较合适?四、某工程师拟合反应釜的收率(Y)与反应釜温度(X)之间的回归关系,根据收集的数据,它拟合了一条y=a+bx直线,得到以下回归模型拟合结果。为了检查模型,它还进行了模型诊断,得到下图,根据残差图,你认为以下哪个结论是正确的?回归方程为Y=-39.7+13.1X自变量系数系数标准误TP常量-39.7123.323-11.950.000X13.13340.482527.220.000S=4.17714R-Sq=97.6%R-Sq(调整)=97.5%方差分析来源自由度SSMSFP回归11292912929741.000.000残差误差1831417合计1913243A.两个系数的P值小于0.05,且R-Sq=97.6%,R-Sq(调整)=97.5%,说明模型拟合很好B.Y和X存在明显的线性关系C.方差分析表明模型拟合非常好D.残差图表明Y与X可能存在二次的非线性关系五、研究货运总量y与工业总产值、x1农业总产值x2、居民非商品支出x3的关系,数据如表,编号货运总量y(万吨)工业总产值x1(亿元)农业总产值x2(亿元)居民非商品支出x3(亿元)116070351226075402.4321065402426574423524072381.2622068451.5727578424816066362927570443.21025065423经使用JMP软件进行多元线性回归,输出结果如下:拟合汇总R方0.805508调整R方0.708262均方根误差23.44188响应均值231.5观测数(或权重和)10方差分析源自由度平方和均方F比率模型313655.3704551.798.2832误差63297.130549.52概率F校正合计916952.5000.0149*参数估计值项估计值标准误差t比率概率|t|截距-348.2802176.4592-1.970.0959工业总产值(亿元3.75403681.9333151.940.1002农业总产值(亿元)7.10071242.8802812.470.0488*居民非商品支出(亿元)12.4474710.569331.180.2835回答下面问题(1)回归方程是否显著?(2)各偏回归系数分别是多少?是否显著?(3)写出回归方程?(4)决定系数2r是多少?