第八章相关与回归分析一、本章重点1.相关系数的概念及相关系数的种类。事物之间的依存关系,可以分为函数关系和相关关系。相关关系又有单向因果关系和互为因果关系;单相关和复相关;线性相关和非线性相关;不相关、不完全相关和完全相关;正相关和负相关等类型。2.相关分析,着重掌握如何画相关表、相关图,如何测定相关系数、测定系数以及进行相关系数的推断。相关表和相关图是变量间相关关系的生动表示,对于未分组资料和分组资料计算相关系数的方法是不同的,一元线性回归中相关系数和测定系数有着密切的关系,得到样本相关系数后还要对总体相关系数进行科学推断。3.回归分析,着重掌握一元回归的基本原理方法,一元回归是线性回归的基础,多元线性回归和非线性回归都是以此为基础的。用最小平方法估计回归参数,回归参数的性质和显著性检验,随机项方差的估计,回归方程的显著性检验,利用回归方程进行预测是回归分析的主要内容。4.应用相关与回归分析应注意的问题。相关与回归分析都有它们的应用范围,必须知道在什么情况下能用,什么情况下不能用。相关分析和回归分析必须以定性分析为前提,否则可能会闹出笑话,在进行预测时选取的样本要尽量分散,以减少预测误差,在进行预测时只有在现有条件不变的情况下才能进行,如果条件发生了变化,原来的方程也就失去了效用。二、难点释疑本章难点在于计算公式多,不容易记忆,所以更要注重计算的练习。为了掌握基本计算的内容,起码应认真理解书上的例题,做完本指导书上的全部计算题。初学者可能会感到本章公式多且复杂,难于记忆,其实只要抓住Lxx、Lxy、Lyy这三个记号,记住它们的展开式,几个主要的公式就不难记忆了。如果能自己把这些公式推证一下,搞清其关系,那就更容易记住了。三、练习题(一)填空题1事物之间的依存关系,根据其相互依存和制约的程度不同,可以分为()和()两种。2.相关关系按相关关系的情况可分为()和();按自变量的多少分()和();按相关的表现形式分()和();按相关关系的密切程度分()、()和();按相关关系的方向分()。3.回归方程只能用于由()推算()。4.一个自变量与一个因变量的线性回归,称为()5.估计变量间的关系的紧密程度用()6.在相关分析中,要求两个变量都是随机的,而在回归分析中要求自变量是(),因变量是()。7.已知剩余变差为250,具有12对变量值资料,那么这时的估计标准误差是()。8.将现象之间的相关关系,用表格来反映,这种表称为(),将现象之间的相关关系用图表示称()。9.若两个变量完全不相关,则相关系数等于(),若两个变量完全相关,则相关系数等于()。10.在回归方程y=a+bx中,待定系数a为(),b为()。11.若已知y为每亩蔬菜产量(单位:百公斤),x为每亩地施肥量(单位:公斤),已知y=9.964+0.891x并已知每亩地最高施肥量为70公斤,最低施肥量为35公斤,那么每亩地蔬菜产量的大致变动范围为()到()。(二)名词解释1.函数关系2.相关关系3.单项因果关系4.互为因果关系5.回归分析6.一元线性回归模型7.估计标准误差(三)判断题1.某一变量的每一个数值都有另一变量的确定的值与之对应,这种关系叫相关关系。()2.任何两个有相关关系的现象,计算其相关系数一定是在-1至1之间。()3.当相关系数等于1或-1时,两个变量的关系是函数关系,当相关系数等于零时,说明两个变量之间的关系不是相关关系。()4.计算相关系数时,首先要确定自变量和因变量。()5.积距相关系数的正负号主要取决于计算公式的分子符号。()(四)单项选择题1.相关分析研究的是()。A、变量间相互关系的密切程度B、变量之间因果关系C、变量之间严格的相依关系D、变量之间的线性关系2.若变量X的值增加时,变量Y的值也增加,那么变量X和变量Y之间存在着()。A、正相关关系B、负相关关系C、直线相关关系D、曲线相关关系3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着()。A、正相关关系B、负相关关系C、直线相关关系D、曲线相关关系4.相关系数等于零表明两变量()。A、是严格的函数关系B、不存在相关关系C、不存在线性相关关系D、存在曲线线性相关关系5.相关关系的主要特征是()。A、某一现象的标志与另外的标志之间的关系是不确定的B、某一现象的标志与另外的标志之间存在着一定的依存关系,但它们不是确定的关系C、某一现象的标志与另外的标志之间存在着严格的依存关系D、某一现象的标志与另外的标志之间存在着不确定的直线关系6.时间数列自身相关是指()。A、两变量在不同时间上的依存关系B、两变量静态的依存关系C、一个变量随时间不同其前后期变量值之间的依存关系D、一个变量的数值与时间之间的依存关系7.如果变量X和变量Y之间的相关系数为负1,说明两个变量之间()。A、不存在相关关系B、相关程度很低C、相关程度很高D、完全负相关8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间()。A、无相关B、存在正相关C、存在负相关D、无法判断是否相关9.相关分析对资料的要求是()。A、两变量均为随机的B、两变量均不是随机的C、自变量是随机的,因变量不是随机的D、自变量不是随机的,因变量是随机的10.回归分析中简单回归是指()。A、时间数列自身回归B、两个变量之间的回归C、变量之间的线性回归D、两个变量之间的线性回归(五)多项选择题1.下列属于相关关系的有()。A、农作物收获量和施肥量之间的关系B、家庭收入与生活费支出间的关系C、圆面积和圆半径之间的关系D、身高与体重之间的关系E、美国人口数和加拿大粮食产量之间的关系2.下述关系中属于负相关的有()。A、在合理限度内,农业中施肥量和平均亩产量之间的关系B、工业企业中生产用固定资产平均价值和产品总产量之间的关系C、商业企业的劳动效率和流通费用率之间的关系D、单位产品成本和原材料消耗量之间的关系E、工业产品产量和单位产品成本之间的关系3.现象间相互依存的类型有()。A、函数关系B、相关关系C、回归关系D、随机关系E、结构关系4.下列语句中正确的有()。A、具有明显因果关系的两变量一定不是相关关系B、只要相关系数数值较大,两变量就一定存在密切的相关关系C、相关系数的符号可说明两变量相互关系的方向D、样本相关系数和总体相关系数之间存在着抽样误差E、不具有因果关系的变量一定不存在相关关系5.回归方程可用于()。A、根据自变量预测因变量B、给定因变量推算自变量C、推算时间数列中缺失的数据D、给定自变量推算因变量E、用于控制因变量6、直线相关分析的特点有()。A、两变量不是对等的B、两变量只能算出一个相关系数C、相关系数有正负号D、两个变量都是随机的E、相关系数的绝对值是介于0-1之间的数(六)简答题1.什么是相关关系,相关分析有什么作用?2.简述相关分析的特点。3.简述相关分析和回归分析的关系。(七)论述题试述相关与回归分析应注意的几个问题。(八)计算题1.某地生猪存栏数资料如下:单位(千头)年份1979198019811982198319841985存栏数52.064.982.6107.9146.2154.4172.2计算本期与前期存栏头数的相关系数;2.生产某种产品的八个企业产量与单位成本资料如下:企业编号12345678产量(千件)2.51.83.22.33.64.21.22.9单位成本(万元)1.62.41.41.81.51.42.31.5①①计算单位成本与产量间的相关系数;②②列出正规方程组求单位成本倚产量的回归方程并解释回归方程中各系数的经济意义;③③试估计产量为3千件的单位成本;④④计算估计标准误差。3.已知:n=6∑x=21∑y=426∑xx=79∑yy=30268∑xy=1481要求:①计算相关系数②建立回归方程③计算估计标准误差4.某市1995—1999年每人平均月收入和商品销售额资料如下表:年份平均每人月收入(十元)x商品销售额(十万元)y1995199619971998199948606468762230283240要求:(1)以人均收入为自变量,商品销售额为因变量,建立直线回归方程;(2)用最小平方法求人均收入数列的直线趋势方程,并估计2000年该市的人均收入;(3)根据2000年的人均收入的估计值,利用回归方程推算2000年该市的商品销售额。5.有10个同类企业的生产性固定资产年平均原值和总产值资料如下表:企业编号生产性固定资产原值(万元)x工业总产值(万元)y123456789103139102004094155023141210102212255241019638815913928605151612191624根据上表资料:(1)计算相关系数;(2)建立回归直线方程;(3)计算估计的标准误差;(4)估计生产性固定资产为1100万元时的工业总产值。6.某市1997—2001年各年的职工生活费收入和商品销售额的资料如下:年份职工生活费收入(千元)x商品销售额(亿元)y199719981999200020015.66.06.16.47.08793100106114计算相关系数,并作简要说明。7.某市电子工业企业的年设备能力和年劳动生产率的资料如下:企业编号年设备能力(千瓦/人)年劳动生产率(千元/人)企业编号年设备能力(千瓦/人)年劳动生产率(千元/人)12345672.82.83.02.93.43.94.06.76.97.27.38.48.89.18910111213144.84.95.25.45.56.27.09.810.611.711.112.812.112.4要求:(1)计算以劳动生产率为因变量的回归方程;(2)解释回归方程中b待定系数的经济意义;若新建一企业,其年设备能力为6.5千瓦/人,估计劳动生产率将为多少?8.已知1991—2000年个人消费支出和收入资料如下(单位:亿元):年度个人收入x消费支出y年度个人收入x消费支出y19911992199319941995647077829256606670781996199719981999200010712514316518988102118136155要求:(1)判断两者的关系;(2)建立直线回归方程;(3)计算估计的标准误差;(4)若个人收入为213亿元时,估计个人消费支出。9.某市10家百货商店每人平均完成销售额和利润资料如下:商店序号每人月平均销售额(千元)x利润率(%)y12345678910658147633712.610.418.53.08.116.312.36.26.616.8要求:(1)画出散点图,观察其相互关系;(2)计算相关系数;(3)建立直线回归方程;(4)若某商店每人月平均销售额为2千元,估计其利润率;(5)计算估计的标准误差。10.某家具厂生产家具的总成本与木材耗用量有关,其资料是:1234567木材耗用量(千立方米)总成本(千元)2.43.12.12.62.32.91.92.71.92.32.13.02.43.2要求:(1)建立以总成本为因变量的回归方程;(2)计算回归方程的估计标准误差;(3)计算相关系数,判断相关程度。