统计学课件-第八章-相关和回归分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第八章相关和回归分析第一节相关的意义和种类第二节相关图表和相关系数第三节一元线性回归分析第四节多元线性回归分析第五节非线性回归分析★★★2本章学习要求1.理解相关的意义、主要形式、以及相关分析的基本内容。2.掌握相关系数的设计原理,以及相关关系显著性检验。3.回归和相关的区别和联系4.普通最小二乘法的原理以及回归参数的意义。5.估计标准误差的分析等。3第一节相关的意义和种类一、问题的提出二、相关关系的概念三、相关关系的种类四、相关分析的主要内容4一、问题的提出相关5相关和回归分析是研究事物的相互关系,测定它们联系的紧密程度,揭示其变化的具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。678一、相关关系的概念客观现象之间的数量联系存在着两种不同的类型:函数关系和相关关系函数关系:即当一个(或一组)变量每取一个值时,相应的另一个变量必然有一个确定值与之对应。9(函数关系)(1)是一一对应的确定关系(2)设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x,当变量x取某个数值时,y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量(3)各观测点落在一条线上xy10自变量与因变量如果变量之间有因果关系,那么原因变量就叫作自变量,而受自变量影响的变量就称因变量。自变量通常发生在因变量之前。(不是所有先发生的变量都是自变量)一般自变量记为X,因变量记为Y。11【例】(1)某种商品的销售额(y)与销售量(x)之间的关系可表示为y=px(p为单价)(2)圆的面积(S)与半径之间的关系可表示为S=R2(3)企业的原材料消耗额(y)与产量(x1)、单位产量消耗(x2)、原材料价格(x3)之间的关系可表示为y=x1x2x312停下来想一想?在下面的几对变量中,哪一个是自变量哪一个是因变量?1.产品产量与总成本。2.销售税的总量与商品总成本。3.电影院里爆米花的销售率与垃圾袋的使用率。4.发电量与热天的天数。13相关关系(correlationanalysis):相关关系:变量之间存在有依存关系,但这种关系是不完全确定的随机关系,即当一个(或一组)变量每取一个值时,相应的另一个变量可能有多个不同值与之对应。14因果关系相关关系互为因果关系共变关系随机性依存关系确定性依存关系函数关系变量之间关系15相关关系(1)变量间关系不能用函数关系精确表达;(2)一个变量的取值不能由另一个变量唯一确定;(3)当变量x取某个值时,变量y的取值可能有几个;(4)各观测点分布在直线周围。xy16【例】商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系父母亲身高(y)与子女身高(x)之间的关系身高与体重的关系17停下来想一想?下列变量之间存在相关关系吗?1抽烟与肺癌之间的关系2怀孕期妇女的饮酒量与婴儿出生体重之间的关系3纳税者年龄和他们交纳税款的数量之间的关系4采光量与植物的生产量之间的关系5一个人的投票倾向性与其年龄之间的关系18相关关系与函数关系的关系:在一定的条件下互相转化.具有函数关系的变量,当存在观测误差和随机因素影响时,其函数关系往往以相关的形式表现出来.而具有相关关系的变量之间的联系,如果我们对它们有了深刻的规律性认识,并且能够把影响因变量变动的因素全部纳入方程,这时相关关系也可转化为函数关系.另外,相关关系也具有某种变动规律,所以,相关关系也经常可以用一定的函数形式去近似地描述.19二、相关关系的种类1.按相关的程度分:完全相关不完全相关不相关(或零相关)例:完全相关:在价格P不变的情况下,销售收入Y与销售量X的关系;不相关:股票价格的高低与气温的高低是不相关的;202.按相关的方向分:正相关负相关正相关:两个变量之间的变化方向一致,都是增长趋势或下降趋势。例:收入与消费的关系;工人的工资随劳动生产率的提高而提高。负相关:两个变量变化趋势相反,一个下降而另一个上升,或一个上升而另一个下降。例:物价与消费的关系;商品流转的规模愈大,流通费用水平则越低。213.按相关的形式分:线性相关非线性相关线性相关(直线相关):当一个变量每变动一个单位时,另一个变量按一个大致固定的增(减)量变动。例:人均消费水平与人均收入水平非线性相关(曲线相关):当一个变量变动时,另一个变量也相应发生变动,但这种变动是不均等的。例:产品的平均成本与总产量;农产量与施肥量.224.按相关的影响因素多少分:单相关复相关偏相关单相关(一元相关):只有一个自变量。复相关(多元相关):有两个及两个以上的自变量。如:居民的收入与储蓄额;成本与产量如:某种商品的需求与其价格水平以及收入水平之间的相关关系便是一种复相关。23偏相关:在某一现象与多种现象相关的场合,假定其他变量不变,专门考察其中两个变量的相关关系称为偏相关。如:在假定人们的收入水平不变的条件下,某种商品的需求与其价格水平的关系就是一种偏相关。245.按相关的性质分:真实相关虚假相关真实相关是现象的内在联系所决定.虚假相关:如某人曾观察过某一国家历年的国内生产总值与精神病患者人数的关系,呈相当高的正相关.25讨论下面的关系是因果关系还是伪关系?1.冰淇淋的销量与儿童出事故次数之间2.街上警察数量与犯罪数量之间3.历史上,妇女裙子的长度与经济的好坏有关系:裙子越短,经济越景气。4.鹳的数量与丹麦乡间婴儿出生率的关系26不相关负线性相关正线性相关非线性相关完全负线性相关完全正线性相关图示27三、相关分析的主要内容确定现象之间是否存在相关关系,以及相关关系呈现的形态.确定相关关系的紧密程度.确定相关关系的数学表达式确定因变量估计值误差程度.预测或估计28第二节相关图表和相关系数一、相关表和相关图二、简单相关系数29相关分析:就是用一个指标来表明现象间相互依存关系的密切程度。广义的相关分析包括相关关系的分析(狭义的相关分析)和回归分析。30定性分析是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。定量分析在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数等方法,来判断现象之间相关的方向、形态及密切程度。相关关系的判断31一、相关表和相关图相关表和相关图是研究相关关系的直观工具,在进行详细的定量分析之前,可以先利用它们对现象之间存在的相关关系的方向、形式、和密切程度作大致的判断。简单相关表:将自变量x的数值按照从小到大的顺序,并配合因变量y的数值一一对应而平行排列的表。消费支出y15203040425360657870可支配收入x18254560627588929899居民消费和收入的相关表单位:百元33相关图:又称散点图。将x置于横轴上,y置于纵轴上,将(x,y)绘于坐标图上。用来反映两变量之间相关关系的图形。例:广告费(万元)3033334056586572808090年销售收入(百万元)1212131314142022262630010203040020406080100广告费(万元)销售收入(百万元)34例:国家教育部决定将各高校的后勤社会化。某从事饮食业的企业家认为这是一个很好的投资机会,他得到十组高校人数与周边饭店的季销售额的数据资料,并想根据高校的数据决策其投资规模。05010015020025005101520253035二、简单相关系数(一)简单相关系数的概念是度量两个变量之间线性相关密切程度和相关方向的统计指标。包括简单相关系数、复相关系数、偏相关系数、曲线相关系数(相关指数).简单相关系数又称皮尔逊(1890年,英国)相关系数,或积矩相关系数或动差相关系数。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为.若是根据样本数据计算的,则称为样本相关系数,记为r.样本相关系数是总体相关系数的一致估计量.YXXY236样本简单相关系数的计算公式(积差法)yyxxxyLLLyyxxyyxxr22)()())(((二)简单相关系数的计算公式yxnxyyyxxLynyyyLxnxxxLxyyyxx111222222式中:(1)1.用计算器计算协方差S2xy37协方差S2xy的意义:1.相关系数的正负取决于协方差的正负.2.协方差可以表示变量x、y相关程度的大小.3.变量值的项数和计量单位对离差乘积之和有影响.可见,相关系数是对变量离差标准化以后的协方差.yyxxnSyySxxSnSyyxxSSnyyxxSSSryyxxyyxxyyxxyyxxxy238(1)式可化简为如下公式:2222yynxxnyxxynr2222111ynyxnxyxnxyr或:39㈡用计算机计算⒈选取“工具”-“数据分析”⒉选“相关系数”⒊选“确定”⒋输入“输入区域”⒌输入“输出区域”⒍在“分组方式”中选“逐列”⒎选“标志位于第一行”⒏确定出现结果如下:xyx1.0000y0.96971.0000401.r的取值范围是[-1,1]|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负相关2.r=0,不存在线性相关关系3.-1r0,为负相关4.0r1,为正相关5.|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切相关系数取值及其意义41r的范围在0.1-0.3是微弱相关r的范围在0.3-0.5是低度相关;r的范围在0.5-0.8是显著相关;r的范围在0.8以上是高度相关.42-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加43【例1】计算人均可支配收入和消费支出之间的简单相关系数。消费支出(百元)y人均可支配收入(百元)xy2x2xy151822532427020254006255003045900202513504060160036002400426217643844260453752809562539756088360077445280659242258464598078986084960476447099490098016930473662265075165636933449987.074575226399135.1282777.160733231374575.1282799.915617313222222yynxxnyxxynr解:根据样本相关系数的计算公式有人均国民收入与人均消费金额之间的相关系数为0.998745【例2】在研究我国人均消费水平的问题中,把全国人均消费额记为y,把人均国民收入记为x。我们收集到1981~1993年的样本数据(xi,yi),i=1,2,…,13,数据见表1,计算相关系数。表1我国人均国民收入与人均消费金额数据单位:元年份人均国民收入人均消费金额年份人均国民收入人均消费金额1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148解:由表中数据得:∑y=473,∑x=662,∑y2=26507,∑x2=51656,∑xy=36933,n=1

1 / 131
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功