第六章--相关与回归分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第一节相关关系概述第二节线性相关关系的测定第四节多元线性回归分析第三节一元线性回归分析第六章相关与回归分析第四节非线性回归分析联系与相互影响是普遍的现象受教育的水平工作后的收入预防疾病支出疾病的发病率客观现象总是普遍联系和相互依存的,当我们用变量来反映这些现象的特征时,便表现为变量之间的依存关系。如商品价格的变化会刺激或抑制商品销售量的变化;劳动力素质的高低会影响企业的效益;原材料、直接人工的价格变化对产品销售成本有直接的影响,粮食亩产量与施肥量、降雨量、温度之间的关系等。第六章相关与回归分析STAT相关与回归分析是定量分析现象之间相互依存关系的统计方法之一。相关与回归分析是现代统计学中非常重要的内容,它在自然科学、管理科学和社会经济领域有着十分广泛的应用。第六章相关与回归分析STAT本章从介绍相关分析与回归分析的基本概念与分类入手,以一元线性回归模型为基础,引出包括多元线性回归分析及非线性回归分析中模型识别、参数估计、模型检验、估计与预测等内容。本章重点1、积差法相关系数的计算;2、最小二乘法的原理;回归方程和回归系数的显著性检验;多元线性回归及其预测和控制。变量间的相互关系相关关系的种类相关分析的主要内容相关关系概述线性相关关系的测定一元线性回归分析多元线性回归分析非线性回归分析相关与回归分析一、变量间的相互关系互有联系的客观现象(变量)间关系的紧密程度各不一样。归纳起来,现象间的依存关系大致可以分成两种类型:函数关系和相关关系。第六章相关与回归分析STAT函数关系——完全确定性的关系相关关系——不完全确定的关系例:价格不变时商品销售收入与销售量的关系。X销售收入Y销售量OY与X间的确定性关系(一)函数关系定义:现象之间存在着完全确定的依存关系,即当一个或一组变量每取一个值时,相应的另一个变量必然有一个确定值与之对应。函数关系可以用一个确定的公式,即函数式来表示。),,,(21nxxxfy或:Y=F(X)然而,现实世界中还有不少情况是现象之间有着密切的联系,但密切的程度并没有达到由一个(几个)变量可以完全确定另一个变量的程度,它们之间是一种非确定性的关系。第六章相关与回归分析STAT变量之间的不确定的依存关系称为相关关系(统计关系)。这种统计关系规律性的研究是相关分析和回归分析研究的主要对象。......................X家庭收入非确定性关系OY家庭消费支出Y=b0+b1X(二)相关关系定义:现象之间存在有依存关系,但这种关系是不完全确定的随机关系,即当一个或一组变量每取一个值时,相应的另一个变量可能有多个不同值与之对应。第六章相关与回归分析STAT(1)单一因果关系(如货物运输量与货车保有辆数之间);(2)互为因果关系(如铁路运输业的发展水平与经济发展水平之间);(3)伴随关系(如工资与物价的变动)。现象间数量依存关系的形式:变量间的依存关系在许多情况下表现为因果关系,其中一个或若干个起着影响作用的变量称为自变量,通常用X表示,它是引起另一现象变化的原因,通常是可以控制、给定的值;而受自变量影响的变量称为因变量,通常用Y表示,它是自变量变化的结果,是不确定的值。第六章相关与回归分析STAT(三)相关关系与函数关系的联系与区别区别:(2)函数关系可以用数学表达式精确表示出来,而相关关系只能通过研究变量间的统计规律才能得到。(1)函数关系中的变量之间的关系是完全确定的,而相关关系中的变量之间的关系是不完全确定的。第六章相关与回归分析STAT联系:由于存在着观察或测量上的误差等因素的影响,函数关系在实践中往往通过相关关系表现出来;当人们对某些现象内部规律有较深刻认识时,相关关系可能变为函数关系。为此,在研究相关关系时,又常常使用函数关系作为工具,用一定的函数关系表现相关关系的数量联系。(一)按相关的程度分第六章相关与回归分析STAT完全相关不完全相关不相关二、相关关系的种类第六章相关与回归分析STAT当一种现象的数量变化完全由其它现象的数量变化所确定时,此时现象的关系为完全相关。如:在价格不变的条件下,某商品的销售额与其销售量总是成正比例关系;在相关图上表现为所有的观察点都落在同一条直线上,在这种场合,相关关系便成为函数关系——函数关系是相关关系的一个特例。第六章相关与回归分析STAT当现象间彼此的数量变化互相独立时,称为不相关现象。例如,通常认为股票价格的高低与气温的高低是不相关的;如果现象之间的关系介于完全相关和不相关之间,称为不完全相关。如妇女的结婚年龄与受教育程度之间的关系。不完全相关关系是现实当中相关关系的主要表现形式,也是相关分析的主要研究对象。第六章相关与回归分析STAT正相关:变量的变动方向一致(同增同减);例如:工人的工资随劳动生产率的提高而增加;负相关:变量的变动方向相反(一增一减);例如:商品流转的规模愈大,流通费用水平愈低。(二)按相关的方向分正相关负相关第六章相关与回归分析STAT(三)按相关的形式分相关程度密切相关程度不密切线性相关非线性相关线性相关:当相关现象之间的关系大致呈现为线性关系,即当一个变量变动一个单位时,另一个变量也按一个大致固定的增(减)量变动,就称为线性相关。如:人均消费水平与人均收入水平通常成线性关系;非线性相关:当相关现象之间不按固定比例变化时,近似于某种曲线方程的关系。如:产品的平均成本与产品总产量之间的相关关系就是一种非线性相关。第六章相关与回归分析STAT图6.1相关关系分类示意图第十章相关与回归分析STAT(四)按影响因素的多少分1、单(简)相关:相关:两个现象的相关,即一个变量对另一个变量的相关关系。[例]学习成绩与学习时间;血压与年龄;亩产量与施肥量。2、复(多元)相关:三个或三个以上现象的相关,即一个变量对两个或两个以上其它变量的相关关系.[例]经济增长与人口增长、科技水平、自然资源、管理水平等之间的关系;体重与身高、食欲、睡眠时间之间的关系。3、偏相关:就多个变量测定其中两个变量的相关程度而假定其他变量不变。[例]在假定人们的收入水平不变时,某种商品的需求与其价格水平的关系。就y=ax1+bx2+,研究y与x1之间的关系,假定x2不变。第十章相关与回归分析STAT值得注意的是,并非所有的变量之间都存在相关关系,因此需要用相关分析方法来识别和判断。第十章相关与回归分析STAT三、相关分析的主要内容第六章相关与回归分析STAT分析方法。研究和测度现象所表现的两个或两个以上变量关系的一种统计相关分析,是以现象之间不完全的相关关系为研究对象,第六章相关与回归分析STAT1、确定现象间是否存在依存关系,其依存关系属于何种类型——主要是定性分析和判断;2、确定相关关系的密切程度——定量分析——相关图、表、相关系数;3、确定相关关系的数学表达式——回归分析;4、确定因变量估计值误差的程度。相关分析的主要内容:相关关系概述线性相关关系的测定一元线性回归分析多元线性回归分析非线性回归分析定性分析相关表与相关图相关系数相关与回归分析定性分析是依据研究者的理论知识、专业知识和实践经验,对客观现象之间是否存在相关关系,以及有何种相关关系做出判断。第六章相关与回归分析STAT一、定性分析二、定量分析第六章相关与回归分析STAT在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数与判定系数等方法,来判断现象之间相关的方向、形式及密切程度。相关表和相关图是研究相关关系的直观工具,在进行详细的定量分析之前,可以先利用它们对现象之间存在的相关关系的方向、形式、和密切程度作大致的判断。(一)相关表:相关表是一种统计表。由相关变量相对应的关系数值所编制成的反映现象之间的相关关系的数列表。第六章相关与回归分析STAT简单相关表----根据总体单位的原始资料编制的相关表(适用于所观察的样本单位数较少,不需要分组的情况)分组相关表----将原始资料进行分组而编制的相关表(适用于所观察的样本单位数较多,标志变异又较复杂,需要分组的情况)单变量分组表----按自变量分组双变量分组表----自变量和因变量均分组(二)相关图:又称散点图,它是将两个变量相对应的变量值用坐标点的形式,在直角坐标上描绘出来,以反映二者之间相关关系的图形。第六章相关与回归分析STAT为研究商店人均月销售额和利润率的关系,调查10家商店取得10对数据,说明简单相关表和相关图的编制方法。从表可看出,随着人均月销售额的增加,利润率有明显的增长趋势。所以,资料表明(如图)有明显的直线相关趋势。例1第六章相关与回归分析STAT人均销售额与和利润率相关表编号人均月销售额(千元)利润率(%)1234567891013345667783.06.26.68.110.412.612.316.316.818.5利润率(%)人均销售额(千元)120人均销售额与利润率相关图510152384567第六章相关与回归分析STAT企业按销售额分组(万元)流通费用率(%)4以下9.654~87.688~127.2512~167.0016~206.8620~246.7324~286.6428~326.6032~366.5866.577.588.599.51004812162024283236销售额(万元)流通费用率(%)例2第六章相关与回归分析STAT第六章相关与回归分析STAT从上图中我们看到本例的样本数据()大致分别落在一条直线附近,这说明变量x与y之间具有明显的线性相关关系。另外,所绘制的散点图呈现出从左至右的上升趋势,它表明x与y之间存在着一定的正相关关系,即随着人均GDP的上升,人均消费金额也会增加。iiyx,相关图、表虽然有助于识别变量间的相关关系,但它无法对这种关系进行精确的计量。因此在初步判定变量间存在相关关系的基础上,通常还要计算相应的分析指标—--相关系数。第六章相关与回归分析STAT(三)相关系数相关系数是测定变量之间相关密切程度和相关方向的代表性指标。相关系数用符号“r”表示。在各种相关中,单相关是基本的相关关系,它是复相关和偏相关的基础。单相关有线性和非线性两和表现形式。测定线性相关系数的方法是最基本的相关分析,是测定其他相关系数方法的基础。我们着重研究线性的单相关系数。第六章相关与回归分析STAT(线性)相关系数※1、积差法计算公式:由英国统计学家皮尔逊(Pearson)设计的,故又称为Pearson相关系数。则的一组样本观察值是设,),(),(YXyxii2222)()())(()()())((yyxxyyxxnyynxxnyyxxr的标准差的协方差的相关系数与为yxyxyxryxxyyxxy,,简记为:Lxy))((yyxx2)(xx2)(yy简记为:Lxx简记为:LyyyyxxxyLLLr第六章相关与回归分析STAT22)()())((yyxxyyxxr由于COV(X,Y)的主导地位,又因为其形式是两个差值的乘积之和,故把这个公式又称为“积差公式”。2、下面我们介绍直线相关系数的设计思路,从中我们会接触到一些新的统计指标,同时也能充分享受到皮尔逊给我们展现的“对称”美感。第六章相关与回归分析STATXYyyxx)(一)(二)(三)(四),(11yx),(nnyx00)()())(()()(ryyxxyyxxxy正相关三一yxxyrnyyxxxy))(())((1yyxxnii显示x与y之间的相关方向(1)STAT[负相关]XYyyxx)(一)(二)(三)(四),(11yx),(nnyx00)()())(()()(ryyxxyyxxxy负相关四二nyyxxxy))((yxxyr第六章相关与回归分析显示x与y之间的相关程度)()())(()

1 / 236
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功