统计学课件第八章相关与回归分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2020/1/19统计学课件统计学STATISTICS高等学校应用型特色规划教材清华大学出版社2020/1/19统计学课件第八章相关与回归分析第一节相关与回归分析的基本概念第三节一元线性回归分析第四节多元线性回归分析【学习目标】通过对本章的学习,重点掌握回归分析的估计和检验方法;掌握相关分析的种类及三种相关系数的计算方法;在此基础上能够运用相关分析和回归分析的基本方法解释实际社会经济问题。重点与难点:相关系数的计算及其检验;多元线性回归分析。第五节非线性回归分析第二节相关分析2020/1/19统计学课件第一节相关与回归分析的基本概念(一)函数关系一、相关关系与函数关系第八章相关与回归分析函数关系是指现象之间存在着严格的依存关系,亦即当其它条件不变时,对于某一自变量或几个自变量的每一数值,都有因变量的一个的确定值与之相对应,并且这种关系可以用一个确定的数学表达式反映出来。2020/1/19统计学课件第一节相关与回归分析的基本概念(二)统计关系一、相关关系与函数关系第八章相关与回归分析统计关系不同于函数关系,当重复观测时,观测点不是完全落在统计关系曲线上,而是围绕统计关系曲线散布。统计关系可以表示为确定部分和随机性部分二者之和,这是回归分析的基础。相关关系因果关系2020/1/19统计学课件案例分析相关关系与因果关系一家研究机构有一项惊人的发现:统计数据显示,脚长的儿童拼写能力比脚短的儿童强。原来他们调查的是一群年龄不同的儿童,脚长的儿童比脚短的儿童年龄大!赶快回去量一下儿子的脚长我要把脚拉长一点!2020/1/19统计学课件⒈按涉及变量的多少分为相关关系的种类⒉按照表现形式不同分为⒊按照变化方向不同分为直线相关曲线相关负相关正相关二、相关分析的种类复相关单相关偏相关第八章相关与回归分析2020/1/19统计学课件4.按相关的程度分为相关关系的种类5.按变量之间因果关系的方向分为完全相关不完全相关不相关双向因果相关单向因果相关虚假相关第八章相关与回归分析2020/1/19统计学课件第一节相关与回归分析的基本概念第八章相关与回归分析三、相关分析与回归分析回归分析是关于研究一个叫做因变量的变量对另一个或多个叫做解释变量的依赖关系。相关分析是测度两个变量之间的线性关联度的,并用一些指数(相关系数)表示相关程度。2020/1/19统计学课件第一节相关与回归分析的基本概念第八章相关与回归分析三、相关分析与回归分析相关分析中x与y对等,回归分析中x与y要确定自变量和因变量;相关分析中x、y均为随机变量,回归分析中只有y为随机变量;相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。区别:2020/1/19统计学课件第一节相关与回归分析的基本概念第八章相关与回归分析三、相关分析与回归分析联系:相关分析是回归分析的基础和前提。回归分析是相关分析的深入和继续。2020/1/19统计学课件第一节相关与回归分析的基本概念第八章相关与回归分析四、相关表与相关图(一)简单相关表将某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,便得到简单的相关表。2020/1/19统计学课件第一节相关与回归分析的基本概念第八章相关与回归分析企业编号月产量(千吨)X生产费用(万元)Y123456781.22.03.13.85.06.17.28.0628680110115132135160八个同类工业企业的月产量与生产费用2020/1/19统计学课件第一节相关与回归分析的基本概念第八章相关与回归分析四、相关表与相关图(二)分组相关表单变量分组表双变量分组表三变量分组表。2020/1/19统计学课件第一节相关与回归分析的基本概念第八章相关与回归分析1.单变量分组表表某纺织厂工人看管织机台数和时劳动生产率相关表2020/1/19统计学课件第一节相关与回归分析的基本概念第八章相关与回归分析2.双变量分组表表居住时间与对百货商场的熟悉程度的双变量分组表2020/1/19统计学课件第一节相关与回归分析的基本概念第八章相关与回归分析3.三变量分组表假定对于某项私家车购买意向的调查,最初以教育水平和私家车拥有情况进行分析,对1000人调查的结果用二维列联表表示如:2020/1/19统计学课件第一节相关与回归分析的基本概念第八章相关与回归分析3.三变量分组表表教育程度和私家车拥有状况的双变量分析2020/1/19统计学课件第八章相关与回归分析从上表中可以看出,文化程度越高的人拥有私家车的比例越高,这和实际情况不太相符,于是我们引入收入变量,作三变量的交叉列表分析:教育程度、收入与私家车拥有状况的三变量分析私家车拥有状况收入水平低收入高收入教育程度教育程度本科及以上本科以下本科及以上本科以下有没有20%(20)80%(80)20%(140)80%(560)40%(60)60%(90)40%(20)60%(30)列合计100%100%100%100%被调查者人数100700150502020/1/19统计学课件正相关负相关曲线相关不相关xyxyxyxy第八章相关与回归分析(三)相关图2020/1/19统计学课件第八章相关与回归分析第二节相关分析一、简单相关系数及其检验(一)简单相关系数的定义简单相关系数简称相关系数,是测量两个变量之间线性相关的方向和程度的指标。总体相关系数的表达式为:YDXDYXCov,式中:YXCov,为变量X与变量Y的协方差XDYD为变量Y的方差为变量X的方差2020/1/19统计学课件第八章相关与回归分析第五节相关分析一、简单相关系数及其检验(一)简单相关系数的定义r样本相关系数是总体相关系数的估计值。22ˆyyxxyyxxr简单相关系数通常采用下面的计算公式:2222)()(yynxxnyxxynr2020/1/19统计学课件相关系数r的取值范围:-1≤r≤1r0为正相关,r0为负相关;|r|=0表示不存在线性关系;|r|=1表示完全线性相关;0|r|1表示存在不同程度线性相关:|r|0.4为低度线性相关;0.4≤|r|<0.7为显著性线性相关;0.7≤|r|<1.0为高度显著性线性相关。第八章相关与回归分析2020/1/19统计学课件第八章相关与回归分析第五节相关分析一、简单相关系数及其检验(二)简单相关系数的检验样本相关系数的检验有两种方法:直接检验法,检验法。t2020/1/19统计学课件相关系数的显著性检验(t检验法)⒈提出假设:0:0:10HH目的检验总体两变量间线性相关性是否显著步骤⒉构造检验统计量:)2(~122ntrnrt第八章相关与回归分析2020/1/19统计学课件相关系数的显著性检验(t检验法)⒊根据给定的显著性水平,确定临界值;2t⒌计算检验统计量并做出决策。22ntt⒋确定原假设的拒绝规则:22ntt若,则接受H0,表示总体两变量间线性相关性不显著;若,则拒绝H0,表示总体两变量间线性相关性显著步骤第八章相关与回归分析2020/1/19统计学课件第八章相关与回归分析【例】检验生产量与生产费用之间的线性相关性是否显著。20.025200.978210.9710.2910.29262.447tttntH有:拒绝,表示总体的两变量间线性相关性显著。00:H0:0:,05.0,97.0,810HHrn提出假设:则解:已知当成立时,则统计量)2(~122ntrnrt2020/1/19统计学课件第八章相关与回归分析第五节相关分析二、复相关系数复相关系数是测量一个变量与其它多个变量之间线性相关程度的指标。为了测定一个变量y与其它多个变量之间的相关系数,可以考虑构造一个关于的线性组合,通过计算该线性组合与之间的简单相关系数作为变量与之间的复相关系数。具体计算过程如下:kxxx,,,21kxxx,,,21第一步,用y对作回归,得kkxxyˆˆˆˆ1102020/1/19统计学课件第八章相关与回归分析第五节相关分析;yˆ第二步,计算y和的简单相关系数,此简单相关系数即为y与之间的复相关系数。kxxx,,,2122ˆˆyyyyyyyyR222ˆyyyyR复相关系数的计算公式为:2020/1/19统计学课件第八章相关与回归分析第五节相关分析二、复相关系数;复相关系数与简单相关系数的区别是简单相关系数的取值范围是[-1,1],而复相关系数的取值范围是[0,1]。这是因为,在两个变量的情况下,回归系数有正负之分,所以在研究相关时,也有正相关和负相关之分;但在多个变量时,偏回归系数有两个或两个以上,其符号有正有负,不能按正负来区别,所以复相关系数也就只取正值。2020/1/19统计学课件第八章相关与回归分析当两个变量同时受其它变量影响时,有必要研究当控制其它变量不变时,该两个变量之间的相关关系。这种相关关系被称为偏相关关系。第五节相关分析三、偏相关系数;计算偏相关系数的原因在于任何两个变量这间的相关关系都可能受其余变量的影响。要考察两个变量之间的纯相关关系,必须排除其余变量的影响,或者说必须使其余变量保持不变。2020/1/19统计学课件第八章相关与回归分析第五节相关分析三、偏相关系数偏相关系数的计算是以回归分析为基础的。以三个变量的情形为例,此种情况下,的偏相关系数有三个,分别记作3.12r2.13r1.23r1x3.12r3x2x为与之间的相关系数;保持不变时,、和之间的相关系数;1x2.13r2x与为保持不变时,之间的相关系数;3x为1.23r2x3x1x与保持不变时,之间的相关系数;2020/1/19统计学课件第八章相关与回归分析第五节相关分析uxxˆˆˆ3101计算残差3101ˆˆˆxxuuˆ3x1x此时中不再含有对的影响。2x3x第二步,求对的回归估计式vxxˆˆˆ3102计算残差3102ˆˆˆxxvvˆ3x2x此时中不再含有对的影响。第一步,求对的回归估计式1x3x2020/1/19统计学课件第八章相关与回归分析第五节相关分析uˆvˆ第三步,计算和的简单相关系数uˆ3xuˆvˆ3x1x2x由于和中都不再包含的影响,因此和的简单相关系数就是保持不变时,与之间的相关系数。vˆ223.12ˆˆˆˆvuvur所以偏相关系数2020/1/19统计学课件第八章相关与回归分析第五节相关分析三、偏相关系数可以证明,231312222211ˆˆrrrxxxxvu21321121ˆrxxu22322221ˆrxxv2232132313123.1211rrrrrr2020/1/19统计学课件第八章相关与回归分析第五节相关分析三、偏相关系数类似的2232122312132.1311rrrrrr2212132113231.2311rrrrrr当变量个数多于3个时,求偏相关系数的原则不变,即应先排除其余变量对所考察两个变量的影响,然后求这两个变量之间的简单相关系数。只是变量越多,数学处理以及偏相关系数的表达式就越复杂。2020/1/19统计学课件第二节一元线性回归分析第八章相关与回归分析一、一元线性回归分析随机误差项的基本假定在回归分析中,最简单最基本的单方程模型为一元线性回归模型。一元线性回归分析的总体回归模型为:iiiuxy10为常数项或截距项,为斜率系数,是随机误差项,又称随机干扰项。2020/1/19统计学课件第二节一元线性回归分析第八章相关与回归分析一、一元线性回归分析随机误差项的基本假定第二,模型的设定误差。在线性回归模型中加入随机误差项是基于以下原因:第一,模型不可能包含所有的解释变量。第三,测量误差的影响。第四,其他随机因素的影响。2020/1/19统计学课件第二节一元线性

1 / 92
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功