973.1回归分析的基本思想及其初步应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

.年龄脂肪239.52717.83921.24125.9454927.526.35028.25329.65430.25631.45730.8年龄脂肪5833.56035.26134.6如上的一组数据,你能分析人体的脂肪含量与年龄之间有怎样的关系吗?探究下面我们以年龄为横轴,脂肪含量为纵轴建立直角坐标系,作出各个点,称该图为散点图。如图:O20253035404550556065年龄脂肪含量510152025303540从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在从左下角到右上角的区域。称它们成正相关。但有的两个变量的相关,如下图所示:如高原含氧量与海拔高度的相关关系,海平面以上,海拔高度越高,含氧量越少,称它们成负相关.O如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,该直线叫回归方程。O20253035404550556065年龄脂肪含量5101520253035401.在画两个变量的散点图时,下面哪个叙述是正确的A.预报变量在x轴上,解释变量在y轴上B.解释变量在x轴上,预报变量在y轴上C.可以选择两个变量中任意一个变量在x轴上D.可以选择两个变量中任意一个变量在y轴上08年中山高二期末12345678身高165162157160148165155170体重4847504845614359010203040506070145150155160165170175身高(cm)体重(KG)体重(KG)案例:从某班随机抽取8名女同学的身高和体重数据如下,作散点图,分析变量关系.该班女生身高与体重大概呈线性关系金手指驾校网金手指驾驶员考试2016科目1考试网科目1考试安全文明网文明驾驶考题安全文明考试网文明驾驶模拟考试GrammarFocus练习:下列5组数据中,去掉()组数据后,剩下的数据的线性相关性最大..A(1,3)Oxy.B(2,4).C(4,5).D(3,10).E(10,12)相关系数r12211()()()()niiinniiiixxyyrxxyy(1)r0,x,y正相关;r0,x,y负相关;(2)r的绝对值越接近1,变量的相关性越强;r的绝对值越接近0,变量的相关性越弱.对于相关系数r,下列说法正确的是:....ArBrCrrDrrr越大,相关程度越大;越小,相关程度越大越大,相关程度越小;越小,相关程度越大1且越接近1,相关程度越大;越接近0,相关程度越小现随机抽取了高二级10名学生在某次段考的数学成绩(x)与物理成绩(y),数据如下表:学生号12345678910X12010811710410311010410599108y84648468696869465771请问:这十个学生的两科成绩考试是否具有显著性线性相关关系?12211()()()()niiinniiiixxyyrxxyy解:求相关系数r:0.7506由0.75060.75知,这次段考的数学成绩和物理成绩有显著性的线性相关关系ˆybxa回归直线方程表示为:ˆab复习:最小二乘估计和(1)_______x知识点:______y(,)xy表示样本点中心121()()(2)()niiiniixxyybxxˆ(3)aybx11niixn11niiyn用最小二乘法求线性回归方程系数公式:121()()ˆ()ˆˆniiiniixxyybxayxbx,.某公司利润y与销售总额x(单位:千万元)之间有以下对应数据:x1015172023y11.41.922.7(1)画出散点图(2)求回归直线方程(3)估计销售总额为30千万元的利润101151.4171.9202232.7165.4参考值:5.已知x与y之间的一组数据:x0123y1357则y与x的线性回归方程为ˆy=bx+a必过A.点2,2B.点1.5,0C.点1,2D.点1.5,409年中山高二期末考12345678身高x165162157160148165155170体重y4847504845614359案例:从某班随机抽取8名女同学的身高和体重数据如下:求(1)该样本中心(2)线性回归方程,(3)若本班有一女生身高是160,预报她的体重是多少?解:121()()(2).0.675()niiiniixxyybxx58.04aybx(1)用计算器可得x=160.25,y=50.1250.67558.04yx(3)160,0.67558.0449.96xyx当时探究:身高为160cm的女大学生的体重一定是49.96kg吗?如果不是,你能解析一下原因吗?答:身高为172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体重接近于60.316kg。定义:线性回归模型:y=bx+ax:解释变量,y:预报变量,e随机误差解释变量x(身高)随机误差e求预报变量y(体重)+ex:解释变量,y:预报变量,e随机误差解释变量x(身高)随机误差e求预报变量y(体重)解释变量x对预报变量y影响有多大呢?随机误差e对预报变量y影响又有多大呢?线性回归模型:y=bx+a+e1122,,,,(,)nnxyxyxy样本点:()()ˆˆybxaˆˆiiieyy残差:编号12345678身高x165165157170175165155170体重y4857505464614359ˆiy估计值ˆi残差e54.37354.37347.58158.61862.86354.37345.88358.618-6.3732.6272.419-4.6181.1376.627-2.8830.38221ˆ()128.361niiiyy残差平方:和即随机误差的效应为128.361712.85849.0ˆxy残差平方和越小,y与x的模型拟合程度越好ˆiy理论值ˆie残差54.37354.37347.58158.61862.86354.37345.88358.618-6.3732.6272.419-4.6181.1376.627-2.8830.382我们利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号、身高等,这样作出的图形叫做残差图可以看出第1个样本点和第6样本点的残差比较大,练习、对下表给出的数据,使用最小二乘法求水稻产量y对化肥用量x的回归直线,1234567x15202530354045y330345365405445490455(1)求x与y的相关系数r,并判断它们的相关性强弱(2)求回归方程(4)求相关指数,说明拟合效果,并对回归模型进行残差分析,求出有可疑的数

1 / 25
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功