1.相关关系:与函数关系不同,相关关系是一种_________关系.2.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系为_______,点散布在从左上角到右下角的区域内,两个变量的相关关系为_______.3.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有_____________,这条直线叫_________.非确定性正相关负相关线性相关关系回归直线4.回归直线方程y^=bx+a,其中b=i=1nxi-x-yi-y-i=1nxi-x-2=i=1nxiyi-nx-y-i=1nx2i-nx-2,a=________.b是回归直线的斜率,a是截距.y--bx-6.P(K2≥6.635)≈____.P(K2≥3.841)≈____.P(K2≥2.706)≈____.7.函数关系是一种___________,相关关系是一种_________关系,对具有相关关系的两个变量进行统计分析的方法叫做_________.5.R2=______________,R2越接近1,拟合效果越好.1-i=1nyi-y^i2i=1nyi-y20.010.050.10确定性关系非确定性回归分析8.表示具有相关关系的两个变量组成一组数据,将各组数据在平面直角坐标系中描点,得到的图形叫做_______.9.回归直线方程为y^=bx+a,其中,回归直线斜率b的估计值b^=_______________,截距a的估计值a^=________,上述方程对应的直线叫做_________,而对两个变量所进行的上述统计分析叫做_________.散点图回归直线回归分析i=1nxi-xyi-yi=1nxi-x2y-b^x10.对于性别变量,其取值为男和女两种,这种变量的不同“值”表示个体所属的不同类别,像这类变量称为_________.11.列出两个分类变量的频数表,称为_______.分类变量列联表1.为了了解某电子元件的寿命与某种材料的相关性,现选取与之相关的两个重要变量x,y,并收集了变量x,y的一组样本数据,经计算,得到它们的相关系数为0.8654,因此可以得到结论()A.变量x,y具有较强的线性正相关关系B.变量x,y具有较强的线性负相关关系C.变量x,y具有较弱的线性正相关关系D.变量x,y具有较弱的线性负相关关系解析:r>0时,为线性正相关关系,通常|r|>0.75,则认为两个变量具有较强的相关关系.答案:A2.为了了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机选取了60名高中生,通过问卷调查,得到以下数据:作文成绩优秀作文成绩一般合计课外阅读量较大221032课外阅读量一般82028合计303060由以上数据计算得出K2≈9.643,根据临界值表,以下说法正确的是()A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关解析:因为K2≈9.643,查阅临界值表即知D正确.答案:D3.给出下列命题:①用相关指数R2来刻画回归效果时,R2的值越大,说明模型拟合的效果越好;②对分类变量X与Y的随机变量K2的观测值k来说,k越小,“X与Y有关系”的可信程度越大;③两个随机变量相关性越强,则相关系数的绝对值越接近于1;④三维柱形图中柱的高度表示的是各分类变量的频数.其中正确命题的序号是________(写出所有正确命题的序号).解析:对于②,当K2越小时,“X与Y有关系”的可信度越小;其余①③④均正确.答案:①③④4.某小卖部为了了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶杯数与当天气温,分别作了对照表(如表),由表中数据算得线性回归方程y^=bx+a中的b≈-2,则预测当气温-5℃时,热茶销售量为________杯.气温(℃)181310-1杯数24343864答案:70解析:x=10,y=40,由y=bx+a且b=-2知,a=60,所以当x=-5℃时,y=-2×(-5)+60=70.分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出回归直线方程,把样本数据表示的点在直角坐标系中作出,构成的图叫做散点图.从散点图上,我们可以分析出两个变量是否存在相关关系.1.分析两个变量相关关系的常用方法(1)利用散点图进行判断:把样本数据表示的点在平面直角坐标系中作出,从而得到散点图,如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系.(2)利用相关系数r进行判断:|r|≤1,而且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.2.对具有相关关系的两个变量进行统计分析时,首先进行相关性检验,在确认具有线性相关关系后,再求回归直线方程.3.独立性检验的一般步骤(1)根据样本数据制成2×2列联表.(2)根据公式K2=nad-bc2a+bc+da+cb+d,计算K2的值.(3)根据K2与临界值的大小关系作统计推断.4.判断回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y^=bx+a);(4)按一定规则估计回归方程中的参数(如最小二乘法);(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性,等等),若存在异常,则检查数据是否有误,或模型是否合适等.考点一相关关系的判断【案例1】(2011·江西)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U和V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y和X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()A.r2<r1<0B.0<r2<r1C.r2<0<r1D.r2=r1(即时巩固详解为教师用书独有)关键提示:可描出点再观察.解析:第一组变量正相关,相关系数r1>0;第二组变量负相关,相关系数r2<0.答案:C【即时巩固1】山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg).施化肥量x15202530354045棉花产量y330345365405445450455(1)画出散点图;(2)判断是否具有相关关系.解:(1)散点图如图所示.(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.考点二求线性回归方程【案例2】假设关于某设备的使用年限x和所支出的维修费用y(单位:万元)之间有如下的统计资料:使用年限x23456维修费用y2.23.85.56.57.0若由资料知y与x呈线性相关关系.试求:(1)线性回归方程y^=bx+a的回归系数a、b;(2)估计使用年限为10年时,维修费用是多少?关键提示:求回归方程时,最好能分步完成:先求出x2i,xiyi,进而求出i=1nx2i、i=1nxiyi,再代入公式求出b,最后通过a=y-bx求出a.解:(1)列表,计算i12345合计xi2345620yi2.23.85.56.57.025xiyi4.411.422.032.542.0112.3x4916253690x=4,y=5,i=1nx2i=90,i=1nxiyi=112.3于是有b=112.3-5×4×590-5×42=12.310=1.23,a=y-bx=5-1.23×4=0.08.(2)回归直线方程是y^=1.23x+0.08,当x=10年时,y^=1.23×10+0.08=12.38(万元),即估计使用10年时维修费用是12.38万元.【即时巩固2】随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查10个家庭,得数据如下:家庭编号12345678910xi(收入)千元0.81.11.31.51.51.82.02.22.42.8yi(支出)千元0.71.01.21.01.31.51.31.72.02.5(1)判断家庭平均收入与月平均生活支出是否相关?(2)若二者线性相关,求回归直线方程.解:(1)作出散点图:观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系.(2)x=110(0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,y=110(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,i=110x2i=27.51,i=110xiyi=33.72,b=i=110xiyi-10xyi=110x2i-10x2≈0.8136,a=1.42-1.74×0.8136≈0.0043,所以回归方程为y^=0.8136x+0.0043.考点三独立性检验【案例3】调查某医院某段时间内婴儿出生的时间与性别的关系,得出下面的数据表.出生时间性别晚上白天合计男婴203050女婴92130合计295180试分析婴儿的性别与出生时间有关系吗?关键提示:计算K2的观测值k,依据临界值表判断相关性的把握.解:由K2计算公式,K2=80×20×21-30×9229×51×30×50≈0.811.所以根据临界值表,我们认为婴儿性别与出生时间二者之间没有关系.【即时巩固3】为了研究性格与血型的关系,抽取80名被测试者,他们的血型与性格汇总如下表:血型性格O型或A型B型或AB型总计外向181634内向172946总计354580试判断性格与血型是否相关.解:由列联表中的数据得到K2=80×18×29-16×17235×45×34×46≈2.030<2.706,所以认为没有充分的证据显示“血型与性格有关系”.