知识体系构建1.观察下列各图形,每个图中的两个变量具有相关关系的是()(A)(1)(2)(B)(1)(4)(C)(3)(4)(D)(2)(3)C【规律方法】利用散点图判断两个变量是否有相关关系是比较简便的方法.在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系,如果所有的样本点落在某一函数的曲线附近,变量之间就有相关关系,如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.2.(2010·广东高考)某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:根据统计资料,居民家庭年平均收入的中位数是_______,家庭年平均收入与年平均支出有________线性相关关系.13万元正(较强的)1122211^^()().().nniiiiiinniiiixxyyxynxybxxxnxaybx^^ˆybxa回归直线方程:其中3.求回归直线方程11,,1(,1).nniiiixynyxnxy称为样其本点的中心中求回归直线方程的步骤:;,线性相关变量第一步:画散点图说明yx,;xy第二步:计算第三步:代入公式计算b,a的值;第四步:写出直线方程.^^ˆybxa1.回归直线过样本点中心;2.回归直线方程中x的系数反映正、负相关;回归直线的一些常用结论:3.给定一个x值,可以用回归方程估计y值;4.回归方程的意义:当变量x值增加……个单位,y值平均增加了……个单位?CA的拟合效果越差。大,即模型越小,则残差平方和越越好;越小,模型的拟合效果越大,则残差平方和2212)ˆ(RyyRniii21212)()ˆ(1niiiniiiyyyyR4.(2011·惠州模拟)已知x,y之间的一组数据如表:(1)分别从集合A={1,3,6,7,8},B={1,2,3,4,5}中各取一个数x,y,求x+y≥10的概率;(2)对于表中数据,甲、乙两同学给出的拟合直线分别为试根据残差平方和的大小,判断哪条直线拟合程度更好.111yx1yx322与,n2iii1yy【解析】(1)分别从集合A,B中各取一个数组成数对(x,y),共有25对,其中满足x+y≥10的有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共9对.故使x+y≥10的概率为9.25(2)用y=x+1作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S1=(1-)2+(2-2)2+(3-3)2+(4-)2+(5-)2=用作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S2=(1-1)2+(2-2)2+(3-)2+(4-4)2+(5-)2=.∵S2<S1,故用直线拟合程度更好.13431031137.311yx2272921211yx22设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d)())()()(()(22为样本容量其中dcbandbcadcbabcadnK利用P94表3-10来判断两分类变量x和y的关系有关系”与显示“就认为没有充分的证据的观测值当随机变量YXkK,706.2◆◆◆2独立性检验【例3】(2011·潮州模拟)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)内的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:3(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,并问是否能在犯错误的概率不超过0.01的前提下认为“两个分厂生产的零件的质量有差异”?【自主解答】(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为=64%.360500320500【规律方法】1.独立性检验的步骤:(1)根据样本数据制成2×2列联表.(2)根据公式K2=计算K2的观测值.(3)比较K2与临界值的大小关系作统计推断.2.另外,还可利用图形来判断两个变量之间是否有关系,可以画出等高条形图,从图形上只可以粗略地估计两个分类变量的关系,可以结合所求数值来进行比较,作图时应注意单位统一,图形准确.2nadbcabacbd(cd)