案例:教育经费支出与学生成绩的关系学生教育达到的水平与学生所居住的洲在教育方面的经费支出多少有关系吗?在许多地区,这个重要问题被纳税人提出;而纳税人又被他们的学区请求增加用于教育方面的税收收入。在这种情况下,为了确定在公立学校中教育经费支出和学生成绩之间是否存在某种关系,你将被邀请去参加教育经费支出和学生学习成绩的数据分析。美国联邦政府的《全国教育进展评价》(NAEP)计划常常被用来测量学生的教育水平。对于参加NAEP计划的35个洲,表1给出了每名学生每年的经常性教育经费支出和NAEP测试综合分数的统计数据。综合分数是数学、自然科学和阅读三门课程1996年(阅读课是1994年)NAEP测试分数的总和。参加测试的是8年级学生,只有阅读课是4年级学生,满分是1300分。对于未参加NAEP计划的13个洲,表2给出了每名学生每年的经常性教育经费支出。表1参加NAEP计划的洲每名学生每年的经常性教育经费支出和NAEP测试综合分数洲序号教育经费支出(美元)综合分数(分)洲序号教育经费支出(美元)综合分数(分)140495811945216292342358220655463834917580215338639455325802244836415430460323477264463777604245128649746636112532806508493461126551565794097614277629657104060614286413658116208615295410660123800618305477661134041618315060665145247625324985667156100625336055667165020626344374671174520627355561675188162628表2未参加NAEP计划的洲每名学生每年的经常性教育经费支出洲序号教育经费支出(美元)洲序号教育经费支出(美元)136028543824067955883426510626944658116391551641265796529713789075387管理报告(1)对这些数据做出数值的和图示的概述。教育经费支出与综合分数01000200030004000500060007000800090001357911131517192123252729313335洲序号费用520540560580600620640660680700分数教育经费支出综合分数综合分数与费用的散点分布图0100020003000400050006000700080009000560580600620640660680综合分数教育经费支出由以上两图可以看出:教育经费支出与综合分数的所有点在平面上分布的较分散,不是很集中,虽然在总体上有呈现一定的正相关,但是相关性程度并不高。(2)利用回归分析研究每名学生的教育经费支出和NAEP测试综合分数之间的关系,对你的调研结果进行讨论。SUMMARYOUTPUT回归统计MultipleR0.341388RSquare0.116546AdjustedRSquare0.089775标准误差1035.812观测值35方差分析dfSSMSFSignificanceF回归分析1467077846707784.3533890.044741残差33354059031072906总计3440076681Coefficients标准误差tStatP-valueLower95%Upper95%下限95.0%上限95.0%Intercept-3409.0554067.022-0.838220.407938-11683.54865.363-11683.472084865.363XVariable113.432596.4379262.0864780.0447410.3345326.530650.33453045126.530649所以,回归方程为Y=13.433X-3409.055,由表可以知道教育经费支出与综合分数的相关系数r=0.3410.5,属于低度相关。(3)根据这些数据求出估计的回归方程,你认为能利用它来估计未参加NAEP计划洲的学生的综合分数吗?答:回归方程为Y=13.433X-3409.055,其中方程的相关程度=0.450.55,因此方程的相关程度属于高度相关,所以能利用它来估计未参加NAEP计划洲的学生的综合分数。(4)假定你只考虑每名学生的教育经费支出在4000美元至6000美元之间的洲,对于这些洲,两变量之间的关系与根据35个洲的全部数据所得出的结论显现出任何不同吗?讨论你发现的结果,如果将教育经费支出少于4000美元或者多于6000美元的洲删除,你是否认为删除是合理的?首先对数据进行筛选,结果如下:洲序号教育经费支出综合分数(美元)(分)14049581349175804553258054304603746636118493461194097614104060614134041618145247625165020626174520627194521629215338639224483641234772644245128649265515657295410660305477661315060665324985667344374671355561675答:1、筛选后,教育经费支出与综合分数的相关系数:r=0.397;而总体的相关系数为r=0.341。2、筛选后,回归方程为:Y=7.070X+371.426;而总体回归方程为Y=13.433X-3409.055。3、剔除的数据占总体数据的很大部分,达到30%,使得留下的数据的代表性降低。结论:因为删除后所产生的分析结果有较大偏差,所以并不合理。SUMMARYOUTPUT回归统计MultipleR0.396586RSquare0.15728AdjustedRSquare0.118975标准误差483.1402观测值24方差分析dfSSMSFSignificanceF回归分析1958430.8958430.84.1059570.055025残差225135338233424.5总计236093769Coefficients标准误差tStatP-valueLower95%Upper95%下限95.0%上限95.0%Intercept371.42612204.3520.1684970.867732-4200.124942.971-4200.1192944942.9714XVariable17.0698293.4890062.0263160.055025-0.1659314.30559-0.16592658214.305585(5)对未参加NAEP计划洲,求出学生综合分数的估计值。未参加NAEP计划的洲每名学生每年的经常性教育经费支出洲序号教育经费支出(美元)综合分数的估计值(分)136025232406755834265573446586025516464065297650753876568543866095588671106269722116391731126579745137890843(6)根据上面的分析,你认为学生的教育水平与洲教育经费支出的多少相关吗?答:通过柱状图和散点图可以看出所有的点在平面中较分散,同时,由回归分析可知,总体相关系数r=0.341,学生的教育水平与洲教育经费支出是一种较弱相关。