2.2.2用样本的数字特征估计总体的数字特征第二课时知识探究(二):标准差样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.引例:在一次射击选拔赛中,甲、乙两名运动员各射击10次,每次命中的环数如下:甲:78795491074乙:9578768677甲、乙两人本次射击的平均成绩分别为多少环?77乙甲,xx甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?环数频率0.40.30.20.145678910O(甲)环数频率0.40.30.20.145678910O(乙)甲的成绩比较分散,极差较大,乙的成绩相对集中,比较稳定.45678910环数频率0.10.20.3(甲)456789100.10.20.30.4环数频率(乙)直观上看,还是有差异的.如:甲成绩比较分散,乙成绩相对集中(如图示).因此,我们还需要从另外的角度来考察这两组数据.例如:在作统计图表时提到过的极差.甲的环数极差=10-4=6乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.s≥0,标准差为0的样本数据都相等.标准差标准差是样本数据到平均数的一种平均距离.它用来描述样本数据的离散程度.在实际应用中,标准差常被理解为稳定性.规律:标准差越大,则a越大,数据的离散程度越大;反之,数据的离散程度越小.用计算器可算出甲,乙两人的的成绩的标准差由可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.乙甲ss09512乙甲,ss上面两组数据的离散程度与标准差之间的关系可用图直观地表示出来.45678910甲s乙s从标准差的角度来考察这两组数据:附:1.标准差的平方s²称为方差,有时用方差代替标准差测量样本数据的离散度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数973.1x标准差s=0.868,所以.237.02,105.1709.32,841.2sxsxsxsx。sxsx,个外的只有在区间个数据中这4709.3,237.02,2100。sxsx,据几乎包含了所有样本数也就是说2,2:2的工具测量样本数据分散程度方差来代替标准作为方人们有时用标准差的平从数学的角度考虑s,2222121()()().nsxxxxxxn例1画出下列四组样本数据的直方图,说明它们的异同点.(1)(2)(3)(4)四组数据的平均数都是5.0,标准差分0.00,0.82,1.49,2.83.虽然它们有相同的平均数,但是它们有不同的标准差,说明数据的分散程度是不一样的.例2甲、乙两人同时生产内径为25.40mm的一种零件,为了对两人的生产质量进行评比,从他们生产的零件中各随机抽取20件,量得其内径尺寸如下(单位:mm):甲:25.4625.3225.4525.3925.3625.3425.4225.4525.3825.4225.3925.4325.3925.4025.4425.4025.4225.3525.4125.39乙:25.4025.4325.4425.4825.4825.4725.4925.4926.3625.3425.3325.4325.4325.3225.4725.3125.3225.3225.3225.48从生产零件内径的尺寸看,谁生产的零件质量较高?甲生产的零件内径更接近内径标准,且稳定程度较高,故甲生产的零件质量较高.说明:1.生产质量可以从总体的平均数与标准差两个角度来衡量,但甲、乙两个总体的平均数与标准差都是不知道的,我们就用样本的平均数与标准差估计总体的平均数与标准差.2.问题中25.40mm是内径的标准值,而不是总体的平均数.074.0,038.0;4008,25,4005.25乙甲乙甲ssxx解:例3以往招生统计显示,某所大学录取的新生高考总分的中位数基本稳定在550分,若某同学今年高考得了520分,他想报考这所大学还需收集哪些信息?要点:(1)查往年录取的新生的平均分数.若平均数小于中位数很多,说明最低录取线较低,可以报考;(2)查往年录取的新生高考总分的标准差.若标准差较大,说明新生的录取分数较分散,最低录取线可能较低,可以考虑报考.例4在去年的足球甲A联赛中,甲队每场比赛平均失球数是1.5,全年比赛失球个数的标准差1.1;乙队每场比赛平均失球数是2.1,全年比赛失球个数的标准差为0.4.你认为下列说法是否正确,为什么?(1)平均来说甲队比乙队防守技术好;(2)乙队比甲队技术水平更稳定;(3)甲队有时表现很差,有时表现又非常好;(4)乙队很少不失球.例5有20种不同的零食,它们的热量含量如下:110120123165432190174235428318249280162146210120123120150140(1)以上20个数据组成总体,求总体平均数与总体标准差;(2)设计一个适当的随机抽样方法,从总体中抽取一个容量为7的样本,计算样本的平均数和标准差.(1)总体平均数为199.75,总体标准差为95.26.(2)可以用抽签法抽取样本,样本的平均数和标准差与抽取的样本有关.解:依题意计算可得x1=900x2=900s1≈23.8s2≈42.6甲乙两种水稻6年平均产量的平均数相同,但甲的标准差比乙的小,所以甲的生产比较稳定.练习:解:(1)平均重量约为496.86g,标准差约为s=6.55.(2)重量位于(x-s,x+s)之间有14袋白糖,所占百分比为66.67%.解:平均数x≈19.25,中位数为15.2,标准差s≈12.50.这些数据表明这些国家男性患该病的平均死亡率约为19.25,有一半国家的死亡率不超过15.2,x15.2说明存在大的异常数据,这些异常数据使得标准差增大.小结2、对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变.如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性.3、在抽样过程中,抽取的样本是具有随机性的,如从一个包含6个个体的总体中抽取一个容量为3的样本就有20中可能抽样,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案.4、在实际应用中,调查统计是一个探究性学习过程,需要做一系列工作,我们可以把学到的知识应用到自主研究性课题中去.1、平均数对数据有“取齐”的作用,代表一组数据的平均水平.标准差描述一组数据围绕平均数波动的幅度.在实际应用中,我们常综合样本的多个统计数据,对总体进行估计,为解决问题作出决策.作业:P81习题2.2A组:6,7.B组:1.