著名数学家克莱因所说:数学是人类最高超的智力成就也是人类心灵最独特的创作音乐能激发或抚慰情怀绘画能使人赏心悦目诗歌能动人心弦哲学使人获得智慧科学可改善物质生活但数学能给予以上一切用样本的数字特征估计总体数字特征新授课设计:程宏彦2020年2月17日星期一作业反馈:(态度决定一切,习惯成自然!)完成优秀者:存在的问题:本节课学习目标:1、正确理解样本数据标准差的意义和作用,学会计算数据的标准差;2、能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释;3、会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识。1.对一个未知总体,我们常用样本的频率分布估计总体的分布,其中表示样本数据的频率分布的基本方法有哪些?图、表总体数据的数字特征预习检测:2.美国NBA在2006——2007年度赛季中,甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:甲运动员得分:12,15,20,25,31,31,36,36,37,39,44,49.乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,29.如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征估计总体的数字特征.思考1:在初中我们学过众数、中位数和平均数的概念,这些数据都是反映样本信息的数字特征,对一组样本数据如何求众数、中位数和平均数?思考2:在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么?问题探究:关于三数月均用水量/t频率组距0.500.400.300.200.100.511.522.533.544.5O取最高矩形下端中点的横坐标2.25作为众数.思考3:在频率分布直方图中,每个小矩形的面积表示什么?中位数左右两侧的直方图的面积应有什么关系?每个小矩形的面积即为所在组的频率,中位数左边和右边的直方图的面积应该相等.从左至右各个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.0.5-0.04-0.08-0.15-0.22=0.01,0.5×(0.01÷0.25)=0.02,所以中位数是2.02.月均用水量/t频率组距0.500.400.300.200.100.511.522.533.544.5o思考4:平均数是频率分布直方图的“重心”,将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的估计平均数.由此估计总体的平均数是什么?各小矩形的面积为:0.25,0.75,1.25,1.75,2.25,2.75,3.25,3.75,4.25.月均用水量/t频率组距0.500.400.300.200.100.511.522.533.544.5o0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02=2.02(t).所以平均数是2.02.平均数与中位数相等,是必然还是巧合?巧合思考5:从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组有关.注:在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征.思考6:一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?样本数据的平均数大于(或小于)中位数说明什么问题?你怎样理解“我们单位的收入水平比别的单位高”这句话的含义?如:样本数据收集有个别差错不影响中位数;大学毕业生凭工资中位数找单位可能收入较低.平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值.这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数或平均数.思考1:在一次射击选拔赛中,甲、乙两名运动员各射击10次,每次命中的环数如下:甲:78795491074乙:9578768677甲、乙两人本次射击的平均成绩分别为多少环?77xx甲乙,问题探究:关于两差思考2:甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异在哪里吗?甲的成绩比较分散,极差较大,乙的成绩相对集中,比较稳定.环数频率0.40.30.20.145678910O(甲)环数频率0.40.30.20.145678910O(乙)思考3:对于样本数据x1,x2,…,xn,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?12||||||nxxxxxxn-+-++-L含有绝对值,运算不方便思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s表示.假设样本数据x1,x2,…,xn的平均数为,则标准差的计算公式是:那么标准差的取值范围是什么?标准差为0的样本数据有何特点?s≥0,标准差为0的样本数据都相等.22212()()()nxxxxxxsn-+-++-=Lx计算甲、乙两名运动员的射击成绩的标准差,比较其射击水平的稳定性.甲:78795491074乙:9578768677s甲=2,s乙≈1.095.例1画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;O频率1.00.80.60.40.212345678(1)50.00xs==O频率1.00.80.60.40.212345678(2)50.82xs==(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.频率1.00.80.60.40.212345678O(3)频率1.00.80.60.40.212345678O(4)51.49xs==52.83xs==例2甲、乙两人同时生产内径为25.40mm的一种零件,为了对两人的生产质量进行评比,从他们生产的零件中各随机抽取20件,量得其内径尺寸如下(单位:mm):甲:25.4625.3225.4525.3925.3625.3425.4225.4525.3825.4225.3925.4325.3925.4025.4425.4025.4225.3525.4125.39乙:25.4025.4325.4425.4825.4825.4725.4925.4926.3625.3425.3325.4325.4325.3225.4725.3125.3225.3225.3225.48从生产零件内径的尺寸看,谁生产的零件质量较高?25.401x»甲25.406x»乙0.037s»甲0.068s»乙甲生产的零件内径更接近内径标准,且稳定程度较高,故甲生产的零件质量较高.说明:生产质量可以从总体的平均数与标准差两个角度来衡量,但甲、乙两个总体的平均数与标准差都是不知道的,我们就用样本的平均数与标准差估计总体的平均数与标准差.1.有20种不同的零食,它们的热量含量如下:110120123165432190174235428318249280162146210120123120150140以上20个数据组成总体,求其平均数与标准差;总体平均数为199.75,总体标准差为95.26.2.以往招生统计显示,某所大学录取的新生高考总分的中位数基本稳定在550分,若某同学今年高考得了520分,他想报考这所大学还需收集哪些信息?要点:(1)查往年录取的新生的平均分数.若平均数小于中位数很多,说明最低录取线较低,可以报考;(2)查往年录取的新生高考总分的标准差.若标准差较大,说明新生的录取分数较分散,最低录取线可能较低,可以考虑报考.课堂小结:1.众数,中位数,平均数;2.标准差,方差.本节课都学了哪些内容?