新课标人教A版高中数学必修三2.2.2用样本的数字特征估计总体的数字特征课件

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2.2.2用样本的数字特征估计总体的数字特征第1课时众数、中位数、平均数在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。——用样本的数字特征估计总体的数字特征【创设意境】三数概念1、众数在一组数据中,出现次数最多的数据叫做这一组数据的众数。2、中位数将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数。3、平均数一组数据的总和除以数据的个数所得的值。求下面这组数据的众数、中位数、平均数众数为6中位数为6平均数6810361044103108886666444x也可以说平均数为各个不同数字乘以相应频率之和。4、4、4、6、6、6、6、8、8、8月均用水量/t频率/组距o4.543.532.521.510.50.500.400.300.200.10如何从频率分布直方图中估计众数?如图:2.25众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。思考:频率分布直方图中估计的众数与原始数据中的众数2.3不同,为什么?在频率分布直方图,我们只能直观地看出数据的大概分布情况,从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。讨论:众数估计总体情况有什么优缺点?能够体现样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征。如何从频率分布直方图中估计中位数?0.020.040.060.140.250.220.150.080.04月均用水量/t频率/组距o4.543.532.521.510.50.500.400.300.200.10前四个小矩形的面积和=0.492.02后四个小矩形的面积和=0.26分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等。总结:在频率分布直方图中,把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标称为中位数。注:图中的数据是小矩形的面积即频率上图中,设中位数为x,则02.25.05.0)2(22.015.008.004.0xx思考:2.02这个中位数的估计值,与样本数据的中位数2.0不同,为什么?从频率分布直方图本身得不出原始的数据内容,频率分布直方图已经损失一些样本信息。思考:中位数不受少数极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?考察100位居民的月均用水量表中的数据,如果把最后一个数据错写成22,并不会对样本中位数产生影响也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中人为操作的失误经常造成错误数据。对极端值不敏感有利的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作。这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感。这里更好的方法是同时用平均数和中位数来作为参考指标,选择平均数较大且中位数较大的公司就业。对极端值不敏感有弊的例子:如何从频率分布直方图中估计平均数?注:图中的数据是小矩形的面积即频率0.020.040.060.140.250.220.150.080.04月均用水量/t频率/组距o4.543.532.521.510.50.500.400.300.200.10........0.250.751.251.752.25.2.753.253.754.25平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。2.02思考:平均数估计总体情况有什么优缺点?平均数与每一个样本的数据有关,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。想一想:某次数学期中考试,毛毛同学得了78分。全班共30人,其他同学的成绩为1个100分,4个90分,22个80分,以及一个2分和一个10分。毛毛计算出全班的平均分为77分,所以毛毛回家告诉妈妈说,他这次成绩处于班级“中上水平”。这种说法对吗?探究:课本P73你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?以员工平均工资收入水平去描述他们单位的收入情况。这是不合理的,因为这些员工当中,少数经理层次的收入与大多数一般员工收入的差别比较大,平均数受数据中的极端值的影响大,所以平均数不能反映该单位员工的收入水平。这个老板的话有误导与蒙骗行为三种数字特征的优缺点特征数优点缺点众数中位数平均数体现了样本数据的最大集中点不受少数极端值的影响与每一个数据有关,更能反映全体的信息.无法客观反映总体特征不受少数极端值的影响有时也是缺点受少数极端值的影响较大,使其在估计总体时的可靠性降低.【众数、中位数、平均数的简单应用】例某工厂人员及工资构成如下:人员经理管理人员高级技工工人学徒合计周工资2200250220200100人数16510123合计22001500110020001006900(1)指出这个问题中周工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?分析:众数为200,中位数为220,平均数为300。因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。【课本P74练习】应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息.但平均数会受到极端数据2200万元的影响,所以大多数项目投资金额都和平均数相差比较大.假设你是一名交通部门的工作人员,你打算向市长报告国家对本市26个公路项目投资的平均资金数额,其中一条新公路的建设投资为2200万元人民币,另外25个项目的投资是20~100万元。中位数是25万元,平均数是100万元,众数是20万元。你会选择哪一种数字特征来表示国家对每一个项目投资的平均额?你选择种数字特征的缺点是什么?【课堂练习】1.若M个数的平均数是X,N个数的平均数是Y,则这M+N个数的平均数是多少?2.如果两组数x1,x2,…,xn和y1,y2,…,yn的样本平均数分别是x和y,那么一组数x1+y1,x2+y2,…,xn+yn的平均数是______.3.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数为()A.4B.5C.6D.7NMNYMXyxB4.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()A.a>b>cB.b>c>aC.c>a>bD.c>b>a5.下图是某学校举行的运动会上七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数为()7984464793A.84B.85C.86D.87DB【小结】1、如何从样本数据中求众数、中位数、平均数?2、如何从频率分布直方图中估计众数、中位数、平均数?3、利用众数、中位数、平均数估计总体的数字特征时各自的优缺点。作业金太阳导学测评(十六)2.2用样本估计总体2.2.2用样本的数字特征估计总体的数字特征第二课时标准差引例有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数如下:如果你是教练,你应当如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?甲78795491074乙9578768677众数中位数平均数甲运动员乙运动员777777引例有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数如下:如果你是教练,你应当如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?甲78795491074乙9578768677标准差定义:标准差是样本数据到平均数的一种平均距离,常用s表示.1、平均距离nxxxxxxSn||||||21假设样本数据是,表示这组数据的平均数,到的距离是,于是,样本数据到的“平均距离”是:nxxx,,,21xixx),2,1(||nixxinxxx,,,21x规律:标准差越大,则a越大,数据的离散程度越大;反之,数据的离散程度越小.2.标准差])()()[(122221xxxxxxnsn它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。标准差的取值范围是什么?标准差为0的样本数据有什么特点?标准差是怎样表现数据的离散程度的?标准差的取值范围:[0,+∞)标准差为0的样本数据都等于样本平均数.标准差表现为:标准差越大,表明数据的离散程度就越大;反之,标准差越小,表明各数据的离散程度就越小。它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。标准差的作用:例1:画出下列四组样本数据的条形图,说明它们的异同点。(1)(2)(3)(4)(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8。例2:甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm)甲乙从生产的零件内径的尺寸来看,谁生产的质量较高?X甲≈25.401X乙≈25.406s甲≈25.401S乙≈25.401结论:甲生产的零件内径更接近内径标准,且稳定程度较高,故甲生产的零件质量较高.二.方差的概念:定义:标准差的平方叫做方差,即:])()()[(1222212xxxxxxnsn【练习】求数据1,2,3,4,5的平均数与标准差。品种第一年第二年第三年第四年第五年第六年甲900920900850910920乙890960950850860890解:依题意计算可得x1=900x2=900s1≈23.8s2≈42.6甲乙两种水稻6年平均产量的平均数相同,但甲的标准差比乙的小,所以甲的生产比较稳定.1.农场种植的甲乙两种水稻,在面积相等的两块稻田中连续6年的年平均产量如下(单位:500g):那种水稻的产量比较稳定?解:(1)平均重量约为496.86g,标准差约为6.55(2)重量位于(x-s,x+s)之间有14袋白糖,所占百分比为66.67%.2.一个小商店从一家食品有限公司购进21袋白糖,每袋白糖的标准重量是500g,为了了解这些白糖的重量情况,称出各袋白糖的重量(单位:g)如下:486495496498499493493498484497504489495503499503509498487500508求:(1)21袋白糖的平均重量x是多少?标准差s是多少?(2)重量位于x-s与x+s之间有多少袋白糖?所占的百分比是多少?解:平均数x≈19.25,中位数为15.2,标准差s≈12.50.这些数据表明这些国家男性患该病的平均死亡率约为19.25,有一半国家的死亡率不超过15.2,x15.2说明存在大的异常数据,这些异常数据使得标准差增大.生产过程中的质量控制图正态分布:一些总体的分布密度曲线是由它的平均数与标准差完全确定的,我们把这样的分布记作,称为平均数为,方差为的正态分布.课本P79阅读与思考生产过程中的质量控制图小结])()()[(122221xxxxxxnsn1.标准差2.方差:])()()[(1222212xxxxxxnsn作业金太阳导学测评(十六)

1 / 35
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功