用样本的数字特征估计总体的数字特征--中位数、众数、平均数

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

一、求极差,即数据中最大值与最小值的差二、决定组距与组数:组数=极差/组距三、分组,通常对组内数值所在区间,取左闭右开区间,最后一组取闭区间四、登记频数,计算频率,列出频率分布表五、画出频率分布直方图(纵轴表示频率/组距)复习回顾画频率分布直方图的步骤:连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.画茎叶图的步骤:(1)将每个数据分为茎(高位)和叶(低位)两部分;(2)将最小茎和最大茎之间的数按大小次序排成一列,写在一侧;(3)将各个数据的叶按大小次序写在其茎的另一侧.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.平均数:一组数据的算术平均数,即121()nxxxxn.问题提出:我们初中时学习众数、中位数、平均数等数字特征.我们共同回忆一下?什么是众数、中位数、平均数?二、众数、中位数、平均数与频率分布直方图的关系问题:在上一节抽样调查的100位居民的月均用水量的数据中,我们如何得知这一组样本数据的众数、中位数和平均数?众数2.3t、中位数2.0t、平均数1.973t思考一、在城市居民月均用水量样本数据的频率分布直方图中,如何估计众数?知识探究(一):众数、中位数和平均数思考二、你认为众数应在哪个小矩形内?思考三、由此估计总体的众数是什么?取最高矩形下端中点的横坐标2.25作为众数.知识探究(一):众数、中位数和平均数•因为在频率分布直方图中,各小长方形的面积表示相应各组的频率,也显示出样本数据落在各小组的比例的大小,所以从图中可以看到,在区间[2,2.5)的小长方形的面积最大,即这组的频率是最大的,也就是说月均用水量在区间[2,2.5)内的居民最多,即众数就是在区间[2,2.5)内.众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标.频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)思考四、如何从频率分布直方图估计中位数?分析:在样本数据中,有的个体小于或等于中位数,也有的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)思考五、在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估计总体的中位数是什么?设中位数为x,则0.040.080.150.22(2)0.50.5x,求出2.02x.频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)思考六、平均数是频率分布直方图的“重心”,从直方图估计总体在各组数据内的平均数分别为多少?0.25,0.75,1.25,1.75,2.25,2.75,3.25,3.75,4.25思考七、将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的估值平均数.由此估计总体的平均数是什么?思考八、从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,能解释一下原因吗?频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组有关.注:在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征.思考九、一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?如:样本数据收集有个别差错不影响中位数;大学毕业生凭工资中位数找单位可能收入较低.思考十、样本数据的平均数大于(或小于)中位数说明什么问题?平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值.思考十一、怎样理解“我们单位的收入水平比别的单位高”这句话的含义?这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数或平均数.对众数,中位数,平均数估计总体数字特征的认识:1、样本众数通常用来表示分类变量的中心值,比较容易计算,但是它只能表示样本数据中的很少一部分信息.2、中位数不受少数几个极端值的影响,容易计算,它仅利用了数据排在中间的数据的信息.3、样本平均数与每个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数,众数都不具有的性质,也正因为这个原因,与众数,中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.例:某公司的33名职工的月工资(单位:元)如下表:(1)求该公司职工月工资的平均数、中位数、众数.(2)若董事长、副董事长的工资分别从5500元、5000元提升到30000元、20000元,那么公司职工新的平均数、中位数和众数又是什么?(3)你认为哪个统计量更能反映这个公司员工的工资水平?职务董事长副董事长董事总经理经理管理职员人数11215320工资5500500035003000250020001500•解析:(1)公司职工月工资的平均数约为2091(元),若把所有数据从大到小排序,则得到:中位数是1500元,众数是1500元.•(2)若董事长、副董事长的工资提升后,职工月工资的平均数约为:3288(元),中位数是1500元,众位是1500元.•(3)在这个问题中,中位数和众数都能反映出这个公司员工的工资水平,因为公司少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.课堂练习:应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息。但平均数会受到极端数据2200万元的影响,所以大多数项目投资金额都和平均数相差比较大。1、数据:1,1,3,3的众数和中位数分别是A.1或3,2B.3,2C.1或3,1或3D.3,32、频率分布直方图中最高小矩形的中间位置所对的数字特征是A.中位数B.众数C.平均数D.标准差3、从甲、乙、丙三个厂家生产的同一件产品中各抽出8件产品,对其使用寿命进行跟踪调查,结果如下(单位:年)甲:3,4,5,6,8,8,8,10;乙:4,6,6,6,8,9,12,13;丙:3,3,4,7,9,10,11,12.三家广告中都称该产品的使用寿命是8年,请根据调查结果判断厂家在广告中分别运用了平均数、众数、中位数中哪一种集中趋势的特征数?4、当10名工人某天生产同一种零件,生产的零件数分别是15,17,14,10,15,19,17,16,14,1215,则这一天10名工人生产的零件的中位数是.5、已知一组数据按从小到大的顺序排列为1,0,4,,6,15x,且这组数据的中位数为5那么数据的众数为A.5B.6C.4D.5.51、众数:在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。2、特点:众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.3、中位数:左边和右边的直方图的面积应该相等,由此可以估计中位数的值。4、特点:①中位数易计算,能较好地表现数据信息;②中位数不受少数几个极端值的影响;③常用于计算数据质量较差时。5、平均数:是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点横坐标之和。课堂小结:6、特点:①平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变;②平均数可以反映出更多的关于样本数据全体的信息;③平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。三种数字特征的优缺点:1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.2、中位数它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。课后反馈:课本82页第5题.2、甲、乙两人数学成绩(单位:分)的茎叶图如图所示:分别求出二人的成绩的平均值、众数、中位数,并对二人的成绩进行简要的分析.3、练习册.

1 / 20
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功