《总体分布的估计》PPT课件

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

统计的基本思想方法:根据样本的情况去估计总体的相应情况.统计的核心问题:一类是如何从总体中抽取样本?另一类是如何根据对样本的整理、计算、分析,对总体的情况作出推断.国际奥委会2003年6月29日决定,2008年北京奥运会举办的日期比原定日期推迟两周,改在8月8日至8月24日举行.原因是7月末8月初北京地区得气温高于8月中下旬.下表是随机抽取的近年来北京地区7月25日至8月24日的日最高气温,得到如下样本(单位:ºC)7月25日至8月10日41.937.535.735.437.238.134.733.733.332.534.633.030.831.028.631.528.88月8日至8月24日28.631.528.833.232.530.330.229.833.132.829.425.624.730.030.129.530.3怎样通过上表中的数据,分析比较两时间段的高温(≥33℃)状况呢?问题引入:1.频数与频率频数是指一组数据中,某范围内的数据出现的次数;把频数除以数据的总个数,就得到频率.2.频率分布表当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.7月25日至8月10日41.937.535.735.437.238.134.733.733.332.534.633.030.831.028.631.528.88月8日至8月24日28.631.528.833.232.530.330.229.833.132.829.425.624.730.030.129.530.3时间总天数高温天数频率7月25日至8月10日17110.6478月8日至8月24日1720.118频率分布表:3.频率分布条形图时间总天数高温天数频率7月25日至8月10日17110.6478月8日至8月24日1720.118①各长方形长条的宽度要相同.②相邻长条的间距要适当.③长方形长条的高度表示取各值的频率.0.10.20.30.40.50.60.77/25-8/10时间频率8/8-8/24由此可得:近年来北京地区7月25日至8月10日的高温天气的频率明显高于8月8日至8月24日.我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?探究:你认为,为了较为合理地确定出这个标准,需要做哪些工作?我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?探究:①采用抽样调查的方式获得样本数据②分析样本数据来估计全市居民用水量的分布情况下表给出100位居民的月均用水量表分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式讨论:如何分析数据?根据这些数据你能得出用水量其他信息吗?为此我们要对这些数据进行整理与分析〈一〉频率分布的概念:频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布〈二〉画频率分布直方图其一般步骤为(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图第一步:求极差:(数据组中最大值与最小值的差距)最大值=4.3最小值=0.2所以极差=4.3-0.2=4.1第二步:决定组距与组数:(强调取整)当样本容量不超过100时,按照数据的多少,常分成5~12组.为方便组距的选择应力求”取整”.本题如果组距为0.5(t).则4.18.20.5极差组数=组距第三步:将数据分组:(给出组的界限)所以将数据分成9组较合适.[0,0.5),[0.5,1),[1,1.5),……[4,4.5)共9组.第四步:列频率分布表.分组频数频率频率/组距[0-0.5)4[0.5-1)8[1-1.5)15[1.5-2)22[2-2.5)25[2.5-3)15[3-3.5)5[3.5-4)4[4-4.5)2合计100组距=0.50.040.080.080.160.30.150.440.220.250.512.000.020.040.040.080.10.30.150.0500.10.20.30.40.50.60.511.522.533.544.5第五步:画出频率分布直方图.频率/组距月均用水量/t(组距=0.5)0.080.160.30.440.50.30.10.080.04小长方形的面积=?小长方形的面积总和=?月均用水量最多的在哪个区间?探究:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断.分别以1和0.1为组距重新作图,然后谈谈你对图的印象.从图中我们可以看到,月均用水量在区间[2,2.5)内的居民最多,在[1.5,2)内次之,大部分居民的月均用水量都在[1,3)之间.直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到分布表中看不清楚的数据模式,但是直观图也丢失了一些信息,例如,原始数据不能在图中表示出了.频率分布的条形图和频率分布直方图的区别两者是不同的概念;横轴:两者表示内容相同.思考:频率分布条形图和频率分布直方图是两个相同的概念吗?有什么区别?纵轴:两者表示的内容不相同.频率分布条形图的纵轴(长方形的高)表示频率;频率分布直方图的纵轴(长方形的高)表示频率与组距的比值.其相应组距上的频率等于该组距上长方形的面积.=频率长方形的面积组距频率组距S1计算数据中最大值与最小值的差(极差),确定全距(指整个取值区间的长度)S2根据全距,决定组数和组距(分成的区间的长度).S3分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间.S4登记频数,计算频率,列出频率分布表.算法:1.频率分布表S1作出频率分布表,然后作直角坐标系,以横轴表示数据,纵轴表示“频率/组距”;S2把横轴分为若干段,每一线段对应一个组的组距,S3以此线段为底作一矩形,它的高等于该组的频率/组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.所有矩形的面积和为1.算法:2.频率分布直方图图形的意义:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?各小长方形的面积=频率各小长方形的面积之和=1月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O宽度:组距高度:频率组距频率分布折线图如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率折线图.组距0.500.10.20.30.40.50.6123456789组距0.5组距0.500.10.20.30.40.50.6123456789组距0.5练习:投掷一枚均匀骰子44次的记录是:32415134565425313414516331242634661622526543现对这些数据进行整理,试画出频数分布直方图.第一步:写出样本可能出现的一切数值,即:1,2,3,4,5,6共6个数.(数据分组)第二步:列出频率分布表:样本123456频数778877频率0.160.160.180.180.160.16组距=10.150.1550.160.1650.170.1750.18123456频率/组距第三步:画频率分布直方图小结:画频率分布直方图的步骤:第一步:求极差:(数据组中最大值与最小值的差距)第二步:决定组距与组数:(强调取整)第三步:将数据分组(给出组的界限)第四步:列频率分布表.(包括分组、频数、频率、频率/组距)第五步:画频率分布直方图(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率/组距.)组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。4.18.20.5极差组数=组距频率折线图的优点是它反映了数据的变化趋势.如果将样本容量取得足够大,分组的组距取得足够小,则这条折线将趋于一条曲线,我们称这一曲线为总体分布的密度曲线.总体密度曲线总体在区间内取值的概率),(ba某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,5012345←叶:表示个位数字茎:表示十位数字→茎叶图2545166794901从这张图可以粗略地看出,该运动员平均得分及中位数、众数都在20到40之间,且分布较对称,集中程度高,说明其发挥比较稳定.茎叶图的画法:将所有的两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.茎叶图的优缺点:优点是所有的信息都可以从茎叶图中得到,便于记录和表示.但茎叶图表示三位或三位以上的数据时不够方便.例.甲、乙两篮球运动员在上赛季每场比赛的得分如下,试比较这两位运动员的得分水平.甲12,15,24,25,31,31,36,36,37,39,44,49,50.乙8,13,14,16,23,26,28,33,38,39,51解:画出两人得分的茎叶图;从这个茎叶图可以看出甲运动员的得分大致对称,平均得分及中位数、众数都是30多分;乙运动员的得分除一个51外,也大致对称,平均得分及中位数、众数都是20多分,因此甲运动员发挥比较稳定,总体得分情况比乙好.练习:1.右面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()甲012345乙824719936250328754219441AA.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分从一个养鱼池中捕得m条鱼,做上记号后放入池中,数日后又捕得n条鱼,其中k条有记号,估计池中有鱼多少条?kmnm,N.nNk令得

1 / 30
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功