2.2用样本估计总体2.2.1用样本的频率分布估计总体分布问题提出1.随机抽样有哪几种基本的抽样方法?2.随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们需要进一步学习的内容.简单随机抽样、系统抽样、分层抽样.3.高一某班有50名学生,在数学必修②结业考试后随机抽取10名,其考试成绩如下:82,75,61,93,62,55,70,68,85,78.如果要求我们根据上述抽样数据,估计该班对数学模块②的总体学习水平,就需要有相应的数学方法作为理论指导,本节课我们将学习用样本的频率分布估计总体分布.频率分布表和知识探究(一):频率分布表【问题】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t):3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2思考1:上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么?思考2:样本数据中的最大值和最小值的差称为极差.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?0.2~4.3(4.3-0.2)÷0.5=8.2思考3:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?思考4:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].分组频数累计频数频率[0,0.5)40.04[0.5,1)正80.08[1,1.5)正正正150.15[1.5,2)正正正正220.22[2,2.5)正正正正正250.25[2.5,3)正正140.14[3,3.5)正一60.06[3.5,4)40.04[4,4.5]20.02合计1001.00思考5:上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?用样本的频率分布估计总体分布.思考6:如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?88%的居民月用水量在3t以下,可建议取a=3.思考7:在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?分组时,组距的大小可能会导致结论出现偏差,实践中,对统计结论是需要进行评价的.思考8:对样本数据进行分组,其组数是由哪些因素确定的?思考9:对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.按统计原理,若样本的容量为n,分组数一般在(1+3.3lgn)附近选取.当样本容量不超过100时,按照数据的多少,常分成5~12组.若以0.1或1.5为组距对上述100个样本数据分组合适吗?思考10:一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?第一步,求极差.(极差=样本数据中最大值与最小值的差)第二步,决定组距与组数.(设k=极差÷组距,若k为整数,则组数=k,否则,组数=k+1)第三步,确定分点,将数据分组.第四步,统计频数,计算频率,制成表格.(频数=样本数据落在各小组内的个数,频率=频数÷样本容量)知识探究(二):频率分布直方图思考1:为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率/组距.频率分布直方图中各小长方形的和高度在数量上有何特点?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O宽度:组距高度:频率组距思考2:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O各小长方形的面积=频率各小长方形的面积之和=1思考3:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.思考4:样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何?第一步,画平面直角坐标系.第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.思考5:对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以1为组距画频率分布直方图吗?与分组数(或组距)及坐标系的单位长度有关.月均用水量/t频率组距0.40.30.20.112345O理论迁移例某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58.(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计年龄在32~52岁的知识分子所占的比例约是多少.(1)极差为67-28=39,取组距为5,分为8组.分组频数频率[27,32)30.06[32,37)30.06[37,42)90.18[42,47)160.32[47,52)70.14[52,57)50.10[57,62)40.08[62,67)30.06合计501.00样本频率分布表:(2)样本频率分布直方图:年龄0.060.050.040.030.020.01273237424752576267频率组距O(3)因为0.06+0.18+0.32+0.14=0.7,故年龄在32~52岁的知识分子约占70%.小结作业1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律.我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式.用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚的看到整个样本数据的频率分布情况,并由此估计总体的分布情况.作业:P71练习:1.(1).P81习题2.2A组:2.19、一个人的理想越崇高,生活越纯洁。20、非淡泊无以明志,非宁静无以致远。21、理想是反映美的心灵的眼睛。22、人生最高之理想,在求达于真理。便有了文明。24、生当做人杰,死亦为鬼雄。25、有理想的、充满社会利益的、具有明确目的生活是世界上最美好的和最有意义的生活。26、人需要理想,但是需要人的符合自然的理想,而不是超自然的理想。27、生活中没有理想的人,是可怜的。28、在理想的最美好的世界中,一切都是为美好的目的而设的。29、理想的人物不仅要在物质需要的满足上,还要在精神旨趣的满足上得到表现。30、生活不能没有理想。应当有健康的理想,发自内心的理想,来自本国人民的理想。31、理想是美好的,但没有意志,理想不过是瞬间即逝的彩虹。32、骐骥一跃,不能十步;驽马十驾,功在不舍;锲而舍之,朽木不折;锲而不舍,金石可镂。——荀况33、伟大的理想只有经过忘我的斗争和牺牲才能胜利实现。34、为了将来的美好而牺牲了的人都是尊石质的雕像。35、理想对我来说,具有一种非凡的魅力。36、扼杀了理想的人才是最恶的凶手。37、理想的书籍是智慧的钥匙。人生的旅途,前途很远,也很暗。然而不要怕,不怕的人的面前才有路。——鲁迅2人生像攀登一座山,而找寻出路,却是一种学习的过程,我们应当在这过程中,学习稳定、冷静,学习如何从慌乱中找到生机。——席慕蓉3做人也要像蜡烛一样,在有限的一生中有一分热发一分光,给人以光明,给人以温暖。——萧楚女4所谓天才,只不过是把别人喝咖啡的功夫都用在工作上了。——鲁迅5人类的希望像是一颗永恒的星,乌云掩不住它的光芒。特别是在今天,和平不是一个理想,一个梦,它是万人的愿望。——巴金6我们是国家的主人,应该处处为国家着想。——雷锋7我们爱我们的民族,这是我们自信心的源泉。——周恩来8春蚕到死丝方尽,人至期颐亦不休。一息尚存须努力,留作青年好范畴。——吴玉章9学习的敌人是自己的满足,要认真学习一点东西,必须从不自满开始。对自己,“学而不厌”,对人家,“诲人不倦”,我们应取这种态度。——毛泽东10错误和挫折教训了我们,使我们比较地聪明起来了,我们的情就办得好一些。任何政党,任何个人,错误总是难免的,我们要求犯得少一点。犯了错误则要求改正,改正得越迅速,越彻底,越好。——毛泽东38、理想犹如太阳,吸引地上所有的泥水。9.君子欲讷于言而敏于行。——《论语》译:君子不会夸夸其谈,做起事来却敏捷灵巧。10.二人同心,其利断金;同心之言,其臭如兰。——《周易》译:同心协力的人,他们的力量足以把坚硬的金属弄断;同心同德的人发表一致的意见,说服力强,人们就像嗅到芬芳的兰花香味,容易接受。11.君子藏器于身,待时而动。——《周易》译:君子就算有卓越的才能超群的技艺,也不会到处炫耀、卖弄。而是在必要的时刻把才能或技艺施展出来。12.满招损,谦受益。——《尚书》译:自满于已获得的成绩,将会招来损失和灾害;谦逊并时时感到了自己的不足,就能因此而得益。13.人不知而不愠,不亦君子乎?——《论语》译:如果我有了某些成就,别人并不理解,可我决不会感到气愤、委屈。这不也是一种君子风度的表现吗?知缘斋主人14.言必信,行必果。——《论语》译:说了的话,一定要守信用;确定了要干的事,就一定要坚决果敢地干下去。15.毋意,毋必,毋固,毋我。——《论语》译:讲事实,不凭空猜测;遇事不专断,不任性,可行则行;行事要灵活,不死板;凡事不以“我”为中心,不自以为是,与周围的人群策群力,共同完成任务。16.三人行,必有我师焉,择其善者而从之,其不善者而改之。——《论语》译:三个人在一起,其中必有某人在某方面是值得我学习的,那他就可当我的老师。我选取他的优点来学习,对他的缺点和不足,我会引以为戒,有则改之。1