必修3第二章统计——用样本估计总体点拨:通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布.一、用样本的频率分布估计总体分布1、列频率分布表、绘制频率分布直方图的步骤:(1)求极差(数据组中最大值与最小值的差距);(2)决定组距与组数(强调取整);(3)决定分点,将数据分组;(4)列频率分布表(包括分组、频数累计、频数、频率);(5)作频率分布直方图(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率/组距.)2、频率分布折线图3、茎叶图二、用样本的数字特征估计总体的数字特征*1、样本的众数:样本观测值中出现次数最多的数;*2、样本的中位数:将一组数据从按大小依次排列,处在最中间的一个数据;1、用样本的平均数估计总体的平均数:(1)设容量为n的样本数据分别为nxxx,,,21,则称nxxxxn21为这n个数据的平均数。平均数与样本数据之间的偏差最小,平均数是与样本数据最接近、最理想的近似值。(2)平均数x对数据有“取齐”的作用,代表一组数据的平均水平,定量地反映了数据集中趋势所处的水平。由于样本抽取的随意性,有时用平均数衡量总体会失之偏颇。(3)在频率分布直方图中,平均数是直方图的平衡点。2、用样本的标准差估计总体的标准差:标准差:22212()()()nxxxxxxsn方差:222212()()()nxxxxxxsn从标准差的定义知,如果样本各数据的值都相等,则标准差为0,表明数据没有波动,数据没有离散型;标准差反映数据波动的离散程度。例1:已知某班学生在一次数学考试中的成绩如下:92,88,76,91,68,94,65,58,81,73,69,75,96,81,86,8092,77,73,64,63,87,89,71,90,74,69,88,53,85,31,48,22,64,69,79,80,63,61,43,.(1)列出频率分布表(2)画出频率分布的直方图;(3)估计不及格和优秀率(80以上)练习:已知样本7,10,14,8,7,12,11,10,8,10,13,10,8,11,8,9,1,29,13,12,那么这组样本数据落在8.5——11.5范围内的概率是多少?例2:现有两种玉米.甲\乙,测得它们的高度分别为甲:25,41,40,37,22,14,19,39,21,42乙:27,16,44,27,44,16,40,40,16,40问(1)哪种玉米的苗长得高?(2)试比较哪种玉米长得整齐?分析:(1)只要比较甲、乙两种玉米的均高即可。(2)从样本的数据的收集,我们只需分析数据的离散程度就行了,而离散程度的度量就是所说的数据的方差.因此我们只需比较两组数据的方差即可.例3、为了保护学生的视力,教室内的日光灯在使用了一段时间后必须更换,已知某校使用的100只日光灯在必须换掉之前的使用天数如下表天数151—180181—210211—240241—270271—300301—330331—360361—390灯管数1111820251672(1)试估计这些灯管的平均寿命;(2)若定期更换,可选择多长时间统一更换合适?例4、为了了解某初中毕业男生的体能状况,从该校初中毕业班的学生中抽出若干名男生进行铅球测试,把所得的数据(精确到0.1米)进行整理后,分成6个小组,已知最小数据为5.25m,最大数据为10.65m,组距为0.9m,从左到右前5个小组的频率分别为0.04,0.10,0.14,0.28,0.30,第6小组的频数为7.(1)画出频率分布直方图;(2)该校参加这次测试的男生有多少人?(3)若成绩在8.0米(含8.0米)为合格,试求这次铅球测试的成绩合格率;(4)在这次测中,你能确定该校参加测试的男生铅球成绩的众数和中位数各落在哪个小组内吗?基础练习题:1、一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x=()A21B22C20D232、一个容量为20的样本,分组后,组距与频数如下:;4,]40,30(;3],30,20(;2,]20,10(,2],70,60(;4],60,50(;5,]50,40(则样本在]50,(上的频数为()A201B41C21D1073、频率分布直方图中,小长方形的面积等于()A相应各组频数B相应各组频率C组数D组距4、若样本nxxx,,,21的平均数为x,方差为2s,则样本53,,53,5321nxxx的平均数、方差分别为()A2,sxB2,53sxC29,53sxD2)53(,53sx5、在用样本频率估计总体分布过程中,下列说法正确的是()A总体容量越大,估计越精确B总体容量越小,估计越精确C样本容量越大,估计越精确D样本容量越小,估计越精确6、在100个人中,有40名学生,21名干部,29个工人,10名农民,则0.29是工人的()A频数B频率C累计频率D概率7、在某路段监测点,对200辆汽车的车速进行检测,检测结果表示为频率分布直方图,则车速不小于90km/h的汽车约有_________辆。能力提高题8、期中考试以后,班长算出了全班40个人数学成绩的平均分数为M,如果把M当做一个同学的分数,与原来的40个分数一起算,算出41个分数的平均值为N,那么,M:N为()A4140B1C4041D20.010.020.0459.569.5109.5车速Km/h频率/组距9、已知甲、乙冬小麦实验品种连续五年的平均单位面积产量如下:(单位:t/h2m)品种第一年第二年第三年第四年第五年甲9.89.910.11010.2乙9.410.310.89.79.8其中产量比较稳定的小麦品种是__________.10、一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图。为了分析居民收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样的方法抽出100人做进一步的调查,则在)3000,2500[(元)月收入段应抽出_____人。11、若10个数的平均数为3,标准差为2,则方差是________;这10个数的平方和是_____________.12、一次科技知识竞赛,两组学生成绩如下表:分数5060708090100人数甲组251013146乙组441621212已知算的这两组的平均分都是80分,请根据你所学的统计知识,进一步判断这两个组这次竞赛中成绩谁优谁劣,并说明理由。例1、略例2、解:(1)。乙甲乙甲xxcmxcmx).(31),(30(2)。乙甲乙甲222222).(8.128),(2.104sscmscms所以,乙玉米苗长得高,甲玉米苗长得齐。例3、解(1)各组中平均值分别为:165,195,225,255,285,315,345,375,由此平均数为165×1%+195×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天)。(2)求方差=2128.60.从而标准差约为46天。答:估计这些日光灯的平均寿命为268天。标准差为46天,故可在222天到314天左右统一更换。例4、解:(1)由频率分布直方图的意义可知,各小组频率之和为1,故第6小组的频率为0.14.(图略)(2)有(1)可知第6小组频率为0.14,频数为7,设参加这次测试的男生有x人,则50,14.07xx人。(3)由图可知,第4、5、6小组成绩在8米以上,其频率之和为0.28+0.30+0.14=0.72,故合格率在72%.(4)中位数落在第4小组,众数落在第5小组。(说明:在频率分布直方图中,众数为最高矩形的中点,而中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标。)【答案:1、A;8、B;9、甲;10、25人;11、4,130;解析:这10个数设为1021,xxx,由题意可得4,2,32ssx,21022212)3()3()3[(1014xxxs=…=],90180)[(10121021xxx1302102221xxx。12、(1)甲组的众数为】0.00020.00050.00040.00030.0001频率、组距月收入/元