第55讲用样本估计总体

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第55讲用样本估计总体知识梳理一、用样本的频率分布估计总体分布1.样本中所有数据(或者数据组)的频数和样本容量的比,就是该数据的_频率_,所有数据(或者数据组)的频率的分布变化规律叫做__频率分布__,可以用频率分布表、_频率分布直方图_、频率分布折线图、茎叶图等来表示.2.作频率分布直方图的步骤:(1)求极差,即一组数据中_最大值_与_最小值_的差;(2)决定_组距与组数__;(3)将数据_分组__;(4)列_频率分布表__;(5)画频率分布直方图.在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各小长方形的__面积__表示,各小长方形的面积的总和__等于1__.3.总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的__中点___,就得到频率分布折线图;(2)总体密度曲线:如果样本容量不断增大,作图所分的__组数__增加,__组距__减小,相应的频率折线图会越来越接近于一条_光滑曲线__,统计中称这条_光滑曲线_为总体密度曲线.4.茎叶图:统计中有一种被用来表示数据的图叫茎叶图,茎指中间的_列数_,叶是从茎的旁边_生长出来的数_.在样本数据较少时,用茎叶图表示数据的效果较好,茎叶图表示数据有两个突出的优点:一是它较好地保留了_原始数据_信息,二是能够展示数据的__分布__情况,方便记录与表示.二、样本的数字特征1.众数:一组数据中出现__次数__最多的数据叫做众数.2.中位数:将一组数据从小到大(或从大到小)依次排列,把_中间_数据(或__中间两数据___的平均数)叫做中位数,中位数把样本数据分成了相同数目的两部分.3.平均数:x1,x2,…,xn的平均数x=______________________.由于众数仅能刻画某一数据出现的次数较多,中位数对极端值不敏感,而平均数又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.4.标准差与方差考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s表示s=______标准差的平方s2叫做方差,s2=_____其中xn是______,n是______,x是______.疑难辨析1.频率分布直方图(1)在频率分布直方图中,小矩形的高表示频率.()(2)频率分布直方图中各个长方形的面积之和为1.()2.茎叶图的特点(1)茎叶图中的数据都是原始数据.()(2)茎叶图只能分析一组数据.()3.数字特征(1)中位数一定出现在所给的样本数据中.()(2)比赛中,计算选手得分时,去掉一个最高分和最低分对比赛结果影响不大.()(3)在频率分布直方图中,众数左边和右边的直方图的面积相等.()(4)标准差越小,样本数据的波动也越小.()(5)用样本的数字特征估计总体的数字特征时,只需求出平均数就可以了.()考点一利用样本的频率分布估计总体分布例1(1)[2012·琼海一模]为了了解某校高三400名学生的数学学业水平测试成绩,制成样本频率分布直方图如图,规定不低于60分为及格,不低于80分为优秀,则及格率与优秀人数分别是()A.60%,60B.60%,80C.80%,80D.80%,60(2)[2012·山东卷]如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为________.归纳总结对频率分布直方图和茎叶图识图不准是常见的错误,在频率分布直方图中,小矩形的高=频率组距=频数组距×样本容量,频率=频率组距×组距=小矩形的面积.考点二茎叶图在数据处理中的应用例2(1)[2012·陕西卷]从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示,设甲乙两组数据的平均数分别为x甲,x乙,中位数分别为m甲,m乙,则()A.x甲x乙,m甲m乙B.x甲x乙,m甲m乙C.x甲x乙,m甲m乙D.x甲x乙,m甲m乙(2)如图是某年青年歌手大奖赛中,七位评委为甲乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则一定有()A.a1a2B.a1a2C.a1=a2D.a1,a2的大小与m的值有关归纳总结茎叶图刻画数据的优点:①所有数据信息都可在茎叶图中看到.②茎叶图便于记录和表示,且能够展示数据的分布情况.考点三利用样本数字特征估计总体的数字特征例3[2012·焦作质检]甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲:8281797895889384乙:9295807583809085(1)画出甲、乙两位学生成绩的茎叶图,指出学生乙成绩的中位数;(2)现要从中选派一人参加数学竞赛,从平均状况和方差的角度考虑,你认为派哪位学生参加合适?请说明理由.归纳总结利用频率分布直方图估计样本的数字特征:①中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可估计中位数的值.②平均数:平均数是频率分布直方图的“重心”,等于图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.③众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标.变式题[2012·广东卷]某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x∶y1∶12∶13∶44∶5习题1[2012·银川一中期末]甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.2[2012·北京丰台区二模]某地区农科所为了选择更适应本地区种植的棉花品种,在该地区选择了5块土地,每块土地平均分成面积相等的两部分,分别种植甲、乙两个品种的棉花,收获时测得棉花的亩产量如图所示:请问甲、乙两种棉花哪种亩产量更稳定,并说明理由.3[2012·惠州二调]一组数据共有7个整数,记得其中有2,2,2,4,5,10,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为()A.-11B.3C.17D.94对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如下表:甲273830373531乙332938342836(1)画出茎叶图,由茎叶图你能获得哪些信息?(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、中位数、标准差,并判断选谁参加比赛更合适.课后习题(用样本估计总体)1.将一容量为m的样本分成3组,第一组的频数为10,第二、三组的频率分别为0.35和0.45.则m的值为()A.35B.40C.45D.502.[2013·豫南九校联考]一次选拔运动员,测得7名选手的身高(单位:cm)分布茎叶图如图K55-1,测得平均身高为177cm,有一名候选人的身高记录不清楚,其末位数记为x,那么x的值为()A.5B.6C.7D.8图K55-1图K55-23.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们在这11场比赛的得分用茎叶图(如图K55-2)表示,设甲运动员得分的中位数为M1,乙运动员得分的中位数为M2,则在下列选项中,正确的是()A.M1=18,M2=12B.M1=81,M2=21C.M1=8,M2=2D.M1=3,M2=14.一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如图K55-3).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[2500,3000)(元)月收入段应抽出________人.5.[2013·北京东城区二模]将容量为n的样本中的数据分成6组,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n的值为()A.70B.60C.50D.406.[2013·江西卷]样本(x1,x2,…,xn)的平均数为x,样本(y1,y2,…,ym)的平均数为y(x≠y).若样本(x1,x2,…,xn,y1,y2,…,ym)的平均数z=αx+(1-α)y,其中0α12,则n,m的大小关系为()A.nmB.nmC.n=mD.不能确定图K55-47.[2013·北京西城区二模]如图K55-4是1,2两组各7名同学体重(单位:kg)数据的茎叶图.设1,2两组数据的平均数依次为x1和x2,标准差依次为s1和s2,那么()A.x1x2,s1s2B.x1x2,s1s2C.x1x2,s1s2D.x1x2,s1s28.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图K55-5所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差图K55-69.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如图K55-6.由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为()A.0.27,78B.0.27,83C.2.7,78D.2.7,8310.[2013·黄冈质检]2013年春运期间铁道部门首次实行网上订购火车票,并且规定旅客可以提前10天预订,对60名在网上订票的旅客进行调查后得到下表:网上提前预订车票的时间(天)0~22~44~66~88~10旅客人数36181815则旅客平均提前预订车票的时间大约为________天.图K55-711.[2013·乌鲁木齐三诊]为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳测试.如图K55-7所示的是对200名学生测试所得数据的频率分布直方图,若次数在110以上(含110次)为达标,则从图中可以看出高一学生的达标率是________.12.[2013·广东卷]由正整数组成一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为________(从小到大排列).图K55-813.某班有50名学生,在一次百米测试中,成绩全部在13s与18s之间,将测试成绩分成五组:第一组[13,14),第二组[14,15),…,第五组[17,18].图K55-8是按上述分组方法得到的频率分布直方图,若成绩大于或等于15s,且小于17s认为良好,则该班在这次百米测试中成绩良好的人数是________.14.(10分)[2013·保定八校联考]某校高三年级共有450名学生参加英语口语测试,其中男生250名,女生200名.现按性别用分层抽样的方法从中抽取45名学生的成绩.[来源:学+科+网](1)求抽取的男生与女生的人数?(2)从男生和女生中抽查的结果分别如下表1和表2.表1成绩分组[60,70)[70,80)[80,90)[90,100]人数3m86表2成绩分组[60,70)[70,80)[80,90)[90,100]人数25n5分别估计男生和女生的平均分数,并估计这450名学生的平均分数(精确到0.01).15.(13分)在

1 / 5
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功