23.4用样本估计总体1.计算样本平均数和标准差使学生认识到只有样本容量足够大,才能比较准确地反映总体的特性,这样的样本才可靠,体会只有可靠的样本,才能用样本去估计总体.2.通过实例,使学生体会用样本估计总体的思想,能够根据统计结果作出合理的判断和推测,能与同学进行交流,用清晰的语言表达自己的观点.我们知道在选取样本时应注意的问题,其一是所选取的样本必须具有代表性,其二是所选取的样本的容量应该足够大,这样的样本才能反映总体的特性,所选取的样本才比较可靠.随机抽样调查是了解总体情况的一种重要的数学方法,抽样是它的一个关键,上节课介绍了简单的随机抽样方法,即用抽签的方法来选取样本,这使总体的每个个体都有相等的机会被选入样本.判断下面这些抽样调查选取样本的方法是否合适,若不合适,请说明理由.(1)为调查江苏省的环境污染情况,调查了长江以南的南京市、常州市、苏州市、镇江市、无锡市的环境污染情况.(2)从100名学生中,随机抽取2名学生,测量他们的身高来估算这100名学生的平均身高.(3)从一批灯泡中随机抽取50个进行试验,估算这批灯泡的使用寿命.(4)为了解观众对中央电视台第一套节目的收视率,对所有上因特网的家庭进行在线调查.解:(1)不合适.因为调查对象在总体中必须有代表性,现在所调查的这些地方的环境污染情况仅仅代表了长江以南地区,并不能代表整个江苏省的环境污染情况.(2)不合适.因为抽样调查时所抽取的样本要足够大,现在只抽取了2名学生的身高,不能用来估算100名学生的平均身高.(3)合适.(4)不合适.虽然调查的家庭很多,但仅仅增加调查的数量,不一定能够提高调查质量,本题中所调查的仅代表上因特网的家庭,不能代表全部的家庭,因此这样的抽样调查不具有普遍代表性.从300名学生的考试成绩中随机抽取几名学生的成绩,考察一下抽样调查的结果是否可靠,老师选取的一个样本是:随机数(学号)11125416794276成绩8086669167它的频数分布直方图、平均成绩和标准差分别如下:另外,同学们也分别选取了一些样本,它们同样也包含五个个体,如下表:随机数(学号)13224559889成绩7873766975同样,也可以作出这两个样本的频数分布直方图、计算它们的平均成绩和标准差,如图所示:随机数(学号)901678627554成绩7286838282样本平均成绩为81分,标准差为4.73分样本平均成绩为74.2分,标准差为3.06分从以上三张图比较来看,它们之间存在明显的差异,平均数和标准差与总体的平均数与标准差也相差甚远,显然这样选择的样本不能反映总体的特性,是不可靠的.【规律方法】当样本中个体太少时,样本的平均数、标准差往往差距较大,如果选取适当的样本的个体数,各个样本的平均数、标准差与总体的平均数、标准差相当接近.对于简单随机样本,可以用样本的百分比去估计总体的百分比(收视率、次品率、合格率等).也可以用样本的平均数去估计总体的平均数;用样本的方差去估计总体的方差.北京在这30天的空气污染指数及质量级别,如下表所示:体会用样本估计总体的合理性经比较可以发现,虽然从样本获得的数据与总体的不完全一致,但这样的误差还是可以接受的,是一个较好的估计.随着样本容量(样本中包含的个体的个数)的增加,由样本得出的平均数往往会更接近总体的平均数,数学家已经证明随机抽样方法是科学而可靠的.对于估计总体特性这类问题,数学上的一般做法是给出具有一定可靠程度的一个估计值的范围.加权平均数的求法问题1:在计算20个男同学平均身高时,小华先将所有数据按由小到大的顺序排列,如下表所示:然后,他这样计算这20个学生的平均身高:小华这样计算平均数可以吗?为什么?47.1608.1603.1622.161+++问题2:假设你们年级共有四个班级,各班的男同学人数和平均身高如表所示.小强这样计算全年级男同学的平均身高:小强这样计算平均数可以吗?为什么?为了估计一批鸡蛋中每个鸡蛋的平均质量p,小红专挑个儿大的鸡蛋30个,称得总质量为1.8kg.小明随意拿出40个鸡蛋,称得总质量为2.2kg.(1)分别计算小红、小明选出的鸡蛋的平均质量.(2)用样本平均数估计p,小红和小明谁的结果更客观些?121.8100060g302.2100055g40xx小明的结果更客观些,估计p为55.1.为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:(1)在这个问题中,总体、个体、样本和样本容量各是什么?(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径.解:(1)总体是要检查的这批手榴弹的杀伤半径的全体;个体是每一颗手榴弹的杀伤半径;样本是所抽取的20颗手榴弹的杀伤半径;样本容量是20.(2)在20个数据中,10出现了6次,次数最多,所以众数是10米.20个数据从小到大排列,第10个和第11个数据是最中间的两个数,分别为9米和10米,所以中位数是9.5米.样本平均数是9.4米.2.为估计一次性木质筷子的用量,2010年从某县共600家高、中、低档饭店抽取10家作样本,这些饭店每天消耗的一次性筷子盒数分别为:0.6、3.7、2.2、1.5、2.8、1.7、1.2、2.1、3.2、1.0(1)通过对样本的计算,估计该县2010年消耗了多少盒一次性筷子(每年按350个营业日计算);(2)2012年又对该县一次性木质筷子的用量以同样的方式作了抽样调查,调查的结果是10个样本饭店,每个饭店平均每天使用一次性筷子2.42盒.求该县2011年、2012年这两年一次性木质筷子用量平均每年增长的百分率(2012年该县饭店数、全年营业天数均与2010年相同);(3)在(2)的条件下,若生产一套学生桌椅需木材0.07m3,求该县2012年使用一次性筷子的木材可以生产多少套学生桌椅.计算中需用的有关数据为:每盒筷子100双,每双筷子的质量为5g,所用木材的密度为0.5×103kg/m3;(4)假如让你统计你所在省一年使用一次性筷子所消耗的木材量,如何利用统计知识去做,简要地用文字表述出来.解:(1)所以,该县2010年消耗一次性筷子为2×600×350=420000(盒)(2)设平均每年增长的百分率为x,则2(1+x)2=2.42,解得x1=0.1=10%,x2=-2.1(不合题意,舍去)所以,平均每年增长的百分率为10%.(3)可以生产学生桌椅套数为(套)1x=(0.6+3.7+2.2+1.5+2.8+1.7+1.2+2.1+3.2+1.0)=2.01030.0052.42100600350=72600.5100.07(4)先抽取若干个县(或市、州)作样本,再分别从这些县(或市、州)中抽取若干家饭店作样本,统计一次性筷子的用量.1.(南通·中考)某纺织厂从10万件同类产品中随机抽取了100件进行质检,发现其中有5件不合格,那么估计该厂这10万件产品中合格品约为()A.9.5万件B.9万件C.9500件D.5000件答案:A2.(凉山·中考)2010年因干旱影响,凉山州政府鼓励居民节约用水,为了解居民用水情况,在某小区随机抽查了20户家庭的月用水量,结果如下表:则关于这20户家庭的月用水量,下列说法错误的是()A.中位数是6吨B.平均数是5.8吨C.众数是6吨D.极差是4吨答案:D月用水量(吨)45689户数457313.(嘉兴·中考)李大伯有一片果林,共有80棵果树.某日,李大伯开始采摘今年第一批成熟的果子,他随机选取2棵果树共摘得10个果子,质量分别为(单位:㎏):0.28,0.26,0.24,0.23,0.25,0.24,0.26,0.26,0.25,0.23.以此估算,李大伯收获的这批果子的单个质量和总质量分别约为()A.0.25㎏,200㎏B.2.5㎏,100㎏C.0.25㎏,100㎏D.2.5㎏,200㎏答案:C1.一般来说,用样本估计总体时,样本容量越大,样本对总体的估计也就越精确.相应地,搜集、整理、计算数据的工作量也就越大.因此,在实际工作中,样本容量既要考虑问题本身的需要,又要考虑实现的可能性和所付出的代价的大小.2.随机抽样是经过数学证明了的可靠的方法,它对于估计总体特征是很有帮助的.