数据的收集与统计图本章内容第5章数据的收集与抽样本课内容本节内容5.1在日常生产、生活和科学研究中,人们经常和许多数据打交道,同时也需要有目的地收集数据,从中掌握相关信息,以便作出决策和判断.动脑筋睡眠是人类生活中一项不可缺少的生理需要,也是评价健康水平的一项基本指标.充足的睡眠是青少年健康成长的必要条件之一.若请你了解本班同学的睡眠时间情况,你会怎么做?为解决这个问题,我们需要做统计调查.首先设计如下调查问卷:姓名睡眠时间A.8h以下B.8~8.5hC.8.5~9hD.9h以上利用调查问卷就可以收集本班全体同学的睡眠时间.假设某同学收回所有调查问卷后,得到了如下50个调查数据:BCBAACCDBBACCBCCDBADDCBCCAACCDBACCDBCCACCBCBCACBCC这些数据太乱了!我们整理以上数据,得到下表:睡眠时间画记人数占全班人数的百分比(%)A.8h以下918B.8~8.5hC.8.5~9hD.9h以上12236244612这个表清楚地反映了该班同学睡眠时间的情况,如睡眠8h以下有9人,占全班人数的18%.可见,我们要了解某方面的情况,就要根据实际需要收集这方面恰当数量的数据.睡眠时间画记人数占全班人数的百分比(%)A.8h以下918B.8~8.5hC.8.5~9hD.9h以上12236244612我们把与所研究问题有关的全体对象称为总体,把组成总体的每个对象称为个体.在调查全班同学的睡眠时间时,该班全体同学的睡眠时间就是这个问题的总体,每个同学的睡眠时间就是一个个体.在上面的调查中,我们对总体中每个个体都进行了调查,像这种调查方式叫做全面调查(又称普查).例如,自1953年以来,我国大约每10年进行一次的人口普查就是一次全面调查.为了了解本班同学从七年级入学到现在的身高变化情况,王强同学设计了如下调查问卷:做一做姓名入学时身高(cm)现在身高(cm)增长的高度x(cm)请你对全班同学进行调查后,将收集的数据整理成下表:增长的高度x(cm)画记人数占全班人数的百分比(%)x11≤x22≤x33≤x44≤x5x≥5回答:(1)本班同学身高增长的高度在哪个范围内的人数最多?(2)在调查中,总体和个体分别是什么?练习1.请你设计一个调查问卷,了解你所在组的同学每天参加运动所花的时间,将收集到的数据整理后,与同学交流你的结果.2.在上面的调查中,总体和个体分别是什么?这种调查是全面调查吗?答:总体:所在组的同学每天参加运动所花的时间.个体:组内每个同学每天参加运动所花的时间该调查是全面调查3.阅读下面的英语短文,填空并回答问题.Ioftengotomovieswithmyfriend,Mike.MyfavoriteactorisPaulJackson.Hehasanewmovie,Myfather’sBirthday.It’saveryfunnycomedy.MikelikestheactorRickSmith.Hereallylikeshismovie,BlackSeptember.It’saverysuccessfulthriller,butIthinkit’sboring.Oneinterestingthing:MikeisEnglish,buthelikesBeijingOpera!HeoftengoestoseeBeijingOperaonweekends.Mike’sfatherlikesit,too!(1)分组合作进行统计,并将结果填入下表:字母字母占字母出现总数的百分比(%)在短文中出现的次数在短文中出现的次数占字母出现总数的百分比(%)bɑcdefɡhijklmonpqrstuvwxyz816844688163731312132.444.882.441.2214.022.442.444.8811.280.913.963.663.962118401825266630906.405.491.2205.497.627.931.831.830.9102.740(1)这篇短文中出现次数最多的字母为;(2)这篇短文中出现次数超过4%的字母为;ea,e,h,i,n,o,r,s,t.(2)根据统计结果,回答下面的问题动脑筋人们每天都在使用计算机,你是否考虑过:各字母怎样排列在键盘上,才能使操作键盘时更加方便?键盘上使用次数多的字母应安排在手指便于控制的位置上,操作起来才方便.要确定哪些字母用的次数较多,哪些较少,就要统计出各字母出现次数所占百分比的数据.如果只对一篇英文文章中各字母出现次数所占百分比进行统计,其所得百分比能否代表所有英文文章中26个字母出现次数所占百分比?为什么?不同的英文文章,其26个字母出现次数所占百分比不会都相同,因此仅凭对一篇英文文章的统计是不够的.议一议对不同的英文文章进行统计,得到的各字母出现次数所占百分比不都相同的现象在统计上称为“随机性”.我们也不可能对所有英文文章进行统计.由于无法对所有英文文章进行调查统计,因此要调查所有英文文章中26个字母出现次数所占百分比是不可能的,因而像这种情况不可能采用全面调查的方式.动脑筋为了了解下列情况,可以采用全面调查吗?(1)调查全校同学睡眠时间的情况;(2)调查一批灯泡的使用寿命;(3)为增强市民的环保意识,调查某城镇10000户人家一年时间内丢弃的塑料袋个数.对于(1),可以进行全面调查,但比较费时、费力.对于(2),若进行全面调查,则每一个灯泡都会被破坏掉,因此不能采用全面调查.对于(3),可以进行全面调查,但费时、费力,也不必要.可以选取100户人家,调查他们一星期或一个月丢弃的塑料袋总数,再由此估算出10000户人家一年丢弃的塑料袋的数量.当不必要或不可能对某一总体进行全面调查时,我们只要从总体中抽取一部分个体进行调查,然后根据调查数据来推断总体的情况.我们把这种调查方式称为抽样调查.请举出一些只能采用抽样调查而不能采用全面调查的实例.对空气污染程度的调查……议一议从总体中抽取的一部分个体就组成了一个样本,样本中个体的个数叫做样本容量.例如,某灯泡厂6月份生产的所有灯泡的使用寿命组成一个总体,每一个灯泡的使用寿命为个体,抽出来检查的200个灯泡的使用寿命组成一个样本,样本容量为200.练习1.要调查以下问题,你认为应该做全面调查还是做抽样调查?为什么?(1)调查市场上某种食品添加剂的含量是否超标;(2)了解某大洋的海水污染质量情况;(3)了解某班同学的跳远成绩;(4)了解一批花炮的燃放质量.抽样调查抽样调查全面调查抽样调查2.分别指出下列调查中的总体、个体、样本和样本容量.(1)为调查电风扇的使用寿命,从一批电风扇中抽取20台进行测试;(2)为调查某校七年级学生每周用于做课外作业的时间,从该校七年级中抽取50名学生进行调查.答:电风扇的使用寿命为总体,每一个电风扇使用寿命为个体,抽出来20台的使用寿命为样本,样本容量为20.答:该校七年级学生每周用于做课外作业的时间为总体,该校每名七年级学生做课外作业的时间为个体,从七年级中抽出来调查的50名学生每周用于做课外作业的时间为样本,样本容量为50.动脑筋1949年,美国某杂志报道:1924年从耶鲁大学毕业的学生目前的年收入一般为25111美元(这个数字相当于当时六七个人年薪的总和).这一数据是耶鲁大学对与母校保持联系的校友的一次问卷调查后的统计结果,问这个结果能较准确地反映1924年从耶鲁大学毕业的学生的年收入吗?为什么?不能.因为这一结果来自1924年从耶鲁大学毕业的,能够联系上的,且回复了调查表的毕业生的年收入,还有一些毕业生收到调查表后没有回答,更有许多毕业生无法联系,所以这个样本不能够代表总体.抽样调查只调查了对象的一部分,必须要求所抽取的样本能够代表总体,才能根据样本对总体作出推断,否则抽样调查的结果就会偏离总体情况.如果在抽样调查时能保证每个个体都有同等的机会被选入样本,那么我们把这种抽样方法称为简单随机抽样,所得到的样本称为简单随机样本.请举出一些日常生活中用到简单随机抽样的例子.议一议通常情况下要使样本具有代表性,必须要选取合适的样本容量.样本容量太小,就不能很好地代表总体;样本容量太大,虽然样本具有代表性,但达不到省时、省力的目的.例如,为了了解某市20000名七年级学生的睡眠时间情况,我们可以使用计算机的随机数发生器从这20000名学生的注册学号(每个人的学号不同)中随机抽取200个学号.由于这种抽取方式可以保证每个学生都有同等的机会被抽取,因此这样的抽样方法是简单随机抽样.这样抽取的200个学号对应的学生的睡眠时间即组成了一个简单随机样本.当总体中的个体数不多时,我们还可以采用抽签的方法来抽取样本.动脑筋某地教育部门为了解本地区30000名中小学学生(高中生9000人,初中生10000人,小学生11000人)的近视情况,计划进行抽样调查.(1)能不能只调查高中生?答:不能只调查高中生.因为小学生、初中生、高中生的近视情况有很大不同,所以不能用某阶段学生的近视情况来代表整个地区中小学学生的近视情况.(2)若从该地区的中小学学生中抽取300名学生作为代表进行调查,你认为应当怎样抽取?答:由于各阶段学生的近视情况不同,而同一阶段的近视情况存在着一定的共性,因此,应对高中生、初中生、小学生分别进行简单随机抽样.每个阶段抽取的人数按实际学生人数的比例进行分配,如下表.中小学学生高中生初中生小学生抽取人取90003003000010000300300001100030030000这样获取的样本与这个地区中小学学生的构成基本相同,与整个地区直接进行简单随机抽样比较,这样抽取的样本一般能更好地反映总体.为了了解某方面的情况,需要根据实际情况收集一些相关数据进行统计分析,收集数据的过程一般按下面步骤进行:(1)明确调查目的;(2)确定调查对象;(3)选择调查方法;(4)具体进行调查;(5)记录调查结果.练习1.在1936年美国总统选举前,一份杂志的工作人员做了一次兰顿(当时任堪萨斯州州长)和罗斯福(当时的总统)中谁将当选下一届总统的民意调查.调查者给电话簿和车辆登记簿上的名单中的一大批人发了调查表(注意:当时只有少数人拥有电话和汽车).通过统计收回的调查表,显示兰顿非常受欢迎,于是该杂志预测兰顿将在选举中获胜,但最后实际选举结果与预测结果正好相反(如下表).候选人预测结果(%)选举结果(%)罗斯福4362兰顿5738你认为该预测结果出错的原因是什么?样本不具有代表性2.某学校想了解全校学生对学校管理工作的意见,让每个班的班长参加座谈会.这样选取的样本是简单随机样本吗?不是简单随机样3.某学校有160名教职工,其中教师120名、行政人员16名、后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.怎样抽取才能确保样本具有较好的代表性?答:教师15名、行政人员2名、后勤人员3名.中考试题例1下列调查,比较适合用普查方式而不适合用抽样调查方式的是().A.调查全省食品市场上某种食品的色素含量是否符合国家标准B.调查一批灯泡的使用寿命C.调查你所在班级全体学生的身高D.调查全国初中生每人每周的零花钱数选项A由于调查范围是全省,范围大,对象多,不易采用普查,而只能采用抽样调查;选项B由于调查灯泡的使用寿命具有一定的破坏性,因而不宜采用普查;选项C由于你所在班级学生人数不是很多,因此宜采用普查;选项D由于全国初中生太多,不宜采用普查.故应选择C.解C中考试题例2下列调查方式合适的是().A.为了了解炮弹的杀伤力,采用普查的方式B.为了了解全国中学生的睡眠状况,采用普查的方式C.为了了解人们保护水资源的意识,采用抽样调查的方式D.对载人航天飞船“神舟”五号零部件的检查,采用抽样调查的方式A项采用普查方式是不可能的,B项采用普查方式是十分困难也没有必要,D项采用抽样调查方式是不科学的,也是不允许的,只有C项选择的方式是必要的,也是可能的,故选C.解C中考试题例3要了解我国八年级学生的视力情况,你认为合适的调查方式为.本题考察的对象是我国八年