高中数学(必修3)《统计初步》知识框架图:如何描述一组数据的情况?从特征数上描述从整体分布上描述描述其集中趋势描述其波动大小平均数众数中位数方差标准差描述其在整体上的分布规律频率分布如何用样本情况估计总体情况?提出总体、个体、样本、样本容量等概念。介绍如何用样本平均数去估计总体平均数。一创设问题情景1、假若你是一名食品工作人员,要对某食店内的一批小包装饼于进行卫生达标检验。你准备怎样做?2.如何从本班学生中抽取5人参加学校的学生代表大会?3.从40件产品中抽取10件进行检查,如何抽取?4.体育彩票的中奖号码是怎样产生的?如有100张体育彩票如何确定10个中奖号码?数理统计是研究如何有效地收集,整理,分析受随机影响的数据,并对所考虑的问题作出推断或预测,直至为采取决策和行动提供依据和建议的一门学科。它是一门应用性很强的学科,凡是有大量数据出现的地方,都要用到数理统计。现在,数理统计的内容已异常丰富,成为数学中最活跃的学科之一。教科书选择了数理统计中最基本问题来介绍这门学科的思想与方法。数理统计所要解决的问题是(1)如何从总体中抽取样本,(2)对样本的整理,计算,分析和综合,然后才能对总体作统计推断。⒈什么叫简单随机抽样?一.阅读课本的内容,回答下列问题2、什么叫抽签法?3、什么叫随机数表法?它有几步骤?注意以下四点:(1)它要求被抽取样本的总体的个体数有限;(2)它是从总体中逐个进行抽取;(3)它是一种不放回抽样;(4)它是一种每个个体被抽到的机会都相等的抽样。一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。1、简单随机抽样抽签法2.随机抽样的具体实施方法:随机数表法1、抽签法先将总体中的所有个体(共N个)编号(号码可以从1到N),并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本。2、用随机数表法进行抽取随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素(1)随机数表是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的。(2)随机数表并不是唯一的,因此可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。(3)用随机数表进行抽样的步骤:⒈将总体中个体编号;⒉选定开始的数字;⒊获取样本号码。(4)由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的。练习:请自行设计一个抽样方法,从某校高二(19)班60人中抽取10人参加初中招生服务队。(1)先将学生编号,号码为01至60,解:(2)规则:从随机数表第七行第13列开始,向右读数,碰到右边线时向下错一行向左继续取。(3)根据规则,所取的数为:24060447213350251225当总体的个数较多时,采用简单随机抽样太麻烦,这时将总体分成均衡的部分,然后按照预先定出的规则,从每一部分中抽取1个个体,得到所需要的样本,这种抽样称为系统抽样。2.系统抽样系统抽样的步骤为:(1)采取随机方式将总体中的个体编号。(2)将整个的编号均衡地分段,确定分段间隔k。是整数时,;不是整数时,从N中剔除一些个体,使得其为整数为止。nNnNknN(3)第一段用简单随机抽样确定起始号码l(l≤k)。(4)按照规则抽取样本:l;l+k;l+2k;……l+nk用系统抽样方法,从某校高二(19)班60人中抽取6人参加初中招生服务队。练习:解:(1)将学生随机编号,号码为01至60。(2)将编号均匀分段,分段的间隔为60/6=10(3)规则:在第一段用简单随机抽样法取一个数a,然后再将a加上10得第二个数,将(a+10)再加上10,得第三个数,这继续下去,直到获取样本。则所得的样本为:0616263646563.分层抽样当已知总体由差异明显的几部分组成时,为了使样本充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样。这种抽样叫做分层抽样。说明:1、分层抽样适用于总体由差异明显的几个部分组成。2、在每一层进行抽样时,采用简单随机抽样或系统抽样;3、分层抽样也是等概率抽样。4、每一层的个数不同,则抽取的个数也应不同。例、一个单位的职工有500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?(1)抽取人数与职工总数的比是100:500=1:5,解:(2)各层抽出的职工数分别为:25,51为125取不到35岁的职工数565149岁的人数为280取35195195取50岁以上的人数为学习目的1、能掌握各种抽样方法,以及各抽样方法的步骤;2、能正确区分使用哪一种抽样方法;3、掌握各抽样方法中每个个体被抽取的概率都相等,并能解决简单的应用问题。1、简单随机抽样的方法:①、抽签法②、随机数表法用随机数表进行抽样的步骤:⒈将总体中个体编号;⒉选定开始的数字,制定规则;⒊获取样本号码。2,系统抽样的步骤为:(1)采取随机方式将总体中的个体编号。(2)将整个的编号均衡地分段,确定分段间隔k。是整数时,;不是整数时,从N中剔除一些个体,使得其为整数为止。nNnNknN(3)第一段用简单随机抽样确定起始号码l。(4)按照规则抽取样本:l;l+k;l+2k;……l+nk3,分层抽样的抽取步骤:(1)总体与样本容量确定抽取的比例。(2)由分层情况,确定各层抽取的样本数。(3)各层的抽取数之和应等于样本容量。(4)对于不能取整的数,求其近似值。各层个数总体个数样本容量各层抽取个数总体个数样本容量抽取比例每层的抽取方法为简单随机抽样或系统抽样4.三种抽样方法的比较题型探究题型一简单随机抽样例1一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为__________.解析:每个个体被抽取的概率均为P=5100=120,故答案为120.答案:120点评:当从一个容量为N的总体中,抽取一个容量为n的样本时,每个体被抽取的概率均为P=nN.变式探究1利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二个抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为()A.13B.514C.14D.1027解析:由题意知9n-1=13,∴n=28.∴P=1028=514.答案:B题型二系统抽样例2某校高中三年级的295名学生已经编号为1,2,…,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.解析:按照1∶5的比例,应该抽取的样本容量为295÷5=59,我们把295名同学分成59组,每组5人.第1组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,第59组是编号为291~295的5名学生.采用简单随机抽样的方法,从第1组5名学生中抽出一名学生,不妨设编号为l(1≤l≤5),那么抽取的学生编号为l+5k(k=0,1,2,…,58),得到59个个体作为样本,如当l=3时的样本编号为3,8,13,…,288,293.点评:在抽样过程中,当总体中个体较多时,可采用系统抽样的方法进行抽样,系统抽样的步骤为:①采用随机的方法将总体中个体编号;②将整体编号进行分段,确定分段间隔k(k∈N*);③在第1段内采用简单随机抽样的方法确定起始个体编号l;④按照事先预定的规则抽取样本.变式探究2某单位有在岗职工624人,为了调查工人用于上班途中的时间,决定抽取68名工人进行调查.如何用系统抽样方法完成这一抽样?解析:因为624=68×9+12,为了保证“等距”分段,应先剔除12人.第一步:将624名职工按随机方式进行编号;第二步:从总体中剔除12人(剔除方法可用随机数表法),将剩下的612名职工重新编号(分别为000,001,002,…,611),并分成68段;第三步:在第1段000,001,002,…,008这9个编号中,用简单随机抽样方法抽出一个,不妨设编号为k作为起始号码;第四步:在各段中抽取的职工编号为k+9l(l=0,1,2,…,67),得到68个个体作为样本,如k=003时样本为003,012,021,…,606.题型三分层抽样例3某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施抽取.解析:用分层抽样方法抽取.具体实施抽取如下:(1)∵20∶100=1∶5,∴105=2,705=14,205=4.∴从副处级以上干部中抽取两人,从一般干部中抽取14人,从工人中抽取4人.(2)因副处级以上干部与工人的人数较少,他们分别按1~10编号与1~20编号,然后采用抽签法分别抽取2人和4人;将一般干部编号为00,01,02,…,69,然后用随机数表法抽取14人.(3)将2人,4人,14人的编号汇合在一起就取得了容量为20的样本.点评:从例题看分层抽样是一种实用性、操作性强,应用比较广泛的抽样方法,但必须保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.变式探究3某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的14,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层抽样方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:(1)游泳组中,青年人、中年人、老年人分别所占的比例;(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.解析:(1)设登山组人数为x,游泳组中,青年人、中年人、老年人各占比例分别为a、b、c,则有x·40%+3xb4x=47.5%,x·10%+3xc4x=10%,解得b=50%,c=10%.故a=100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%.(2)游泳组中,抽取的青年人数为200×34×40%=60人;抽取的中年人数为200×34×50%=75人;抽取的老年人数为200×34×10%=15人.归纳总结•方法与技巧1.简单随机抽样是系统抽样和分层抽样的基础,是一种等可能的抽样,由定义应抓住以下特点:①它要求总体个数较少;②它是从总体中逐个抽取的;③它是一种不放回抽样.2.系统抽样又称等距抽样,号码序列一确定,样本即确定了,但要求总体中不能含有一定的周期性,否则其样本的代表性是不可靠的,甚至会导致明显的偏向.3.抽样方法经常交叉使用,比如系统抽样中的第一均衡部分,可采用简单随机抽样.分层抽样中,若每层中个体数量仍很大时,则可辅之以系统抽样.•失误与防范分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意几点:①分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,两层之间的样本差异要大,且互不重叠;②为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同;③在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.新题速递1.(2012·山东卷)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为()A.7B.9C.10D.15解析:由已知条件可知,应该把总体分成32组,每组9603