1.会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法.2.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.3.理解样本数据标准差的意义和作用,会计算数据标准差,并能做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.会用统计思想解决一些简单的实际问题.5.通过实际问题,借助直观(如实际问题的直方图),认识正态分布曲线的特点及曲线所表示的意义.121._______.231nxnxxxx平均数:一组数据的平均数,记为设有个数据,,,,则平均数为①中位数:一组数据按照从小到大或从大到小的顺序进行排列时,处于中间位置的数.当这组数据的个数为奇数时,中位数为中间一个数;当这组数据的个数为偶数时,中位数为中间.数据的基本数字特征的两个数的平均数.众数:一组数据中出现次数最多的数.2245s______________________.6.ss极差:一组数据中最大数与最小数的差.方差:一组数据中所有数与平均数的差的平方和的平均数,记为,即②标准差:方差的算术平方根,记作12()()()()()()23基本统计图表:象形、条形、折线、直方图、茎叶图.频率分布直方图的画图步骤:ⅰ求极差;ⅱ决定组距与组数;ⅲ将数据分.组;频率ⅳ列频率分布表;ⅴ画频率分布直方图以为纵坐标.组距频率分布折线图:连接频率分布直方图中各小长方形上端的中点所主要统计图表得的折线.45()总体密度曲线:随着样本容量的增加,作频率分布折线图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,则称这条光滑曲线为总体密度曲线.茎叶图:中间的数字表示数据的十位十位和百位数字,旁边的数字分别表示两组数据中各个数据的个位数字.1Nn(nN)____________________.()__________3Nnn简单随机抽样:从含有个个体的总体中逐个不放回地抽取个个体作为样本,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做③有两种常用方法:ⅰ④:就是把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中取出一个号签,连续抽取次,就得到一个容量.抽样方法为的样本.()________________2()()()1()()3____________________________.Nkllkⅱ⑤:利用随机数表、随机数骰子或计算机产生的随机数进行抽样.系统抽样:按下列步骤进行抽样:ⅰ先将总体的个个体编号;ⅱ确定分段间隔,对编号进行分段;ⅲ在第段用简单随机抽样确定第一个个体编号;ⅳ按照一定的规则抽取样本.分层抽样:即⑥21__________________________________.()()d_________4___.baxNabPabxx,,如果随机变量的概率密度为⑦其中、分别表示总体的平均数与标准差,称服从参数为、的正态分布,记作~,,函数图象称为正态密度曲线,简称正态曲线.一般的,如果对于任何实数,随机变量满足,则称.正态分布的分布为⑧2____________0,10,13()()()NNxxxx标准正态分布在正态分布中,当⑨,⑩时,正态总体称为标准正态总体,正态分布,称为标准正态分布,记作~.正态曲线的性质ⅰ曲线在轴的上方,与轴不相交;ⅱ曲线关于直线对称;ⅲ曲线在时位于最高点;()x()xxⅳ当时,曲线上升;当时,曲线下降,并且当曲线向左、右两边无限延伸时,以轴为渐近线向它无限靠近;ⅴ当一定时,曲线的形状由确定,越大,曲线越“矮胖”,表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中.22224().5()()0.6826(22)0.9544(33)0.9974.6()______________________3NEDXNPXPXPXNX若~,,则,若~,,则,,通常认为服从正态分布,的随机变量只取⑪,并简称之为原则.222221212()2.......1(())201(33)nnxxxxxxxxxxnnex①;②;③简单随机抽样;④抽签法;⑤随机数表法;⑥在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽出一定数量的个体,将各层取出的个体合在一起作为样本;⑦,;⑧正态分布;⑨;⑩;⑪,【要点指南】之间的值1.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为()A.10人B.12人C.24人D.30人【解析】抽取男运动员的人数为2148+36×48=12人,故选B.2.已知某商场新进3000瓶食用油,为检查其是否达标,现采用系统抽样的方法从中抽取150瓶进行检查,若第一组抽出的号码是11,则第六十一组抽出的号码为1211.【解析】每组瓶数:d=3000150=20,由题这些号码是以11为首项,20为公差的等差数列a61=11+60×20=1211.3.有一个容量为200的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为()A.18B.36C.54D.72【解析】由图可知样本数据在[10,12)内的频率为0.18,则样本数据在区间[10,12)内的频数为36,故选B.4.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2=3.2.【解析】因为x-=15(10+6+8+5+6)=7,所以s2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=3.2.5.已知随机变量X服从正态分布N(2,σ2),且P(X4)=0.8,则P(0X2)=0.3.【解析】因为μ=2,所以P(X4)=1-P(X≥4)=0.8,所以P(X≥4)=P(X≤2)=0.2,所以P(0X2)=12P(0X4)=12(1-2×0.2)=0.3.一用样本估计总体【例1】在某次测验中,有6位同学的平均成绩为75分.用xn表示编号为n(n=1,2,…,6)的同学所得成绩,且前5位同学的成绩如下:(1)求第6位同学的成绩x6,以及这6位同学成绩的标准差s;(2)从前5位同学中,随机地选2位同学,求恰有1位同学成绩在区间(68,75)中的概率.【解析】(1)因为这6位同学的平均成绩为75分,所以16(70+76+72+70+72+x6)=75,所以x6=90,即第6位同学的数学成绩为90分,这6位同学成绩的方差为s2=16×[(70-75)2+(76-75)2+(72-75)2+(70-75)2+(72-75)2+(90-75)2]=49,所以标准差s=7.(2)从前5位同学中随机选取2位同学,共有C25=10种结果,恰有一位同学的成绩在(68,75)中有(70,76),(76,72),(76,70),(76,72)共4种结果,故所求概率为P=410=0.4.【点评】用样本估计总体即用样本的平均值、方差、标准差估计总体的平均值、方差和标准差.设矩形的长为a,宽为b,其比满足b∶a=5-12≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.5980.6250.6280.5950.639乙批次:0.6180.6130.5920.6220.620素材1根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是()A.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值更接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定【解析】甲批次的平均数为0.617,乙批次的平均数为0.613.所以,可以估计甲批次的总体平均数与标准值更接近,故选A.二茎叶图及应用【例2】(2012·深圳第一次调研)第26届世界大学生夏季运动会将于2011年8月12日到23日在深圳举行,为了搞好接待工作,组委会在某学院招募了12名男志愿者和18名女志愿者.将这30名志愿者的身高编成如下所示的茎叶图(单位:cm):若身高在175cm以上(包括175cm)定义为“高个子”,身高在175cm以下(不包括175cm)定义为“非高个子”,且只有“女高个子”才担任“礼仪小姐”.(1)如果用分层抽样的方法从“高个子”和“非高个子”中抽取5人,再从这5人中选2人,那么至少有一人是“高个子”的概率是多少?(2)若从所有“高个子”中选3名志愿者,用ξ表示所选志愿者中能担任“礼仪小姐”的人数,试写出ξ的分布列,并求ξ的数学期望.【解析】(1)根据茎叶图,有“高个子”12人,“非高个子”18人,用分层抽样的方法,每个人被抽中的概率是530=16,所以选中的“高个子”有12×16=2人,“非高个子”有18×16=3人.用事件A表示“至少有一名‘高个子’被选中”,则它的对立事件A-表示“没有一名‘高个子’被选中”,则P(A)=1-C23C25=1-310=710.因此,至少有一人是“高个子”的概率是710.(2)依题意,ξ的可能取值为0,1,2,3,则P(ξ=0)=C38C312=1455,P(ξ=1)=C14C28C312=2855,P(ξ=2)=C24C18C312=1255,P(ξ=3)=C34C312=155.因此,ξ的分布列如下:所以Eξ=0×1455+1×2855+2×1255+3×155=1.【点评】了解茎叶图的绘制思想,会由茎叶图还原样本数据,并能应用样本估计总体的思想分析解决实际问题.甲、乙两位学生参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,具体成绩如图所示,且甲学生的平均分为85分.素材2(1)观察茎叶图,求图中的x;(2)若要从中选派一人参加数学竞赛,你认为选派哪位学生参加合适?请说明理由;(3)若将频率视为概率,对甲同学在今后的3次数学竞赛成绩进行预测,成绩中高于80分为合格,甲不放过每次考试机会,获得合格即终止考试;记甲同学参加考试的次数为ξ,求ξ的分布列及数学期望Eξ.【解析】(1)x-甲=93+95+81+82+80+x+88+78+798=85,解得x=4.(2)派甲参赛比较合适.理由如下:因为x-甲=85,x-乙=90+92+95+80+80+83+85+758=85,s2甲=35.5,s2乙=41,所以x-甲=x-乙,s2甲s2乙,所以甲的成绩较稳定,派甲参赛比较合适.(3)ξ可能取的值为1,2,3.P(A)=68=34.由于P(ξ=1)=P(A)=68=34,P(ξ=2)=14×34=316,P(ξ=3)=14×14×1=116.则ξ的分布列为ξ123P0.750.18750.0625故ξ的数学期望为Eξ=1.3125.【例3】某班同学在“两会”期间进行社会实践活动,对[25,55]岁的人群随机抽取n人进行了一次当前投资生活方式——“房地产投资”的调查,得到如下统计表和各年龄段人数频率分布直方图:(1)补全频率分布直方图并求n,a,p的值;(2)从年龄在[40,50)岁的“房地产投资”人群中采用分层抽样法抽取18人参加投资管理学习活动,其中选取3人作为代表发言,记选取的3名代表中年龄在[40,45)岁的人数为X,求X的分布列和期望EX.【解析】(1)由题意可知,第二组的频率为1-(0.04+0.04+0.03+0.02+0.01)×5=0.3,所以第二组的频率组距=0.35=0.06,频率分布直方图如下:第一组的人数为1200.6=200,频率