1高2011级高二上期末复习讲义必修3统计知识点复习一一、、知知识识回回顾顾1、统计的的基本思想是:用样本的某个量去估计总体的某个量总体:在统计中,所有考察对象的全体。个体:总体中的每一个考察对象。样本:从总体中抽取的一部分个体叫做这个总体的一个样本。样本容量:样本中个体的数目。2、抽样方法:要求:总体中每个个体被抽取的机会相等(1)简单随机抽样:抽签法和随机数表法特点是:不放回、等可能.抽签法步骤(1)先将总体中的所有个体(共有N个)编号(号码可从1到N)(2)把号码写在形状、大小相同的号签上,号签可用小球、卡片、纸条等制作(3)将这些号签放在同一个箱子里,进行均匀搅拌(4)抽签时,每次从中抽出一个号签,连续抽取n次(5)抽出样本随机数表法步骤(1)将总体中的个体编号(编号时位数要统一);(2)选定开始的数字;(3)按照一定的规则读取号码;(4)取出样本(2)系统抽样特点:容量大、等距、等可能.步骤:1.编号,随机剔除多余个体,重新编号2.分段(段数等于样本容量),确定间隔长度k=N/n3.抽取第一个个体编号为i4.依预定的规则抽取余下的个体编号为i+k,i+2k,…2高2011级高二上期末复习讲义(3)分层抽样特点:总体差异明显、按所占比例抽取、等可能.步骤:1.将总体按一定标准分层;2.计算各层的个体数与总体的个体数的比;3.按比例确定各层应抽取的样本数目4.在每一层进行抽样三种抽样方法的比较:类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的可能性(即概率)是相等的从总体中逐个抽取最基本的抽样方法总体容量较少系统抽样将总体均匀分成几部分,按预先确定出的规则在各部分抽取每一部分进行抽样时,采用的是简单随机抽样总体容量较多分层抽样将总体分成几部分,每一部分按比例抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成3、用样本估计总体1)用样本的频率分布估计总体的分布作样本频率分布直方图的步骤:(1)求极差;(2)决定组距与组数;(组数=极差/组距)(3)将数据分组;(4)列频率分布表(分组,频数,频率);(5)画频率分布直方图。茎叶图作图步骤:1.将每个数据分为茎(高位)和叶(低位)两部分.2.将最小茎和最大茎之间的数按大小顺序排成一列,写在左(右)侧;3.将各个数据的叶按大小次序写在其右(左)侧.2)用样本的数据特征估计总体的数据特征(1)、在频率直方图中计算众数、平均数、中位数众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。中位数在频率分布直方图中,中位数左边和右边的直方图的面积应该相等平均数频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和(2)、标准差和方差:描述了数据的波动范围,离散程度标准差222121[()()()]nsxxxxxxn方差2222121[()()()]nsxxxxxxn4.两变量之间的关系(1)相关关系——非确定性关系(2)函数关系——确定性关系3高2011级高二上期末复习讲义(第8题)240027003000330036003900体重00新疆源头学子小屋特级教师王新敞@126.comwxckt@126.com王新敞特级教师源头学子小屋新疆001频率/组距5.回归直线方程:axbyxbyaxnxyxnyxxxyyxxbniiniiiniiniii,)())((1221121二二、、课课前前练练习习::1.对总数为N的一批零件抽取一个容量为30的样本,若每个零件被抽到的概率为0.25,则N的值为————.2.某校有学生2000人,其中高三学生500人.为了解学生身体情况,采用按年级分层抽样的方法,从该校学生中抽取一个200人的样本,则样本中高三学生的人数为3.将参加数学竞赛的1000名学生编号如下:0001,0002,0003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,0003,…,0020,第一部分随机抽取一个号码为0015,则抽取的第40个号码为.4一个容量为20的样本数据,分组后,组距与频数如下:10,20,2;20,30,3;30,40,4;40,50,5;50,60,4;60,70,2.则样本在区间,50上的频率为_____5.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在(2700,3000]的频率为6已知数据12nxxx,,,的平均数为5x,则数据137x,237x,…,37nx的平均数为.7.数据a1,a2,a3,…,an的方差为σ2,则数据2a1,2a2,2a3,…,2an的方差为———.8,根据下表中的数据:可求出与的线性回归方程是————x-1012y-10114高2011级高二上期末复习讲义9.甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2)品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.310.89.79.8其中产量比较稳定的小麦品种是。三三、、例例题题选选讲讲::例1.今用简单随机抽样从含有6个个体的总体中抽取一个容量为2的样本。问:①总体中的某一个体a在第一次抽取时被抽到的概率是多少?②个体a不是在第1次未被抽到,而是在第2次被抽到的概率是多少?③在整个抽样过程中,个体a被抽到的概率是多少?例2.为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:(1)在这个问题中,总体、个体、样本和样本容量各是什么?(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数例3.为检测,某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,而极品8件,三级品13件,次品14件.(1)列出样本频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计辞呈商品为二极品或三极品的概率约是多少5高2011级高二上期末复习讲义四四、、课课后后练练习习一选择题(每题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的.)1.在统计中,样本的方差可以近似地反映总体的【】A.平均状态B.分布规律C.波动大小D.最大值和最小值2.已知一组数据1、2、y的平均数为4,那么【】A.y=7B.y=8C.y=9D.y=103.甲、乙、丙、丁四人的数学测验成绩分别为90分、90分、x分、80分,若这组数据的众数与平均数恰好相等,则这组数据的中位数是【】A.100分B.95分C.90分D.85分4.某校1000名学生中,O型血有400人,A型血有250人,B型血有250人,AB型血有100人,为了研究血型与色弱的关系,要从中抽取一个容量为40的样本,按照分层抽样的方法抽取样本,则O型血、A型血、B型血、AB型血的人要分别抽的人数为【】A.16、10、10、4B.14、10、10、6C.13、12、12、3D.15、8、8、95.为了了解广州地区初三学生升学考试数学成绩的情况,从中抽取50本密封试卷,每本30份试卷,这个问题中的样本容量是【】A.30B.50C.1500D.1506.某单位有技工18人、技术员12人、工程师6人,需要从这些人中抽取一个容量为n的样本.如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果容量增加一个,则在采用系统抽样时,需要在总体中剔除1个个体,则样本容量n为【】A.4B.5C.6D.无法确定7.已知三年级四班全班35人身高的算术平均数与中位数都是158cm,但后来发现其中有一位同学的身高登记错误,将160cm写成166cm,正确的平均数为acm,中位数为bcm.关于平均数a的叙述,下列正确的是【】A.大于158B.小于158C.等于158D.无法确定8.在7题中关于中位数b的叙述,下列正确的是【】A.大于158B.小于158C.等于158D.无法确定9.在频率分布直方图中,每个小长方形的面积表示【】A.组数B.频数C.频率D.组距频率10.在某餐厅内抽取100人,其中有30人在15岁以下,35人在16至25岁,25人在26至45岁,10人在46岁以上,则数0.35是16到25岁人员占总体分布的【】A.概率B.频率C.累计频率D.频数11.某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,适合的抽取样本的方法是【】6高2011级高二上期末复习讲义A.简单的随机抽样B.系统抽样C.先从老年人中排除一人,再用分层抽样D.分层抽样12.一个容量为20的样本数据,分组后组距与频数如下:[10,20]2个,[20,30]3个,[30,40]4个,[40,50]5个,[50,60]4个,[60,70]2个,则样本在区间(-∞,50)上的频率为【】A.5%B.25%C.50%D.70%二填空题(每题4分,共24分,请把答案写在横线上.)13.某校高一、高二、高三三个年级的学生数分别为1500人、1200人和1000人.现采用按年级分层抽样法了解学生的视力状况,已知在高一年级抽查了75人,则这次调查三个年级共抽查了人.14.有6个数4,x,-1,y,z,6,它们的平均数为5,则x,y,z三个数的平均数为.15.有一个简单的随机样本10,12,9,14,13,则样本平均数x=,样本方差s2=.三解答题(本大题共5小题,共66分.解答应写出文字说明,证明过程或演算步骤.)16.(本大题满分12分)为了了解某市800个企业的管理情况,拟取40个企业作为样本.这800个企业中有中外合资企业160家,私营企业320家,国有企业240家,其他性质的企业80家.如何抽取?17.(本大题满分14分)为了估计某产品寿命的分布,对产品进行追踪调查,记录如下:寿命(h)100~200200~300300~400400~500500~600个数2030804030(1)画出频率分布直方图;(2)估计产品在200~500以内的频率.7高2011级高二上期末复习讲义统计【课前练习】答案1.1202.503.07504。0.75.0.36.227.4σ2.8,ˆ0.70.1yx.9甲例题答案例1.解析:(1)31,(2)31,(3)31。例2.解析:(1)总体是要检查的这批手榴弹的杀伤半径的全体;个体是每一颗手榴弹的杀伤半径;样本是所抽取的20颗手榴弹的杀伤半径;样本容量是20。(2)在20个数据中,10出现了6次,次数最多,所以众数是10(米)。20个数据从小到大排列,第10个和第11个数据是最中间的两个数,分别为9(米)和10(米),所以中位数是21(9+10)=9.5(米)。样本平均数4.9)112311610495817(201x(米)例3.解析:(1)样本的频率分布表为产品频数频率一级晶50.17二级晶80.27三级晶130.43次品40.13(2)样本频率分布的条形图为:(3)此种产品为二极品或三极品的概率约为0.27+0.43=0.7。点评:条形图中纵坐标一般是频数或频率。课后练习答案一、选择题8高2011级高二上期末复习讲义二、填空题13.185;14.7;15.11.6,3.44;三、解答题16.解:采用分层抽样,样本容量与总体的比为1∶20,故应抽取中外合资企业8家,私营企业16家,国有企业12家,其他性质的企业4家.17.解:(1)频率分布直方图如下.(2)答案:0.75.频率组距寿命(h)100200300400500600题号123456789101112答案CCCACCBCCBCD