2020版高中数学 第二章 统计章末复习学案(含解析)新人教A版必修3

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1章末复习学习目标1.梳理本章知识,构建知识网络.2.会根据不同的特点选择适当的抽样方法获得样本数据.3.能利用图、表对样本数据进行整理分析,用样本和样本的数字特征估计总体.4.能利用散点图对两个变量是否相关进行初步判断,能用线性回归方程进行预测.1.抽样方法(1)用随机数法抽样时,对个体所编号码位数要相同,当问题所给位数不同时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.(2)用系统抽样法时,如果总体容量N能被样本容量n整除,抽样间隔为k=Nn;如果总体容量N不能被样本容量n整除,先用简单随机抽样剔除多余个体,抽样间隔为k=Kn(其中K=N-多余个体数).(3)三种抽样方法的异同点类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽到的可能性相同从总体中逐个抽取总体中的个体数较少系统抽样将总体平均分成几部分,按事先确定的规则分别在各部分中抽取在起始部分抽样时,采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,按各层个体数之比抽取在各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成2.用样本估计总体(1)用样本估计总体用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率分布表与频率分布直方图.当样本只有两组数据且样本容量比较小时,用茎叶图刻画数据比较方便.(2)样本的数字特征样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均2数;另一类是反映样本数据波动大小的,包括方差及标准差.3.变量间的相关关系(1)两个变量之间的相关关系的研究,通常先作变量的散点图,根据散点图判断这两个变量最接近于哪种确定性关系(函数关系).(2)求回归方程的步骤:①先把数据制成表,从表中计算出x,y,∑ni=1x2i,∑ni=1xiyi;②计算回归系数a^,b^,公式为b^=∑ni=1xiyi-nxy∑ni=1x2i-nx2,a^=y-b^x;③写出回归方程y^=b^x+a^.题型一抽样方法例1(1)大、中、小三个盒子中分别装有同一产品120个、60个、20个,现在需从这三个盒子中抽取一个容量为25的样本,较为恰当的抽样方法是()A.分层抽样B.系统抽样C.简单随机抽样D.以上三种均可(2)某企业三月中旬生产A,B,C三种产品共3000件,根据分层抽样的结果,企业统计员制作了如下的表格:产品类别ABC产品数量(件)1300样本数量(件)130由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本数量比C产品的样本数量多10,根据以上信息,可得C产品的数量是________件.答案(1)B(2)800解析(1)总体无明显差异,但总体中个体数较多,故采用系统抽样较恰当.(2)设C产品的样本数量为n,则A产品的样本数量为n+10,由题意知n+n++1303000=1301300,解得n=80.3故C产品的数量为80÷1301300=800(件).反思感悟系统抽样的特点是“等距离”抽样,分层抽样的特点是“等比例”抽样.跟踪训练1某高级中学有学生270人,其中一年级108人,二、三年级各81人.现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270.关于上述样本的下列结论中,正确的是()A.②③都不能为系统抽样B.②④都不能为分层抽样C.①④都可能为系统抽样D.①③都可能为分层抽样答案D解析按分层抽样时,在一年级抽取108×10270=4(人),在二年级、三年级各抽取81×10270=3(人),则在号码段1,2,…,108中抽取4个号码,在号码段109,110,…,189中抽取3个号码,在号码段190,191,…,270中抽取3个号码,①②③符合,所以①②③可能是分层抽样,④不符合,所以④不可能是分层抽样;如果按系统抽样时,抽出的号码应该是“等距”的,①③符合,②④不符合,所以①③都可能为系统抽样,②④都不能为系统抽样.题型二用样本的频率分布估计总体例2某制造商生产一批直径为40mm的乒乓球,现随机抽样检查20个,测得每个球的直径(单位:mm,保留两位小数)如下:40.0340.0039.9840.0039.9940.0039.9840.0139.9839.9940.0039.9939.9540.0140.0239.9840.0039.9940.0039.96(1)完成下面的频率分布表,并画出频率分布直方图;分组频数频率频率组距[39.95,39.97)4[39.97,39.99)[39.99,40.01)[40.01,40.03]合计(2)假定乒乓球的直径误差不超过0.02mm为合格品.若这批乒乓球的总数为10000,试根据抽样检查结果估计这批产品的合格个数.解(1)频率分布表如下:分组频数频率频率组距[39.95,39.97)20.105[39.97,39.99)40.2010[39.99,40.01)100.5025[40.01,40.03]40.2010合计201.0050频率分布直方图如图.(2)∵抽样的20个产品中在[39.98,40.02]范围内的有17个,∴产品合格率为1720×100%=85%.∴10000×85%=8500.故根据抽样检查结果,可以估计这批产品的合格个数为8500.反思感悟总体分布中相应的统计图表主要包括:频率分布表、频率分布直方图、频率分布折线图等.通过这些统计图表给出的相应统计信息可以估计总体.跟踪训练2从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下:(单位:分)[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)估计成绩在[60,90)分的学生比例.5解(1)频率分布表如下.成绩分组频数频率频率/组距[40,50)20.040.004[50,60)30.060.006[60,70)100.20.020[70,80)150.30.030[80,90)120.240.024[90,100]80.160.016合计501.000.100(2)频率分布直方图和折线图如图所示:(3)成绩在[60,90)分的学生比例为0.2+0.3+0.24=0.74=74%.题型三用样本的数字特征估计总体的数字特征例3为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图.(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x1,x2,估计x1-x2的值.解(1)设甲校高三年级学生总人数为n.由题意,知30n=0.05,解得n=600.样本中甲校高三年级学生数学成绩不及格的人数为5,据此估计甲校高三年级这次联考数学6成绩的及格率为1-530=56.(2)设甲、乙两校样本平均数分别为x′1,x′2.根据样本茎叶图知,30(x′1-x′2)=30x′1-30x′2=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=15.因此x′1-x′2=0.5,所以x1-x2的估计值为0.5分.反思感悟样本的数字特征分为两大类:一类是反映样本数据集中趋势的特征数,例如平均数;另一类是反映样本数据波动大小的特征数,例如方差和标准差.通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和方差(标准差),从而实现对总体的估计.跟踪训练3对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:甲6080709070乙8060708075问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡?解甲的平均成绩为x甲=74,乙的平均成绩为x乙=73.所以甲的平均成绩好.甲的方差是s2甲=15[(-14)2+62+(-4)2+162+(-4)2]=104,乙的方差是s2乙=15×[72+(-13)2+(-3)2+72+22]=56.因为s2甲s2乙,所以乙的各门功课发展较平衡.线性回归及应用典例理论预测某城市2020到2024年人口总数与年份的关系如下表所示:年份202x(年)01234人口数y(十万)5781119(1)请画出上表数据的散点图;(2)指出x与y是否线性相关;(3)若x与y线性相关,请根据上表提供的数据,用最小二乘法求出y关于x的回归方程y^=b^x+a^;(4)据此估计2025年该城市人口总数.7(参数数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30)8解(1)数据的散点图如图:(2)由散点图可知,样本点基本上分布在一条直线附近,故x与y呈线性相关.(3)由表知x=15×(0+1+2+3+4)=2,y=15×(5+7+8+11+19)=10.∴b^=i=15xiyi-5xyi=15x2i-5x2=3.2,a^=y-b^x=3.6,∴回归方程为y^=3.2x+3.6.(4)当x=5时,y^=19.6(十万)=196万.故2025年该城市人口总数约为196万.[素养评析](1)最小二乘法估计的三个步骤①作出散点图,判断是否线性相关.②如果是,则用公式求a^,b^,写出回归方程.③根据方程进行估计.(2)线性回归的应用,注意三个方面,一是收集数据,二是准确计算求得回归方程,三是用回归方程进行估计预测,所以,这类题目培养的数学核心素养为数学运算与数据分析.1.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的标准差是()A.1B.2C.3D.4答案B解析设这10个数为a1,a2,…,a10,则有a21+a22+…+a210=200,9且a1+a2+…+a10=40,∴a1-2+a2-2+…+a10-210=a21+a22+…+a210-a1+a2+…+a10+16010=200-8×40+16010=4,∴标准差为4=2.2.某农田施肥量x(单位:kg)与小麦产量y(单位:kg)之间的回归方程是y^=4x+250,则当施肥量为50kg时,可以预测小麦的产量为________kg.答案450解析直接将x=50代入回归方程中,可得y^=4×50+250=450.3.如图所示是一次考试结果的频率分布直方图,则据此估计这次考试的平均分为________.答案75解析利用组中值估算平均分,则有x=55×0.1+65×0.2+75×0.4+85×0.2+95×0.1=75,故估计这次考试的平均分为75.4.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程y^=b^x+a^,并在坐标系中画出回归直线;10(3)试预测加工10个零件需要多少小时?注:b^=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x解(1)散点图如图.(2)由表中数据得:i=14xiyi=52.5,x=3.5,y=3.5,i=14x2i=54,∴b^=0.7,∴a^=1.

1 / 12
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功