-1-第1讲统计与统计案例[做真题]1.(2019·高考全国卷Ⅰ)某学校为了解1000名新生的身体素质,将这些学生编号为1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生B.200号学生C.616号学生D.815号学生解析:选C.由系统抽样可知第一组学生的编号为1~10,第二组学生的编号为11~20,…,最后一组学生的编号为991~1000.设第一组取到的学生编号为x,则第二组取到的学生编号为x+10,以此类推,所取的学生编号为10的倍数加x.因为46号学生被抽到,所以x=6,所以616号学生被抽到,故选C.2.(2019·高考全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为____________.解析:依题意知,经停该站高铁列车所有车次的平均正点率的估计值为10×0.97+20×0.98+10×0.9940=0.98.答案:0.983.(2019·高考全国卷Ⅰ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(K2≥k0)0.0500.0100.001k03.8416.63510.828解:(1)由调查数据知,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该-2-商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)K2=100×(40×20-30×10)250×50×70×30≈4.762.由于4.7623.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.[明考情]1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等.2.在概率与统计的交汇处命题,以解答题中档难度出现.抽样方法(基础型)[知识整合]简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.[注意]无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值.[考法全练]1.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为()A.7B.9C.10D.15解析:选C.由题意知应将960人分成32组,每组30人.设每组选出的人的号码为30k+9(k=0,1,…,31).由451≤30k+9≤750,解得44230≤k≤74130,又k∈N,故k=15,16,…,24,共10人.2.(2019·广东省七校联考)假设要考察某公司生产的狂犬疫苗的剂量是否达标,现用随-3-机数法从500支疫苗中抽取50支进行检验,利用随机数表抽取样本时,先将500支疫苗按000,001,…,499进行编号,若从随机数表第7行第8列的数开始向右读,则抽取的第3支疫苗的编号为________.(下面摘取了随机数表的第7行至第9行)844217533157245506887704744767217633502583921206766301637859169555671998105071751286735807443952387933211234297864560782524207443815510013429966027954解析:由题意得,从随机数表第7行第8列的数开始向右读,符合条件的前三个编号依次是331,455,068,故抽取的第3支疫苗的编号是068.答案:0683.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为23,第9组抽取号码为________;若采用分层抽样,40~50岁年龄段应抽取________人.解析:根据题意可得每5人中抽取一人,所以第九组抽取的号码为(9-5)×5+23=43,根据分层抽样,40~50岁年龄段应抽取:40×30%=12人.答案:4312“双图”“五数”估计总体(综合型)[知识整合]统计中的四个数字特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:在样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即x=1n(x1+x2+…+xn).(4)方差与标准差方差:s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].-4-标准差:s=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].[典型例题](2019·高考全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:74≈8.602.【解】(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y=1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2==1100[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.0296,s=0.0296=0.02×74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.(1)两类数字特征的意义①平均数、中位数、众数描述数据的集中趋势.②方差和标准差描述数据的波动大小.方差、标准差越大,数据的离散程度越大,越不稳定.(2)与频率分布直方图有关的问题①已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求-5-出样本与整体的关系,利用频率和等于1就可求出其他数据.②众数为频率分布直方图中最高矩形的底边中点的横坐标.③中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.④平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之积的和.[对点训练]1.某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则n-m的值是()A.5B.6C.7D.8解析:选B.由甲组学生成绩的平均数是88,可得70+80×3+90×3+(8+4+6+8+2+m+5)7=88,解得m=3.由乙组学生成绩的中位数是89,可得n=9,所以n-m=6.2.(2019·江西八所重点中学联考)某地区某村的前3年的经济收入(单位:万元)分别为100,200,300,其统计数据的中位数为x,平均数为y.今年经过政府新农村建设后,该村经济收入(单位:万元)在上年基础上翻番,则在这4年里经济收入的统计数据中,下列说法正确的是()A.中位数为x,平均数为1.5yB.中位数为1.25x,平均数为yC.中位数为1.25x,平均数为1.5yD.中位数为1.5x,平均数为2y解析:选C.由数据100,200,300可得,前3年统计数据的中位数x=200,平均数y=100+200+3003=200.根据题意得第4年该村的经济收入的统计数据为600,则由数据100,200,300,600可得,这4年统计数据的中位数为200+3002=250=1.25x,平均数为100+200+300+6004=300=1.5y,故选C.3.(2019·广东六校第一次联考)某机构组织语文、数学学科能力竞赛,按照一定比例淘汰后,颁发一、二、三等奖(分别对应成绩等级的一、二、三等).现有某考场所有考生的两-6-科成绩等级统计如图1所示,其中获数学二等奖的考生有12人.(1)求该考场考生中获语文一等奖的人数;(2)用随机抽样的方法从获得数学和语文二等奖的考生中各抽取5人,进行综合素质测试,将他们的综合得分绘成茎叶图(如图2所示),求样本的平均数及方差并进行比较分析;解:(1)因为获数学二等奖的考生有12人,所以该考场考生的总人数为121-0.40-0.26-0.10=50,故该考场获语文一等奖的考生人数为50×(1-0.38×2-0.16)=4.(2)设获数学二等奖考生综合得分的平均数和方差分别为x1,s21,获语文二等奖考生综合得分的平均数和方差分别为x2,s22.x1=81+84+92+90+935=88,x2=79+89+84+86+875=85,s21=15×[(-7)2+(-4)2+42+22+52]=22,s22=15×[(-6)2+42+(-1)2+12+22]=11.6,因为8885,11.622,所以获数学二等奖考生较获语文二等奖考生综合素质测试的平均分高,但是成绩差距较大.回归分析(综合型)-7-[典型例题]某省的一个气象站观测点在连续4天里记录的AQI指数M与当天的空气水平可见度y(单位:cm)的情况如表1:表1M900700300100y0.53.56.59.5该省某市2017年11月份AQI指数频数分布如表2:表2M[0,200)[200,400)[400,600)[600,800)[800,1000]频数(天)361263(1)设x=M100,若x与y之间是线性关系,试根据表1的数据求出y关于x的线性回归方程;(2)小李在该市开了一家洗车店,洗车店每天的平均收入与AQI指数存在相关关系如表3:表3M[0,200)[200,400)[400,600)[600,800)[800,1000]日均收入(元)-2000-1000200060008000根据表3估计小李的洗车店2017年11月份每天的平均收入.附参考公式:y^=b^x+a^,其中b^=,a^=y-b^x.【解】(1)x=14(9+7+3+1)=5,y=14(0.5+3.5+6.5+9.5)=5,∑4i=1=3×18+8.04=62.04,故预报值为62.04万元.