2014高考金钥匙数学解题技巧大揭秘专题二十统计及其与概率的交汇问题

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

专题二十统计及其与概率的交汇问题1.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中x的值;(2)从成绩不低于80分的学生中随机选取2人,该2人中成绩在90分以上(含90分)的人数记为ξ,求ξ的数学期望.解(1)由题意得:10x=1-(0.006×3+0.01+0.054)×10=0.18,∴x=0.018.(2)成绩不低于80分的学生共有(0.018+0.006)×10×50=12人,其中90分以上(含90分)的共有0.006×10×50=3人,ξ的可能值为0,1,2,P(ξ=0)=C29C212=611,P(ξ=1)=C19C13C212=922,P(ξ=2)=C23C212=122,∴ξ的分布列为ξ012P611922122∴E(ξ)=0×611+1×922+2×122=12.本部分主要考查随机抽样、样本估计总体、线性回归分析,独立性检验的简单应用,一般是选择题、填空题,试题难度中等或稍易.若以解答题出现,往往与概率、离散型随机变量的分布列交汇考查.在复习统计问题时,要紧紧抓住这些图表和方法,把图表的含义弄清楚,这样剩下的问题就是有关的计算和对统计思想的理解,在弄清楚统计问题的基础上,要与概率、离散型随机变量的分布列、期望、方差密切结合掌握.必备知识抽样方法抽样方法包含简单随机抽样、系统抽样、分层抽样三种方法,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围.[来源:学科网ZXXK]用样本估计总体(1)利用样本频率分布估计总体分布:①频率分布表和频率分布直方图;②总体密度曲线;③茎叶图.(2)用样本的数字特征估计总体的数字特征:①众数、中位数;②样本平均数x=1n(x1+x2+…+xn)=1ni=1nxi;③样本方差s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2]=1ni=1n(xi-x)2;④样本标准差s=1n[x1-x2+x2-x2+…+xn-x2]=1ni=1nxi-x2.线性回归方程方程y^=bx+a称为线性回归方程,其中b=i=1nxiyi-nxyi=1nx2i-nx2a=y-bx;(x,y)称为样本中心点.独立性检验假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量K2=nad-bc2a+bc+da+cb+d,P(K2≥k)0.1000.0500.0250.0100.001k2.7063.8415.0246.63510.828必备方法用样本估计总体(1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为1.解决与频率分布直方图有关的问题时,应正确理解已知数据的含义,掌握图表中各个量的意义.(2)当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当总体容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布.①总体期望的估计,计算样本平均值x=1ni=1nxi;②总体方差(标准差)的估计:方差=1ni=1n(xi-x)2,标准差=方差,方差(标准差)较小者较稳定.统计此类试题主要考查分层抽样、频率分布直方图、茎叶图、线性回归方程、平均数和方差的计算、以及识图能力、借助概率统计知识分析、解决问题的能力,均可单独命制一道小题.【例1】►某校举行了由全部学生参加的校园安全知识考试,从中抽出60名学生,将其成绩分成六段[40,50),[50,60),…,[90,100)后,画出如图所示的频率分布直方图.观察图形的信息,回答下列问题:估计这次考试的及格率(60分及以上为及格)为__________;平均分为__________.[审题视点][听课记录][审题视点](1)由图可知甲、乙的成绩,再利用公式计算.用样本中及格的频率估计总体的及格率,以样本的平均数估计总体的平均数,即以各组的中点值乘以各组的频率之和估计总体的平均数.(1)C[由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A错;甲、乙的成绩的中位数分别为6,5,B错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C对;甲、乙的成绩的极差均为4,D错.](2)解析及格的各组的频率是(0.015+0.03+0.025+0.005)×10=0.75,即及格率约为75%;样本的均值为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71,以这个分数估计总体的分数即得总体的平均分数约为71.答案75%71(1)如果已知频率分布直方图,那么就用样本在各个小组的频率估计总体在相应区间内的频率,用样本的均值估计总体的均值,根据频率分布图估计样本均值的方法是取各个小组的中点值乘以各个小组的频率之和进行的.(2)根据茎叶图,我们可方便地求出数据的众数与中位数,大体上估计出两组数据的平均数大小与稳定性.【突破训练1】从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x甲,x乙,中位数分别为m甲,m乙,则().A.x甲<x乙,m甲>m乙B.x甲<x乙,m甲<m乙C.x甲>x乙,m甲>m乙D.x甲>x乙,m甲<m乙答案:(1)C[从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n组抽到的号码为an=9+30(n-1)=30n-21,由451≤30n-21≤750,得23615≤n≤25710,所以n=16,17,…,25,共有25-16+1=10人,选C.](2)B[由茎叶图可知甲数据集中在10至20之间,乙数据集中在20至40之间,明显x甲<x乙,甲的中位数为20,乙的中位数为29,即m甲<m乙,所以选B.]抽样方法、直方图、茎叶图与概率的交汇问题准确提取直方图、茎叶图中的信息是解此类题的关键,借助这些数据结合独立事件、互斥事件可设计概率、分布列问题,高考在此结合点处命题有加强的趋势.【例2】某班同学进行社会实践,对[25,55]岁的人群随机抽取n人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图:组数分组低碳族的人数占本组的频率第一组[25,30)1200.6第二组[30,35)195p第三组[35,40)1000.5第四组[40,45)a0.4第五组[45,50)300.3第六组[50,55)150.3(1)补全频率分布直方图,并求n、a、p的值;(2)从[40,50)岁年龄段的“低碳族”中采用分层抽样法抽取18人参加户外低碳体验活动,其中选取3人作为领队,记选取的3名领队中年龄在[40,45)岁的人数为X,求X的分布列和期望E(X).[审题视点][听课记录][审题视点](1)频率=小长方形的面积;(2)用超几何分布解决.解(1)第二组的频率为1-(0.04+0.04+0.03+0.02+0.01)×5=0.3,所以高为0.35=0.06.频率直方图如下:第一组的人数为1200.6=200,频率为0.04×5=0.2,所以n=2000.2=1000.由题可知,第二组的频率为0.3,所以第二组的人数为1000×0.3=300,所以p=195300=0.65.第四组的频率为0.03×5=0.15,所以第四组的人数为1000×0.15=150,所以a=150×0.4=60.(2)因为[40,45)岁年龄段的“低碳族”与[45,50)岁年龄段的“低碳族”的比值为60∶30=2∶1,所以采用分层抽样法抽取18人,[40,45)岁中有12人,[45,50)岁中有6人.随机变量X服从超几何分布.P(X=0)=C012C36C318=5204,P(X=1)=C112C26C318=1568,P(X=2)=C212C16C318=3368,P(X=3)=C312C06C318=55204.X0123P52041568336855204所以随机变量X的分布列为所以数学期望E(X)=0×5204+1×1568+2×3368+3×55204=2.解决该类问题的基础是频数分布表、茎叶图等知识,在解题时,一定要仔细认真,防止在这个数据表中出现错误,导致后续各问解答也随之出现错误.【突破训练2】以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X表示.甲组乙组990X891110(1)如果X=8,求乙组同学植树棵数的平均数和方差;(2)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数Y的分布列和数学期望.(注:方差s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2],其中x为x1,x2,…,xn的平均数)解(1)当X=8时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10,所以平均数为:x=8+8+9+104=354;方差为:s2=14×8-3542+8-3542+9-3542+10-3542=1116.(2)当X=9时,由茎叶图可知,甲组同学的植树棵数是:9,9,11,11;乙组同学的植树棵数是:9,8,9,10.分别从甲、乙两组中随机选取一名同学,共有4×4=16种可能的结果,这两名同学植树总棵数Y的可能取值为17,18,19,20,21.事件“Y=17”等价于“甲组选出的同学植树9棵,乙组选出的同学植树8棵”,所以该事件有2种可能的结果,因此P(Y=17)=216=18.同理可得P(Y=18)=14;P(Y=19)=14;P(Y=20)=14;P(Y=21)=18.所以随机变量Y的分布列为:Y1718192021P1814141418E(Y)=17×P(Y=17)+18×P(Y=18)+19×P(Y=19)+20×P(Y=20)+21×P(Y=21)=17×18+18×14+19×14+20×14+21×18=19.独立性检验与概率相结合以实际问题为背景,给定数据表,借助这些数据结合独立事件或对立事件设计概率及分布列问题.【例3】电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女1055合计[来源:学科网ZXXK](2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X).附:K2=nn11n22-n12n212n1+n2+n+1n+2,P(K2≥k)0.050.01k3.8416.635[审题视点][听课记录][审题视点](1)按照独立性检验的步骤进行;(2)建立概率分布表,利用期望的定义式求解数学期望.解(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:非体育迷体育迷合计男301545女451055合计7525100将2×2列联表中的数据代入公式计算,得K2=nn11n22-n12n212n1+n2+n+1n+2=100×30×10-45×15275×25×45

1 / 13
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功