公众号:高中试卷君公众号:高中试卷君§10.8概率与统计的综合问题题型一频率分布直方图与分布列的综合问题例12022年是中国共产主义青年团成立100周年,为引导和带动青少年重温共青团百年光辉历程,某校组织全体学生参加共青团百年历史知识竞赛,现从中随机抽取了100名学生的成绩组成样本,并将得分分成以下6组:[40,50),[50,60),[60,70),…,[90,100],统计结果如图所示.(1)试估计这100名学生得分的平均数;(2)从样本中得分不低于70分的学生中,用比例分配的分层随机抽样的方法选取11人进行座谈,若从座谈名单中随机抽取3人,记其得分在[90,100]的人数为ξ,试求ξ的分布列和均值;(3)以样本估计总体,根据频率分布直方图,可以认为参加知识竞赛的学生的得分X近似地服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2,经计算s2=42.25.现从所有参加知识竞赛的学生中随机抽取500人,若这500名学生的得分相互独立,试问得分高于77分的人数最有可能是多少?参考数据:若随机变量X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.6827,P(μ-2σ≤X≤μ+2σ)≈0.9545,P(μ-3σ≤X≤μ+3σ)≈0.9973.解(1)估计这100名学生得分的平均数为10×(45×0.010+55×0.015+65×0.020+75×0.030+85×0.015+95×0.010)=70.5.(2)从样本中得分不低于70分的学生中,用比例分配的分层随机抽样的方法选取11人进行座谈,其中得分在[90,100]的人数为0.0100.015+0.030+0.010×11=2.若从座谈名单中随机抽取3人,记其得分在[90,100]的人数为ξ,则ξ的所有可能取值为0,1,2.P(ξ=0)=C39C311=2855,P(ξ=1)=C29C12C311=2455,P(ξ=2)=C19C22C311=355,则ξ的分布列为公众号:高中试卷君公众号:高中试卷君ξ012P28552455355所以E(ξ)=0×2855+1×2455+2×355=611.(3)由题意知,μ=70.5,σ2=s2=42.25,σ=6.5.P(X77)=P(Xμ+σ)=1-Pμ-σ≤X≤μ+σ2≈0.15865,所以这500名学生得分高于77分的人数最有可能为0.15865×500≈79.思维升华高考常将频率分布直方图与分布列等交汇在一起进行考查,解题时要正确理解频率分布直方图,能利用频率分布直方图正确计算出各组数据.概率问题以计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来.跟踪训练1(2023·济南模拟)从某企业的某种产品中随机抽取100件,测量这些产品的一项质量指标值,由测量结果制成如图所示的频率分布直方图.(1)求这100件产品质量指标值的样本平均数x(同一组数据用该区间的中点值作代表);(2)已知某用户从该企业购买了3件该产品,用X表示这3件产品中质量指标值位于[35,45]内的产品件数,用频率估计概率,求X的分布列.解(1)由已知得,x=10×0.015×10+20×0.040×10+30×0.025×10+40×0.020×10=25.(2)因为购买一件产品,其质量指标值位于[35,45]内的概率为0.2,所以X~B(3,0.2),因为X的所有可能取值为0,1,2,3,所以P(X=0)=(1-0.2)3=0.512,P(X=1)=C13×0.2×(1-0.2)2=0.384,P(X=2)=C23×0.22×(1-0.2)=0.096,P(X=3)=0.23=0.008,所以X的分布列为X0123P0.5120.3840.0960.008公众号:高中试卷君公众号:高中试卷君题型二回归模型与分布列的综合问题例2(2022·德州模拟)工信部发布的《“十四五”促进中小企业发展规划》中明确提出建立“百十万千”的中小企业梯度培育体系,引导中小企业走向“专精特新”“小巨人”“隐形冠军”的发展方向,“专精特新”是指具备专业化、精细化、特色化、新颖化优势的中小企业.下表是某地2017-2021年新增企业数量的有关数据:年份(年)20172018201920202021年份代码(x)12345新增企业数量(y)817292442(1)请根据表中所给的数据,求出y关于x的经验回归方程,并预测2023年此地新增企业的数量;(2)若在此地进行考察,考察企业中有4个为“专精特新”企业,3个企业中为普通企业,现从这7个企业中随机抽取3个,用X表示抽取的3个企业中为“专精特新”企业的个数,求随机变量X的分布列与均值.参考公式:经验回归方程y^=a^+b^x中,斜率和截距最小二乘估计公式分别为b^=i=1nxi-xyi-yi=1nxi-x2,a^=y-b^x.解(1)x=1+2+3+4+55=3,y=8+17+29+24+425=24,i=15(xi-x)(yi-y)=(-2)×(-16)+(-1)×(-7)+0×5+1×0+2×18=75,i=15(xi-x)2=4+1+0+1+4=10,所以b^=i=15xi-xyi-yi=15xi-x2=7.5,则a^=y-b^x=1.5,所以y^=1.5+7.5x,公众号:高中试卷君公众号:高中试卷君预测2023年,即当x=7时,由经验回归方程可得y^=54,所以估计2023年此地新增企业的数量约为54家.(2)由题意可知,X的所有可能取值为0,1,2,3,则P(X=0)=C33C37=135,P(X=1)=C14C23C37=1235,P(X=2)=C24C13C37=1835,P(X=3)=C34C37=435,所以X的分布列为X0123P13512351835435所以E(X)=0×135+1×1235+2×1835+3×435=127.思维升华高考常将回归模型与分布列等交汇在一起进行考查,求经验回归方程时要充分利用已知数据,合理利用公式减少运算.求解概率问题时要注意概率模型的应用,明确所求问题所属的事件类型是关键.跟踪训练2(2023·三明模拟)2022年,中国新能源汽车销售火爆,A省相关部门调查了该省2022年1月份至10月份的新能源汽车销量情况,得到一组样本数据(xi,yi)(i=1,2,…,10),其中xi表示第i个月,yi表示第i个月A省新能源汽车的销量(单位:万辆),由样本数据的散点图可知,y与x具有线性相关关系,并将这10个月的数据作了初步处理,得到下面一些统计量的值:yi=110xiyii=110x2ii=110yi1.589.138515(1)建立y关于x的经验回归方程,并估计A省12月份新能源汽车的销量;(2)为鼓励新能源汽车销售商积极参与调查,A省汽车行业协会针对新能源汽车销售商开展抽奖活动,所有费用由某新能源汽车厂商赞助.奖项共设一、二、三等奖共三个奖项,其中一、二、三等奖分别奖励2万元、1万元、5千元,抽中一、二、三等奖的概率分别为16,13,12.现有甲、乙两家汽车销售商参加了抽奖活动,假设他们是否中奖相互独立,求这两家汽车销售商所获奖金总额X(单位:万元)的分布列及均值.附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归方程y^=a^+b^x的斜率和截距公众号:高中试卷君公众号:高中试卷君的最小二乘估计分别为b^=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x.解(1)由题意得,x=1+2+3+…+9+1010=5.5,又y=1.5,i=110xiyi=89.1,i=110x2i=385,所以b^=i=110xiyi-10xyi=110x2i-10x2=89.1-10×5.5×1.5385-10×5.52=0.08,a^=1.5-0.08×5.5=1.06,则y关于x的经验回归方程为y^=1.06+0.08x,当x=12时,y^=2.02,故A省12月份新能源汽车的销量约为2.02万辆.(2)这两家汽车销售商所获得的奖金总额X的所有可能取值为4,3,2.5,2,1.5,1,P(X=4)=16×16=136,P(X=3)=2×16×13=19,P(X=2.5)=2×16×12=16,P(X=2)=13×13=19,P(X=1.5)=2×13×12=13,P(X=1)=12×12=14,则X的分布列为X432.521.51P1361916191314E(X)=4×136+3×19+2.5×16+2×19+1.5×13+1×14=116.公众号:高中试卷君公众号:高中试卷君题型三独立性检验与分布列的综合问题例3(2023·滨州模拟)新能源汽车是指除汽油、柴油发动机之外的所有其他能源汽车,有利于减少空气污染和缓解能源短缺的压力.在当今提倡全球环保的前提下,新能源汽车越来越受到消费者的青睐,新能源汽车产业也必将成为未来汽车产业发展的导向与目标.某车企随机调查了今年3月份购买本车企生产的汽车的100位车主,经统计其购车种类与性别情况如表所示(单位:人).性别购车种类合计购置新能源汽车购置传统燃油汽车男性501060女性251540合计7525100(1)根据小概率值α=0.05的独立性检验,分析购车种类是否与性别有关;(2)用样本估计总体,用本车企售出汽车样本的频率代替售出汽车的概率,从该车企今年3月份售出的汽车中,随机抽取3辆汽车,设被抽取的3辆汽车中属于传统燃油汽车的辆数为X,求X的分布列及均值.附:χ2=nad-bc2a+bc+da+cb+d,n=a+b+c+d.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828解(1)零假设为H0:购车种类与性别无关,根据表中数据可得χ2=100×15×50-25×10275×25×60×40=509≈5.5563.841=x0.05,根据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为购车种类与性别有关.(2)随机抽取1辆汽车属于传统燃油汽车的概率为25100=14,设被抽取的3辆汽车中属于传统燃油汽车的辆数为X,则X的所有可能取值为0,1,2,3,依题意得,X~B3,14,P(X=0)=C03×140×343=2764,P(X=1)=C13×141×342=2764,P(X=2)=C23×142×341=964,P(X=3)=C33×143×340=164,公众号:高中试卷君公众号:高中试卷君所以X的分布列为X0123P27642764964164则E(X)=3×14=34.思维升华高考常将独立性检验与分布列等交汇在一起进行考查,解决独立性检验问题,要注意过好“三关”:假设关、公式关、对比关.解决概率问题要准确地把握题中所涉及的事件,明确所求问题所属的事件类型.跟踪训练3(2023·昆明模拟)2022年,举世瞩目的冬奥会在北京举行,冬奥会吉祥物“冰墩墩”和“雪容融”有着可爱的外表和丰富的寓意,自亮相以来就好评不断,深受各国人民的喜爱.某市一媒体就本市小学生是否喜爱这两种吉祥物对他们进行了一次抽样调查,列联表如下(单位:人):性别是否喜爱合计喜爱不喜爱男生302050女生401050合计7030100(1)根据小概率值α=0.01的独立性检验,能否推断是否喜爱吉祥物与性别有关?(2)现从样本的男生中采用比例分配的分层随机抽样的方法抽取5人,再从这5人中随机抽取3人,记抽取的3人中有X人喜爱吉祥物,求X的分布列和均值.附:χ2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d.α0.10.050.01xα2.7063.8416.635解(1)零假设为H0:喜爱吉祥物与性别无关.根据表中数据得χ2=100×30×10-20×40270×30×50×50=10021≈4.7626.635=x