专题23概率统计综合大题必刷100题任务一:善良模式(基础)1-30题1.医学统计表明,X疾病在老年人中发病率较高.已知某地区老年人的男女比例为3:2,为了解X疾病在该地区老年人中发病情况,按分层抽样抽取100名老人作为样本,对这100位老人是否患有X疾病进行统计,得条形图如下所示.(1)完成下列2×2列联表,并判断有没有90%的把握认为患X疾病与性别有关?男性女性合计患有X疾病未患X疾病合计(2)在这100个样本中,将未患X疾病老年人按年龄段[60,65),[65,70),[70,75),[75,80),[80,85]分成5组,得频率分布直方图如图二所示.求未患病老年人的中位数(精确到小数点后一位).附:22()()()()()nadbcKabcdacbd,其中nabcd.20PKk0.150.100.050.0250.0100.0050.0010k2.0722.7063.8415.0246.6357.87910.8282.品酒师需定期接受酒味鉴别功能测试,通常采用的测试方法如下:拿出n(*nN且4n)瓶外观相同但品质不同的酒让品酒师品尝,要求其按品质优劣为它们排序;经过一段时间,等其记忆淡忘之后,再让其品尝这n瓶酒,并重新按品质优劣为它们排序.这称为一轮测试,根据一轮测试中的两次排序的偏离程度的高低为其评分.现分别以1a,2a,3a,…,na表示第一次排序时被排在1,2,3,…,n的n种酒在第二次排序时的序号,并令123123nXaaana,则X是对两次排序的偏离程度的一种描述.下面取4n研究,假设在品酒师仅凭随机猜测来排序的条件下,1a,2a,3a,4a等可能地为1,2,3,4的各种排列,且各轮测试相互独立.(1)直接写出X的可能取值,并求X的分布列和数学期望;(2)若某品酒师在相继进行的三轮测试中,都有2X,则认为该品酒师有较好的酒味鉴别功能.求出现这种现象的概率,并据此解释该测试方法的合理性.3.随着新冠疫情防控进入常态化,人们的生产生活逐步步入正轨.为拉动消费,某市政府分批发行2亿元政府消费券.为了解政府消费券使用人群的年龄结构情况,在发行完第一批政府消费券后,该市政府采用随机抽样的方法在全市市民中随机抽取了200人,对是否使用过政府消费券的情况进行调查,部分结果如下表所示,其中年龄在45岁及以下的人数占样本总数的35,没使用过政府消费券的人数占样本总数的310.使用过政府消费券没使用过政府消费券总计45岁及以下9045岁以上总计200(1)请将题中表格补充完整,并判断是否有90%的把握认为该市市民是否使用政府消费券与年龄有关?(2)现从45岁及以下的样本中按是否使用过政府消费券进行分层抽样,抽取8人做进一步访谈,然后再从这8人中随机抽取2人填写调查问卷,则抽取的2人中恰好一个使用过政府消费券,一个没使用过政府消费券的概率为多少?附:22nadbcKabcdacbd,其中nabcd.20PKk0.150.100.050.0250k2.0722.7063.8415.0244.为助力湖北新冠疫情后的经济复苏,某电商平台为某工厂的产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:单价x(元/件)88.28.48.68.89销量y(万件)908483807568(1)根据以上数据,求y关于x的线性回归方程;(2)若该产品成本是7元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润?(参考公式:回归方程ybxa$$$,其中121niiiniixxyybxx,aybx)5.为评估设备M生产某种零件的性能,从设备M生产零件的流水线上随机抽取100个零件作为样本,测量其直径后,整理得到下表:直径/mm5758606162636465666768697072合计件数11356193318442121100经计算,样本的平均值64u,标准差2.2,以频率作为概率的估计值.(1)为评估设备M的性能,从样本中任意抽取一个零件,记其直径为X,并根据以下规则进行评估(P表示相应事件的频率):①0.6827PuXu;②220.9545PuXu;③330.9973PuXu.若同时满足上述三个不等式,则设备M的性能等级为甲;若满足其中两个不等式,则设备M的性能等级为乙;若仅满足其中一个不等式,则设备M的性能等级为丙;若全部不满足,则设备M的性能等级为丁.试判断设备M的性能等级.(2)将直径小于或等于2u或直径大于2u的零件认为是次品.①从设备M的生产流水线上任意抽取2个零件,计算其中次品个数Y的数学期望;②从样本中任意抽取2个零件,计算其中次品个数Z的数学期望EZ6.某校高三年级共有学生1200人,经统计,所有学生的出生月份情况如表:月份123456789101112人数180110120160130100805090705060(1)从该年级随机选取一名学生,求该学生恰好出生在上半年(1-6月份)的概率;(2)为了解学生考试成绩的真实度,也为了保护学生的个人隐私,现从全体高三学生中随机抽取120人进行问卷调查,对于每个参与调查的同学,先产生一个0,1范围内的随机数a,若0.4a≤,则该同学回答问题A,否则回答问题B,问题A:您是否出生在上半年(1-6月份)?,问题B:您是否在考试中有过作弊行为?,假设在问卷调查过程中,问题只对参与者本人可见,且每个参与的同学均能如实回答问题且相互独立,若最后统计结果显示回答“是”的人数为38,则:①求该年级学生有作弊情况的概率;②若从该年级随机选取10名同学,记其中有过作弊行为的人数为X,求X的数学期望EX和方差DX.7.有一种双人游戏,游戏规则如下:双方每次游戏均从装有5个球的袋中(3个白球和2个黑球)轮流摸出1球(摸后不放回),摸到第2个黑球的人获胜,同时结束该次游戏,并把摸出的球重新放回袋中,准备下一次游戏.(1)求先摸球者获胜的概率;(2)小李和小张准备玩这种游戏,约定玩3次,第一次游戏由小李先摸球,并且规定某一次游戏输者在下一次游戏中先摸球.每次游戏获胜得1分,失败得0分.记3次游戏中小李的得分之和为X,求X的分布列和数学期望()EX.8.随着改革开放的不断深入,祖国不断富强,人民生活水平逐步提高,为了进一步改善民生,2019年1月1日起我国实施了个人所得税的新政策,新政策的主要内容包括:①个税起征点为5000元;②每月应纳税所得额(含税)=(收入)-(个税起征点)-(专项附加扣除);③专项附加扣除包括赡养老人、子女教育、继续教育、大病医疗等.新个税政策下赡养老人的扣除标准为:独生子女每月扣除2000元,非独生子女与其兄弟姐妹按照每月2000元的标准分摊扣除,但每个人的分摊额度不能超过1000元;子女教育的扣除标准为:每个子女每月扣除1000元(可由父母中的一方扣除,或者父母双方各扣除500元)税率表如下:级数全月应纳税所得额税率1不超过3000元的部分3%2超过3000元至12000元的部分10%3超过12000元至25000元的部分20%4超过25000元至35000元的部分25%………(1)税务部门在小李所在公司用分层抽样方法抽取某月100位不同层次员工的税前收入,并制成如图的频率分布直方图.(i)请根据频率分布直方图估计该公司员工税前收入的中位数;(ii)同一组中的数据以这组数据所在区间中点的值作代表,在不考虑他们的专项附加扣除的情况下,甲、乙两位同学用如下两种方法估计小李所在的公司员工该月平均纳税,请判断哪位同学的方法是正确的,不需说明理由.甲同学:0.2400.32300.2900.122900.084900.04690129.2(元);乙同学:先计算收入的均值0.2440000.3260000.280000.12100000.0812000x0.04140007200(元),再利用均值计算平均纳税为:(72005000)0.0366(元)(2)为研究某城市月薪为20000元群体的纳税情况,现收集了该城市500名公司白领(每人至多1个孩子)的相关资料,通过整理数据知道:这500人中有一个孩子符合子女教育专项附加扣除(假定由他们各自全部扣除)的有400人,不符合子女教育专项附加扣除的人有100人,符合子女专项附加扣除的人中有300人也符合赡养老人专项附加扣除,不符合子女专项附加扣除的人中有50人符合赡养老人专项附加扣除,并且他们均不符合其他专项附加扣除(统计的500人中,任何两人均不在一个家庭且为独生子女).若他们的月收入均为20000元,依据样本估计总体的思想,试估计在新个税政策下这类人群每月应缴纳个税金额X(单位:元)的分布列与期望.9.某市的教育主管部门对所管辖的学校进行年终督导评估,为了解某学校师生对学校教学管理的满意度﹐分别从教师和不同年级的同学中随机抽取若干师生﹐进行评分(满分100分),绘制如下频率分布直方图(分组区间为40,50,50,60,60,70,70,80,[80,90),90,100),并将分数从低到高分为四个等级:满意度评分0,6060,8080,9090,100满意度等级不满意基本满意满意非常满意已知满意度等级为基本满意的有340人.(1)求表中a的值及不满意的人数﹔(2)记A表示事件“满意度评分不低于80分”,估计A的概率﹔(3)若师生的满意指数不低于0.8,则该校可获评“教学管理先进单位”.根据你所学的统计知识﹐判断该校是否能获评“教学管理先进单位”?并说明理由.(注:满意指数100满意度的平均分)10.近几年,快递业的迅速发展导致行业内竞争日趋激烈.某快递网点需了解一天中收发一件快递的平均成本y(单位:元)与当天揽收的快递件数x(单位:千件)之间的关系,对该网点近5天的每日揽件量ix(单位:千件)与当日收发一件快递的平均成本iy(单位;元)(i=1,2,3,4,5)数据进行了初步处理,得到下面的散点图及一些统计量的值.xyw51iiixxyy51iiiwwyy521iixx521iiww45.160.41513.22.028300.507表中1iiwx,5115iiww.(1)根据散点图判断,yabx与dycx哪一个适宜作为y关于x的回归方程类型?并根据判断结果及表中数据求出y关于x的回归方程;(2)各快递业为提高快递揽收量并实现总利润的增长,除了提升服务质量、提高时效保障外,价格优惠也是重要策略之一.已知该网点每天揽收快递的件数x(单位:千件)与单件快递的平均价格t(单位;元)之间的关系是252512xtt,收发一件快递的利润等于单件的平均价格减去平均成本,根据(1)中建立的回归方程解决以下问题:①预测该网点某天揽收2000件快递可获得的总利润;②单件快递的平均价格t为何值时,该网点一天内收发快递所获利润的预报值最大?附:对于一组数据11,uv,22,uv,…,,nnuv,其回归直线vu的斜率和截距的最小二乘估计分别为121niiiniiuuvvuu,vu.11.澳大利亚Argyle钻石矿石全球最重要的粉钻和红钻出产地,占全球供应的90%.该钻石矿曾发现一颗28.84ct的宝石级钻石原石——[ArgyleOctavia],为该矿区27年来发现最大的钻石原石之一.如图,这颗钻石拥有完整的正八面体晶形,其命名[ArgyleOctavia]特别强调钻石的正八面体特征——[Octavia]在拉丁语中是[第八]的意思.如图设为随机变量,从棱长为1的正八面体的12条棱中任取两条,当两条棱相交时,0;当两条棱平行时,的值为两条棱之间的距离;当两