8.4统计与统计案例(精练)1(2023·河南开封·统考模拟预测)某学校组建了演讲,舞蹈,合唱,绘画,英语协会五个社团,全校2000名学生每人都参加且只参加其中二个社团,校团委从这2000名学生中随机选取部分学生进行调查,并将调查结果绘制成如下不完整的两个统计图:则选取的学生中,参加绘画社团的学生数为()A.20B.30C.40D.452.(2024秋·湖北武汉·高三统考开学考试)公司邀请用户参加某产品的试用并评分,满意度为10分的有1人,满意度为9分的有1人,满意度为8分的有2人,满意度为7分的有4人,满意度为5分和4分的各有1人,则该产品用户满意度评分的平均数、众数、中位数、85%分位数分别为()A.8分,7分,7分,9分B.8分,7分,7分,8.5分C.7.2分,7分,7分,9分D.7.2分,7分,7分,8.5分3.(2023·贵州黔东南·凯里一中校考模拟预测)“说文明话、办文明事、做文明人,树立城市新风尚!创建文明城市,你我共同参与!”为宣传创文精神,华强实验中学高一(2)班组织了甲乙两名志愿者,利用一周的时间在街道对市民进行宣传,将每天宣传的次数绘制成如下频数分布折线图,则以下说法不正确...的为()A.甲的众数小于乙的众数B.乙的极差小于甲的极差C.甲的方差大于乙的方差D.乙的平均数大于甲的平均数4.(2023春·河北石家庄·高三校联考阶段练习)2023年考研成绩公布不久,对某校“软件工程”专业参考的200名考生的成绩进行统计,可以得到如图所示的频率分布直方图,其中分组的区间为340,360,360,380,380,400,400,420,同一组中的数据用该组区间的中间值作代表值,则下列说法中不正确的是()A.这200名学生成绩的众数为370分B.这200名学生成绩的平均分为377分C.这200名学生成绩的70%分位数为386分D.这200名学生成绩在400,420中的学生有30人5.(2023·河北衡水·河北衡水中学校考一模)某新能源汽车生产公司,为了研究某生产环节中两个变量,xy之间的相关关系,统计样本数据得到如下表格:ix2023252730iy22.4334.6由表格中的数据可以得到y与x的经验回归方程为1ˆ4yxa,据此计算,下列选项中残差的绝对值最小的样本数据是()A.30,4.6B.27,3C.25,3D.23,2.46(2023秋·云南保山·高三统考期末)新冠肺炎疫情发生以来,中医药全面参与疫情防控救治,做出了重要贡献.某中医药企业根据市场调研与模拟,得到研发投入x(亿元)与产品收益y(亿元)的数据统计如下表:研发投入x(亿元)12345产品收益y(亿元)3791011用最小二乘法求得y关于x的经验回归直线方程是ˆˆ2.3ybx,相关系数0.95r(若0.30.75r,则线性相关程度一般,若0.75r,则线性相关程度较高),下列说法不正确的有()A.变量x与y正相关且相关性较强B.ˆ1.9bC.当20x=时,y的估计值为40.3D.相应于点5,11的残差为0.87.(2023·湖南·校联考模拟预测)若需要刻画预报变量w和解释变量x的相关关系,且从已知数据中知道预报变量w随着解释变量x的增大而减小,并且随着解释变量x的增大,预报变量w大致趋于一个确定的值,为拟合w和x之间的关系,应使用以下回归方程中的(0b,e为自然对数的底数)()A.wbxaB.lnwbxaC.wbxaD.exwba8.(2023秋·湖北·高三校联考阶段练习)(多选)某医院护士对甲、乙两名住院病人一周内的体温进行了统计,其结果如图所示,则下列说法正确的有()A.病人甲体温的极差为0.3CB.病人乙的体温比病人甲的体温稳定C.病人乙体温的众数、中位数与平均数都为36.4CD.病人甲体温的上四分位数为36.4C9.(2023春·山东菏泽·高三校考开学考试)(多选)一组样本数据126,,,xxx,且成等差数列,其中1x是最小值,6x是最大值,则下列各选项正确的是()A.2345,,,xxxx的平均数等于126,,,xxx的平均数B.2345,,,xxxx的中位数等于126,,,xxx的中位数C.2345,,,xxxx的标准差不小于126,,,xxx的标准差D.2345,,,xxxx的极差不大于126,,,xxx的极差10.(2023秋·云南昆明·高三云南省昆明市第十中学校考开学考试)(多选)若甲组样本数据12,,nxxx,(数据各不相同)的平均数为3,乙组样本数据122,2,,2nxaxaxa的平均数为5,下列说错误的是()A.a的值不确定B.乙组样本数据的方差为甲组样本数据方差的2倍C.两组样本数据的极差可能相等D.两组样本数据的中位数可能相等11.(2023·广东梅州·统考三模)(多选)某公司经营五种产业,为应对市场变化,在五年前进行了产业结构调整,优化后的产业结构使公司总利润不断增长,今年总利润比五年前增加了一倍,调整前后的各产业利润与总利润的占比如图所示,则下列结论错误的是()A.调整后传媒的利润增量小于杂志B.调整后房地产的利润有所下降C.调整后试卷的利润增加不到一倍D.调整后图书的利润增长了一倍以上12.(2023·辽宁·大连二十四中校联考模拟预测)(多选)大连市教育局为了解二十四中学、第八中学、育明中学三所学校的学生文学经典名著的年阅读量,采用样本比例分配的分层随机抽样抽取了一个容量为120的样本.其中,从二十四中学抽取容量为35的样本,平均数为4,方差为9;从第八中学抽取容量为40的样本,平均数为7,方差为15;从育明中学抽取容量为45的样本,平均数为8,方差为21,据此估计,三所学校的学生文学经典名著的年阅读量的()A.均值为6.3B.均值为6.5C.方差为17.52D.方差为18.2513.(2023秋·广西南宁·高三南宁市武鸣区武鸣高级中学校考开学考试)(多选)下列命题为真命题的有()A.若随机变量X的方差为1225,则(52)14DXB.已知y关于x的回归直线方程为ˆ0.30.7yx,则样本点(2,3)的残差为1.9C.若随机变量2,XN,且(4)(2)PXPXp,则1212PXpD.根据分类变量X与Y的成对样本数据,计算得到23.712,根据0.05的独立性检验2((3.841)0.05)P,有95%的把握认为X与Y有关14.(2023·福建三明·统考三模)若n为一组从小到大排列的数1,2,3,5,6,8的第六十百分位数,则21nxy的展开式中23xy的系数为.15.(2024秋·浙江·高三舟山中学校联考开学考试)已知成对样本数据1122,,,,,,3nnxyxyxyn中12,,,nxxx互不相等,且所有样本点,1,2,,iixyin都在直线112yx上,则这组成对样本数据的样本相关系数r.16.(2023·四川绵阳·绵阳中学校考二模)2022年4月16日,神舟十三号载人飞船返回舱成功着陆,航天员翟志刚、王亚平、叶光富完成在轨驻留半年的太空飞行任务,标志着中国空间站关键技术验证阶段圆满完成.并将进入建造阶段某地区为了激发人们对天文学的兴趣,开展了天文知识比赛,满分100分(95分及以上为认知程度高),结果认知程度高的有m人,这m人按年龄分成5组,其中第一组:20,25,第二组:25,30,第三组:30,35,第四组:35,40,第五组:40,45,得到如图所示的频率分布直方图,已知第一组有10人.(1)根据频率分布直方图,估计这m人的第80百分位数(中位数第50百分位数);(2)现从以上各组中用分层随机抽样的方法抽取20人,担任“党章党史”的宣传使者.①若有甲(年龄36),乙(年龄42)两人已确定入选宣传使者,现计划从第四组和第五组被抽到的使者中,再随机抽取2名作为组长,求甲、乙两人至少有一人被选上的概率;②若第四组宣传使者的年龄的平均数与方差分别为36和52,第五组宣传使者的年龄的平均数与方差分别为42和1,据此估计这m人中3545岁所有人的年龄的平均数和方差.17.(2023·全国·高三专题练习)某乡镇为了提高乡镇居民收入,对山区进行大面积指导农民种植黄茋、党参、当归等药材,同时在种植药材附近种植草,让牛羊吃,发展畜牧业,第二年将种植药材的地改种草让牛羊吃,将牛羊吃过的草地改种药材,这样药材的生长主要依靠牛羊等有机肥来供给,提高药效,同时增加农民的经济收入.现将该乡镇某农户近7年(2016-2022年对应年份代码1-7)的种植药材的收入金额绘成折线图,同时统计出相关数据:72.65,71266iiy,711197iiixy,17225.8iiyy,71133iiixxyy.(1)根据图中所给出的折线图,判断ybxa$$$和exymn哪一个更适合作为回归模型;(给出判断即可,不必说明理由)(2)求相关系数r(保留两位小数)并求药材种植收入y关于年份代码x的回归直线方程;(3)若在生物学上将在药材附近同时种植草称作间作,将药材和草每年轮流种植称作轮作,根据题目所给信息,分析这两种种植方式对当地居民收入的影响.附:相关系数12211nniiiiiiinxxyyrxxyy,回归直线方程ˆˆybxa中斜率和截距的最小二乘估计公式分别为121ˆniiiniixxyybxx,ˆˆaybx.17.(2022秋·四川遂宁·高三射洪中学校考阶段练习)文旅部门统计了某网红景点在2022年3月至7月的旅游收入y(单位:万),得到以下数据:月份x34567旅游收入y1012111220(1)根据表中所给数据,求出y关于x之间的线性回归方程;(2)为调查游客对该景点的评价情况,随机抽查了200名游客,得到如下列联表,请填写下面的22列联表,能否有99.9%的把握认为“游客是否喜欢该网红景点与性别有关联”.喜欢不喜欢总计男100女60总计110参考公式:线性回归方程:ˆˆˆybxa,其中1122211ˆˆˆ,nniiiiiinniiiixxyyxynxybaybxxxxnx,22()nadbcabcdacbd.临界值表:0.0100.0050.001x6.6357.87910.82818.(2023秋·四川巴中·高三统考开学考试)中央电视台“国家品牌计划”栏目组为了做好新能源汽车的品牌推介,利用网络平台对年龄(单位:岁)在20,60内的人群进行了调查,并从参与调查者中随机选出600人,把这600人分为对新能源汽车比较关注和不太关注两类,制成如下表格:年龄20,3030,4040,5050,60男性人数4012016080比较关注人数87211248女性人数107010020比较关注人数5498016(1)完成下面的列联表,并根据列联表判断能否在犯错误的概率不超过0.01的前提下认为性别与对新能源汽车的关注有关;比较关注不太关注总计男性女性总计(2)为了进一步了解不同性别的消费者对新能源汽车的关注情况,采用分层抽样的方法从这600人中选出6人进行访谈,最后从这6人中随机选出3人参与电视直播节目,记其中男性的人数为X,求X的分布列与期望.附:22()nadbcKabcdacbd,其中nabcd.20PKk0.100.050.0100.0050k2.7063.8416.6357.87920.(2023秋·陕西汉中·高三统考阶段练习)为加强学生对垃圾分类意义的认识,让学生养成良好的垃圾分类的习惯,某校团委组织了垃圾分类知识问卷调查.从该校随机抽取100名男生和100名女生参与该问卷调查,已知问卷调查