第九章统计与成对数据的统计分析(测试)时间:120分钟分值:150分第Ⅰ卷一、选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要求的。1.已知某地区中小学生人数和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.100,10B.100,20C.200,10D.200,202.已知某设备的使用年限x(年)与年维护费用y(千元)的对应数据如下表:x24568y34.56.57.59由所给数据分析可知:x与y之间具有线性相关关系,且y关于x的经验回归方程为ˆˆ1.05yxa,则ˆa()A.0.75B.0.85C.0.95D.1.053.一组数据按从小到大的顺序排列为1,4,4,x,7,8(7x),若该组数据的中位数是众数的54倍,则该组数据的60%分位数是()A.4B.5C.6D.74.用模型ekxya拟合一组数据组,1,2,3,,7iixyi,其中1277xxx,设lnzy,得变换后的线性回归方程为ˆ4zx,则127yyy()A.70eB.35eC.70D.355.某机构对1000名网络购物者2022年度的消费情况进行统计,发现消费金额(单位:万元)都在0.3,0.9内,其频率分布直方图如图所示,则这1000名购物者消费金额的平均数约为(同一组中的数据用该组区间的中点值作代表)()A.0.69(万元)B.0.537(万元)C.0.53(万元)D.0.62(万元)6.以下四个命题,其中正确的个数有()①经验回归直线ˆˆˆybxa必过样本中心点(),xy;②在经验回归方程ˆ120.3yx中,当变量x每增加一个单位时,变量ˆy平均增加0.3个单位;③由独立性检验可知,有99%的把握认为物理成绩与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀;④在一个22列联表中,由计算得213.709,则有99.9%的把握确认这两个变量间有关系(其中210.8280.001P).A.1个B.4个C.3个D.2个7.根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:①平均数4x;②平均数4x且极差小于或等于3;③平均数4x且标准差4s;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有()A.1组B.2组C.3组D.4组8.设两个相关变量x和y分别满足ixi,12iiy,1i,2,…,6,若相关变量x和y可拟合为非线性回归方程ˆ2bxay,则当7x时,y的估计值为()A.32B.63C.64D.128二、选择题:本题共4小题,每小题5分,共20分。在每小题给出的选项中,有多项符合题目要求。全部选对的得5分,部分选对的得2分,有选错的得0分。9.在某区高三年级第一学期初举行的一次质量检测中,某学科共有2000人参加考试.为了解本次考试学生的该学科成绩情况,从中抽取了n名学生的成绩(成绩均为正整数,满分为100分)进行统计,成绩均在50,100内,按照50,60,60,70,70,80,80,90,90,100的分组作出频率分布直方图(如图所示).已知成绩落在50,60内的人数为16,则下列结论正确的是()A.1000nB.估计全体学生该学科成绩的平均分为70.6分C.若成绩低于60分定为不及格,估计全体学生中不及格的人数约为300人D.若将该学科成绩由高到低排序,前15%的学生该学科成绩为A等,则成绩为79分的学生该学科成绩有可能是A等10.某学校一同学研究温差C()x与本校当天新增感冒人数y(人)的关系,该同学记录了5天的数据:x568912y1720252835经过拟合,发现基本符合经验回归方程2.6ˆˆyxa,则()A.样本中心点为8,25B.ˆ4.2aC.5x,残差为0.2D.若去掉样本点(8,25),则样本的相关系数r增大11.若一组不完全相同的数据1x,2x,…,nx的平均数为x,极差为a,中位数为b,方差为2s,在这组数据中加入一个数x后得到一组新数据x,1x,2x,…,nx,其平均数为x,极差为a,中位数为b,方差为2s,则下列判断一定正确的是()A.xxB.aaC.bbD.22ss12.小明在家独自用下表分析高三前5次月考中数学的班级排名y与考试次数x的相关性时,忘记了第二次和第四次月考排名,但小明记得平均排名6y,于是分别用m=6和m=8得到了两条回归直线方程:11ybxa,22ybxa,对应的相关系数分别为1r、2r,排名y对应的方差分别为21s、22s,则下列结论正确的是()x12345y10m6n2(附:1221niiiniixynxybxnx,aybx)A.12rrB.2212ssC.12bbD.12aa第Ⅱ卷三、填空题:本题共4小题,每小题5分,共20分。13.现从某学校450名同学中用随机数表法随机抽取30人参加一项活动.将这450名同学编号为001,002,…,449,450,要求从下表第2行第5列的数字开始向右读,则第5个被抽到的编号为.16227794394954435482173793237887352096438426349164844217533157245506887704744767217633502583921206766301637859169555671998105071751286735807443952387914.为调查某地区中学生每天睡眠时间,采用样本量比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间均值为9小时,方差为0.5,抽取高中生1200人,其每天睡眠时间均值为8小时,方差为1,则估计该地区中学生每天睡眠时间的方差为.15.近年来,加强青少年体育锻炼,重视体质健康已经在社会形成高度共识.2021年10月,《中华人民共和国体育法》在颁布20多年后迎来首次大修.教育部发布的2022年工作要点中提出,实施学校体育和体教融合改革发展行动计划.为了考察某校各班参加两项以上体育项目锻炼小组的人数,在全校随机抽取五个班级,把每个班级参加两项以上体育项目锻炼小组的人数作为样本数据.已知样本平均数为7,样本的标准差为2,若样本数据各不相同,则样本数据的第80百分位数是.16.某校团委对“学生性别和喜欢网络游戏是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢网络游戏的人数占男生人数的45,女生喜欢网络游戏的人数占女生人数的35.若根据独立性检验认为喜欢网络游戏和性别有关,且此推断犯错误的概率超过0.01但不超过0.05,则被调查的学生中男生可能有人.(请将所有可能的结果都填在横线上)附表:22nadbcabcdacbd,其中nabcd.0.0500.010x3.8416.635四、解答题:本题共6小题,共70分。解答应写出文字说明、证明过程或演算步棸。17.(10分)ChatGPT作为一个基于大型语言模型的聊天机器人,最近成为全球关注的焦点.ChatGPT是一个超强的AI,它能像人类一样聊天交流,甚至能完成撰写邮件、文案、写论文、答辩、编程等任务.专家预言,随着人工智能技术的发展,越来越多的职业可能会被ChatGPT或其他类似的人工智能工具所取代.某地区为了了解ChatGPT的普及情况,统计了该地区从2023年1月至5月使用ChatGPT的用户人数y(万人),详见下表:X(月份)12345Y(万人)3.66.411.718.6427.5(1)根据表中数据信息及模型(1)yaxb与模型(2)2yaxb,判断哪一个模型更适合描述变量x和y的变化规律(无需说明理由),并求出y关于x的经验回归方程;(2)为了进一步了解人们对适应人工智能所将带来的职业结构变化的自信程度(分为“基本适应”和“不适应”)是否跟年龄有关,某部门从该地区随机抽取300人进行调查,调查数据如下表:基本适应不适应合计年龄小于30岁10050150年龄不小于30岁7575150合计175125300根据小概率0.01的独立性检验,分析该地区对职业结构变化的自信程度是否与年龄有关.附参考公式与数据:1221)(ˆniiiniixynxybxnx,ˆaybx;51iix521iix541iix51iiy51iiixy521iiixy155597967.84263.561120.2422,nadbcnabcdabcdacbd0.150.10.050.0250.010.001x2.0722.7063.8415.0246.63510.82818.(12分)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:40,50,50,60,…,90,100得到如图所示的频率分布直方图.(1)求频率分布直方图中a的值;(2)求样本成绩的第75百分位数;(3)已知落在50,60的平均成绩是61,方差是7,落在60,70的平均成绩为70,方差是4,求两组成绩的总平均数z和总方差2s.19.(12分)如图是我国2016年至2022年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1—7分别对应年份2016—2022.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2024年我国生活垃圾无害化处理量.附注:参考数据:719.32iiy,7140.17iiity,7210.55iiyy,72.646.参考公式:相关系数12211niiinniiiittyyrttyy,回归方程yabt$$$中斜率和截距最小二乘估计公式分别为121niiiniittyybtt,aybt$$.20.(12分)秋天的第一杯奶茶是一个网络词汇,最早出自四川达州一位当地民警之口,民警用“秋天的第一杯奶茶”顺利救下一名女孩,由此而火爆全网.后来很多人开始在秋天里买一杯奶茶送给自己在意的人.某奶茶店主记录了入秋后前7天每天售出的奶茶数量(单位:杯)如下:日期第一天第二天第三天第四天第五天第六天第七天日期代码x1234567杯数y4152226293132(1)请根据以上数据,绘制散点图,并根据散点图判断,yabx与lnycdx哪一个更适宜作为y关于x的回归方程模型(给出判断即可,不必说明理由);(2)建立y关于x的回归方程(结果保留1位小数),并根据建立的回归方程,试预测要到哪一天售出的奶茶才能超过35杯?(3)若每天售出至少25杯即可盈利,则从第一天至第七天中任选三天,记随机变量X表示盈利的天数,求随机变量X的分布列.参考公式和数据:其中711ln,7iiiiuxuu回归直线方程ˆˆˆybxa中,111221ˆˆˆ,niniixynxybaybxxnxyu711iixy711iiuy721iiu2.1e22.71.2759235.113.28.221.(12分)黄河鲤是我国华北地区的主要淡水养殖品种之一,其鳞片金黄、体形梭长,尤以色泽鲜丽、肉质细嫩、气味清香而著称.为研究黄河鲤早期生长发育的规律,丰富黄河鲤早期养殖经验,某院校研究小组以当地某水产养