1模拟试题一一.单项选择题(每小题2分,共20分)1.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是(A)A.1000个消费者B.所有在网上购物的消费者C.所有在网上购物的消费者的平均花费额D.1000个消费者的平均花费金额2.为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种抽样方法属于(D)A.简单随机抽样B.整群抽样C.系统抽样D.分层抽样3.某班学生的平均成绩是80分,标准差是10分。如果已知该班学生的考试分数为对称分布,可以判断考试分数在70到90分之间的学生大约占(C)A.95%B.89%C.68%D.99%4.已知总体的均值为50,标准差为8,从该总体中随机抽取容量为64的样本,则样本均值的数学期望和抽样分布的标准误差分别为(B)A.50,8B.50,1C.50,4D.8,85.根据某班学生考试成绩的一个样本,用95%的置信水平构造的该班学生平均考试分数的置信区间为75分~85分。全班学生的平均分数(D)A.肯定在这一区间内B.有95%的可能性在这一区间内C.有5%的可能性在这一区间内D.要么在这一区间内,要么不在这一区间内6.一项研究发现,2000年新购买小汽车的人中有40%是女性,在2005年所作的一项调查中,随机抽取120个新车主中有57人为女性,在05.0的显著性水平下,检验2005年新车主中女性的比例是否有显著增加,建立的原假设和备择假设为(C)A.%40:,%40:10HHB.%40:,%40:10HHC.%40:,%40:10HHD.%40:,%40:10HH7.在回归分析中,因变量的预测区间估计是指(B)A.对于自变量x的一个给定值0x,求出因变量y的平均值的区间B.对于自变量x的一个给定值0x,求出因变量y的个别值的区间C.对于因变量y的一个给定值0y,求出自变量x的平均值的区间D.对于因变量y的一个给定值0y,求出自变量x的平均值的区间8.在多元线性回归分析中,如果F检验表明线性关系显著,则意味着(A)A.在多个自变量中至少有一个自变量与因变量之间的线性相关系著B.所有的自变量与因变量之间的线性关系都显著C.在多个自变量中至少有一个自变量与因变量之间的线性关系不显著D.所有的自变量与因变量之间的线性关系都不显著9.如果时间序列的逐期观察值按一定的增长率增长或衰减,则适合的预测模型是(D)A.移动平均模型B.指数平滑模型C.线性模型D.指数模型10.设p为商品价格,q销售量,则指数0010qpqp的实际意义是综合反映(B)A.商品销售额的变动程度B.商品价格变动对销售额影响程度C.商品销售量变动对销售额影响程度D.商品价格和销售量变动对销售额影响程度二.简要回答下列问题(每小题5分,共15分)1.简述直方图和茎叶图的区别。2.简述假设检验中P值的含义。3.解释指数平滑法。2三.(15分)甲、乙两个班参加同一学科考试,甲班的平均考试成绩为86分,标准差为12分。乙班考试成绩的分布如下:考试成绩(分)学生人数(人)60以下60—7070—8080—9090—10027975合计30(1)画出乙班考试成绩的直方图。(2)计算乙班考试成绩的平均数及标准差。(3)比较甲乙两个班哪个班考试成绩的离散程度大?四.(25分)某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(克)如下:每包重量(克)包数96-98298-1003100-10234102-1047104-1064合计50假定食品包重服从正态分布,要求:(1)确定该种食品平均重量95%的置信区间。(2)如果规定食品重量低于100克属于不合格,确定该批食品合格率95%的置信区间。(3)采用假设检验方法检验该批食品的重量是否符合标准要求?(05.0,写出检验的具体步骤)。五.(25分)一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(y)与该公司的销售价格(x1)、各地区的年人均收入(x2)、广告费用(x3)之间的关系,搜集到30个地区的有关数据。利用Excel得到下面的回归结果(05.0):方差分析表变差来源dfSSMSFSignificanceF回归4008924.78.88341E-13残差——总计2913458586.7———参数估计表Coefficients标准误差tStatP-valueIntercept7589.10252445.02133.10390.00457XVariable1-117.886131.8974-3.69580.00103XVariable280.610714.76765.45860.00001XVariable30.50120.12593.98140.00049(1)将方差分析表中的所缺数值补齐。(2)写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数的意义。(3)检验回归方程的线性关系是否显著?(4)计算判定系数2R,并解释它的实际意义。(5)计算估计标准误差ys,并解释它的实际意义。3模拟试题一解答一、单项选择题1.A;2.D;3.C;4.B;5.D;6.C;7.B;8.A;9.D;10.B。二、简要回答下列问题1.(1)直方图虽然能很好地显示数据的分布,但不能保留原始的数值;茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息。(2)在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。2.如果原假设0H是正确的,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值P值是假设检验中的另一个决策工具,对于给定的显著性水平,若P,则拒绝原假设。3.指数平滑法是对过去的观察值加权平均进行预测的一种方法,该方法使得第t+1期的预测值等于t期的实际观察值与第t期预测值的加权平均值。一次指数平滑法是适合于平稳序列的一种预测方法,其模型为tttFYF)1(1。三、(1)乙班考试成绩的直方图如下:乙班考试成绩分布的直方图024681060以下60-7070-8080-9090-100考试成绩人数(2)77302310305957859757652551nfMxkiii分分86.112940801305)7795(7)7785(9)7775(7)7765(2)7755(1)(2222212nfxMskiii(3)甲班考试分数的离散系数为:1395.08612xsv甲。乙班考试分数的离散系数为:5401.07768.11xsv乙。由于乙甲vv,所以甲班考试成绩的离散程度小于乙班。4四、(1)已知:50n,96.1205.0z。样本均值为:32.1015050661nfMxkiii克,样本标准差为:634.14988.1301)(12nfxMskiii克。由于是大样本,所以食品平均重量95%的置信区间为:453.032.10150634.196.132.1012nszx即(100.867,101.773)。(2)提出假设:100:0H,100:1H计算检验的统计量:712.550634.110032.1010nsxz由于96.1712.5205.0zz,所以拒绝原假设,该批食品的重量不符合标准要求。五、(1)方差分析表变差来源dfSSMSFSignificanceF回归312026774.14008924.772.808.88341E-13残差261431812.655069.7——总计2913458586.7———(2)多元线性回归方程为:3215012.06107.808861.1171025.7589ˆxxxy。8861.117ˆ1表示:在年人均收入和广告费用不变的情况下,销售价格每增加一个单位,销售量平均下降117.8861个单位;6107.80ˆ2表示:在销售价格和广告费用不变的情况下,年人均收入每增加一个单位,销售量平均增加80.6107个单位;5012.0ˆ3表示:在年销售价格和人均收入不变的情况下,广告费用每增加一个单位,销售量平均增加0.5012个单位。(3)由于SignificanceF=8.88341E-1305.0,表明回归方程的线性关系显著。(4)%36.897.134585861.120267742SSTSSRR,表明在销售量的总变差中,被估计的多元线性回归方程所解释的比例为89.36%,说明回归方程的拟合程度较高。(5)67.2347.550691MSEknSSEse。表明用销售价格、年人均收入和广告费用来预测销售量时,平均的预测误差为234.67。5模拟试题二一.单项选择题(每小题2分,共20分)1.根据所使用的计量尺度不同,统计数据可以分为(A)A.分类数据、顺序数据和数值型数据B.观测数据和试验数据C.截面数据和时间序列数据D.数值型数据和试验数据2.饼图的主要用途是(A)A.反映一个样本或总体的结构B.比较多个总体的构成C.反映一组数据的分布D.比较多个样本的相似性3.如果一组数据是对称分布的,则在平均数加减2个标准差之内的数据大约有(C)A.68%B.90%C.95%D.99%4.从均值为200、标准差为50的总体中,抽出100n的简单随机样本,用样本均值x估计总体均值,则x的数学期望和标准差分别为(A)A.200,5B.200,20C.200,0.5D.200,255.95%的置信水平是指(C)A.总体参数落在一个特定的样本所构造的区间内的概率为95%B.总体参数落在一个特定的样本所构造的区间内的概率为5%C.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为95%D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为5%6.在假设检验中,如果所计算出的P值越小,说明检验的结果(A)A.越显著B.越不显著C.越真实D.越不真实7.在下面的假定中,哪一个不属于方差分析中的假定(D)A.每个总体都服从正态分布B.各总体的方差相等C.观测值是独立的D.各总体的方差等于08.在方差分析中,数据的误差是用平方和来表示的,其中组间平方和反映的是(C)A.一个样本观测值之间误差的大小B.全部观测值误差的大小C.各个样本均值之间误差的大小D.各个样本方差之间误差的大小9.在多元线性回归分析中,t检验是用来检验(B)A.总体线性关系的显著性B.各回归系数的显著性C.样本线性关系的显著性D.0:210kH10.下面的哪种方法不适合对平稳序列的预测(D)A.简单平均法B.移动平均法C.指数平滑法D.线性模型法二.简要回答下列问题(每小题5分,共20分)1.简述直方图和条形图的区别。2.简述中心极限定理。3.回归分析主要解决以下几个方面的问题?4.解释拉氏价格指数和帕氏价格指数。三.(20分)一家物业公司需要购买大一批灯泡,你接受了采购灯泡的任务。假如市场上有两种比较知名品牌的灯泡,你希望从中选择一种。为此,你从两个供应商处各随机抽取了60个灯泡的随机样本,进行“破坏性”试验,得到灯泡寿命数据经分组后如下:灯泡寿命(小时)供应商甲供应商乙700~900124900~1100143461100~130024191300~1500103合计6060(1)请用直方图直观地比较这两个样本,你能得到什么结论?(2)你认为应当采用哪一种统计量来分别描述供应商甲和供应商乙灯泡寿命的一般水平?请简要说明理由。(3)哪个供应商的灯泡具有更长的寿命?(4)哪个供应商的灯泡寿命更稳定?四.(20分)为估计每个网络用户每天上网的平均时间是多少,随机抽取了225个网络