统计学复习提纲一、单选题1.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是(C)。A.1000个消费者B.所有在网上购物的消费者C.所有在网上购物的消费者的平均花费D.1000个消费者的平均花费2.为了调查某学校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种抽样方法属于(D)。A.简单随机抽样B.整群抽样C.系统抽样D.分层抽样3.某班学生平均成绩是80分,标准差10分。如果已知该班学生的考试分数为对称分布,可以判断考试分数在70-90分之间的学生大约占(C)。A.95%B.89%C.68%D.99%4.已知总体的均值为50,标准差为8,从该总体中随机抽取容量为64的样本,则样本均值的期望和抽样分布的标准差分别为(B)。A.50,8B.50,1C.50,4D.8,85.根据某班学生考试成绩的一个样本,用95%的置信水平构造的该班学生考试分数的置信区间为75-85分。全班学生的平均分数(B)A.肯定在这一区间内B.有95%的可能在这一区间内C.有5%的可能在这一区间内D.或者在区间内,或者不在。6.一项研究发现,2000年新购买小汽车的人中有40%是女性,在2005年所做的一项调查中,随机抽取120个新车主中有57认为女性,检验2005年薪车主中女性的比例是否显著增加,建立的原假设和备择假设为(C)A.H0:π=40%,H1:π≠40%B.H0:π≥40%,H1:π40%C.H0:π≤40%,H1:π40%D.H0:π40%,H1:π≥40%7.在回归分析中,因变量的预测区间估计是指(B)。A.对于自变量x的一个给定量x0,求出因变量y的平均值的区间B.对于自变量x的一个给定量x0,求出因变量y的个别值的区间C.对于自变量y的一个给定量y0,求出自变量x的平均值的区间D.对于自变量y的一个给定量y0,求出自变量x的个别值的区间8.在多元线性回归分析中,如果F检验表明线性关系显著,则意味着(A)A.至少有一个自变量与因变量之间的线性关系显著B.所有自变量与因变量之间的线性关系显著C.至少有一个自变量与因变量之间的线性关系不显著D.所有自变量与因变量之间的线性关系不显著9.如果时间序列的逐期观察值按一定的增长率增长(即增长的增长)或衰落,则适合的预测模型是(D)。A.移动平均模型B.指数平滑模型C.线性模型D.指数模型10.设p为商品价格,q为销售量,则指数0010qpqp的实际意义是综合反映了(C)A.商品销售额的变动程度B.商品价格变动对销售额的影响C.商品销售量变动对销售额的影响D.商品价格和销售量的变动对销售额的影响11.根据所使用的计量尺度,统计数据分为(A)。A.分类数据,顺序数据和数值型数据B.观测数据和试验数据C.截面数据和时间序列数据D.数值型数据和试验数据12.饼图的主要作用是(A)。A.反映一个样本或总体的结构B.比较多个总体的构成C.反映一组数据的分布D.比较多个样本的相似性13.如果一组数据是对称分布,则在平均数加减2个标准差之内的数据大约有(C)A.68%B.90%C.95%D.99%14.从均值为200、标准差为50的总体中,抽出n=100的简单随机样本,用样本均值估计总体均值,则x的期望值和标准差为(A)。A.200,5B.200,20C.200,0.5D.200,2515.95%的置信水平是指(C)。A.总体参数在一个特定的样本所构造的区间内的概率为95%B.总体参数在一个特定的样本所构造的区间内的概率为5%C.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95%D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5%。16.在假设检验中,如果所计算的P值越小,说明检验的结果(A)。A.越显著B.越不显著C.越真实D.越不真实17.在下面的假定中,哪一个不属于方差分析中的假定(D)。A.每个总体都服从正态分布B.各总体的方差相等C.观测值是独立的D.各总体方差等于018.在方差分析中,数据的误差是用平方和来表示的,其中组间平方和反映的是(C)。A.一个样本观测值之间的大小B.全部观测值误差的大小C.各个样本均值之间误差的大小D.各个样本方差之间误差的大小19.在多元线性回归分析中,t检验是用来检验(B)。A.总体线性关系的显著性B.各回归系数的显著性C.样本线性关系的显著性D.H0:β1=β2=…=βk=020.下面的哪种方法不适合对平稳序列的预测(D)。A.简单平均法B.移动平均法C.指数平滑法D.线性模型法21.考察总体中个别现象或个别项目数量变动的相对数称为(A)。A.个体指数B.总指数C.简单指数D.加权指数22.反映数量指标变动程度的相对数称为(A)。A.数量指标指数B.质量指标指数C.简单指数D.加权指数23.不存在趋势的时间序列称为(D)。A.非平稳序列B.周期性序列C.季节性序列D.平稳序列24.时间序列在长期内呈现出来的某种持续向上或持续向下的变动称为(A)。A.趋势B.季节性C.周期性D.随机性25.时间序列在一年内呈现出来的周期性波动称为(B)A.趋势B.季节性C.周期性D.随机性26.下面的各问题中,哪个不是相关分析要解决的问题(B)。A.判断变量之间是否存在关系B.判断一个变量数值的变化对另一个变量的影响C.描述变量之间的关系强度D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系27.设产品的产量与产品单位成本之间的线性相关系数为-0.87,说明二者之间存在(A)。A.高度相关B.低度相关C.中度相关D.极弱相关28.从三个总体中各选取了4个观测值,得到组间平方和SSA=536,组内平方和SSE=828,用α=0.05的显著性水平检验假设,H0:μ1=μ2=μ3,H1:μ1,μ2,μ3不全相等,得到的结论是(B)。A.拒绝H0B.不拒绝H0C.可以拒绝也可以不决绝H0D.可能拒绝也可能不决绝H029.在方差分析中,某一水平下的样本数据之间的误差称为(A)。A.随机误差B.非随机误差C.系统误差D.非系统误差30.列联分析是利用列联表来研究(A)。A.两个分类变量的关系B.两个数值型变量的关系C.一个分类变量和一个数值变量的关系D.两个数值型变量的分布31.设R为列离岸表的行数,C为列离岸表的列数,则χ2分布的自由度为(D)A.RB.CC.R×CD.(R-1)(C-1)32.假设检验H0:π=0.2,H1:π≠0.2,由n=200组成的一个随机样本,得到样本比例p=0.175,用于检验的P值为0.2112,在α=0.05的显著性水平下,得到的结论是(B)。A.拒绝H0B.不拒绝H0C.可以拒绝也可以不决绝H0D.可能拒绝也可能不决绝H033.若检验的假设为H0:μ≥μ0,H1:μμ0,则拒绝域为(B)。A.zzαB.z-zαC.zzα/2或z-zα/2D.zzα或z-zα34.如果原假设H0为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率称为(C)。A.临界值B.统计量C.P值D.事先给定的显著性水平35.在其他条件相同的情况下,95%的置信区间比90%的置信区间(A)。A.宽B.窄C.相同D.可能宽也可能窄36.指出下面的正确说法(A)。A.样本量越大,样本均值的抽样标准差就越小B.样本量越大,样本均值的抽样标准差就越大C.样本量越小,样本均值的抽样标准差就越小D.样本量与样本均值的抽样标准差无关37.下列不是次序统计量的是(B)。A.中位数B.均值C.四分位数D.极差38.抽样分布是指(C)。A.一个样本观测值的分布B.总体中各观测值的分布C.样本统计量的分布D.样本数量的分布39.指出下面的变量哪一个是分类变量(D)A.年龄B.工资C.汽车产量D.支付方式(现金、信用卡、支票)40.研究者想要了解总体的某种特征称为(A)A.参数B.变量C.统计量D.变量值41.若检验的假设为H0:μ≤μ0,H1:μμ0,则拒绝域为(A)。A.zzαB.z-zαC.zzα/2或z-zα/2D.zzα或z-zα42.方差分析的主要目的是判断(C)A.各总体是否存在方差B.各样本数据之间是否有显著差异C.分类型自变量对数值型因变量的影响是否显著D.分类型因变量对数值型自变量的影响是否显著43.下列不属于描述统计问题的是(A)A.根据样本信息对总体进行的推断B.了解数据分布的特征C.分析感兴趣的总体特征D.利用图,表或其他数据汇总工具分析数据44.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入.这项研究的参数是(D)A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入45.一名统计学专业的学生为了完成其统计作业,在”统计年鉴”中找到了2006年城镇家庭的人均收入数据,这一数据属于(C).A.分类数据B.顺序数据C.截面数据D.时间序列数据46.哪一个属于抽样误差(A)A.随机误差B.抽样框误差C.回答误差D.无回答误差47.一组样本数据为3,3,1,5,13,12,11,9,7.这组数据的中位数是(D)A.3B.13C.7.1D.748.某厂家生产的灯泡寿命的均值为60小时,标准差为4个小时.如果从中随机抽取30只灯泡进行检测,则样本均值(D)A.抽样分布的标准差为4小时B.抽样分布近似等同于总体分布C.抽样分布的中位数为60小时D.抽样分布近似等同于正态分布,均值为60小时49.置信系数表达了置信区间的(D)A.准确性B.精确性C.显著性D.可靠性50.在方差分析中,检验统计量F是BA.组间平方和除以组内平方和B.组间均方除以组内均方C.组间平方除以总平方和D.组间均方除以总均方51.在方差分析中,不同水平下样本数据之间的误差称为(B)A.组内误差B.组间误差C.组内平方D.组间平方52.在回归分析中,F检验主要是用来检验(C)A.相关系数的显著性B.回归系数的显著性C.线性关系的显著性D.估计标准误差的显著性53.在回归模型中,反映的是(C)A.由于的变化引起的的线性变化部分B.由于的变化引起的的线性变化部分C.除和的线性关系以外的随机因素对的影响D.和的线性关系对的影响54.由最小二乘法得到的回归直线,要求满足因变量的(D)A.平均值与其估计值的离差平方和最小B.实际值与其平均值的离差平方和最小C.实际值与其估计值的离差和为0D.实际值与其估计值的离差平方和最小55.在用正态分布进行置信区间估计时,临界值1.96所对应的置信水平是(C)A.85%B.90%C.95%D.99%56.在Excel输出的方差分析表中,Significance-F值是(D)A.计算出的统计量F值B.给定显著性水平的F临界值C.用于检验回归系数显著性的P值D.用于检验线性关系显著性的P值57.在用正态分布进行置信区间估计时,临界值2.58所对应的置信水平是(D)A.85%B.90%C.95%D.99%58.通过对时间序列逐期递移求得平均数作为预测值的一种预测方法称为(C)A.简单平均法B.加权平均法C.移动平均法D.指数平滑法59.帕氏指数方法是指在编制综合指数时(B)A.用基期的变量值加权B.用报告期的变量值加权C.用固定某一时期的变量值加权D.选择有代表性时期的变量值加权60.由两个不同时期的总量对比形成的指数称为(A)A.总量指数B.综合指数C.加权综合指数D.加权平均指数61.根据样本计算的用于推断总体特征的概括性度量值称作(D).A.参数B.总体C.样本D.统计量62.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入.这项研究的统计量是(C)A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入63.下面的图形中最适合描述一组数据分布的图形是(C).A.条形图B.箱线图C.直方图D.饼图64.下列关于众数的