统计学(E)一、单项选择题(每题2分,共20分)1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于()A、应用统计学B、描述统计学C、推断统计学D、理论统计学2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数()A、扩大2倍B、减少到1/3C、不变D、减少到1/23、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31.则最大艇速的均值的无偏估计值为A、32.5B、33C、39.6D、304、若两个变量的平均水平接近,标准差越大的变量,其()A、平均值的代表性越好B、离散程度越大C、稳定性越高D、离散程度越小5、对正态总体均值进行区间估计时,其它条件不变,置信水平1越小,则置信上限与置信下限的差()A、越大B、越小C、不变D、不确定6、方差分析中的原假设是关于所研究因素()A、各水平总体方差是否相等B、各水平的理论均值是否相等C、同一水平内部数量差异是否相等D、同一水平内部数值相等7、某年某地区甲乙两类职工的月平均收入分别为1060元和3350元标准差分别为230元和680元则职工月平均收入的离散程度A、甲类较大B、乙类较大C、两类相同D、不确定8、在假设检验中,若500:,500:10HH,则此检验是()A、左侧检验B、右侧检验C、双侧检验D、不知道9、某专家小组成员的年龄分别为29,45,35,43,45,58,他们年龄的中位数为()A、45B、40C、44D、4310、某次考试学生的考试成绩X近似服从正态分布,64,78~NX,则可认为有大约95.45%的学生考试成绩分布的范围是A、(70,80)B、(70,86)C、(62,94)D、(70,90)二、多项选择题(每题2分,共10分)1.估计量的评价标准是()A无偏性B有效性C一致性D客观性E及时性2.下列哪些属于全面调查()A普查B全面统计报表C重点调查D典型调查E抽样调查3.下列关于变量数列中频率的说明不正确的是()A各组频率大于1B各组频率大于0C各组频率之和等于1D各组频率之和小于1E各组频率之和大于14.总体平均数的假设检验方法通常有()AZ检验法Bt检验法C2检验法DF检验法E几何检验法5.收入与消费存在一定的相关关系,这种相关属于()A正相关B单相关C负相关D复相关E完全相关三、填空题(每空2分,共20分)1、统计词有三种涵义,即________________、_________________与_____________________。2、加权算术平均数受两个因素的影响,一个是______________,一个是_____________。3、在假设检验中,把符合0H的总体判为不符合0H加以拒绝,这类错误称为____________错误;把不符合0H的总体当作符合0H而接受,这类错误称为____________错误;显著性水平是用来控制犯第_______类错误的概率。4、直线相关系数等于零,说明两变量之间________________;直线相关系数等于-1,说明两变量之间_______________________。四、简答题(每题5分,共20分)1、统计学的确对我们的生活的各个方面起着重要的作用,但如果有意或者无意地误用统计学方法,其结论则会带来更大的欺骗性。为了避免这种情况的发生,请根据你的了解,写出1个误用统计学方法的例子,并说明应该如何正确应用方法?2、随机抽样的含义与特点?3、什么是标准差系数?在什么场合下计算标准差系数?4、说明单因素方差分析中,总离差平方和、水平项离差平方和、误差项离差平方和的含义与三者的关系?五、计算题(每题10分,共30分)1、随机抽查某企业100名职工,其月工资资料如下表2、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)3、从某一行业中随机抽取5家企业,所得产品产量与生产费用的数据如下:产品产量(台)xi4050507080生产费用(万元)yi130140145150156要求:利用最小二乘法求出估计的回归方程。附:58x2.144y17900512ixi104361512iyi4243051yxiii月工资额(百元)职工数(人)要求:根据表中资料计算职工月工资的平均数、标准差和离散系数。5—88-1010-1212-1414—184108033合计100统计学(E)一、选择题(每题2分,共20分)1.B2.A3.B4.B5.B6.B7.A8.A9.C10.C二、多项选择题(每题2分,共10分)1.ABC2.AB3.ADE4.AB5.AB三、填空题(每空2分,共20分)1.统计工作、统计数据、统计学2\变量水平、权数3\各组权数相等4\所有单位、全面调查5\无线性相关、完全负相关四、简答题(每题5分,共20分)1.答:有关数据均值的计算。当数据呈较严重偏态分布时,用平均数则代表性很差(2分)。正确使用的原则:(1)众数:不受极端值影响,具有不惟一性,数据分布偏斜程度较大时应用(1分)。(2)中位数:不受极端值影响,数据分布偏斜程度较大时应用(1分)。(3)平均数:易受极端值影响,数学性质优良,数据对称分布或接近对称分布时应用(1分)。2.答:随机原则,就是排除主观意愿的干扰,使总体的每个单位都有一定的概率被抽选为样本单位,每个总体单位能否入样是随机的(1分)。遵循随机原则抽样,能有效避免主观选样带来的倾向性误差,使得样本资料能够用于估计和推断总体的数量特征,而且使这种估计和推断得以建立在概率论和数理统计的科学理论上,可以计算和控制抽样误差,能够说明估计结果的可靠程度(3分)。3.答:标准差系数是标准差与均值的比较,是一个无量纲的相对数,用于反映与比较数据的离散程度。(2分)因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数。(3分)4、答:SST----总离差平方和,反映全部数据总的误差程度;SSE-----误差项离差平方和,反映随机误差的大小;SSA-----水平项离差平方和,反映随机误差和系统误差的大小;(3分)三者之间的关系:SST=SSA+SSE。(2分)五、计算题(每题10分,共30分)1.解:人)百元/(83.101001083fxfx(4分)12fxxsi)(=1.44(百元/人)(4分)xsv13.3%(2分)2.解:49n是大样本,已知:8.2,6.12Sx0455.0则有:202275.02ZZ平均误差=4.078.22nS(3分)极限误差8.04.0222nSZ(3分)据公式22SxZxn(4分)代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4)元。3.解:计算估计的回归方程:)(221xxnyxxyn=290217900572129042430554003060=0.567(4分)nxny10144.2–0.567×58=111.314(4分)估计的回归方程为:y=111.314+0.567x(2分)