《统计学原理》作业(三)(第五~第七章)一、判断题1、抽样推断是利用样本资料对总体的数量特征进行的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(×)2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(×)3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(√)4、抽样误差即代表性误差和登记误差,这两种误差都是不可避免的。(×)5、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。(√)6、在一定条件下,施肥量与收获率是正相关关系。(√)7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高。(√)8、利用一个回归方程,两个变量可以互相推算(×)二、单项选择题1、在一定的抽样平均误差条件下(A)。A、扩大极限误差范围,可以提高推断的可靠程度B、扩大极限误差范围,会降低推断的可靠程度C、缩小极限误差范围,可以提高推断的可靠程度D、缩小极限误差范围,不改变推断的可靠程度2、反映样本指标与总体指标之间的平均误差程度的指标是(C)。A、抽样误差系数B、概率度C、抽样平均误差D、抽样极限误差3、抽样平均误差是(C)。A、全及总体的标准差B、样本的标准差C、抽样指标的标准差D、抽样误差的平均差4、当成数等于(C)时,成数的方差最大。A、1B、0c、0.5D、-15、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是(C)。A、等于78%B、大于84%c、在此76%与84%之间D、小于76%6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差(A)。A、甲厂比乙厂大B、乙厂比甲厂大C、两个工厂一样大D、无法确定7、反映抽样指标与总体指标之间抽样误差可能范围的指标是(B)。A、抽样平均误差;B、抽样极限误差;C、抽样误差系数;D、概率度。8、如果变量x和变量y之间的相关系数为1,说明两变量之间(D)。A、不存在相关关系B、相关程度很低C、相关程度显著D、完全相关9、一般说,当居民的收入减少时,居民的储蓄款也会相应减少,二者之间的关系是(A)。A、直线相关B、完全相关C、非线性相关D、复相关10、年劳动生产率x(千元)和工人工资y(元)之间的回归方程为yc=30+60x,意味着劳动生产率每提高2千元时,工人工资平均增加(B)。A、60元B、120元C、30元D、90元11、如果变量x和变量y之间的相关系数为-1,说明两个变量之间是(B)A、高度相关关系B、完全相关关系C、完全不相关D、低度相关关系12、价格不变的条件下,商品销售额和销售量之间存在着(D)。A、不完全的依存关系B、不完全的随机关系C、完全的随机关系D、完全的依存关系三、多项选择题1、影响抽样误差大小的因素有(A、B、C、D)。A、抽样调查的组织形式B、抽取样本单位的方法C、总体被研究标志的变异程度D、抽取样本单位数的多少E、总体被研究标志的属性2、在抽样推断中(A、C、D)。A、抽样指标的数值不是唯一的B、总体指标是一个随机变量C、可能抽取许多个样本D、统计量是样本变量的涵数E、全及指标又称为统计量3、从全及总体中抽取样本单位的方法有(B、C)。A、简单随机抽样B、重复抽样c、不重复抽样D、概率抽样E、非概率抽样4、在抽样推断中,样本单位数的多少取决于(A、B、C、E)。A、总体标准差的大小B、允许误差的大小C、抽样估计的把握程度D、总体参数的大小E、抽样方法5、总体参数区间估计必须具备的三个要素是(B、D、E)。A、样本单位数B、样本指标c、全及指标D、抽样误差范围E、抽样估计的置信度6、在抽样平均误差一定的条件下(A、D)。A、扩大极限误差的范围,可以提高推断的可靠程度B、缩小极限误差的范围,可以提高推断的可靠程度C、扩大极限误差的范围,只能降低推断的可靠程度D、缩小极限误差的范围,只能降低推断的可靠程度E、扩大或缩小极限误差范围与推断的可靠程度无关7、判定现象之间有无相关关系的方法是(A、B、C、D)。A、对客观现象作定性分析B、编制相关表C、绘制相关图D、计算相关系数E、计算估计标准误8、相关分析特点有(B、C、D、E)。A.两变量不是对等的B.两变量只能算出一个相关系数C.相关系数有正负号D.两变量都是随机的E.相关系数的绝对值介于0和1之间9、下列属于负相关的现象是(A、B、D)。A、商品流转的规模愈大,流通费用水平越低B、流通费用率随商品销售额的增加而减少C、国民收入随投资额的增加而增长D、生产单位产品所耗工时随劳动生产率的提高而减少E、某产品产量随工人劳动生产率的提高而增加10、设产品的单位成本(元)对产量(百件)的直线回归方程为,这表示(A、C、E)A、产量每增加100件,单位成本平均下降1.85元B、产量每减少100件,单位成本平均下降1.85元C、产量与单位成本按相反方向变动D、产量与单位成本按相同方向变动E、当产量为200件时,单位成本为72.3元四、简答题1、例子说明总体、样本、参数、统计量、变量这几个概念?答:如果研究的对象是100人,这100人就是总体。从中抽取10人做研究,那就是样本。参数是反映总体统计特征的数字,如这100人的平均身高,方差等等。变量就是反应总体的某些特性的量,如身高。2、什么是抽样平均误差和抽样极限误差?二者有何关系?写出二者的计算机公式答:抽样平均误差是反映抽样误差一般水平的指标;而抽样极限误差是反映抽样误差的最大范围的指标,二者既有联系又有区别。二者的联系是:极限误差是在抽样平均误差的基础上计算得到的,即;二者的区别是:(1)二者涵义不同;(2)影响误差大小的因素不同;(3)计算方法不同。抽样平均误差=标准差/样本单位数的平方根;抽样极限误差=样本平均数减去总体平均数的绝对值;抽样极限误差是T倍的抽样平均误差。3、解释相关关系的含义,说明相关关系的特点。。函数关系是一一对应的确定关系,例如当银行年利率确定时,年利息额y与存款额x之间就是函数关系,它表现为y=x×r。而相关关系就没有这样确定的关系了,我们把变量之间存在的不确定的数量关系称为相关关系(correlation)。比如家庭的储蓄额和家庭收入之间的关系。如果发现家庭储蓄额随家庭收入的增长而增长,但它们并不是按照一个固定不变的比率变化的,由于可能还会有其他很多较小的因素影响着家庭储蓄这个变量,因此这其中可能会有高低的偏差,这种关系就是相关关系而不是函数关系。另一个变量惟一确定,当变量x取某一个值时,变量y的取值可能有几个。对这种关系不确定的变量显然不能用函数关系进行描述,但也不是无任何规律可循。通过对大量数据的观察与研究,我们就会发现许多变量之间确实存在一定的客观规律。4、请写出计算相关系数的简要公式,说明相关关系的取值范围及其判断标准?答:相关系数的简要公式:2222111ynyxnxyxnxyr1)相关系数的数值范围是在–1和+1之间,即时,0r时为正相关,0r时为负相关。2)当时,x与y完全相关;两变量是函数关系;微弱相关低度相关当时,x与y不完全相关(存在一定线性相关)显著相关高度相关当时,x与y不相关5、拟合回归程yc=a+bx有什么前提条件?在回归方程yc=a+bx,参数a,b的经济含义是什么?答:1)拟合回归方程的要求有:1)两变量之间确存在线性相关关系;2)两变量相关的密切程度必须是显著相关以上;3)找到全适的参数a,b使所确定的回归方程达到使实际的y值与对应的理论估计值cy的离差平方和为最小。2)a的经济含义是代表直线的起点值,在数学上称为直线的纵轴截距,它表示x=0时y常项。参数b称为回归系数,表示自变量增加一个单位时因变量y的平均增加值,回归系数b正负号可以判断相关方向,当b0时,表示正相关,当b0表示负相关。五、计算题1、某企业生产一批零件,随机重复抽取400只做使用寿命试验。测试结果平均寿命为5000小时,样本标准差为300小时,400只中发现10只不合格。根据以上资料计算平均数的抽样平均误差和成数的抽样平均误差。(学习指导书P177第2题)解:1)平均数的抽样平均误差:2)成数的抽样平均误差:2、外贸公司出口一种食品,规定每包规格不低于150克,现在用重复抽样的方法抽取其中的100包进行检验,其结果如下:每包重量(克)包数148-149149-150150-151151-15210205020——100要求:(1)以99.73%的概率估计这批食品平均每包重量的范围,以便确定平均重量是否达到规格要求;(2)以同样的概率保证估计这批食品合格率范围。解:组中值包数fXf148.510148532.4149.520199012.8150.55075252151.520303028.8合计10015030=76=fxfbxayc11003.05.3.0o1.08.08.05.o10小时15400300nx%78.0400%&75*%25n)1(ppxfxx2)(fxffxx2)((克)(克)2)已知:3;70;1001tnn答:1)以99.73%的概率估计这批食品平均每包重量的范围为150.04---150.56克,大于150克,所以平均重量是达到规格要求2)以99.73%的概率保证估计这批食品合格率范围为56.26%--83.74。3、单位按简单随机重复抽样方式抽取40名职工,对其业务情况进行考核,考核成绩资料如下:68898884868775737268758299588154797695767160916576727685899264578381787772617087要求:(1)根据上述资料按成绩分成以下几组:60分以下,60-70分,70-80分,80-90分,90-100分,并根据分组整理成变量分配数列;(2)根据整理后的变量数列,以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围;(3)若其它条件不变,将允许误差范围缩小一半,应抽取多少名职工?解:1)分配数列成绩工人数(频数)f各组企业数所占比重(频率)%60以下37.560——7061570——801537.580——90123090—100410合计401002)全体职工业务考试成绩的区间范围成绩组中值工人数fXf55316514526563908647515112560851210207689543801296合计403080=4440=fxf30.15010015030fxfx872.010076)(2ffxx0872.0100872.0nx26.00872.03xxt56.15004.15026.030.15030.15026.0XXxXxxxfffxx2)(fxffxx2)(77403080fxfx52.10404440)(2ffxx67.14052.10nx34.367.12xxt3.8066.7334.37734.377XXxXxxx%58.4100)7.01(7.0)1(%;70%100100701nPPnnpp74.1358.43ppt%74.83%26.56%74.13%70%70%74.13PPpPppp3)已知:67.1234.3212xx(分)t=2(人)答:(2)根据整理后的变量数列,以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围73.66---80.3;(3)若其它条件不变