1《统计学原理》作业(三)(第五~第七章)一、判断题:1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(×)2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(×)3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证(√)4、抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的。(×)5、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。(√)6、在一定条件,施肥量与收获率是正相关关系。(√)7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√)。8、利用一个回归方程,两个变量可以互相推算(×)。二、单项选择题1、在一定的抽样平均误差条件下(A)。A、扩大极限误差范围,可以提高推断的可靠程度B、扩大极限误差范围,会降低推断的可靠程度C、缩小极限误差范围,可以提高推断的可靠程度D、缩小极限误差范围,不改变推断的可靠程度2、反映样本指标与总体指标之间的平均误差程度的指标是(C)。A、抽样误差系数B、概率度C、抽样平均误差D、抽样极限误差3、抽样平均误差是(C)。A、全及总体的标准差B、样本的标准差C、抽样指标的标准差D、抽样误差的平均差4、当成数等于(C)时,成数的方差最大。A、1B、0c、0.5D、-125、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是(C)。A、等于78%B、大于84%c、在此76%与84%之间D、小于76%6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差(A)。A、甲厂比乙厂大B、乙厂比甲厂大C、两个工厂一样大D、无法确定7、反映抽样指标与总体指标之间抽样误差可能范围的指标是(B)。A、抽样平均误差;B、抽样极限误差;C、抽样误差系数;D、概率度。8、如果变量x和变量y之间的相关系数为1,说明两变量之间(D)。A、不存在相关关系B、相关程度很低C、相关程度显著D、完全相关9、一般说,当居民的收入减少时,居民的储蓄款也会相应减少,二者之间的关系是(A)。A、直线相关B、完全相关C、非线性相关D、复相关10、年劳动生产率x(千元)和工人工资y(元)之间的回归方程为yc=30+60x,意味着劳动生产率每提高2千元时,工人工资平均增加(B)。A、60元B、120元C、30元D、90元11、如果变量x和变量y之间的相关系数为-1,说明两个变量之间是(B)A、高度相关关系B、完全相关关系C、完全不相关D、低度相关关系12、价格不变的条件下,商品销售额和销售量之间存在着(D)。A、不完全的依存关系B、不完全的随机关系C、完全的随机关系D、完全的依存关系三、多项选择题1、影响抽样误差大小的因素有(ABCD)。A、抽样调查的组织形式B、抽取样本单位的方法3C、总体被研究标志的变异程度D、抽取样本单位数的多少E、总体被研究标志的属性2、在抽样推断中(ACD)。A、抽样指标的数值不是唯一的B、总体指标是一个随机变量C、可能抽取许多个样本D、统计量是样本变量的涵数E、全及指标又称为统计量3、从全及总体中抽取样本单位的方法有(BC)。A、简单随机抽样B、重复抽样c、不重复抽样D、概率抽样E、非概率抽样4、在抽样推断中,样本单位数的多少取决于(ABCE)。A、总体标准差的大小B、允许误差的大小C、抽样估计的把握程度D、总体参数的大小E、抽样方法5、总体参数区间估计必须具备的三个要素是(BDE)。A、样本单位数B、样本指标c、全及指标D、抽样误差范围E、抽样估计的置信度6、在抽样平均误差一定的条件下(AD)。A、扩大极限误差的范围,可以提高推断的可靠程度B、缩小极限误差的范围,可以提高推断的可靠程度C、扩大极限误差的范围,只能降低推断的可靠程度D、缩小极限误差的范围,只能降低推断的可靠程度E、扩大或缩小极限误差范围与推断的可靠程度无关7、判定现象之间有无相关关系的方法是(ABCD)。A、对客观现象作定性分析B、编制相关表C、绘制相关图D、计算相关系数E、计算估计标准误8、相关分析特点有(BCDE)。A.两变量不是对等的B.两变量只能算出一个相关系数C.相关系数有正负号D.两变量都是随机的4E.相关系数的绝对值介于0和1之间9、下列属于负相关的现象是(ABD)。A、商品流转的规模愈大,流通费用水平越低B、流通费用率随商品销售额的增加而减少C、国民收入随投资额的增加而增长D、生产单位产品所耗工时随劳动生产率的提高而减少E、某产品产量随工人劳动生产率的提高而增加10、设产品的单位成本(元)对产量(百件)的直线回归方程为Yc=76-1.85x,这表示(ACE)。A.产量每增加100件,单位成本平均下降1.85元B.产量每减少100件,单位成本平均下降1.85元C.产量与单位成本按相反方向变动D.产量与单位成本按相同方向变动E.当产量为200件时,单位成本为72.3元四、简答题1、什么是抽样误差?影响抽样误差大小的因素有哪些?答:抽样误差是指由于抽样的偶然因素使样本各单位的结构不足以代表总体各单位的机构,而引起抽样指标和全及指标之间的绝对离差。影响抽样误差大小的因素有:总体各单位标志值的差异程度、样本的单位数、抽样方法和抽样调查的组织形式。2、什么是抽样平均误差和抽样极限误差?二者有何关系?写出二者的计算公式答:抽样平均误差是反映抽样误差一般水平的指标;而抽样极限误差是反映抽样误差的最大范围的指标,二者既有联系又有区别。二者的联系是:极限误差是在抽样平均误差的基础上计算得到的,即t;二者的区别是:(1)二者涵义不同;(2)影响误差大小的因素不同;(3)计算方法不同。3、请写出计算相关系数的简要公式,并说明相关系数的取值范围及其判断标准。答:r=2222)()(yynxxnyxxyn第一,当1r时,x与y变量为完全线性相关,x与y之间存在着确定的函数关系。第二,当0<r<1时,表示x与y存在着一定的线性相关。r的数值愈大,愈接近于1,表示x与y直线相关程度愈高;反之,r的数值愈小,愈接近于0,表示x与y直线相关程度愈低。通常判断5的标准是,r<0.3称为微弱相关,0.3<r<0.5称为低度相关,0.5<r<0.8称为显著相关,0.8<r<1称为高度相关。第三,当r>0时,表示x与y为正相关;当r<0时,表示x与y为负相关。第四,当0r时,表示y的变化与x无关,即x与y完全没有直线相关。相关系数为0即所谓零相关。零相关未必就是不相关,因为可能存在其他非线性相关。4、拟合回归方程yc=a+bx有什么前提条件?在回归方程yc=a+bx,参数a,b的经济含义是什么?答:拟合直线回归方程的要求是:(1)两变量之间确实存在线性相关关系;(2)两变量相关的密切程度必须显著;(3)找到合适的参数ba,,使所确定的回归方程达到使实际的y值与对应的理论值cy的离差平方和为最小。(1)回归方程中参数a代表直线的起点值,在数学上称为直线的纵轴截距,它表示0x时y的常数项。(2)参数b称为回归系数,表示自变量x增加一个单位时因变量y的平均增加值。回归系数的正负号与相关系数是一致的,因此可以从回归系数的正负号判断两变量相关的方向。五、计算题1、某企业生产一批零件,随机重复抽取400只做使用寿命试验。测试结果平均寿命为5000小时,样本标准差为300小时,400只中发现10只不合格。根据以上资料计算平均数的抽样平均误差和成数的抽样平均误差。解:n=400101nx=5000小时=300x=n=400300=15(小时)P=nn1=40010=2.5%p=npp)1(=400975.0025.0=0.00778=0.78%答:平均数的平均误差为15小时。成数的平均误差为0.78%62、外贸公司出口一种食品,规定每包规格不低于150克,现在用重复抽样的方法抽取其中的100包进行检验,其结果如下:每包重量(克)包数148-149149-150150-151151-15210205020合计100要求:(1)以99.73%的概率估计这批食品平均每包重量的范围,以便确定平均重量是否达到规格要求.(2)以同样的概率保证估计这批食品合格率范围。解:7.010070pfxfx=20502010205.151505.150205.149105.1483.15010015030ffxx2==100203.1505.151503.1505.150203.1505.149103.1505.1482222)()()()(=0.87087.010087.0nx261.0087.03zx56.15004.150261.03.150,即xx0458.0)1(nppp1374.00458.03ppz78374.05626.01374.07.0,即pp3、单位按简单随机重复抽样方式抽取40名职工,对其业务情况进行考核,考核成绩资料如下:68898884868775737268758299588154797695767160916576727685899264578381787772617087要求:(1)根据上述资料按成绩分成以下几组:60分以下,60-70分,70-80分,80-90分,90-100分,并根据分组整理成变量分配数列;(2)根据整理后的变量数列,以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围;(3)若其它条件不变,将允许误差范围缩小一半,应抽取多少名职工?解:(1)成绩组中值人数比重60分以下5537.5%60-7065615%70-80751537.5%80-90851230%90-10095410%合计40100%(2)fxfx=412156349512851575665355)(77403080分ffxx2==4047795127785157775677653775522222)()()()()()(54.10404440分67.14054.10nx34.367.12xxz34.80,66.7334.377xx(3)1609889.23664.444234.354.10422222tn84、采用简单重复抽样的方法,抽取一批产品中的200件作为样本,其中合格品为195件。要求:(1)计算样本的抽样平均误差(2)以95.45%的概率保证程度对该产品的合格品率进行区间估计(z=2)解:(1)%5.97200195p011.0200025.0975.0)1(nppp(2)022.0011.02ppz997.0,953.0022.0975.0pp即:%7.99%3.95p5、某企业上半年产品产量与单位成本资料如下:━━━━━┯━━━━━━━┯━━━━━━━━━━━━月份│产量(千件)│单位成本(元)─────┼───────┼───────────1│2│732│3│723│4│714│3│735│4│696│5│68━━━━━┷━━━━━━━┷━━━━━━━━━━━要求:(1)计算相关系数,说明两个变量相关的密切程度。(2)配合回归方程,指出产量每增加1000件时,单位成本平均变动多少?(3)假定产量为6000件时,单位成本为多少元?解:(1)产量x成本yxy2x2y27314645329937221695184471284165041373219953294692761647