应用统计学习题及答案简答题1.简述普查和抽样调查的特点。答:普查是指为某一特定目的而专门组织的全面调查,它具有以下几个特点:(1)普查通常具有周期性。(2)普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。(3)普查的数据一般比较准确,规划程度也较高。(4)普查的使用范围比较窄。抽样调查指从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。它具有以下几个特点:(1)经济性。这是抽样调查最显著的一个特点。(2)时效性强。抽样调查可以迅速、及时地获得所需要的信息。(3)适应面广。它适用于对各个领域、各种问题的调查。(4)准确性高。2.为什么要计算离散系数?答:离散系数是指一组数据的标准差与其相应得均值之比,也称为变异系数。对于平均水平不同或计量单位不同的不同组别的变量值,是不能用方差和标准差比较离散程度的。为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。离散系数的作用主要是用于比较不同总体或样本数据的离散程度。离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。3、加权算术平均数受哪几个因素的影响?若报告期与基期相比各组平均数没变,则总平均数的变动情况可能会怎样?请说明原因。答:加权算术平均数受各组平均数喝次数结构(权数)两因素的影响。若报告期与基期相比各组平均数没变,则总平均数的变动受次数结构(权数)变动的影响,可能不变、上升、下降。如果各组次数结构不变,则总平均数;如果组平均数高的组次数比例上升,组平均数低的组次数比例下降,则总平均数上升;如果组平均数低的组次数比例上升,组平均数高的组次数比例下降,则总平均数下降。4.解释相关关系的含义,说明相关关系的特点。答:变量之间存在的不确定的数量关系为相关关系。相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个;变量之间的相关关系不能用函数关系进行描述,但也不是无任何规律可循。通常对大量数据的观察与研究,可以发现变量之间存在一定的客观规律。5.解释抽样推断的含义。答:简单说,就是用样本中的信息来推断总体的信息。总体的信息通常无法获得或者没有必要获得,这时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量特征。6.回归分析与相关分析的区别是什么?答:(1)相关分析所研究的两个变量是对等关系,而回归分析所研究的两个变量不是对等关系;(2)对于两个变量X和Y来说,相关分析只能计算出一个反映两个变量间相关密切程度的相关系数,而回归分析可分别建立两个不同的回归方程;(3)相关分析对资料的要求是,两个变量都必须是随机的,而回归分析对资料的要求是自变量是给定的,因变量是随机的。7.什么是方差分析?答:方差分析是通过对误差的分析,检验多个总体均值是否相等的一种统计方法。它分为单因素方差分析和双因素方差分析。8.简述相关分析与回归分析的联系。答:相关分析是用于判断两个变量之间相关关系的密切程度,进而对这种判断的可靠程度加以检验的统计方法;而回归分析是分析研究变量之间相关关系的一种统计分析方法,考察一个变量随其余变量变化而变化的情况。相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。计算题1.下面是20个长途电话通话时间的频数分布,计算该数据的平均数通话时间/分钟频数通话时间/分钟频数4-7420-2318-11524-27112-157合计2016-192答案:由题意:通话时间/ixif通话时间/ixif分钟分钟4-75.5420-2321.518-119.5524-2725.5112-1513.57合计2016-1917.52平均数=61ii61iiiffx=12.32.拥有工商管理学位的大学毕业生每年年薪的标准差大约为2000美元,假定希望估计每年年薪底薪的95%置信区间,当边际误差分别500美元时,样本容量应该为多大?(96.12)答:2/n222/2n=61.47=623.某一汽车装配操作线完成时间的计划均值为2.2分钟。由于完成时间既受上一道装配操作线的影响,又影响到下一道装配操作线的生产,所以保持2.2分钟的标准是很重要的。一个随机样本由45项组成,其完成时间的样本均值为2.39分钟,样本标准差为0.20分钟。在0.05的显著性水平下检验操作线是否达到了2.2分钟的标准。96.12答案:根据题意,此题为双侧假设检验问题(1)原假设0H:=2.2;备择假设1H:2.2(2)构造统计量:xUs/n,得2.39-2.2U=6.3730.2/45(3)由于0.05,则查表得:/20.025UU1.96(4)6.3731.96,/2UU,所以拒绝原假设,即在0.05的显著水平下没有达到2.2分钟的标准。4.下表中的数据是主修信息系统专业并获得企业管理学士学位的学生,毕业后的月薪(用y表示)和他在校学习时的总评分(用x表示)的回归方程。总评分月薪/美元总评分月薪/美元2.628003.230003.431003.534003.635002.93100解:iXiY2iXiiYX2iY2.628006.76728078400003.4310011.561054096100003.6350012.9612600122500003.2300010.24960090000003.5340012.2511900115600002.931008.418990961000061iiX=19.261iiY=18900612iiX=62.18iiiYX61=6091059870000设XbbY10nXXnYXYXbiiiiiiiiii2616126161611)())((=62.192.1918.626189002.1960910=581.08XbYb10=18900/6-581.08*19.2/6=1290.54于是XY08.58154.12905.设总体X的概率密度函数为2(ln)21,0(,)2x0,0xexfxx其中为未知参数,nXXX,...,,21是来自X的样本。(1)试求13)(g的极大似然估计量)(gˆ;(2)试验证)(gˆ是)(g的无偏估计量。解:(1)当ix0时,似然函数为:2)(ln21221;,...,,ixinexxxxL令0;,...,,ln21nxxxL,即0ln1nxnii解得:niixn1ln1ˆ13)(g是的单调函数,所以)(g的极大似然估计量1ln3ˆ1niixng(2)因为dxexxXEx2)(ln022ln)(ln)(2)(ln2ln2)(2)(ln022tdetxdextx)(131)(ln31)(ln3))(ˆ(1gXEXEngEini,故)(ˆg是)(g的无偏估计量。6、某商店为解决居民对某种商品的需要,调查了100户住户,得出每月每户平均需要量为10千克,样本方差为9。若这个商店供应10000户,求最少需要准备多少这种商品,才能以95%的概率满足需要?解:设每月每户至少准备0x%95)(0xxP%95)//(0nxnxPsn时,当30%95100/310/00xnsx查表得,645.110/3100xkgx44.100若供应10000户,则需要准备104400kg。7.糖果厂用自动包装机装糖,每包重量服从正态分布,某日开工后随机抽查10包的重量如下:494,495,503,506,492,493,498,507,502,490(单位:克)。对该日所生产的糖果,给定置信度为95%,试求:(1)平均每包重量的置信区间,若总体标准差为5克;(2)平均每包重量的置信区间,若总体标准差未知;(8125.1,8331.1,2281.2,2622.210,05.09,05.010,025.09,025.0tttt);解:n=10,为小样本(1)方差已知,由x±,12nnt,x1niiXn=(494+495+503+506+492+493+498+507+502+490)/10,0.025,9,125n10ntt计算可得平均每包重量的置信区间为(494.9,501.1)(2)方差未知,由x±,12nnstx1niiXn=(494+495+503+506+492+493+498+507+502+490)/10,s即样本方差,211()1niiSxxn0.025,9,12n10nsstt计算可得,平均每包重量的置信区间为(493.63,502.37)8.假定某化工原料在处理前和处理后取样得到的含脂率如下表:处理前0.1400.1380.1430.1420.1440.137处理后0.1350.1400.1420.1360.1380.140假定处理前后含脂率都服从正态分布,问处理后与处理前含脂率均值有无显著差异。解:根据题中数据可得:0027.0,0028.0,139.0,141.02121SSxx,621nn由于621nn30,且总体方差未知,所以先用F检验两总体方差是否存在差异。(1)设0H:2221;22211:H则F=108.12221SS由621nn,查F分布得15.7)5,5(025.0F,14.0)5,5(975.0F)5,5(2FF接受0H,即处理前后两总体方差相同。(2)设210:H,:1H21则T=2102111nnSxx,2)1()1(212222110nnSnSnST=1.26)10(2t=2.2281接受0H,即处理前后含脂率无显著差异。9.根据下表中Y与X两个变量的样本数据,建立Y与X的一元线性回归方程。YijfX5101520yf1200081018140343010fx34111028解:设x为自变量,y为因变量,一元线性回归设回归方程为y=xbb101b=22)(11iiiiiixnxyxnyx=538.16501000213.15015538.11429.12710xbyb回归方程为y=150.213-1.538x10.以下为16种零食的卡路里含量:110120120164430192175236429318249281160147210120。试计算均值和中位数。解:现把16个变量值由小到大排序如下:110120120120147160164175192210236249281318429430(1)中位数的位次为(n+1)/2=8.9,所以中位数计算如下:50.1832192175eM(2)均值计算如下:32.216163461161nxxii11.某企业2005年第三季度各月末的职工人数资料见下表:时间(月末)789职工人数(人)209020602131又知2005年6底的职工人数为2030人,试计算第三季度的平均职工人数。解:依题意,计算如下:83.207635.623014221312060209022030Y(人)12.某集团公司对生产的一批A产品进行抽样调查,随机抽取的200件中有170件合格。试以95%的概率估计该批产品合格率的置信区间。解:已知85.0%85200170p,200n,5170np,530)1(pn,当05.0时,查表96.12/Z,于是有:(nppZp)1(2/,nppZp)1(2/)=(200)85.01(85.0