第6章抽样与参数估计一、单项选择题12345678910111213141516BCDAAACCCBCBACDC二、多项选择题123456789101112131415ACDEABDACEABCEACDEABABDEABDBCACDBCABCDEACACDBDE三、判断题1.×2.√3.×4.×5.√6.√7.×8.√9.×10.√11.√12.×四、计算分析题1.解:1414.0002222(克)===nX1407.0110000100100002002122(克)===NnNnX2.解:①已假定总体标准差为=15元,则样本均值的抽样标准误差为1429.24915nX②已知置信水平1-=95%,得Z=1.96,允许误差2.41429.296.1XXZnZ③已知样本均值为元120X,置信水平1-=95%,得Z=1.96,总体均值的置信区间为2.4120nZX如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。3.解:①该校学生考试的平均成绩的范围:6.76100766015151kkkkkfXfX43.1199129441151251kkkkkfXXfS143.110043.11nX由1=95.45%查表Z=22754.21377.12XXZXXXX2754.26.762754.26.76X该校学生考试的平均成绩区间范围是:88.7832.74X②该校学生成绩在80分以上的学生所占比重范围:%481004821nnp04996.0100)48.01(48.0)1(nppp09992.004996.02ppZ全校80分以上的学生所占的比重范围为:下限=pp=0.48-0.09992=0.3801上限=pp=0.48+0.9992=0.5799所以在95.45%概率保证程度下,该校学生成绩在80分以上的比重范围在38.01%—57.99%之间。4.解:①平均每包重量(克)3.150100150304141kkkkiffXX每包重量包数组中值总重量离差离差平方乘权数148-14910148.51485-1.832.4149-15020149.52990-0.812.8150-15150150.575250.22151-15220151.530301.228.81001503076样本方差76.01007611412412kkkkkfXXfS抽样平均误差(克)==08718.010076.02nX概率为99.73%,所以概率度为Z=3,允许误差X=3×0.08708=0.26154。抽样置信区间:XXXX,即26514.03.150,26154.03.150=53.150,04.150这批食品平均重量每包不低于150克,达到规格要求。②P=70÷100=0.7则方差2p=0.3×0.7=0.210458.010021.01==)(=nppp,因为概率为99.73%,所以概率度Z=3。允许误差x=3×0.0458=0.1374。则抽样置信区间:pppPp1374.07.0,1374.07.0=8374.0,5626.0能以99.73%的概率保证这批食品的合格率范围在56.3%—83.7%之间。5.解:①μ的置信度为0.95的置信区间为(nZX),计算得)392.6,608.5()96.196.00.6(,6.0,96.1,0.6即为查表ZX②μ的置信度为0.95的置信区间为(nSTX),计算得0.6X,查表T=2.3060。33.064.281)(819122iiXXS)442.6,558.5()3060.2333.00.6(6.解:已知96.1,05.0500,,00015002ZX5.22500150000096.122222XZn这家广告公司应设计抽选23个批发类商店作样本,进行调查。7.解:根据抽样结果及要求整理成如下分布数列:按成绩分组(分)人数(人)f比重(%)组中值xxfxx2xxfxx260分以下60~7070~8080~9090~10036151247.51537.53010556575859516539011251020380-22-12-28184841444643241452864607681296合计4010030804440分77403080111mkkkmkkfXfX分54.104044401121mkkkmkkfXXf分67.14054.10nX分34.367.12XXZnZ全体职工考试成绩区间范围是:XXXXxX34.37734.377即全体职工考试成绩在73.66---80.3分之间。若其它条件不变,极限误差范围缩小一半,应抽取的人数为:人1603.159234.354.10221222222XZn8.解:因机构改革关系到所有人的利益,故采用分层抽样方法较宜.∵10020=51,∴10×51=2,70×51=14,20×51=4故从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.副处级以上干部被抽到的概率为102=51,一般干部被抽到的概率为7014=51,工人被抽到的概率为204=51,即每个个体被抽到的概率都是10020=519.解:2,50,22,10,40),(5.60,8,8022ZmMXrR群内群间 千克 1122MmMrmRrRrX群内群间14010401085018088082273.148077.050633.246.373.12XXZ则46.35.6046.35.60以94.45%的概率推断该校学生平均体重的范围:)(96.63)(04.57千克千克五、简答题1.答:⑴按照随机原则抽取样本:总体中的各个单位是否入选样本,不受主观因素影响,保证总体中的每一单位都有相同的中选机会,剔除了人为主观因素,提高样本代表性。⑵由样本数据推断总体特征:通过逻辑上的归纳推算实现了从特殊到一般,从部分到总体的认识,由获得的样本的实际数据,计算样本指标,推算总体指标。⑶抽样调查中的抽样误差是不可避免的,但在事先可以估计:样本指标推断总体指标存在误差,这种误差可以事先估计,并能够控制这个误差范围。抽样推断根据事先给定的误差允许范围设计,具有一定概率保证的估计和判断。2.答:①样本容量n的多少。在其它条件不变的情况下,样本容量愈大,抽样误差就愈小;反之,抽样误差就愈大。总体被研究标志的变异程度。②在其它条件不变的情况下,标志变异程度愈大,抽样误差也愈大;反之,则抽样误差就愈小。③抽样方法的选择。在相同的情况下,不重复抽样比重复抽样的误差小,这是因为重复抽样有可能使同一单位被多次抽中,因而产生的样本对总体的代表性就较差。3.答:抽样平均误差x是反映抽样误差一般水平的指标,它的实质含义是指抽样平均数(或成数)的标准差。即它反映了抽样指标与总体指标的平均离差程度。抽样平均误差的作用首先表现在它能够说明样本指标代表性的大小。抽样平均误差大,说明样本指标对总体指标的代表性低;反之则说明样本指标对总体指标的代表性高。抽样极限误差x是指用绝对值形式表示的样本指标与总体指标偏差的可允许的最大范围。它表明被估计的总体指标有希望落在一个以样本指标为基础的可能范围。它是由抽样指标变动可允许的上限或下限与总体指标之差的绝对值求得的。两者的关系:抽样平均误差是反映抽样误差一本水平的指标;而抽样极限误差是反映抽样误差的最大范围的指标。联系:xxZnZ即极限误差是在抽样平均误差的基础上计算得到的。其他条件不变时,概率保证程度越大,则临界值Z越大,从而极限误差x越大;反之亦然。4.答:精确性和可靠性(即效度和信度)在抽样估计中是相互矛盾的两个方面。两者的对立统一,停留在经验描述水平上是无法真正讲清楚的。这就要从参数估计的角度(而不仅仅是从假设检验的角度)来运用概率论。粗略地讲,效度和信度是成反比的。当精确程度达到最大而可信程度达到最小时,就过渡到了点估计。但若仔细分析不难发现,在参数估计中对效度和信度的要求并不是并重的。由于复杂系统内部事物矛盾运动的客观统计规律性,我们可以做点估计,即使这时估计区间为零,但估计对总体仍有一定的代表性。我们却不可以将估计区间任意放大,这样获得的可靠性对统计推论将没有任何意义。所以就此而言,在精确性和可靠性两因素之中,精确性是矛盾的主要方面。5.答:估计量如果具有无偏性、一致性和有效性这三个要求或标准,就可以认为这种统计量是总体参数的合理估计或最佳估计。(1)无偏性。如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认为是无偏估计。(2)一致性。虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量越来越接近总体参数,满足这种情况,我们就说该统计量对总体参数是一个一致的估计量。(3)有效性。估计量的有效性指统计量的抽样分布集中在真实参数周围的程度。如果估计是无偏的,就可以用估计量的标准差来量度这种集中程度。标准差越小,估计量的有效性越高。总之,如果一个估计量满足无偏性、一致性和有效性这三条准则,就可称其为最佳估计量。数理统计知识证明,只要样本容量大一些,用样本均值作为总体均值的估计量,总能满足上述三个标准,所以可以认为这是质量很高的点估计。6.答:⑴总体各单位标志变异程度,即总体方差的大小。总体标志变异程度越大,要求样本容量要大些;反之则相反。⑵抽样极限误差的大小。抽样极限误差越大,要求样本容量越小;反之则相反。⑶抽样方法。在其他条件相同时,重复抽样比不重复抽样要求样本容量大些。⑷抽样组织形式。例如,采用类型抽样的样本容量要小于简单随机抽样的样本容量。⑸抽样推断的概率保证程度的大小。概率越大,要求样本容量越大;反之则相反。7.答:分层抽样也称类型抽样,将总体按照某一标志进行分组,在各组中按照随机原则抽取样本单位的组织方式。分层抽样将总体按照某一标志进行分组,各组的单位数一般是不相同的,样本单位数在各组之间的分配一般有两种方法:⑴按照比例抽取样本数目,不考虑各组标志变异程度的大小,按各组的单位数占总体的比重抽取样本数目。⑵各组抽取的样本数目,按照各组标志变异程度来确定,变异程度大多抽一点,变异程度小少抽一点。