第一、二章习题课1.某校高一共有学生1000名,预调查50名学生,英语期末考试的成绩分别如下:现在要求在满足的条件下,设计一个简单随机抽样调查方案,并具体实施抽样调查,并给出调查的结果。95.0}2{=−YyP1.d=2,N=1000,s2=125.702108100017.125)96.1(211)(1)()(22221222112221222≈+×=+=+=−−−NSudSudSunNααα2.调查费用为c0+c1n,损失与误差成正比。使总费用及损失最小,求出样本容量n.2)(YyEa−210)(YyEancc−++2.调查费用为c0+c1n,损失与误差成正比。使总费用及损失最小,求出样本容量n.2)(YyEa−210)(YyEancc−++NnaSnccYyEanccnf11)()(10210−++=−++=0112/1)(21=−−=′NnnaScnf2.调查费用为c0+c1n,损失与误差成正比。使总费用及损失最小,求出样本容量n.2)(YyEa−210)(YyEancc−++4222121211)11(411120112/1)(nNnSacnNnaScNnnaScnf=−=−=−−=′3/212⎟⎟⎠⎞⎜⎜⎝⎛≈caSn3.某调查要估计某种疾病患者中,吸烟人所占的比例,随机抽了1000人中,有这种疾病的人有50人,其中有40人吸烟,试求患者中吸烟所占比例的95%置信区间。3.某调查要估计某种疾病患者中,烟民所占的比例,随机抽了1000人中,有这种疾病的人有50人,其中有40人吸烟,试求患者中吸烟所占比例的95%置信区间。{}212112)()()(1222RrEurRRrEurPuRrERrP−+≤≤−−=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤−−≈−−−−αααα)3.5.2();()(11)])(11[()3()2.5.2(;),1()1()()1(1)()2()1.5.2();1(),cov()()1(,1,,),0(,112125.11222−===+−−=−−==+−−−=−=−=−=∑∑∑nORXYNrxynENnfnOnORXYNXnfRrEnOXxrRrEN,...,iMYMXMNNiiiniiiNiiiii其中则有)(使无关的数若存在与在简单随机抽样下εε定理定理22.5.1.5.1∑∑∑∑∑∑∑=======−+=−+=−niiiniiniiniiiniiniiniiiyxrxryyxrxryrxy11211122121222)(∑∑∑===−−≈−−−−−≈−NiiiniiiNiiiRXYNrxynERXYNXnfRrE12121222)(11)])(11[()3()()1(1)()2(2122)()(111RrErxynxnniii−⎯⎯→⎯−−∑=估计忽略抽样比{}212112)()()(1222RrEurRRrEurPuRrERrP−+≤≤−−=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤−−≈−−−−αααα8406.1508.0402)(2112112=×−×+=−+=−∑∑∑∑====niiiniiniiniiiyxrxryrxy323122102.399905.0108)(111−=×≈××=−−∑niiirxynxn{}212112)()()(1222RrEurRRrEurPuRrERrP−+≤≤−−=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤−−≈−−−−αααα患者中吸烟所占比例的95%置信区间为[0.7937[0.7937,,0.8063]0.8063]96.1,102.3)(,8.0975.032=×≈−=−uRrEr4.设是总体中最小者和最大者。抽取样本量为n的简单随机样本,定义的估计量如下:其中c是一个常数。试证:(1)是的无偏估计量;(2)的方差是.N1Y,Y⎪⎩⎪⎨⎧−+=其他,而不含若样本中含,而不含若样本中含,yYYcyYYcyyNNS11Syy)](12/)[1(12ncYYNcnSfN−−−−−Sy4.证明:(1)YyES=)((1))1()1(1111DcDDcDyyYYcyYYcyyNNNNS−−−+=⎪⎩⎪⎨⎧−+=其他,而不含若样本中含,而不含若样本中含,YNNnnNncNNnnNncYDDcEDDcEyEyENNS=−−−−−−−+=−−−+=))1()1(())1()1(()]1([)]1([)()(114.证明:(2)(2))(1)1()1(1111NNiiiNNSDDcDYnDcDDcDyy−+=−−−+=∑=))(,1(2))((1))(,1(2))(()1())(1()()(1112111111NNiiiNYNNiiiNNiiiNNiiiSSDDcDYnCovDDcVarSnfDDcDYnCovDDcVarDYnVarDDcDYnVaryVaryV−+−+−=−+−+=−+==∑∑∑∑====)](12/)[1()(12ncYYNcnSfyVNS−−−−−=4.证明:(2)(2)))(,1(2))((1)(1112NNiiiNYSDDcDYnCovDDcVarSnfyV−+−+−=∑=)](12/)[1()(12ncYYNcnSfyVNS−−−−−=)1(12)111)(1(2)]1()1(2)1(2[)],(2)()([))(())((222112121fNncNNnNncNnNNnNnNncDDCovDVarDVarcDDVarcDDcVarNNNN−−=−+−=−−−⋅−−⋅=−+=−=−4.证明:(2)(2))](12/)[1()(12ncYYNcnSfyVNS−−−−−=)1)((12))1(11)(1()(2)]1()1()()1()[(2))](,())(,([2))](,())(,())(,([2))(,(2))(,1(21111111111111121111fYYNcNNnNnYYncNnNNnYYNnNnYYncDDDCovYDDDCovYncDDDCovYDDDCovYDDDCovYncDDDCovYncDDcDYnCovNNNNNNNNNNNNNiNiiNiNiiNNiii−−−=−−−−−=−−−−−−−=−+−=−+−+−=−=−∑∑∑−===4.证明:(2)(2))](12/)[1()(12ncYYNcnSfyVNS−−−−−=)1)((12))(,1(2111fYYNcDDcDYnCovNNNiii−−−=−∑=)1(12))((21fNncDDcVarN−−=−))(,1(2))((1)(1112NNiiiNYSDDcDYnCovDDcVarSnfyV−+−+−=∑=)](12)[1()1)((12)1(121)(12122ncYYNcnSffYYNcfNncSnfyVNYNYS−−−−−=−−−+−−+−=5.从一个有限总体中抽了一个含量为n=n1+n2的简单随机样本,均值是,从这个样本中抽了一个含量为n1的子样,均值是。证明:(1)(2)(3).y1y)11()(121nnSyyVar−=−)11()(21221nnSyyVar+=−0),(1=−yyyCovynynyn=+22115.证明:(1))(1221yynnyy−=−0][][][11=−=−=−yyyEyEyyE第一次抽样取定第一次抽样取定第一次抽样取定0]}[E{][][121221=−=−=−第一次抽样取定yyEnnyyEnnyyEynynyn=+22115.证明:(1))(1221yynnyy−=−]))(([)()()(2122212212221第一次抽样取定yyEEnnyyEnnyyVarnnyyVar−⎟⎟⎠⎞⎜⎜⎝⎛=−⎟⎟⎠⎞⎜⎜⎝⎛=−⎟⎟⎠⎞⎜⎜⎝⎛=−2121)11(])[(snnyyE−=−第一次抽样取定212212121)11(])11[()(SnnnSnnsnnEyyE=−=−=−22122121222212221)11()()(SnnSnnnSnnnnnyyEnnyyVar+==⋅⎟⎟⎠⎞⎜⎜⎝⎛=−⎟⎟⎠⎞⎜⎜⎝⎛=−5.(3)2)]()([)(),(),(2)()()(111111yVaryyVaryVaryyyCovyyyCovyVaryyVaryVar+−−=−⇒−++−=)11()(2NnSyVar−=0),(1=−yyyCov)11()(121nnSyyVar−=−)11()(121NnSyVar−=0),(1=−yyyCovp11习题一1.概括普查和抽样调查的优缺点。考虑确保这些调查获得成功的前提条件和注意事项。p11习题一1.普查:对研究对象的全体进行全面调查.优点优点:获得全面的信息。缺点缺点:需投入大量的人力、物力,且时间较长。概率抽样调查:非非全面全面调查中运用概率统计理论指导的抽样调查方法。优点优点:1.节约人力、物力,节省时间。2.利用已知信息,设计适宜的抽样方案,获得有代表性的样本,从而对总体的特征指标做出好的估计及误差。缺点缺点:获得非全面的信息。p11习题一2.有人说:“只有确信样本能很好地代表总体,调查研究人员才能肯定样本均值与总体均值相一致。但是研究人员不能绝对地肯定样本是否真正有代表性,他总要允许分析结果有一个较小的误差范围。”你对这段话有何评述?p11习题一2.样本是构成总体的一部分,这部分单元的特征或多或少地反映了总体的特征。但是,它毕竟是总体的一部分,而非全部,没有任何一个人在未进行全面调查就断言:“它取得的样本能很好的代表总体”,多数抽样的情况是:样本与总体的特征有所偏离,即误差。我们在抽样时利用已知信息,设计适宜的抽样方案,获得有代表性的样本,从而对总体的特征指标做出的估计的误差就会得到有效的控制。p11习题一3.假定你对一本厚厚的英文字典进行研究,调查书中的收词总数。你认为以什么作为抽样单元比较合理?如果被调查的书中有大幅的插图,该如何处理?p11习题一3.一页作为一个抽样单元抽样单元。首先首先,抽取一部分单元,估计出大幅插图的页在字典中所占的比例。将总体分为两层两层,一层是普通的页,另一层是有大幅插图的页。然后再从总体中随机抽取若干页,统计每页在哪一层以及每页收录词条数,然后按后分层估计后分层估计给出该字典收录词条总数。或者进行定额抽样定额抽样。p11习题一4.设计一个完整的抽样框是不容易的,在下述调查中可以使用什么作为抽样框?(1)调查一个市镇每周每个成年人用于看电视的总时数;(2)调查某一城市中服装商店或商贩出售某一品牌服装的情况;(3)调查某一城市中去年发现患肺结核的人数。p11习题一4.(1)以该市镇的每一个居民区作为抽样框;(2)以该市的街区作为抽样框;(3)以该市的所有防疫站作为抽样框;p11习题一5.某刊物随刊物发行附有一张调查表,要求读者填表后返回。调查人员对寄回的调查表进行了分析,试问这是不是概率的随机调查?如何看待调查结果?p11习题一5.这不是概率随机抽样,是自愿自愿““抽样抽样””,报刊、电视、互联网等媒体上进行的调查的受访者大多是自愿参与的,这种志愿者组成的样本的代表性是有疑问有疑问的,因为参加调查的往往是那些对调查问题很感兴趣的单元,不那么感兴趣的人参加的可能性则很小。这些感兴趣的人的观点往往是偏激的偏激的,由此作出的推断也必然是不具有很好代表性的.p12习题一6.从100只试验兔子中抽10只作试验。研究人员从一个圈养场中,不经挑选地抓到哪只算哪只,抓满10只为止。这是不是合适的抽样方法?p12习题一6.这不不是概率随机抽样,注意随机并不等于随便。p50习题二1.对N个个体单元的总体抽样,先从N个单元中按简单随机抽样抽出n个样本单元,再对这n个单元按简单随机抽样抽出m个样本单元(mn)。试证明,此m个样本单元是总体N个单元的一个简单随机样本。p50习题二1.不记顺序,每一具体样本的概率为mNmnnNmnmNCNmmNmnmnnNnNnNmnmNCCC1!!)!()])!(!/(![)])!(!/(![])!()!/[()!(=−=−⋅−−−−=−−p52习题二10.在简单随机抽样中,若总体每个单元有两个指标Yi和Xi(i=1,…,N),所得n个样本单元相应