1习题一1.请列举一些你所了解的以及被接受的抽样调查。2.抽样调查基础理论及其意义;3.抽样调查的特点。4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:56760166573236693746261927928769052050231245256255757435087583420359398017228775325927687669237188764139944292744291811178416405210587977461536444761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。习题二一判断题1普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。2概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。3抽样单元与总体单元是一致的。4偏倚是由于系统性因素产生的。5在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。6偏倚与抽样误差一样都是由于抽样的随机性产生的。7偏倚与抽样误差一样都随样本量的增大而减小。8抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。9抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。10总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。211一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。12抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。13抽样误差越小,说明用样本统计量对总体参数进行估计时的精度越低。14样本量与调查费用呈现线性关系,但样本量与精度却呈非线性关系。15精度和费用也是评价抽样设计方案优劣的两条准则。16简单随机抽样时每个总体单元都有非零的入样概率,但每个总体单元的入样概率是不同的。17当总体N很大时,构造一个包含所有总体单元名单的抽样框是有局限性的,这也是简单随机抽样的局限性。18设N=872,n=10。利用随机数字表抽取一个简单随机样本如下:12815750645512778986795493862219设N=678n=5利用随机数字表抽取一个简单随机样本如下:55648509826048520在实际工作中,如果抽样比接近于1时,人们会采用全面调查二填空题1抽样比是指(),用()表示。2偏倚为零的估计量,满足(),称为()。3简单随机抽样的抽样误差等于()。4简单随机抽样时重复抽样的抽样误差等于()5抽样时某一总体单元在第m次被选入样本的概率是()6简单随机抽样时总体单元被选入样本的概率是()7某一样本被选中概率是()。8大数定理是指()的规律性总是在大量()的观察中才能显现出来,随着观察次数()的增大,()影响将互相抵消而使规律性有稳定的性质。9中心极限定理证明了当()增大时,观察值的均值将趋向于服从(),即不论()服从什么分布,在观察值足够多时其均值就趋向()分布。10抽样调查的核心是估计问题,选择估计量的标准是()()()。三简答题1概率抽样与非概率抽样的区别2普查与抽样调查的区别3何谓抽样效率,如何评价设计效果?4何谓三种性质的分布?它们之间的关系怎样?5简述抽样估计的原理。四计算题1已知总体N={5,6,7,8,9,10,11},n=5试求:(1)重复抽样与不重复抽样的所有可能样本数。(2)第一个单位在第m次被选入样本的概率3(3)第一个单位被选入样本的概率(4)抽到{5,6,7,8,9}的概率(5)不放回简单随机抽样的所有可能样本2某调查公司受一消费品生产公司的委托,想在某一地区进行一项民意测验,了解消费者中喜欢该公司消费品的人占多大比例,要求允许绝对误差不超过0.1,调查估计值的置信水平为95%,预计的回答率为65%,试问此次调查的样本量应取多少才能满足需要?3.欲调查我校大一学生平均每月生活费支出情况,采用简单随机抽样抽出35名学生,他们每月的生活费支出平均为285元,计算得到的样本方差为73,试计算我校一年级学生平均每月生活费的支出额标准差、变异系数、置信区间(置信水平为95%)。。4.某县采用简单随机抽样估计粮食、棉花、大豆的播种面积,抽样单元为农户。根据以往资料其变量的变异系数为名称粮食棉花大豆变异系数0.380.390.44若要求以上各个项目的置信度为95%,相对误差不超过4%,需要抽取多少户?若用这一样本估计粮食的播种面积,其精度是多少?五设计题为了了解北京市民对目前北京市公共环境卫生以及绿色建设方方面的满意程度和期望程度,计划组织一次关于“北京市公共环境卫生状况的调查”,从而为绿色北京的建设提供指导性建议和意见,为2008年奥运会尽一份力量。请针对这一调查目的,设计一份调查问卷。要求问卷能真正反映调查目的,并对相关部门的实际工作起到指导性的作用。同时还要充分考虑数据处理的难易程度。4习题三一、单选题1、分层抽样设计效应满足()A、1deffB、1deffC、1deffD、1deff2、分抽样的特点是()A、层内差异小,层间差异大B、层间差异小,层内差异大C、层间差异小D、层内差异大3、下面的表达式中错误的是()A、1hfB、nnhC、1hWD、1hN4、在给定费用下估计量的方差)(styV达到最小,或者对于给定的估计量方差V使得总费用达到最小的样本量分配称为()A、常数分配B、比例分配C、最有分配D、奈曼分配5、最优分配(optV)、比例分配(propV)的分层随机抽样与相同样本量的简单随机抽样(srsV)的精度之间的关系式为()A、srspropoptVVVB、srsoptpropVVVC、srsoptpropVVVD、optpropsrsVVV6、下面哪种样本量分配方式属于比例分配?A、NnNnhhB、hLhhhhhhhcSNcSNnn1C、LhhhhhhSNSNnn1D、LhhhhhhSWSWnn17、下面哪种样本量分配属于一般最优分配?A、NnNnhhB、hLhhhhhhhcSNcSNnn1C、LhhhhhhSNSNnn1D、LhhhhhhSWSWnn1二、多选题51.分层抽样又被称为()A.整群抽样B.类型抽样C.分类抽样D.系统抽样E.逆抽样2.在分层随机抽样中,当存在可利用的辅助变量时,为了提高估计精度,可以采用()A.分层比估计B.联合比估计C.分别回归估计D.联合回归估计E.分别简单估计3.样本量在各层的分配方式有()A.常数分配B.比例分配C.最优分配D.奈曼分配E.等比分配4.分层抽样的优点有()A.在调查中可以对各个子总体进行参数估计B.易于分工组织及逐级汇总C.可以提高估计量的精度D.实施方便E.保证样本更具有代表性5.关于分层数的确定,下面说法正确的有()A.层数多一些比较好B.层数少一些比较好C.层数一般以不超过6为宜D.层数一般以4层为最好E.应该充分考虑费用和精度要求等因素来确定层数6.下面哪种样本量分配方式属于奈曼分配?()A.hhnnNNB.1//hhhhLhhhhNScnnNScC.1khhLhhhnNSnNSD.1hhhLhhhnWSnWSE.1//hhhhLhhhhWScnnWSc7.事后分层的适用场合有()A.各层的抽样框无法得到B.几个变量都适宜于分层,而要进行事先的多重交叉分层存在一定困难C.一个单位到底属于哪一层要等到样本数据收集到以后才知道D.总体规模太大,事先分层太费事E.一般场合都可以适用三、判断题1分层抽样不仅能对总体指标进行推算,而且能对各层指标进行推算。2分层的基本原则是尽可能地扩大层内方差,缩小层间方差。3分层抽样的效率较简单随机抽样高,但并不意味着分层抽样的精度也比简单随机抽样高。4分层抽样克服了简单随机抽样可能出现极端的情况。5分层抽样的样本在总体中分布比简单随机抽样均匀。6分层后各层要进行简单随机抽样。7分层抽样的主要作用是为了提高抽样调查结果的精确度,或者在一定的精确度的减少样本的单位数以节约调查费用。8分层后总体各层的方差是不同的,为了提高估计的精度,通常的做法是在方差较大的层多抽一些样本。9在不同的层中每个单位的抽样费用可能是不等的。10在分层抽样的条件下,样本容量的确定与简单随机抽样的共同点都是取决于总体的方差。11多主题抽样中,不同的主题对样本量大小的要求不同。在费用允许的情况下,应尽可能地选择较大的样本量。612有时在抽样时无法确定抽样单位分别属于哪一层,只有在抽取样本之后才能区分。13比例分配指的是按各层的单元数占样本单元数的比例进行分配。14等容量分配时各层的样本单元数与各层的层权是相同的。15所谓最优分配是指给定估计量方差的条件下,使总费用最小。16在奈曼分配时,如果某一层单元数较多,内部差异较大,费用比较省,则对这一层的样本量要多分配一些。17在实际工作中如果第k层出现kn超过kN,最优分配是对这个层进行100%的抽样。18在实际工作中,如果要给出估计量方差的无偏估计,则每层至少2个样本单元,层数不能超过n/2。19无论层的划分与样本量的分配是否合理,分层抽样总是比简单随机抽样的精度要高。20即使层权与实际情况相近,利用事后分层技术也难以达到提高估计精度的目的。四填空题1分层抽样又称为类型抽样,它是将包含N个单位的总体分成各包含N1,N2,…,NL个单位的(),这些()互不重复,合起来就是整个的总体,因此N=()。2分层抽样的基本原则是()3分层抽样中层权是(),抽样比是()。4分层抽样中的样本均值是(),样本方差是()。5分层抽样中,对总体的均值进行估计时,其抽样误差是(),对总体的总量进行估计时,其抽样误差是()。6分层抽样在对各层分配样本量时,可以采用不同的分配方法,各种方法所考虑的因素不同。最优分配时主要考虑的因素是()、()、()。7在实际工作中,通常分层抽样比简单随机抽样的精度要高。但如果出现不合理地划分()或分配()的情况,可能使分层抽样的更()的结果发生。8事后分层的层权与实际情况相差很大,则不能利用其提高()。9分层抽样要求在抽取样本之前()对()。10如果要给出估计量方差的无偏估计,则层数不能超过()。五简答题1何谓分层抽样?简述分层抽样的意义?2试举一例说明分层抽样的抽样效率比简单随机的抽样要好。3分层抽样的分层的原则及其意义。4简述分层抽样的局限性。75简述分层抽样中总样本量的分配方法。6怎样分层能提高精度?六计算题1一个由N=1000个人构成的总体被划分为两层:第一层由4001N名男性组成,第二层由6002N名女性组成。从中抽取一个样本量为n=250的样本,将样本等比例地分配给各层,使得两层的抽样比都等于n/N=1/4。求各层的样本量分别是多少?2一公司希望估计某一个月肭由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽样。已知下列资料:工人技术人员行政管理人员1321N3621s922N2522s273N923s若样本量n=30,试用奈曼分配确定各层的样本量。3某工厂生产的新产品供应国内市场的300家用户,试销售滿一年后,现欲请用户对该厂的新产品进行评价。现把这些用户分成本地区、本省外地区、外省三层。现有资料如下:本地区本省外地区外省1541N932N533N25.221S24.322S24.323S91C252C363C8若要求估计评价成绩均值的方差1.0)(styV,并且费用最省(假定费用为线性形式),求样本量n在各层的分配。4某林业局欲估计植树面积,该局共辖240个林场,按面积大小分为四层,用等比例抽取40个林场,取得下列资料(单位:公顷)