抽样技术方案设计调查南昌市4所高校内的大学生月平均生活消费支出Y。抽样总体为着4所学校的所有同学,抽样框省略,下面主要阐述一下我的抽样方法。总的来说,是根据学校不同,将抽样单元分为4层,然后每层再作为一个整体进行两阶段抽样,第一阶段抽学院时不等概率抽样的方法,再在抽中的学院中用简单随机的方法抽中目标样品。1、确定样本总量。(根据分层设计估计样本量)精度要求是以sty的绝对误差d(在给定的置信水平1下)的形式给出。此时2()stdzVy*确定样本量的分配形式为内曼分配,即:所以样本总量为:hhNWN即第h层的层权,hS为根据同类或相似二手数据预估,deff为分层随机抽样的抽样效应,值取1,r为判定的估计回答率。4411SSSShhhhhhhhhhhWNnnWN421242h21/211()hhhhhWSndeffdrWSzN()班级:09统计一班姓名:李洪超学号:20090410030119题目:大学生月平均生活消费支出调查2、各层的样本量分配用内曼最优分配法费用函数为0TCccn(0c与样本量无关的固定费用,c单位抽样费用。)各层权重41SShhhhhh所以11nnw22nnw33nnw44nnw3、根据抽样框在各层用两阶段的抽样方法........。具体地说,分别把每一个学校作为一个总体,每一个总体,都进行初级单元规模不等的两阶段抽样。其中以学院作为初级抽样单元(PSU),以具体同学为二级抽样单元(SSU)。由于初级单元规模大小不等,所以各学院人数为权重进行PPS抽样。对于抽中的学院,以全院名单为抽样框,用随机数法,确定具体同学。4、实施调查,获得数据,录入计算机。5、计算Y的简单估计量:41sthhhYwy6、计算sty的方差的无偏估计量:2224411hhhhsthhhwswsvynN其中2211()1hnhhihhhsyyn是第h层样本的样本方差。7、计算总体均值Y在置信水平为1下的置信区间:/2()ststyzvyˆY的最大相对误差:YYvtrˆ)ˆ(8、根据得出的数据可以达到估计南昌这四所高校的同学月平均生活消费支出的目的。还可以比较不同层的差异,当然也可以按性别分层估计,比较差异。大学生月平均生活消费调查表学校学院专业性别您在2011上半年各月份的消费支出为:单位:元2011.012011.052011.022011.062011.032011.072011.04统计总额:平均数:所学本门课程的知识概括:*比率估计和回归估计都是一种间接估计量。*对于比率估计,使用时,必须可以得到辅助变量的总体总值,然后根据抽样的方法,确定一个比率R,之后再计算估计量。*分层抽样是尽量缩小组内差异,扩大组间差异。整群抽样是尽量扩大组内差异,缩小组间差异。*分层抽样中有多种在各层中分配样本量的方法。如比例分配,最优分配,内曼最优分配。内曼分配是在单位抽样费用相等时的最优分配。使用时,可能会出现需要修正的情况。*多阶段抽样既有许多整群抽样的优点,又有降低抽样框设计量的优点。比较适合大规模的调查。而且通常与其它抽样方法结合使用。*不等概率抽样较常使用在初级单元规模相差较大的情形。提高估计精度是它的一大优点,使用时要选择合适的辅助变量。印象较深的有PPS抽样中使用代码法来实现各单元被抽中概率与其规模成比例的目的。*系统抽样使用方便且它的样本单元在总体中分布较均匀。还有1、群内方差大于总体方差,系统抽样精度较高。2、群内相关系数小,系统抽样精度较高。*二重抽样的第一次抽样是为了获取辅助信息,本质是定性分析,两次抽样的单位是相同的。编号: