+常用的抽样方法

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

常用的抽样方法一、单纯随机抽样(simplerandomsampling)1、抽样方法根据研究目的选定总体,首先对总体中所有的观察单位编号,遵循随机原则,采用不放回抽取方法,从总体中随机抽取一定数量观察单位组成样本。具体方法①随机数字法②抽签法2、优缺点①对所有观察单位编号,当数量大时,有难度②抽样误差的计算较方便3、抽样误差的估计有限总体与无限总体总体类型均数标准误率的标准误无限总体有限总体ns11nppNnns1Nnnpp111二、系统抽样(systematicsampling)又称等距/机械抽样1、抽样方法先将总体的观察单位按某顺序号等分成n个部分再从第一部分随机抽第k号观察单位,依次用相等间隔,机械地从每一部分各抽取一个观察单位组成样本。2、优缺点(1)抽样方法简便(2)易得到一个按比例分配的样本,抽样误差较小(3)仍需对每个观察单位编号(4)当观察单位按顺序有周期趋势或单调性趋势时,产生明显偏性3、抽样误差无固定的计算公式,常按单纯随机抽样方法来计算,与总体的性质和被抽样个体间的间隔有关。三、整群抽样(clustersampling)1、抽样方法先将总体划分为若干个“群”组,每个群包括若干个观察单位,再随机抽取n个群,被抽到的各群的全部观察单位则组成样本。2、优缺点(1)在较大规模的现场调查中,易组织,较节省。(2)若各群间的差异较大,该抽样方法的误差较大。3、抽样误差四、分层抽样(stratifiedsampling)1、抽样方法先将总体按某种特征分成若干层,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。(1)按比例分配:按总体各层观察单位数的多少分配(2)最优分配:按各层观察单位数多少及其变异大小分配NnNniiiiiiiNNnn:均数iiiiiiiNNnn11:率2、优缺点(1)在一定程度上控制了抽样误差,尤其是最优分配法(2)应尽量使层内差别小而层间差别大,以提高效率(3)事先应了解各层的总体含量,最优分配还应了解标准差多阶段随机抽样样本含量的估计单纯随机抽样一、先决条件1、容许误差,预计样本统计量与相应总体参数的最大相差控制在什么范围。常取可信区间长度一半。2、所调查总体标准差,若不了解,须通过预试验的标准差S或前人的资料作出估计;3、第一类错误的概率4、对有限总体抽样时,还须了解总体观察单位数。二、计算公式punXun::,1,22222率的抽样均数的抽样随机应答技术RandomizedResponseTechniques(RRT)敏感问题(sensitiveproblem)是指涉及个人(或单位)的隐私或利益的问题以及大多数人认为不便在公开场合表态或陈述的问题,在某些情况下,还包括一些违法犯罪的行为。敏感问题的特点:一般是社会舆论导向所不认同的或反对的行为或观点不同特征的人群有不同的敏感问题不同敏感问题在敏感程度上存在差异敏感问题的分类:属性特征敏感问题数量特征敏感问题对于敏感性问题,若采用直接回答的形式,被调查者难免产生抵触情绪,不愿据实回答,这样导致调查数据失真、调查结果无效。因此寻求解决敏感性问题调查的有效方法至关重要。随机化回答是指在调查中使用特定的随机化装置,使得被调查者以预定的概率来回答敏感性问题。这一技术的宗旨就是最大限度地为被调查者保守秘密,从而取得被调查者的信任。RRT技术的基本原理在于当被调查者确信调查者及其他人无法从被调查者的回答中获知他们的真实行为时,能更加真实地对敏感问题进行回答。并且RRT技术保护调查对象的个人隐私,能充分得到调查对象的配合,最终可显著降低无应答率和误答率,得到高质量的调查结果。随机应答技术RandomizedResponseTechniques(RRT)(一)沃纳模型(Warnermodel)1965年由Warner提出的,其设计思想是向被调查者显示两个与敏感性问题(具有特征A)有关,但完全对立的问题,让调查者按预定的概率从中选一个回答,调查者无权过问被调查者回答的是哪一个问题,从而起到了为被调查者保密的效果。(二)西蒙斯模型1967年由西蒙斯提出的,其基本思想仍以沃纳模型为基础,但有一些改进,它将沃纳模型中与敏感性问题相对的具有特征A的问题改为一个与敏感性问题不相关的其它问题。(三)“随机变量和”回答模型随机化应答模型一、随机应答技术的步骤设计一对问题,使两个问题的答案种数和编码完全一致,应答者随机选取一个问题,将答案编码选出,在答案上做出相应的记号。由于答卷上没有问题的编号,只有一套答案编码,人们无从知晓应答者回答的是哪一个问题,因而起到保密作用。1.向应答者提出一对问题(1)两个相关联问题模式:设计两个相对立的陈述。例如问题1:你曾经吸过毒吗?①是②否问题2:你从未吸过毒吗?①是②否(2)两个不相关联问题模式:第一陈述为敏感性问题,第二陈述是与第一陈述无关的非敏感性问题,可以得到确切的答案。例如问题1:你曾经吸过毒吗?①是②否问题2:你是工人吗?①是②否2.设置一个随机装置进行调查使用一个内装许多黑、白两色小球的匣子,黑白球的比例接近1:1,但不等于1:1,例如可以是60%和40%。混合均匀后,被调查者从匣子中随机摸取一球,摸取的是黑球还是白球只有被调查者知道。若摸取的是黑球,则回答第一个问题,否则,回答第二个问题。答卷上只有答案选择,没有题号,可按如下格式设计:“请将你的回答在相应的编号处做上记号√:①是②否”。3.根据概率理论进行计算(1)问题1:你曾经吸过毒吗?①是②否问题2:你从未吸过毒吗?①是②否假设黑球所占的比例为P,白球所占的比例为1-P,应答者中回答“是”的总比例为r,那么对第一个问题回答“是”的比例RA可以由下式推算:r=PRA+(1-P)(1-RA)RA=r-(1-P)/(2P-1)(1>P>0.50)(2)问题1:你曾经吸过毒吗?①是②否问题2:你是工人吗?①是②否假设回答者中工人占的比例为RU,则r与RA的关系为:r=PRA+(1-P)RURA=r–(1-P)RU/P例14-1:欲调查某地已婚育龄妇女有无婚前性行为的比例。(1)先把这项技术的意义、性质和方法,特别是其保密功能,坦诚地告诉调查对象,以取得理解、信任和合作。(2)问卷中设A、B两个问题。(3)备有一个口袋,里面装有黑白两种颜色的球(也可用围棋的黑子和白子),两种球的比例不是1:1,例如可以是60%和40%。(4)调查对象在填写答案前,先随机抽取一个球(球的颜色对调查员保密),据球的颜色决定回答两个问题中的哪一个。(5)由于调查员不知道某一对象抽取的球是什么颜色的,所以无法知道某一对象回答的是问题A还是问题B,也无法知道调查对象的“秘密”。(6)设立两个问题:问题A:婚前有过性行为?回答:①是②否问题B:婚前没有性行为?回答:①是②否(7)如果调查对象抽取的球是黑色的,则回答问题A;如果调查对象抽取的球是白色的,则回答问题B。(8)计算调查对象中婚前有性行为者的比例。若调查200人,回答“是”的比例为λ=0.48,二、估计比例用的3种改进模型1、模型I把问题B改为一个完全无关、答案为“是”的概率是已知值的问题将沃纳模型中与敏感性问题相对的具有特征A的问题改为一个与敏感性问题不相关的其它问题。BA例14-2:欲调查某地已婚育龄妇女有无婚前性行为的比例。问题A:婚前有过性行为?回答:①是②否问题B:你生日(月+日)除以3余数是0吗?回答:①是②否有无性行为如果黑球比例为p=60%,同时回答问题A和B均为是的比例π=0.24,生日(月+日)除以3余数是0占π0=33.33%,则0.1780.60.33330.6)-(1-0.24ˆ0025.06.0200)24.01(24.0)1(ˆ2)ˆ(2)ˆ(VnpV本例,的方差是此时,西蒙斯模型的不足之处(1)π是预先已知或待估计的值,π的估计偏差会增加估计方差。(2)要提高估计精度,应增大P值和减小π值。但随着P值的增大和π的减小,被调查者的疑虑会增加。2、模型II将模型I中设立无关联问题B的方法改为两套抽取球的装置优点:对问题B回答“是”的概率不必是已知的。要求调查对象抽取两次彩球和回答问题两次。装置中黑球的比例是P1和P2,有专家建议,两者都不要取0或0.5,习惯k常取P2=1—P1。不论对于第一装置还是对于第二装量,摸到黑球者如实回答问题A,摸到白球者如实回答问题B。要求调查对象在两次回答问题中不能有矛盾。例14-3对于前面所说的调查婚前性行为的研究中,假定共480名调查对象。问题A:你在婚前有过性行为吗?回答①是②否。问题B:你在这3天内是吃过鱼吗?回答①是②否。211221)1(p-1ˆppp)(解此方程组,得%7.49497.00.2-0.80.8)-(10.05-0.2)-(10.36ˆ例为估计有婚前性行为的比05.0236.012.02,8.012121的比例:时调查对象回答“是”用装置的比例:时调查对象回答“是”用装置中黑球的比例:装置中黑球的比例:如果装置pp课本上有误0012.0480)8.01)(05.01(05.0480)2.01)(36.01(36.0)2.08.0(1222)ˆ(V对本例,两次试验模型的主要缺陷(1)若对同一批被调查者试验两次,他们两次回答的结果必具有相关性,从而破坏了模型的随机性。但如果对两批被调查者分别进行试验,又不容易保证两次的结构具有相似性,从而产生较大误差。(2)方差V(π)是两次试验产生的方差之和,在相同条件下,它比西蒙斯模型的方差要大得多。(3)P1和P2不能太接近。当p1=p2时,模型就没有意义了。要减小方差V(π),就应该增大P1而减小P2,但当p1增得过大时,又会减少被调查者的配合。3.模型III本方法的优点是不需要设立非敏感问题。但是球的颜色要有3种(红、黑、白)。每种球的比例是已知的(P3=1-P1-P2),要求摸到红球者如实回答问题,摸到黑球者全部回答“是”,摸到白球者全部回答“否”。例14-4如调查一批与媳妇一起生活的婆婆,问婆媳关系好不好。红、黑、白球的比例是0.5、0.3和0.2。最后问答“是”的比例为55%,要求估计婆婆真正认为婆媳关系不好的比例。50%5.05.03.055.0ˆ好的比例为即婆婆认为婆媳关系不2111)12()1(1ˆpnppnV方差:敏感问题调查注意事项调查者态度端庄、和蔼,通俗语言向被调查者解释调查的目的与调查的意义,争取得到其信任和支持巧妙提问,避免转折太大调查同时要关心调查对象的健康状况,适当予以有关的健康咨询或指导注意为被调查者的隐私保密,调查内容不公开,不伤害调查者的自尊心,并做出相应的许诺,消除顾虑。注意调查方法,可适当采用通俗,流行的语言进行调查,使被调查者有亲切感,愿意如实提供有关信息。

1 / 49
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功