医学统计学(10)——调查设计季聪华2012.12.06调查设计•调查设计概述•调查问卷设计•量表的信效度评价•队列研究与病例对照研究调查设计•1.确定调查对象和调查指标•2.确定调查方法•3.常用的概率抽样方法•4.抽样调查的主要偏倚及其控制措施•5.确定样本含量•6.确定资料收集方式•7.编制调查表或调查问卷•8.制定资料整理分析计划•9.制定调查的组织计划和质量控制方案1.确定调查对象和调查指标调查对象和调查指标是调查研究的两个基本要素,即进行调查研究要根据调查目的确定调查什么范围内的什么对象及其从调查对象身上观测哪些具体内容或项目。统计学要求调查对象是具有同质的总体或样本,调查指标要尽量用客观性强、灵敏度高和精确性好的定量指标,少用定性指标。2.确定调查方法•常用的调查方法有普查、抽样调查、典型调查三种。•普查(全面调查)普查一般用于了解总体在某一特定“时点”上的情况,如某年某地某病时点患病率等。理论上只有普查才能取得总体参数且无抽样误差,但往往系统误差和过失误差较大。疾病普查的适用范围一般是:①发病率较高的疾病。②灵敏度和特异度较高的检查或诊断方法。③普查方法便于操作、易于接受且具有实施条件。普查一般应尽可能在短时间内完成,但不适于病程较短的急性病。普查成本高,除非十分必要,一般不宜采用。•抽样调查是一种非全面调查,它是医学科研中最为常用的方法。抽样调查是从总体中抽取一定数量的观察单位组成样本,然后根据样本信息来推断总体特征。抽样调查中,通常采用随机抽样的方法获得样本,使样本对总体具有较好的代表性。抽样调查只观察总体中的一部分观察单位,节省人力、物力和时间,并可获得较为深人细致和准确的资料,在实际工作中应用最多,是值得提倡的研究方法,并且许多医学问题只能作抽样调查,如药物疗效观察等。此外,抽样调查还可用于评价普查的质量。•典型调查亦称案例调查。即在对事物进行全面分析的基础上,选择典型的人或单位进行调查。如调查疾病的个别典型患者,研究其病理损害等;调查几个卫生先进或后进单位,用以总结经验教训。典型常常是同类事物特征的集中表现,有利于对事物特征进行深人的研究,若与普查相结合,则可分别从深度和广度说明问题。由于典型调查没有贯彻随机抽样的原则,不宜进行统计推断,但在一定条件下,结合专业知识,可对总体特征作经验推论。3.常用的概率抽样方法单纯随机抽样系统抽样整群抽样分层抽样各种抽样方法的抽样误差规律是:整群抽样≥随机抽样≥系统抽样≥分层抽样。实际问题中,常常把两种或几种抽样方法结合起来使用,如分层整群随机抽样等。•单纯随机抽样是把调查总体的全部观察单位进行编号,再用随机数字表或抽签等方法随机抽取部分观察单位组成样本。随机抽样是最基本的抽样方法。优点是计算样本数字特征比较简单,缺点是要对所有观察单位编号,费时费力,实际工作困难。在抽样设计时,还必须考虑样本容量。样本例数过少,所得指标不稳定,推断总体的精度差,检验的效能低;样本例数过多,不但造成浪费,而且给质量控制带来困难。•系统抽样又称为机械抽样或等距抽样,是把总体观察单位按一定顺序分为n个部分,从第一个部分随机抽取第k位次的观察单位,再从其他部分中抽取相同位次的观察单位,由这些观察单位组成样本。优点是简单易行,容易得到一个按比例分配的样本,抽样误差小于单纯随机抽样。缺点是:①系统抽样抽取各个观察单位不是彼此独立,总体的观察单位有周期趋势或单调增减趋势时,抽样方法会出现明显的偏性。②实际工作中,一般按单纯随机抽样方法估计其抽样误差,由于系统抽样抽取的各个观察单位不是彼此独立,因此,对抽样误差的估计只是近似的。•整群抽样是把总体N个观察单位分为K个“群”,每个群包含若干观察单位,随机抽取k个“群”,用这些群中的全部观察对象组成样本。优点是便于组织,节省经费,容易控制调查质量。缺点是当样本例数一定时,其抽样误差一般大于单纯随机抽样,这是因为样本观察单位并非广泛地散布在总体中。为降低抽样误差,可采用增加抽取的“群”数,减少“群”内观察单位数的方法进行抽样,即重新划分“群”组,使每个“群”更小。整群抽样的抽样误差大于单纯随机抽样,需要增加样本量,一般增加50%左右。•分层抽样又称分类抽样,先按总体人口学特征或影响观察值变异较大的某种特征(如年龄、性别、病情和病程等)分成若干层次,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。优点是减小抽样误差,不同的层可以采用不同的抽样方法,不同的层可以独立进行分析。分层增加了层内同质性,观察指标的变异减小,各层的抽样误差减小,样本含量相同时,标准误一般均小于单纯随机抽样、系统抽样和整群抽样的标准误。但当研究资料各层之间的差距小时,就不需要分层抽样。一般说,当样本含量足够大时,调查患病率和相关因素,只要单纯随机抽样即可,不一定需要事先分层。但是调查结束后处理资料时,分层统计分析是必要的,这是为了控制混杂偏倚。4.抽样调查的主要偏倚及其控制措施•选择性偏倚①未遵守随机抽样的原则,使样本对总体的代表性差。控制措施:随机抽样。②样本含量计算不精确,导致样本含量不足够,使样本缺乏代表性。控制措施:偏大估计。③调查对象依从性低或各种原因回避问题无应答。一般认为应答率80%时,调查结果不能代表总体真实情况。控制措施:加强量表设计的科学性和调查的组织管理。•信息偏倚•①来自调查对象:有回忆偏倚和报告偏倚。控制措施:设法帮助回忆,更好理解问题的要求。•②来自调查者:对调查对象的询问和检查(四诊收集资料过程)不能同等对待,持有个人意愿而失去客观公正。控制措施:盲法收集资料。•③来自仪器检测手段:缺乏质量内控制和外控制。控制措施:质量内控制是对操作者统一培训、统一型号的仪器和试剂;质量外控制是对操作者盲法使用标准样品并规定警告线和最大容许线。5.确定样本含量抽样调查不可避免地存在抽样误差,如何使样本比较好地代表总体,一方面要根据调查研究的目的、内容和观察对象的分布特征选定适宜的抽样研究方法,另一方面要保证适当的样本含量。样本含量的估计原则是在保证研究结果具有一定的推断精度和检验效能的前提下,确定最少的样本含量。单纯随机抽样和系统抽样时样本含量的估计【例1】若用单纯随机抽样的方法了解某医科大学大学生SCL-90的平均水平,该大学有在校学生15000人,允许误差不超过5分,根据预调查结果,医学生SCL-90总分的标准差为39.2分,取α=0.05。问需要调查多少医学生?【例2】某校医预调查该校医学生的失眠患病率,如果文献报道医学生的失眠患病率为15%,允许误差不超过5%,取α=0.05。先用单纯随机抽样的方法了解该校医学生的失眠患病率,间需要调查多少人?分层随机抽样时样本量估计•分层随机抽样样本含量计算步骤:(1)求分层随机抽样总体参数估计值:参数估计值为对各层的参数估计值进行加权平均(权重为各层在总体中所占的比例)。(2)根据单纯随机抽样的样本含量计算式估计样本含量。(3)根据各层的大小按比例分配各层样本量。整群抽样时样本含量的估计•整群抽样的样本含量估计方法:先使用单纯随机抽样的方法估计出n,然后乘以设计效率k即可(如果整群抽样的方差是单纯随机抽样的k倍,就确定设计效率为k)。至于抽取的群的数目以及每群的平均大小,还涉及群间的变异与费用大小。6.确定资料收集方式•1.观察法•2.个人访谈•3.报告法•4.问卷调查法•观察法是指调查人员不直接与受访者进行接触,而是通过旁观的方法获得对受访者情况的了解。使用观察法时,要求访问员具有较强的观察能力和心理分析能力,能够敏锐地发现受访者的各种无意识活动。参与观察:也称实地观察,指研究者参与到研究对象的生活中,与研究对象一起生活和工作,在密切的相互接触和直接体验中倾听和观察研究对象的言行。非参与观察:研究者处于所观察的对象或现象之外,完全不进入研究对象的日常生活。研究者通常置身于被观察的世界之外,作为旁观者了解事情的发展动态。结构观察:是按照一定程序、采用明确的观察提纲或观察记录表格对所要研究的现象进行观察。无结构观察:通常使用现场工作记录的方式记录所收集的资料,并常以参与观察的方式进行。直接观察:直接观察研究对象。间接观察:对自然物品、社会环境、行为痕迹等与研究对象有关联的事物进行观察,以间接反映调查对象的状况和特点。•个人访谈是指调查人员根据访问提纲,与受访面对面交谈并收集资料。使用采访法时,访问员需要及时掌握受访者的谈话内容,对于有价值的信息进行深人追问。优点:了解受访者的反应,可以探索深层次的问题,适合冗长问卷的调查,完成整份问卷的几率较高,可以让受访者产生视觉刺激且觉得有人在倾听,高度参与。缺点:成本高,时间长,受访者的匿名问题,受访者有时谈话漫无边际,很难进行定量分析等。27按访谈内容分:非结构式访谈:不事先拟定表格、问卷或定向的标准程序,只制定粗略的调查提纲,是访谈者与被访谈者之间就某些问题自由的交谈。其形式是非正式的、自由的。用于收集人们感情、态度、价值观、信念等方面的资料,能使受访者充分发表自己的意见。半结构式访谈:就一些关键性要点形成问题并发问被访问者。讨论由研究者特别感兴趣和被调查者希望进行交流的内容来确定。强调一种非确定性开放方法,可获取新的信息,并能深入了解问题而不受规定的限制,使被访者有较大的自由回答问题。结构式访谈:调查者事先准备好调查提纲或问卷,逐项有序地向被调查者提问。多为开放性问题。研究者事先了解研究人群的观点和认识,通过自由列答案法、归类法、打分法、排序法等方法,对回答者的观点进行描述,对其文化和行为进行分析。访谈前,要对访谈的主要目标和要了解的内容有个明确认识访谈前,最好对被访谈者的背景情况有大体的了解以方便被访者尽可能减少不必要的麻烦为原则以饱满的热情专心的态度完成整个访谈保持资料的原始性和完整性进行深入访谈的要点•报告法是指由受访者填写有关报告表格,向调查人员报告自身情况。报告法是我国政府统计的传统方法,也是政府统计信息的主要来源。在组织良好的情况下,报告法能够在较低的成本下,快速地获得有关统计结果。•问卷调查法是指调查人员利用格式化的调查问卷,向受访者进行询问。可以获得符合分析要求的定量数据。常见的问卷调查方法包括:①入户访问。②街头拦截式访问。③电话调查。④邮寄问卷调查。⑤电子邮件传送问卷。⑥因特网中设置问卷。⑦媒体问卷调查等。7.编制调查表或调查问卷调查表或调查问卷是调查指标的载荷,一个好的调查表对调查研究起着至关重要的作用。根据调查目的和要求,将所需要调查的问题具体化,经过合理设计,转化为可回答和测量的条目,可以更好地获取被调查者的信息资料,以便进一步的统计分析,揭示调查事物的特征与规律。8.制定资料整理分析计划通过调查收集到的原始资料还必须经过整理与分析,去粗取精,去伪存真,才能揭示出事物的本质和规律。其内容应包括以下方面:•调查问卷的回收与核查•数据编码与录入•设计数据整理表和数据分组•数据汇总•数据分析•调查问卷的回收与核查调查问卷的回收是整理工作的第一步,要认真管理好收回的调查问卷,并作好专门的记录,全面掌握问卷的回收情况。调查问卷回收过程中,在编码录人计算机之前,调查项目的核查工作是必不可少的工作环节。主要包括完整性核查和逻辑核查。完整性核查是对调查问卷的所有项目进行核查,核对是否有漏填项,缺项内容应立即补填。完整性核查一般在调查现场进行,以免问卷收回后某些数据弥补困难。逻辑核查主要检查内容逻辑上的矛盾,如入院日期与死亡日期的矛盾,患疾病种类与性别、年龄等不符的情况等。有些逻辑核查可在数据录入后,由计算机自动核查。•数据编码与录入数据编码即对每条调查项目的所有可能的调查结果分配一个代码。在问卷设计时编码为事前编码,编码要方便调查员和被调查者对调查条目的理解和作答。在数据收集后编码为事后编码,主要针对调查问卷中的开放性调查项目,将调查中的各种回答进行比较,归纳整理出回答内容的主要类型,给予恰当的