第十四章调查设计与资料分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

132第十四章调查设计与资料分析一、教学大纲要求(一)掌握内容1.调查的概念及其特点,调查研究与实验研究的区别。2.调查设计的基本原则与内容(1)明确调查目的。(2)确定调查对象和观察单位。(3)确定调查方法。(4)确定调查指标和变量。(5)调查工具和调查表的种类、调查表和问卷的一般结构、调查问题的形式、调查问题设计应注意的问题。(6)确定样本含量的意义及方法。(7)对调查员的要求。(8)有关伦理道德的问题。3.常用的抽样方法(1)概率抽样的概念。(2)常用的概率抽样方法:简单随机抽样、系统抽样、分层抽样、整群抽样。(3)(二)熟悉内容(1)非概率抽样的概念,配额抽样、“滚雪球”样本、识别(判断)样本的概念。(2)标准化率的概念及计算方法。(三)了解内容病例对照研究和队列研究的概念及数据的处理和分析。二、教学内容精要(一)调查的概念及其特点调查(survey)是指在没有任何干预措施的条件下客观地观察和记录研究对象的现状及其相关特征。在调查中,欲研究的对象及其相关特征(包括研究因素和非研究因素)是客观存在的,不能采用随机分配的方法来平衡或消除非研究因素对研究结果的影响,这是调查研究区别于实验研究的最重要特征。当然对非研究因素的控制可以在调查分析阶段通过标准化法、分层分析以及多因素统计分析等方法得以实现,而不是在调查阶段。(二)调查设计的基本原则与内容1.明确调查目的每一项调查,必须有明确的调查目的。调查目的一般可分为调查的总目的和具体目的。133调查目的是选定调查指标的依据。2.确定调查对象和观察单位根据调查目的确定调查对象,即明确调查总体的同质范围。在确定的总体范围内,组成调查对象的每个个体即为观察单位。观察单位可以是一个人、一个家庭或一个群体。3.确定调查方法根据研究问题的性质、客观条件和研究目的选择合适的调查方法。按调查的涉及面,一般可分为普查(overallsurvey)和抽样调查(samplingsurvey)。普查也称全面调查(completesurvey),是对调查范围内的全部观察对象(总体)进行调查,一般用于了解总体在某一特定“时点”的情况。抽样调查是一种非全面调查,是从总体中抽取一定数量的观察单位组成样本,然后根据样本信息来推断总体特征。抽样调查是医学科研中最为常用的方法。调查方法还可按调查的内容发生的时间,分为横断面调查(cross-sectionalstudy)和纵向调查(longitudinalstudy);按资料的来源,可分为现场调查和利用现有资料两种;按调查方式,可分为面对面调查和非面对面调查(信访、电话采访等)两种。4.确定调查指标和变量调查目的是选定调查指标的依据,调查指标是调查目的的具体体现。设计时,应将调查目的转化为具体的调查指标。调查指标可分为客观指标和主观指标,还可分为定性指标和定量指标。一个指标可以是一个或几个变量,也可以是几个指标构成一个变量。指标的设立应注意灵敏性、特异性和客观性,并紧扣研究目的,做到少而精。5.调查工具和调查表(1)调查工具:调查工具(instruments)可分为两类,一类是“硬”工具,一类是“软”工具。如尺、秤、温度计等是“硬”工具;调查表和问卷等是“软”工具。调查工具必须标准化,要防止系统误差。工具的使用和调查结果的记录也必须标准化。(2)调查表和问卷的一般结构:调查表和问卷(questionnaire)一般可划分为4个部分,分别为:“说明部分”、“填写说明”、“核查项目”、“调查项目”。“说明部分”主要说明调查目的,以取得调查对象的合作;“填写说明”是为了保证所有调查员和调查对象均能对调查项目及填写方法正确理解、统一认识而编写的;“核查项目”这一部分是与调查目的无关、不向调查对象询问的质量控制项目,如调查员姓名、调查日期、复核结果、未调查原因等;“调查项目”部分是调查对象填写的部分,是调查的核心内容。(3)问题的形式:根据问题答案的形式,问题可分为开放型和封闭型两类。开放型问题对问题答案不加任何限制,由调查对象对问题自由回答,适于调查者不清楚答案如何以及答案很多的情况,或事先不能确定回答的范围以及预调查;封闭型问题是根据问题可能的答案,提出两个或多个固定答案共调查对象选填,常用“是与否”或多项选择的形式。封闭型问题只能得到分类资料或等级资料,而开放型问题有时可得到数值变量资料。可根据具体情况加以选择。(4)问题设计应注意的问题:尽量避免术语;避免含糊的提问用词;避免双重问题;避免诱导或强制;敏感问题的调查要有专门技巧。6.确定样本含量为什么要确定样本含量或者说其意义有哪些?(1)可以控制统计量的抽样误差,样本含量越大,标准误越小;(2)提高估计的精度,增大样本含量是控制可信区间的宽度的有效办法;134(3)增大样本含量是控制统计分析中Ⅱ型错误的概率大小的有效措施;(4)表示抽样误差的指标(各种标准误)的抽样误差也与样本含量有关(如样本方差的方差)。在现场调查中,最常用的是估计总体均数及估计总体率时要求的样本含量。估计总体均数的样本含量的计算公式:22/)(tn(14-1)式中为允许误差。为估计的标准差,一般都是从以前的研究资料中获得。在算得n之前,自由度不能确定,2/05.0t仍是未知的,解决的办法是先以2/05.0u代替2/05.0t,用迭代法求得n。估计总体率的样本含量的计算公式:22/2)1(ppun(14-2)式中为允许误差。如果估计的p是一个范围,那就应该取其中最靠近50%的值。假定估计的p约在10%到30%之间,则取p=0.30;假定估计的p约在40%到80%之间,则取p=0.50;如果对p一无所知,则取p=0.50。7.调查员调查员应该经过选择和培训,培训分理论培训和实践培训。调查员的工作量要合理,对调查员应有监督机制和质量控制措施。8.伦理道德伦理道德问题可以来自于某些调查的问题本身,也可以来自于为获得有效而可靠的资料所用的方法。调查时要注意知情同意(informedconsent)和隐私的保护。知情同意是指在研究对象暴露于某种危险之中或丧失某种个人权益时,要征得研究对象同意。(三)抽样方法1.概率抽样所谓概率抽样(probabilitysampling),就是在抽样中必须使该总体中的每一个个体都有已知的或可计算的和非零的概率被抽样抽中。常用的概率抽样方法包括:简单随机抽样、系统抽样、分层抽样和整群抽样。各种抽样方法的抽样误差一般是:整群抽样≥简单随机抽样≥系统抽样≥分层抽样。在应用大多数的概率抽样方法时,确切的抽样框架非常重要。抽样框架(Samplingframe),简单地说就是一份完整的可以用来抽样的名单。如果没有抽样框架,也就是说目标人群(总体)不明确,那么所得的调查结论很难说适用于什么人群。(1)简单随机抽样:所谓简单随机抽样(simplerandomsampling)是在某个总体中以完全随机的方法抽取一部分个体组成样本。一般,在抽样前,需要先对抽样总体中的全部个体进行编号即确定抽样框架,然后用抽签或随机数字表的方法抽取一部分个体。这种抽样方法简单,计算抽样误差方便。但是,在大规模的调查中,由于对总体中的所有个体进行编号很困难,而且当样本量不大时抽取的个体可能很分散,因此,抽样和现场调查都会相当困难。简单随机抽样的均数和率的标准误的计算公式如下:135nSNnSX2)1((14-3)1)1()1(nppNnSp(14-4)期中,Nn/称为抽样比(samplingfraction),)/1(Nn为“有限总体校正数”(finitepopulationcorrection)。去掉“有限总体校正数”即可用于无限总体抽样误差的计算。(2)系统抽样:所谓系统抽样(systematicsampling)是指随机地在抽样框架内每间隔若干个个体抽取一个个体的抽样方法。在一般情况下,系统抽样的抽样误差是和简单随机抽样相仿甚至比简单随机抽样的抽样误差更小。系统抽样的抽样误差一般按简单随机抽样方法估计。(3)分层抽样:所谓分层抽样(stratifiedsampling)是先按对观察指标影响较大的某种特征,将总体分为若干类别(统计上称之为“层”,strata),再从每一层内随机抽取一定数量的观察单位,合起来组成样本。分层的原则是层间差别越大越好,层内差别越小越好。在样本总含量n确定后,有两种比较常用的方法来分配各层的观察单位数ni。按比例分配(proportionalallocation):按各层观察单位数Ni占总体观察单位数N比例抽取样本,使各层样本含量ni与样本总含量n之比等于各层观察单位数Ni与总体观察单位数N之比。采用按比例分层随机抽样时,所得均数或比例是自动加权的。样本量分配可按下式计算:NNnnii或NnNnii(14-5)最优分配(optimumallocation):即同时按总体各层观察单位数Ni的多少和标准差σi的大小分配,按下面两式分配各层的样本量,使抽样误差最小。均数的抽样公式:iiiiiNNnn(14-6)率的抽样公式:)1()1(iiiiiiiNNnn(14-7)分层抽样中,若令NNWii/,样本均数X和率p及其标准误的计算公式如下:样本均数:iiXWX(14-8)样本均数的标准误:22)1(iXiiiXSWNnS(14-9)样本率:iipWp(14-10)样本率的标准误:22)1(ipiiipSWNnS(14-11)(4)整群抽样:所谓整群抽样(clustersampling)是先将总体按照某种与研究指标无关的特征化分为K个群组,每个群包括若干观察单位,然后在随机抽取k个群,将抽取的各个群的全部观察单位组成样本。整群抽样的特点是抽样和调查都很方便,可能省时、省力和省钱。缺点是可能抽样误差较大,特别是群间差别较大时。136整群抽样样本均数X和率p及其标准误的计算公式如下:样本均数:iiXmNkKX(14-12)均数的标准误:kiiXTTkkKkNKS12)())1(1)(1((14-13)式中iT为样本第i群内观察值之和,T为各iT的均数,kTTi/。样本率:iaNkKp(14-14)率的标准误:kiipaakkKkNKS12)())1(1)(1((14-15)式中ia为样本中各群阳性数之和,a为样本各群的平均阳性数。2.非概率抽样所谓非概率抽样(non-probabilitysampling),是指各个个体被抽样抽中的概率是未知的和无法计算的。然而,一些非概率抽样方法,尽管不能按常规的理论来计算抽样误差和推断总体,在特定条件下,还是有用的。但在应用中,不能忘了它们的局限性,特别要注意结论的合适性。(1)配额抽样:所谓配额抽样(quotasampling)是一种的实用的非概率抽样方法。就是要求样本中个体的构成在指定的几个特征方面的(分配额度)比例完全与总体一样,例如,由于全人口中男女各半,所以要求调查对象中也是男女各半,由于该地有苗族居民30%,要求在调查对象中苗族居民占30%。配额抽样可以使样本有宏观上的代表性。(2)“滚雪球”样本和识别(判断)样本:在有些情况下,缺少目标总体中全部个体的名单,无法构成抽样框架,此时可用另外一些非概率抽样的方法,即“滚雪球”(snowballing)抽样和识别(judgement)抽样的方法。比如调查太极拳爱好者,由于正式参加太极拳运动的人数太少,因此难以获得抽样框架。但是每一位太极拳运动爱好者都会有一些相同兴趣的好友,所以可以通过这种关系滚雪球似地把样本扩大。所谓识别抽样,是指研究者尽可能找到和识别需调查的个体。这两种调查方法,都未能明确规定抽样框架,甚至难以说出要推断的总体是什么,然而,作为一项探索性的调查,仍可能获得有价值的信息。(四)病例对照研究和队列研究病例对照研究(casecontrolstudy)是一种“由果推因”的回顾性观察性研究,根据有无研究疾病或其它结局,将研究人群分为病例组(cases)和对照组(controls),追溯过去某些暴露情况

1 / 14
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功