描述性研究descriptivestudy本章学习要点1.描述性研究的概念及常用研究方法。2.现况研究的概念、特点、种类。3.抽样调查的抽样方法。4.调查表的编制、调查变量的规定。5.现况研究中常见的偏倚及其控制。描述性研究描述性研究又称描述流行病学。指根据日常记录资料或通过特殊调查所得到的资料,包括实验室检查结果,按不同地区、不同时间及不同人群特征分组,将一个社区人群疾病或健康状态分布情况进行简单描述,常常是流行病学调查的第一步,也是分析流行病学的基础。•特点:1、主要描述分布的三大特征,即地区特征、时间特征和人群特征。2、设计时无须设立对照;3、它不能分析暴露与效应之间的联系。Prevalencesurvey现况调查概念按照事先设计的要求在某一人群中应用普查和抽样调查的方法收集特定时间内有关变量、疾病或健康的资料,以描述疾病或健康状况的分布及某因素与疾病的关联。进行现况研究时,疾病或健康状况与发现的某些因素或特征是在一次调查中得到的,即因与果是并存的,因而在病因分析时只能对病因提出初步线索,不能得出有关病因因果关系的结论。1、研究人群中个体在某一特定时间上暴露与疾病的状态;2、研究只能分析特定时点上,某人群中暴露与疾病的联系;3、适用于不会经常发生变化的暴露因素的研究;4、适用于慢性疾病的研究,不适合病程短的疾病研究。5、无法区分暴露与疾病的时间关系;特点Howlargeisthesky?1、描述疾病或健康状况或某一事件的发生情况及其分布特征;如:AIDS在中国的现况2、为病因学研究提供线索和假说;发现高危人群或发现有关的病因线索,为疾病的防治提供依据。3、开展疾病的二级预防,即早发现、早诊断和早治疗;如:高血压的普查。4、评价防治措施效果及医疗卫生工作质量;5、用于经常性的疾病监测。目的及用途现况调查的方法•面访•信访•电话访问•自填式问卷调查•体格检查和实验室检查•敏感问题的调查–属性(分类)特征敏感–数量特征敏感随机应答技术现况调查的种类(一)普查•概念为了了解某病的患病率或健康状况,于一定时间内对一定范围的人群中每一成员所作的调查或检查。•开展普查时必备的条件(1)有足够的人力、物资和设备用于发现病例和及时治疗。(2)所普查的疾病患病率较高。(3)疾病的检验方法操作技术不很复杂,试验的敏感性和特异性均较高。•普查的目的(1)为了早期发现和及时治疗病例,如高血压普查。(2)为了了解疾病的疫情和分布,如血吸虫、疟疾的普查。(3)为了了解健康水平,如儿童发育状况普查。(4)为了建立某些生理指标正常值,如血脂、发铅、血色素等。(5)为了解某病的患病率以及流行病学特征,为开展疾病防制工作提供依据。•普查的优缺点•优点:(1)由于是调查某一人群的所有成员,所以在确定调查对象上比较简单。(2)普查所获得的数据可以了解疾病的三间分布特征,因此对疾病的流行因素能有一定的启示。•缺点:(1)普查对象多,调查期限短暂,漏查难免。(2)参加普查工作人员多,掌握调查技术和检验方法的熟练程度不等,调查质量不易控制。(3)对患病率低,诊断技术复杂的病不宜开展普查。(二)抽样调查•概念在实际调查工作中,如要揭示疾病的分布规律,可以调查某一人群中有代表性的部分(统计学上称为样本)。根据抽取样本所调查出的结果可以估计出该人群某病的患病率,或某些特征的情况。这种调查方法称为抽样调查。•基本原理1、抽样必须遵循随机化的原则,才能获得有较好代表性的样本,并通过样本信息推断总体。随机抽样是研究的样本由总体中抽取时,每个单位都有同等机会可能被抽中。2.样本量适中(足够大)。抽样方法(1)单纯随机抽样:是最基本的抽样方法,也是其他抽样方法的基础。即先将被研究的对象编号,再用随机数字表或抽签、摸球、电子计算机抽取等进行抽样。此法只能用于数目不大的情况下,如几万人的调查就很难用单纯随机抽样。抽样方法(2)系统抽样:此法是按照一定顺序,机械地每隔一定数量的单位抽取一个单位,又称间隔抽样或机械抽样。本法常用于调查研究,优点是简便易行,样本的观察单位在总体中分布均匀,一般情况下,比单纯随机抽样法的抽样误差小。抽样方法(3)分层抽样:即先将研究对象按主要特征(如性别、年龄、职业、教育程度等)分为几层,然后再在各层中进行随机抽样,这样就保证了各层至少在重要的有关因素方面取得均衡。分层随机抽样又分为两类:①按比例分层随机抽样:各层内抽样比例相同。②最优分配分层随机抽样:按照一定的要求,各层内抽样比例不同,如在一个较大地区调查儿童身体发育的某项指标,可划分平原、山区、沿海等几个层,再按各层比例确定随机抽样的数量。这样就可使每层中观察值的变异度小些,样本的代表性加强,多层间还可作比较分析。要求:层内变异越小越好,层间变异越大越好。抽样方法(4)整群抽样:用此法抽样时,可抽到的不是个体,而是由个体所组成的集体或群体。如村、车间、班级、连队、居民小组等。这些群体是从相同类型的群体中随机抽出的,被抽到单位的所有成员都是研究对象。抽样方法(5)两级或多级抽样:又称多阶段抽样。这是大型调查时常用的一种抽样方法。例如某学校有9000名大学生,15个系。每个系的学生数相差不多。如要调查600名学生,抽样方法如下:先自15个系随机抽取2个系,再自这2个系随机抽取300名学生,这就是两级抽样。此法应注意多阶段的连续性。各阶段抽样方法多用单纯随机抽样法,亦可几种抽样法结合使用。抽样误差:整群>单纯>系统>分层样本量的估计•估计样本大小主要取决于以下因素:1)预期现患率:在调查的人群中,欲调查某疾病的现患率,若现患率低,则样本量大;反之,则样本量可小些。(反比)2)调查单位间的变异程度;若各个调查单位之间的变异较大,则样本量要大;反之其间均衡性较好,则样本量可以小些。(正比)3)精确度:若调查要求的精确度高,既允许误差小,则样本量就要大;反之,则样本不必过大。(反比)4)把握度(1-β):如把握度要求高则样本量适当大些,反之,则样本量可小些。(正比)•确定样本大小的办法:(1)凭经验:视具体问题而异。例如一般认为确定正常值范围最好在100例以上。肿瘤死亡率调查通常要10万人口以上。一般说来,计量资料样本含量可少些,计数资料应多些。(2)凭估算:按以下公式计算。•计量资料:N=4s2/d2(α=0.05)•计数资料:N=400Q/P(d=0.1P)N=178Q/P(d=0.15P)式中N为样本含量,d为容许误差即样本均数(或率,p)与总体均数(或率,P)之差,s为样本的预期标准差。例1:如拟调查某地成人白细胞数量是否偏低,若抽样调查样本量至少应有多少人?据文献,正常成人白细胞数的标准差约1×109个/L,d=0.1S=0.1×109个/L,代入公式得:人400)101.0()101(42929n例2:需要抽样调查当地儿童蛔虫感染率,据以往经验儿童蛔虫感染率不超过30%,若规定容许误差为0.1P即3%,则样本含量至少应为多少人?人9333.07.040040003.07.03.096.122PQn现况调查的实施步骤•确定研究目的–明确调查目的;–掌握有关背景资料;•确定研究对象–三早:高危人群–关联:暴露人群或职业人群–分布或参考值:代表性总体–评价效果:实施人群•确定研究类型和方法P51图调查表的内容•标识变量–年龄、出生日期、性别、民族、文化程度、婚姻状况、家庭人口数及结构组成、家庭经济状况、职业等。•研究变量:需研究的因素。–疾病指标(发病、死亡)–相关暴露因素(经济收入、饮食习惯、家族史等)调查表的基本结构•封面语:简明、亲切、谦虚、诚恳–*调查者身份、调查目的–必要时:填写方法、要求,致谢•指导语:简明易懂–卷头:填表说明–卷中:针对特殊问题所做出的特定指示•问题和答案:–“封闭式”问题——将各种可能的答案列在调查表上由回答者选择其中一个答案。便于分类编码和资料的计算机处理。–“开放式”问题——被调查者对问题的回答不受限制。适合难于限定答案尺度的问题。调查表的基本结构•编码调查表——在每个问题后留出编码用方框。•时间记录和调查员签名;可核查调查员的调查质量•预试正式开始调查前应对拟好的调查表进行预试验,以确定调查表的可行性。调查表设计的要求及注意事项•问题应具体、确定,不能抽象、笼统•避免复合性或双重含义、带有倾向性和诱导性的问题•通俗易懂,避免使用专业术语和冷僻的词汇,尽量简短•用词准确,避免含糊不清、模棱两可•必要的问题一个不漏,无关的问题一个不要(30分钟)•调查表问题的排列–先易后难,先一般后隐私(敏感),多客观事实、行为少主观感觉–同类问题放在一起–时间顺序–封闭式问题在前,开放式问题在后问题的形式•填空式•是否式•多项式•矩阵式•表格式•半封闭半开放式资料的收集•掌握有关的背景资料–标识变量:年龄、出生日期、性别、民族、文化程度、婚姻状况、家庭人口数及结构组成、家庭经济状况、职业等。•疾病测量:严格的诊断标准•暴露测量:暴露必须有明确的定义和测量尺度。可用调查表、实验室检查、体检等手段来测量。•培训调查员调查员培训•实事求是的科学态度和高度的责任心•有一定的文化水平,但不一定要求医学专业•培训内容–调查技巧–指标含义–填表方法–……资料整理分析1.对原始资料进行检查与核对,并进行逻辑检错,以提高原始资料的正确性和完整性。应填补缺漏、删去重复,纠正错误等,以免影响资料的质量。2.按照卫生统计学和流行病学的专业需要进行原始资料的整理,例如划分组别、制订整理表和统计表等。3.计算各种率,常用现患率、阳性率、检出率等;数量变量资料可计算平均数等;4.计算标化率,即分析结果时,为了便于不同地区的比较,常采用率的标准化方法。5.应用流行病学的原理和方法,采用分类、分析、综合、比较和各种归纳推理方法,通过描述分布、相关分析、单因素对比分析和多因素分析的技术研究分析疾病或健康状况的规律性。结果解释现况调查资料经统计学分析后,应根据研究目的对结果作出解释。1.若现况调查的目的是为了了解疾病的分布,可根据“三间”分布特征的结果,结合有关因素解释疾病的分布特点。2.若现况调查的目的是提供病因线索,可将描述性资料进行对比分析,寻找规律,为进一步进行分析性流行病学研究建立病因假设提供证据。可以将调查对象分为病例和非病例,通过对比两者的差异对病因作初步检验,但不能作因果关系的分析。现况研究的质量控制•1)确保抽样过程的随机化原则•2)提高研究对象的依从性和受检率•3)正确选择测量工具和检测方法•4)培训好调查员,统一标准和认识•5)作好资料的复查、复核等工作•6)选择正确的统计分析方法,注意混杂因素的影响。在特定时间对特定人群的调查研究目的研究对象和数量、调查方法、调查内容定义和标准结果(描述分布特征)1、不同性别、年龄高血压患病情况2、BMI与WHR与高血压患病的关系3、吸烟、饮洒与高血压患病的关系4、文化程度与高血压患病的关系5、家族史与高血压患病情况6、体力活动与高血压患病情况讨论(分析原因和结论)1、高血压患病率为55.51%,形势严峻2、男女患病率随年龄上升但无显著差别3、BMI、WHR与高血压患病率关系明显4、饮酒同高血压患病有关,但吸烟无关5、饮茶者发生高血压的危险低6、从事脑力活动者患病率低7、高血压相关知识普及不够