现场流行病学中常用的统计方法现场流行病学中常用的统计方法及SPSS实现广东省CDC传防所杨芬基本概念基本概念统计学好比总体与样本间的桥梁,它帮助人们挖掘样本中的信息,推断总体的规律人们挖掘样本中的信息推断总体的规律性。统计资料的分类统计资料的分类有种类有三种类型的资料¾计量资料(连续型资料、定量资料)计量资料(连续型资料、定量资料)¾计数资料(离散型资料、分类资料、定性资料)¾等级资料¾等级资料观察单位observations变量Unitselements住院号年龄身高体重住院天数职业文化程度分娩方式妊娠结局observations个体individualsvariablesUnits;elements住院号年龄身高体重住院天数职业文化程度分娩方式妊娠结局20256552716571.55无中学顺产足月20256532216074.05无小学助产足月20258302515868.06管理员大学顺产足月20225432316169.05无中学剖宫产足月20224662515962.011商业中学剖宫产足月商业中学剖宫产足月20245352715768.02无小学顺产早产20258342015866.04无中学助产早产中学助产20194642415870.53无中学助产足月20257832915457.07干部中学剖宫产足月Quantitativedata计量资料Qualitativedata计数资料计资料计数资料统计方法的选择统计方法的选择数资等资率检验计数资料、等级资料(率):x2检验、回归归计量资料(均数):t检验、方差分析、相关病例对照研究中常用统计方法照究及SPSS实现定义定义通过比较病例组与对照组曾经接触某种危险因素(或保护因素)的率来推断发病险因素(或保护因素)的率,来推断发病与危险因素之间的关系。¾如果病例组与对照组的率的差别有统计学意义,提示该危险因素(或保护因素)可能是造成发病的因素之一。率率的比较-x2检验单因素与多因素分析单因素与多因素分析单析单因素分析¾研究某个单一危险因素与发病之间的关系研究某个单危险因素与发病之间的关系¾未考虑其它可能危险因素的混杂作用¾2检验/单因素的Logistic回归¾x2检验/单因素的Logistic回归多因素分析¾同时研究多个危险因素与发病之间的关系¾考虑了多个危险因素的交互作用¾考虑了多个危险因素的交互作用¾多因素的Logistic回归适用条件适用条件单因素分析单因素分析¾样本含量不高¾研究的危险因素数不多¾在流行病学现场调查中更常用在流行病学现场调查中更常用¾为多因素分析筛选可能的危险因素多因素分析多因素分析¾一定的样本含量¾研究的危险因素数较多¾研究的危险因素数较多¾更适用于科研单因素分析单因素分析检验x2检验¾Pearsonx2检验检验¾配对x2检验¾分层2检验¾分层x2检验¾趋势x2检验Pearsonx2检验Pearsonx检验比较病例组与对组的率的差别有无统计学意义比较病例组与对照组的率的差别有无统计学意义表5病例和对照行为习惯等情况病例(29例)对照(29例)变量人数构成比(%)人数构成比(%)卡方值P值人数构成比(%)人数构成比(%)饭前便后洗手2.6050.272经常1241.41862.1有时候1655.21034.5无13.413.4甲肝疫苗史0.491有269000有26.900.0无2793.129100.0零花钱1.4060.236有2689.729100.0无310.300.0去小卖部1.4060.236有有2689.729100.0无310.300.0集体聚餐史0.491有26.900.0无2793.129100.0生吃瓜菜2.530.112有931.0413.8无2069.02586.2喝生水1.4060.236有310.300.0无2689.729100.0外出史2.4170.120有413.800.0无2586.229100.0接触史0.2790.597有1448.31241.4无1551.71758.6四格表四格表例1:¾Data—Weightcases—人数aaegcases人数¾Analyze—Descriptivestatistics—Crosstabs—Crosstabs¾Row—发病与否,Column—暴露与否SttitiChiRik¾Statistics—Chi-square,RiskX2值P值OR值OR值OR值的置信区间SPSS应用中的注意事项SPSS应用中的注意事项Row发病与否Column暴露与否Row—发病与否,Column—暴露与否¾这样计算出来的OR值不会出错“暴露因素”的编码暴露素编¾不暴露的编码一定要大于暴露¾暴露1,不暴露2“发病因素”的编码发病因素的编码¾不发病的编码一定要大于发病¾发病1,不发病2OR值的意义OR值的意义¾与追踪研究的相对危险度相等¾暴露相对不暴露,发病的危险性增加或减少的倍数¾暴露因素:性别,男1,女2¾男相对女,发病的危险性增加或减少的倍数Pearsonx2检验Pearsonx检验例2:四格表中出现频数为0的格子四格表中出现频数为0的格子SPSS无法计算OR值OR=(4/25)÷(0/29)=∞(有这么大吗?)将“频数为0的格子”赋一定的值:05将频数为0的格子赋定的值:0.5,便于OR值计算若n≥40,但少量格子1≤eij<5时,连续性校正;正;若n<40或eij<1时,精确概率计算法课堂练习课堂练习国庆节婚礼后,婚礼参加者中发生了某种传染病暴发。83名宾客中有79名被调查,传染病暴发宾客中有被调其中有54人被确诊。下面四格表表示婚礼蛋糕的食用和发病情况。请计算优势比。蛋糕的食用和发病情况。请计算优势比。是否吃蛋糕病例非病例总计是50353否42226合计542579非四格表R×C列表非四格表:R×C列表例3:暴露因素为多等级暴露因素为多等级若进行普通的x2检验¾只能反映两组的构成比的差别有无统计学意义¾没有利用“等级”信息有利等信趋势X2检验Cochran-ArmitageTrendTest随着暴露水平的升高或降低相应的优势比是¾随着暴露水平的升高或降低,相应的优势比是否也升高或降低DtWiht人数Data—Weightcases—人数Analyze—Descriptivestatistics—AnalyzeDescriptivestatisticsCrosstabs—Row—发病,Column—暴露,StatisticsChisquareLinearbyLinearStatistics—Chi-square,Linear-by-LinearAssociation那一项为近似X2值趋势方向看实际的OR值,一般以第一个级别OR值作为标准进行比较别值作为标准进行较课堂练习课堂练习病病究病对某病进行病例对照研究,选取病例136例,对照361例,研究可能的危险因素。其中对照例研究能危险素其中某一研究结果如下表,请分析某危险因素接触程度与病例发病是否有关系?是什么接触程度与病例发病是否有关系?是什么关系?两样本的等级秩和检验例4例4:比较两组疗效的差别普通的2检验普通的x2检验¾只能反映两组的构成比的差别有无统计学意义¾没有利用“等级”信息趋势X2检验¾随着暴露水平的升高或降低,相应的优势比是否也升高或降低不是病例对照研究¾不是病例对照研究两样本的等级秩和检验两样本的等级秩和检验¾比较两组的等级构成比是否有差别数Data—Weightcases—人数Analyze—Nonparamatrictest-twoAnalyzeNonparamatrictesttwoindependentSamplestest-TestVariable-疗效GroupingVariable治疗与否疗效,GroupingVariable-治疗与否,Mann-WhiteneyU结果:Z值秩和检验两组的差别有无统计学意义秩和检验,两组的差别有无统计学意义如果有统计学意义如果有统计学意义¾比较两组的平均秩次¾平均秩次高的组表明疗效较好¾平均秩次高的组表明疗效较好注意事项¾疗效的编码(无效1,有效2,显效3)课堂练习课堂练习比较不同根端形态患牙的治疗疗效有否差别。配对设计的2检验配对设计的x2检验每一例病人选择1至数例在混杂因素的暴露水平上相一致合乎研究条件的未露水平上相致、合乎研究条件的、未患病的人作为对照注意注意:¾每个年龄层的匹配-成组匹配-成组比较每个年龄层较¾可以提高成组比较的研究效能¾不是严格意义的配对设计¾不是严格意义的配对设计体案教材例5(具体案例见方教材p320)3个变量(病例是否暴露、对照是否暴露、3个变量(病例是否暴露、对照是否暴露、人数)DtWiht人数Data—Weightcases—人数Analyze—Descriptivestatistics—ayeescptestatstcsCrosstabs—R病例Cl对照Row—病例,Column—对照Statistics—McNemarOR=b/c=30/12=2.5(无法用spss计算)课堂练习课堂练习种清检验结较两种血清学检验结果比较分层2检验分层x2检验按可能的混杂因素分层年龄对心肌梗死与使用避孕药之间的关系起¾年龄对心肌梗死与使用避孕药之间的关系起一定的混杂作用一个四格表分解为多个四格表计算消除了混杂因素后的公共优势比计算消除了混杂因素后的公共优势比例具体案例方教材例6(具体案例见方教材p317)4个变量(发病与否、暴露与否、人数、分层)Data—Weightcases—人数Analyze—Descriptivestatistics—Crosstabs—Analyze—Descriptivestatistics—Crosstabs—Row—发病与否,Column—暴露与否,Layer-分层分层Statistics—Chi-square,Cochran’sandMantel-Haenszel在不同层(四格表)进行2检验在不同层(四格表)进行x2检验P值大小不一是由于检验效能不够导致还是事实如此?表明不同层的检验值OR值是相同的检验不同层的OR值是否相同¾若相同,进一步计算公共优势比若相同,进步计算公共优势比¾若不同,分层计算优势比表明公共优势比有统计学意义统计学意义•去除了分层因素后,公共优势比是否有统计学意义有统计学意义公共优势比公共优势比置信区间去除了年龄这个混杂因素后心肌梗死与去除了年龄这个混杂因素后,心肌梗死与服用避孕药的相关性充分显现出来课堂练习课堂练习超市个店性帮某超市3个不同分店对性别与寻求帮助的关系研究结果见下表,请问消除了分层因素系研究结果见下表请问消除了分层因素后性别与寻求帮助之间是否有关系?什么关系?关系?t检验t检验样本均数体均数较样本均数与总体均数的比较成组设计两样本均数的比较成组设计两样本均数的比较配对设计的样本均数比较适用条件:正态分布、方差齐、独立性样本均数与总体均数的比较样本均数与总体均数的比较用自动打包机打包每包标准质量为100K用自动打包机打包,每包标准质量为100Kg。某日开工后在试机后共打了9个包,测得9个包的质量(Kg)为:请判断打包机是否正常。见ttt1见:t-test1.sav成组设计两样本均数的比较成组设计两样本均数的比较现希望评价两位老师的教学质量,试比较其分别任教的甲、乙两班考试后的成绩是其分别任教的甲两班考试后的成绩是否存在差异?见ttest2sav见:t-test2.sav配对设计的样本均数比较配对设计的样本均数比较高病每病用某药治疗10名高血压病人,对每一病人治疗前、后的舒张压(mmHg)进行了测疗前后舒张g行测量,问该药有无降压作用?见pairedtsav见:paired-t.sav课堂练习课堂练习为研究国产新药阿卡波糖胶囊的降血糖效果某医院用40名II型糖尿病病人进行同期果,某医院用40名II型