1统计学傻瓜指南!Dr.HamdaQotba,B.Med.Sc,M.D,ABCM翻译:acred(DXY)2定义统计学是搜集、整理、总结、分析数据以及依据数据进行推断的科学统计描述,包括搜集数据、整理数据、总结数据、分析数据以及将数据呈现出来统计推断,包括进行推测、假设检验、确定关系然后作出预测3变量定量的(Quantitative)•离散的(Discrete)•连续的(Continuous)定性的(Qualitative)•有序的(Ordinal)•分类的(Categorical)4参数检验与非参数检验•参数检验:需要知道样本统计量的分布才能作出决断•非参数检验:不需要知道样本统计量的分布就可以作出决断5t-检验•在样本中比较连续变量的平均数,以检验两个均值之间的差异是否大于能被机遇所解释的差异均值有差异,概率是多少?6应用条件•观测值(变量)相互独立•从正态分布的总体中抽样得到•样本量30;如果30,则使用正态曲线的z检验(二项检验,binomialtest)7t-检验的类型•单样本t检验:某个变量的样本均数与给定总体的已知均数相比,其差异是否有意义•非配对或独立t检验:检验由两个独立样本估计的总体均数之间的差异是否有意义(如男性群体和女性群体)•配对t检验:检验由相关样本估计的总体均数之间的差异是否有意义(如给同一组病人施加处理前后,测量值的均数)8χ2检验•用来检验定性变量间关联的强度•用于分类数据9应用条件•数据应以频数的形式呈现•被观察的病例总数应大于20•任一类别或单元格内的理论频数应5(当任一单元格观测频数5:yate’s校正)或(当任一单元格理论频数5:fisher精确概率)•相比较的组别应大致相似10相关与回归•研究两个或两个以上变量之间关联的强度以及函数关系的方法11相关•指明变量间关联的强度r=+1r=-1r=0曲线12回归•揭示一个因变量与一个或多个自变量间数学关系的方法•简单线性回归和多重回归适用于连续变量如血压、体重•Logistic回归适用于二值响应,如生/死13测量值•若为参数•Pearson相关系数连续变量线性关系•若为非参数•Spearman等级相关两个均为连续变量•Kendall等级相关(Kendall’sτ)两个均为有序变量或一个有序另一个连续14方差分析(ANOVA)•用来揭示作用于一个因变量的几个分类自变量(称为因素)的主效应和交互效应15方差分析的类型•单因素方差分析(One-wayANOVA):检验一个因变量在一个分类自变量两组、三组或多组类别间的差异16•两因素方差分析(Two-wayANOVA):分析一个因变量在两个自变量所形成的组间的差异,其中一个自变量可看作处理变量•多因素方差分析*(n-wayANOVA):简言之,多因素方差分析处理多个自变量。应当注意,自变量的个数越多,可能的交互作用的数量也随之增多17如何选择恰当的统计检验方法•变量类型•定量的(血压)•定性的(性别)•所研究问题的类型•关联•比较•危险因素•数据的构成•独立的•配对的•匹配的18所研究的中心问题两变量(因变量,自变量)之间的联系变量类型检验方法因变量自变量分类分类χ2分类定量Logistic回归定量分类2个结局:T检验3个以上结局:方差分析定量定量Spearman相关线性回归19变量间比较(差异)变量自变量的个数2组配对数据2组定量T检验配对T检验方差分析有序Mann-WhitneyWilcoxonKruskal-wallis分类χ2*McNemarχ2*有1个单元格理论频数5,用fisher精确概率法有1个单元格观测频数5,用yate’s校正20寻找危险因素变量类型检验方法因变量多个自变量分类分类logistic回归定量分类方差分析定量定量线性回归,logistic回归