医学研究中常见的统计学错误(季聪华)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

医学研究中常见的统计学错误季聪华一、随机二、均数±标准差三、独立样本t检验四、配对t检验五、卡方检验六、回归分析七、信效度评价八、统计图九、统计表格十、统计结果内容十一、样本量•随机是指采用随机的方式,使每个受试对象均有同等的机会被抽取或分配到实验组和对照组。•包括“随机抽样”和“随机分组”两类。•随机抽样主要用于调查性研究,如发病率调查、危险因素调查等。•随机分组主要用于试验性研究,如干预措施的有效性和安全性评价。一、随机•错用1:在不可能随机的情况下,滥用“随机分组”•随机分组适用于前瞻性试验性研究,而非对回顾性资料的分析。队列研究、病例对照研究虽然也有对照,但对照的形成不是根据随机原则确定的。•错用2:明显的假随机分组•随机分组的研究,组间数量呈规律的比例关系,如1:1,2:1,3:1等。因脱落等原因可能会造成例数的不严格比例关系,但文章要有明确交代。一、随机•5•排序法步骤:编号、取随机数、排序、分组将10例试验对象随机分配到甲、乙组中对象编号12345678910随机数字13926699472449577432排序19710425683组别甲乙乙乙甲甲甲乙乙甲“随机”的数字表法•一段分层区组随机的SPSS代码inputprogram.Loop#i=0to71.Computex=rnd(#i/8+0.5).endcase.Endloop.Endfile.Endinputprogram.execute.computeii=uniform(1).rankvariables=IIbyx.execute.Recoderii(1=1)(2=1)(3=1)(4=1)(5=2)(6=2)(7=2)(8=2)intogroup.Execute.“随机”的计算机程序法“随机”的例数调整法(不推荐)•“均数±标准差”的描述用于符合正态或近似正态分布的资料。前者表示集中趋势,后者表示离散趋势。•可通过均数与标准差的相对大小来大致判断资料是否符合正态分布。二、均数±标准差•错用1:偏态资料,用“均数±标准差”表示•正确用法:偏态资料的描述用中位数(四分位间距)二、均数±标准差•错用2:对数正态分布资料用“均数±标准差”表示•正确用法:对数正态资料用“几何均数±标准差”二、均数±标准差如何在WORD中写出x•1、输入英文小写字母x,并将其改为斜体x如何在WORD中写出x•2、选中x后,单击菜单栏中的【格式】→【中文版式】→【拼音指南】如何在WORD中写出x•3、在【拼音指南】对话框的【基准文字】项可以看到x,在【拼音文字】项下第一行输入“_”。如何在WORD中写出x判断是否符合正态分布的方法行业共识均数与标准差的大小关系正态性检验:正态性的判断不需要特别严格。正态或近似正态,不要矫枉过正•独立样本t检验用于两组正态或近似正态分布资料的组间比较。三、独立样本t检验•错用1:用于多组资料比较•正确用法:多组正态分布资料的组间比较及两两比较用方差分析三、独立样本t检验•错用2:用于非正态资料•正确用法:非正态资料的组间比较采用非参数检验三、独立样本t检验t检验与方差分析•两组时也可以用方差分析,结果与t检验等价。•F=t2•两独立样本t检验的计算公式:•即使没有原始资料,也可以复核统计计算是否正确•配对t检验适用于正态分布资料的组内成对比较(如治疗前后)四、配对t检验•错用:用于组内多点资料•正确用法:组内多点资料应采用重复测量方差分析四、配对t检验•卡方检验是两个或多个率(或构成比)进行组间比较的方法,适用于双向无序资料的比较。其基本原理是用卡方值的大小来衡量实际频数和理论频数之间的吻合程度,进而做出统计学推断。五、卡方检验五、卡方检验•错用1:检验结果的错选•正确用法:卡方检验有使用的前提条件,不符合前提条件需要校正,或者采用精确概率法。•当n≥40,所有理论值≥5时,用pearson卡方检验。•当n≥40,1≤理论值<5时,用校正的卡方检验。•n40或有理论值1,或P≈α时,用确切概率法。•错用2:用于单向有序资料•正确用法:采用秩和检验或者Ridit分析法五、卡方检验组别治愈有效无效死亡不加牛黄组3223185加牛黄组5611101组别治愈未愈不加牛黄组3246加牛黄组5622•错用3:用于双向有序的资料•正确用法:采用等级相关分析或者线性趋势检验。五、卡方检验•线性回归是单个或多个因素与因变量间线性依存关系的统计方法。线性回归要求因变量符合正态分布,自变量则是可以测量的。六、回归分析•logistic回归是研究因变量为二分类或多分类观察结果与影响因素(自变量)之间关系的一种多变量分析方法,属概率型非线性回归。•Logistic回归主要获取OR值。六、回归分析RR(OR)关联强度0.9~1.01.0~1.1无0.7~0.81.2~1.4弱0.4~0.61.5~2.9中0.1~0.33.0~9.9强<0.110~很强•错用1:滥用线性回归或logistic回归•正确用法:根据资料特征,选用相应方法。六、回归分析•连续型因变量(y)---线性回归分析•分类型因变量(y)---Logistic回归分析•时间序列因变量(t)---时间序列分析•生存时间因变量(t,y)---COX回归分析•错用2:logistic回归连续型自变量的解释•正确用法:Logistic回归分析的自变量可以是连续型资料(如年龄的具体值),也可以是分类资料(如1=年龄大于50岁,0=年龄小于等于50岁),计算出来的OR值差别很大,解释的专业意义也是不一样的。六、回归分析如果是连续资料,表示每变化一个单位,风险增加了(1-OR)倍。•量表的信度(reliability)重测信度:两次测量的相关分析内部一致性信度:可靠性分析分半信度:可靠性分析七、信效度检验•量表的效度(validity)内容效度:内部条目的相关分析结构效度:因子分析效标效度:与标准值的比较•错用:对因子分析结果的应用:错将前提条件当成最终结果。•正确方法:因子分析两个关键步骤:1、前提条件检验;2、因子载荷、结构矩阵。在满足前提条件的情况下判断结构矩阵表结果与专业意义之间是否一致。七、信效度检验因子分析的适宜度分析KMO可反映各指标间相关程度,其取值在0~1之间,越接近1,变量间的相关性越强,因子分析的效果越好。通常将KMO统计量的大小按以下分段解释:•KMO≥0.9非常适合做因子分析•0.8≤KMO0.9很适合做因子分析•0.7≤KMO0.8适合做因子分析Bartlett球形性检验从检验整个相关矩阵出发,H0:相关矩阵为单位矩阵。如果不能拒绝该假设,各变量独立,不宜作因子分析:•p≤0.05适合做因子分析p0.05不适合做因子分析结构矩阵•5个维度共44个条目维度1:态度和行为积极性条目:11-15,17,19,21,22,25,26,30,32维度2:情绪控制条目:16,18,20,23,33-36维度3:保持独立和社会功能条目:37-44维度4:保持社会关系条目:1-10维度5:配合医疗服务条目:24,27-29,31因子分析结果与原先量表设计时的维度划分一致,因此认为该量表具有较好的结构效度。结构矩阵结果与专业意义比对•错用:非三线表。正确方法:统计用表规范使用三线表,可以是简单表,也可以是复合表。八、统计表如何在WORD中画三线表初始的表格默认是0.5磅,有竖线的表格。去除竖线及其它不需要线的方法:选择表格工具中的无边框,然后在不需要的线上画一遍。加粗顶线和底线的方法:将线条选择为1.5磅后,用鼠标在顶线和底线上画一遍。•错用1:均数图无标准差。•正确方法:按照数据特征规范使用九、统计图均数标准差•错用2:非正态资料用均值图•正确方法:用箱式图九、统计图•错用:结果报告不完整。•关键要点:基线比较(评价组间均衡)干预前后差值的组间比较校正的分析(必要时)十、统计结果报告十一、样本量•对于已发表的研究结果•P0.05,样本量是足够的•对于待评估的方案•根据主要指标的特征,计量资料要小于分类资料。•根据研究对象,动物实验要小于临床研究。•如果有具体的表述,那就最好了。其他细节•同一种数据小数点位数保持一致•p和统计量(t、F、r等)一般是3位小数•研究设计缺乏对照计量资料:正态:身高、体重、RBC、PLT偏态:病程、输血量分类资料:两分类:男、女;有效、无效无序多分类:职业(工人、农民、商人)、血型(A、B、O、AB)有序多分类:痊愈、显效、有效、无效-、+、++、+++小结小结•统计学描述、统计学检验、统计学关联分析方法的选择最根本的依据是数据的特征(连续型、两分类、多分类无序、多分类有序、正态性等)。•理解并真实地实施研究设计,抓住数据特征规律,才能减少统计学误用。Thankyou!

1 / 49
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功