常用医学统计分析方法

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

常用医学统计学方法胸外四病区叶曼内容提要为什么要学统计学?统计学(statistics)从数据中提取信息的一门学科医学统计学(medicalstatistics)用统计学的原理和方法研究医学中的问题什么是医学统计学?4医学统计工作的内容1.科研设计:包括调查设计、实验设计2.收集资料:取得准确可靠的原始资料3.整理资料:对资料进行清理、改错,数量化4.分析资料:统计描述、统计推断1.采用统计学方法,发现不确定现象背后隐藏的规律。图1-1120名正常成年男子红细胞计数直方图05101520252.63.23.84.45.05.66.2红细胞计数(1012/L)比率%2.用统计学思维方式考虑有关医学研究中的问题“阳性”结果能否说明干预有效?某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效?(时间效应)“阴性”结果是否说明干预无效?样本含量是否足够?(吸烟与肺癌的相关性)干预时间是否足够?(心理护理与心理健康)3.保证你的论文能通过统计学审查中华医学会杂志对来稿都有统计学要求或统计学指导。科学的科研设计正确的统计分析准确的结论推断4.获得循证医学证据的主要手段“以证据为基础的医学”(evidence-basedmedicine,EBM)需要运用最好的统计学证据可靠“证据”:随机对照试验1.了解医学统计学的基本概念2.掌握医学统计数据的分类3.掌握统计学分析方法的选择4.了解SPSS统计学软件的使用10变量及变量值胆管癌患者部分指标编号性别年龄(岁)部位分化程度分期肝转移PCNA指数生存时间(月)(1)(2)(3)(4)(5)(6)(7)(8)(9)1男61上低分化Ⅰ阳性52142女58中高分化Ⅱ阴性89203女63上高分化Ⅳ阴性93194女71下中分化Ⅱ阳性7855男59上高分化Ⅲ阴性8535………………………总体与样本populationandsample总体:根据研究目的确定的同质研究对象的全体(集合)。样本:从总体中随机抽取的部分研究对象随机抽样randomsampling为了保证样本的可靠性和代表性,需要采用随机的方法抽取样本(在总体中每个个体具有相同的机会被抽到)。13随机抽样的方法:抽签法:编号、抽签机械抽样法:又称等间隔抽样,按比例分配分层抽样法:先分层,每层内按比例抽样随机数字:随机数字表、软件产生随机数字14研究目的总体湘雅二医院2011年全体住院患者满意度得分值观测单位每个住院患者观测值每个住院患者满意度得分了解湘雅二医院2011年全体住院患者满意度情况样本从湘雅二医院2011年全体住院患者中随机抽取1000人测得满意度得分样本的实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现f次,则事件A出现的频率为f/n。概率:随机事件发生的可能性大小,用大写的P表示;取值[0,1]。频率与概率frequencyandprobability频率与概率间的关系:1.样本频率总是围绕概率上下波动2.样本含量n越大,波动幅度越小,频率越接近概率。必然事件P=1随机事件0P1不可能事件P=0P≤0.05(5%)或P≤0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。小概率事件CertainImpossible0.501100%某一组成部分的观察单位数构成比同一事物各组成部分的观察单位总数=(100%)甲指标相对比乙指标某时期内发生某现象的观察单位数率比例基数同期可能发生某现象的观察单位总数1.不能以构成比代率放环情况(1)放环人数(2)失败人数(3)失败人数比(%)(4)失败率(%)(5)人工流产后2557861.930.6月经后873931.044.8哺乳期1797.152.9合计359126100.035.1表已婚育龄妇女不同情况下放环失败率的比较年龄组(岁)患者人数患者构成比(%)0~93.810~3615.320~3414.430~3715.740~4519.150~3916.560~218.970~156.3合计236100.0表口腔门诊龋齿患者年龄构成例如某医师对口腔门诊不同年龄龋齿患病情况进行了分析,得出40~49岁组患病率高,0~9岁组和70岁及以上组患病率低的错误结论。如果例数较少会使相对数波动较大。如某种疗法治疗5例病人5例全部治愈,则计算治愈率为5/5×100%=100%,若4例治愈,则治愈率为4/5×100%=80%,由100%至80%波动幅度较大,但实际上只有1例的变化。2.计算相对数分母不宜太小3.正确计算合计率1112221212,pXnpXnXXpnn若则合计率例如用某疗法治疗肝炎,甲医院治疗150人,治愈30人,治愈率为20%;乙医院治疗100人,治愈30人,治愈率为30%。两个医院合计治愈率应该是[(30+30)/(150+100)]×100%=24%。4.注意资料的可比性(1)观察对象是否同质,研究方法是否相同,观察时间是否相等,以及地区、周围环境、风俗习惯和经济条件是否一致或相近等。(2)观察对象内部结构是否相同,若两组资料的年龄、性别等构成不同,可以分别进行同年龄别、同性别的小组率比较或对总率(合计率)进行标准化后再作比较。24问:流脑的预防工作1990年不如1985年吗?死亡人数构成(%)死亡人数构成(%)伤寒-副伤寒3310.961410.61流脑278.972317.42痢疾21069.777153.79白喉268.64139.85百日咳51.66118.33合计301100.00132100.00病名1985年1990年表4某地区5种急性传染病的死亡情况案例25统计资料的类型根据变量值的性质可将资料分为:计量资料、计数资料、等级资料261.计量资料--数值变量资料定义:用定量的方法对观察单位准确测量后所得的资料。特点:有度量衡单位,多为连续性资料。连续数据:例:身高、体重、年龄、体温、血压离散数据:例:心率、白细胞计数、24小时早博次数27定义:用定性的方法得到的资料。将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。特点:没有度量衡单位;多为间断性资料。2.计数资料--分类变量资料28两分类数据(binarydata):例:男/女;怀孕/未怀孕;糖尿病/非糖尿病;吸烟/不吸烟;高血压/血压正常多分类数据(polytomousdata):名义数据(nominal):已婚/单身/离婚/分居/鳏寡;A/B/AB/O有序数据(ordinalcategories):轻/中/重;治愈、好转、无效;29定义:将观察单位按某种属性的不同程度分成等级后分组计数所得的资料,是介于计量资料和计数资料之间的一种资料。特点:其变量值具有半定量性质,表现为等级大小或属性程度。3.等级资料三类数据间的相互转化例:一组2040岁成年人的血压以12kPa为界分为正常(=0)与异常(=1)两组,统计每组例数8低血压18正常血压212轻度高血压315中度高血压417重度高血压5计量数据等级数据计数数据31三类数据间的相互转化不同资料转化举例(每分钟脉搏次数)计量资料计数资料等级资料75缓脉(60)82正常(60~100)125正常脉(60~100)96异常(60或100)56速脉(100)住院号年龄身高体重住院天数职业文化程度分娩方式妊娠结局20256552716571.55无中学顺产足月20256532216074.05无小学助产足月20258302515868.06管理员大学顺产足月20225432316169.05无中学剖宫产足月20224662515962.011商业中学剖宫产足月20245352715768.02无小学顺产早产20258342015866.04无中学助产早产20194642415870.53无中学助产足月20257832915457.07干部中学剖宫产足月观察单位observations个体individuals变量variablesQuantitativedata计量资料Qualitativedata计数资料怎样选择统计学方法?三类数据的统计分析1.计量数据:计算均数、标准差等(可采用t、F检验等)2.计数数据:编码是任意的,不能对编码执行均数标准差等计算,但可计算率或比(可采用卡方检验等)3.等级数据:允许基于顺序的计算,如计算中位数、百分位数(可当做计数数据处理)李炜制作变量关系的显著性检验类型定类定序定距定类卡方类测量(卡方检验)卡方类测量(卡方检验)方差分析(F检验)定序Spearman相关系数(Z检验)Spearman相关系数(Z检验)定距Pearson相关(F检验)回归系数(T检验)等级计数计量计数等级计量表4-1g个处理组的试验结果处理分组测量值统计量1水平X11X12…X1j…1nX1n11XS12水平X21X22…X2j…2nX2n22XS2…………………………g水平Xg1Xg2…Xgj…ggnXnggXSg完全随机设计资料的方差分析的基本思想合计NSXijX完全随机设计统计分析方法选择:1.对于正态分布且方差齐同的资料,常采用单因素方差分析的单向分类的方差分析或成组资料的t检验(g=2);2.对于非正态分布或方差不齐的资料,可进行数据变换或采用Wilcoxon秩和检验。例某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组(具体分组方法见表5),进行双盲试验。6周后测得低密度脂蛋白作为试验结果,见表4-3。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?完全随机设计统计量分组测量值niXX2X3.534.594.342.663.593.132.642.563.503.253.304.043.533.563.854.073.523.934.192.96安慰剂组1.373.932.332.984.003.552.964.34.162.59303.43102.91367.85降血脂新药2.423.364.322.342.682.951.563.111.811.771.982.632.862.932.172.722.652.222.902.972.4g组2.362.562.522.272.983.722.803.574.022.31302.7281.46233.002.862.282.392.282.482.283.212.232.322.682.662.322.613.642.583.652.663.682.653.024.8g组3.482.422.412.663.292.703.042.811.971.68302.7080.94225.540.891.061.081.271.631.891.192.172.281.721.981.742.163.372.971.690.942.112.812.527.2g组1.312.511.881.413.191.922.471.022.103.71301.9758.99132.13表54个处理组低密度脂蛋白测量值(mmol/L)完全随机设计分析步骤H0:1234,即4个试验组的总体均数相等H1:4个试验组的总体均数不全相等0.05按表4-4中的公式计算各离均差平方和SS、自由度、均方MS和F值。H0:即4个试验组总体均数相等H1:4个试验组总体均数不全相等12340.052.计算检验统计量1.建立检验假设,确定检验水准0.053.确定P值,作出推断结论:按水准如果P0.05,则拒绝H0,接受H1,认为4个试验组ldl-c总体均数不相等,即不同剂量药物对血脂中ldl-c降低影响有差别。如果P0.05,则不能拒绝H0,不能认为4个试验组ldl-c总体均数有差别。分组观测值记得一定要是计量资料建立数据库2个或者2个以上组之间某观测值的比较2个组之间某观测值的比较观测值分组两两比较时选择47案例1.不同科室护士实施静脉输液操作所用工时是否差别?2.不同科室患者满意度是否有差别?3.不

1 / 66
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功