医学统计学(MedicalStatistics)第一章绪论2020年8月24日第一节医学统计学的定义利用统计学原理,研究医学领域中数据的收集、整理及分析的一门学科2020年8月24日第二节医学统计学的主要内容一.研究设计二.常用的基本统计方法:1.统计描述2.统计推断3.二项分布的应用4.直线回归等三.临床医学中常用的统计方法四.多因素分析2020年8月24日统计工作的基本步骤1.统计设计:包括调查研究设计、实验设计2.收集资料:取得准确可靠的原始资料3.整理资料:对资料进行清理、改错,数量化4.分析资料:统计描述、统计推断2020年8月24日第三节统计学基本概念1.总体与样本2.随机变量及其分类3.误差4.概率2020年8月24日1.总体与样本populationandsample总体:根据研究目的确定的同质研究对象的全体(集合)。分有限总体与无限总体样本:从总体中随机抽取的部分观察单位2020年8月24日随机抽样randomsampling为了保证样本的可靠性和代表性,需要采用随机的抽样方法(在总体中每个个体具有相同的机会被抽到)。2020年8月24日2.随机变量(randomvariable)简称变量(variable),统计上习惯用大写拉丁字母表示,如X、Y、Z、…。编号(ID)性别(X)体重(kg)(Y)疗效(Z)张11660李21781王30572…………2020年8月24日(1).计量资料用仪器、工具等测量方法获得的数据,即为计量资料也叫定量数据特点:有计量单位,如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(1012/L)2020年8月24日(2)分类资料也称为定性资料,有两种情况:A.无序分类:二项分类及多项分类B.有序分类:等级资料2020年8月24日三类资料间关系例:一组2040岁成年人的血压以12kPa为界分为正常与异常两组,统计每组例数8低血压8正常血压12轻度高血压15中度高血压17重度高血压计量资料等级资料分类资料2020年8月24日3.误差error误差:实际观察值与客观真实值之差(1)系统误差(2)随机误差2020年8月24日(1)系统误差systematicerror在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。流行病学称之为偏倚(bias)。特点:观察值有系统性、方向性、周期性的偏离真值。可以通过严格的实验设计和技术措施消除。2020年8月24日无应答偏倚调查吸烟在男女人群中的比例;人群调查表返回:–男性回答率90%以上;女性回答率50%,且多数为女性吸烟者未回答。–结果:低估女性吸烟率。2020年8月24日志愿者偏倚体锻与冠心病队列研究:研究组为志愿者,对照组为非志愿者结论:体锻减少冠心病发生–偏倚:志愿参加研究者更关心自己的健康:注意饮食及营养,禁烟酒、坚持体锻。2020年8月24日健康工人偏倚化学物质接触与白血病发生的队列研究;研究组:接触苯的工人,对照组:普通工人;结果:两组发生白血病比例相似;结论:接触苯与白血病发生无关2020年8月24日非同期对照偏倚研究监护室建立在心梗中作用;研究组:2019-2000年监护室建立后死亡率15%,对照组:2019-2019年监护室建立前死亡率25%;结果:建立监护室减少心梗死亡率。2020年8月24日(2)随机误差randomerror排除上述误差后尚存的误差,受多种无法控制的因素的影响。特点:大小方向不一的随机变化。随机测量误差(randommeasurementerror)——提高操作者熟练程度可以减少这种误差随机抽样误差(randomsamplingerror):由抽样造成的样本统计量和总体参数间的差异。——不可避免,但有一定的分布规律,可估计。2020年8月24日4.概率probability概率:随机事件发生的可能性大小,用大写的P表示;取值[0,1]。2020年8月24日必然事件P=1不可能事件P=0随机事件0P1P≤0.05(5%)或P≤0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。小概率事件2020年8月24日统计学发展及有关问题20世纪20年代,英国统计学家R.A.Fisher爵士(1890-1962)创立了实验设计方法和统计分析技术,奠定现代生物统计的基础。1948年,英国发表了评价链霉素治疗肺结核疗效的随机对照的临床试验报告,第一次采用生物统计方法进行临床干预试验。2020年8月24日1.实例遗传学家F.Galton爵士(1822-1911)对上千家庭父亲身高和儿子身高的观察发现遗传的“回归”现象1960年英国医生Doll,Hill等发现吸烟与肺癌有关2020年8月24日2.医学论文中的统计学问题60年代到80年代,国外医学杂志调查结果:有统计错误的论文20%~72%。2019年对4586篇论文统计(中华医学会系列杂志占6.9%),数据分析方法误用达55.7%。2020年8月24日3.伪造统计数据违反科学道德1976年NewScience杂志关于科研舞弊行为的调查(1)74%的调查表反映有不正当修改数据的情况(2)17%拼凑实验结果(3)7%凭空捏造数据(4)2%故意曲解结果2020年8月24日THEEND