医学统计基本方法.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第一节医学统计学方法概述MedicalStatistics第三章医学统计基本方法一、漫谈”统计”日常生活中,我们常听到很多关于“统计”的词汇.例如:国家统计局公布,2004年全国GDP增长9%;国家气象局预报,明天北京天气阴,降水概率40%;报刊统计信息文摘2003年,北京市人平寿命77.93岁,婴儿死亡率为5.56‰,儿童计划免疫接种率98%.这些主要健康指标已接近或超过中等发达国家的水平.北京日报.京报网,2003年11月20日统计学的概念什么是统计学?statisticsstate指政府,官方所要求的信息。统计学是一门处理数据中变异性的科学和艺术。---JohnM.Last《ADictionaryofEpidemiology》统计学的应用领域统计学经济学管理学医学工程学社会学…医学统计学概念用统计学原理和方法研究医学问题.应用概率论和数理统计的基本原理和方法,结合医学实际,研究资料和信息的搜集、整理与分析的一门学科。(从看起来错综复杂的偶然性中揭露潜在的必然性)怎样学习医学统计学1.重在理解基本的统计原理,各种统计方法的基本概念,掌握适用范围和注意事项;学习过程中必须注意联系实际、结合专业;2.对于书中所引用的统计公式,只要求了解其意义及使用方法,不必深究其数理推导。充分利用计算工具,始终把注意力放在统计公式的理解,正确选择及结果分析上。二、医学统计学中的几个基本概念(一)同质-变异同质homogeneity指事物的性质、影响条件或背景相同或非常相近。(条件相同,性质相似的个体)变异variation在同质的条件下,就同一观察条件说,各观察单位表现出来的数量间存在着差异,这种客观存在的差异性为变异。通常来源于一些未加控制或无法控制的甚至不明原因的因素。例1:儿童身体发育:同性别、同年龄身高不同例2:同种属、同性别、同年龄、同窝小白鼠喂以同样的饲料,增重量不同(同质)(变异)(变异)(同质个体)(二)总体(population)与样本(sample)总体:是根据研究目的确定的同质的研究对象的全体。是性质相同的所有观察单位某种变量值的集合。例如:某地1990年正常成年人的血压值有限总体finitepopulation明确了时间、空间范围内有限个观察单位的总体。无限总体infinitepopulation总体是抽象的、设想的,无时间和空间范围的限制。被观察的个体数在理论上存在。例如:研究用某药治疗缺铁性贫血的疗效总体中个体数目有限总体中个体数目无限多样本sample是指从总体中随机抽取的有代表性的部分个体所组成的集合。特点:代表性随机性可靠性可比性(三)参数与统计量parameterandstatistic参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数总体样本抽取部分观察单位统计量参数推断inference统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为。参数附近波动的随机变量。SX、(四)随机抽样-抽样误差随机抽样randomsampling为了保证样本的可靠性和代表性,需要采用随机化的抽样方法(在总体中每个个体具有相同的机会被抽到)。抽样误差例:1982年某市全体7岁男童(总体)的平均身高为122cm(总体均数).随机抽取一个(份)样本,含110名(样本含量),平均身高为119.95cm;再随机抽取一个(份)样本,含110名,平均身高122.80cm;抽样误差:样本均数≠总体均数一(份)样本的均数≠另一(份)样本的均数由于随机抽样所造成的样本统计量与总体参数的差异,或者各样本统计量之间的差异,称抽样误差。(五)频率-概率频率frequency在相同的条件下,独立重复n次试验,随机事件A出现f次,则称f/n为随机事件A出现的频率。频率的大小反映了事件A发生的频繁程度,频率大,则事件A发生就频繁,这意味着A在一次试验中发生的可能性就大。概率随机事件发生的可能性大小,用大写的P表示;取值[0,1]。15黑球85白球上述摸球模型,一次摸出黑球的可能性=15%必然事件P=1随机事件0P1不可能事件P=0P≤0.05(5%)或P≤0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。小概率事件CertainImpossible0.501(六)误差观测值(observedvalue)与真实值之差,以及样本指标与总体指标之差。误差抽样误差随机测量误差系统误差1.系统误差:由于人为因素造成。在收集资料的过程中,由于仪器设备、标准试剂、判定标准等不准确,使测定结果呈倾向性的偏大或偏小,这种误差称为系统误差。应尽可能避免。(受确定因素影响,大小变化有方向性。)2.随机测量误差由于对同一受试对象采用同一方法重复测定时所出现的误差。(随机误差变动倾向具有不确定性,原因不明了,一般是不可避免的。)计量资料计数资料等级资料三、医学统计资料的类型资料类型不同,统计方法不同(一)计量资料measurementdata对每个观察单位的某项指标用定量的方法,通过测量得到的数值,一般有度量衡单位。如:身高(cm)、体重(kg)、血压(Kpa)等值2.354.213.325.354.174.132.784.263.584.344.844.414.783.953.923.583.664.283.263.502.704.614.752.913.914.594.192.684.524.913.183.684.833.873.953.914.154.554.803.414.123.955.084.533.923.585.353.843.603.514.063.073.554.233.574.833.523.844.503.964.503.274.523.194.593.753.984.134.263.633.875.713.304.734.175.133.784.573.803.933.783.994.484.284.065.265.253.985.033.513.863.023.704.333.293.254.154.364.953.003.26某单位1999年110名正常成年女性职工血清总胆固醇测量结果(mmol/l)(二)计数资料enumerationdata将观察单位按某种属性或类别分组,然后清点所得各组的观察单位数。没有度量衡单位,通过枚举或记数得来。多项分类:人群血型分布:A、B、O、AB二分类:蛔虫卵粪检:+、-住院号年龄身高体重住院天数职业文化程度分娩方式妊娠结局20256552716571.55无中学顺产足月20256532216074.05无小学助产足月20258302515868.06管理员大学顺产足月20225432316169.05无中学剖宫产足月20224662515962.011商业中学剖宫产足月20245352715768.02无小学顺产早产20258342015866.04无中学助产早产20194642415870.53无中学助产足月20257832915457.07干部中学剖宫产足月观察单位observations个体individualsUnits;elements变量variablesQuantitativedata计量资料Qualitativedata计数资料(三)等级资料rankeddata将观察单位按某种属性的不同程度分组,所得各组的观察单位数。某疾病治疗结果疗效人数治愈49好转41无效32死亡10例:一组2040岁成年人的血压8低血压8正常血压12轻度高血压15中度高血压17重度高血压等级资料计量资料计数资料以12kPa为界分为正常与异常两组,统计每组例数三种资料之间的关系四、统计学工作的基本步骤统计设计收集资料整理资料分析资料调查设计实验设计资料来源质量控制审核合理分组统计描述统计推断……第三章医学统计基本方法第二节数值变量资料的统计描述与推断一、列表描述法——频数分布表(frequencytable)140名成年男子红细胞数3.825.95频数表的编制步骤(1)求全距(range,R):即最大值与最小值之差;本例极差:R=5.95-3.82=2.13(2)决定组数和组距:组数通常取10-15个组,组距为全距的十分之一,再略加调整;本例i=R/10=2.13/10=0.213≈0.20(3)列出组段:第一组段必须包括最小值,最后一个组段必须包含最大值;(4)划记计数频数表的用途1.作为陈述资料的形式2.揭示计量资料的分布类型:正态分布、偏态分布3.描述计量资料分布的集中趋势和离散趋势4.便于发现某些特大或特小的可疑值图示描述法----频数分布图Graphoffrequencydistribution频数分布图-直方图对称分布图2-259名链球菌咽喉炎患者的潜伏期(h)0246810121416181224364860728496108120潜伏期(h)病例数图2-3101名正常人的血清肌红蛋白含量051015202505101520253035404550肌红蛋白含量(ug/mL)人数正偏态(右偏态)峰向左偏移,向右侧拖尾负偏态(左偏态)峰向右偏移,向左侧拖尾二、集中趋势的描述——平均水平的度量1.算术均数(arithmeticmean,M)适用于正态分布和近似正态分布的资料。总体均数用µ表示;样本均数用表示。x直接计算法将所有观察值直接相加再除以观察值的个数。Lx/1077.414076.402.561.526.576.412加权法(观察值个数较多时)根据频数表计算均数的一种方法.把各组的组中值视为各组观察值的代表值,分别乘以各组的频数得到各组观察值之和,然后将它们相加得到观察值的总和再除以总例数。LX/1078.414090.5170.5230.41110.4690.32122.几何均数(geometricmean,G)适用于偏态分布的变量值经对数转换后呈对称分布的资料,观察值间按倍数关系变化的资料,观察值间不能有0或负数。如抗体滴度、血清凝集效价、某些物质的浓度等。用G来表示。几何均数:变量对数值的算术均数的反对数。直接计算法例2.2测得5个人的血清滴度的倒数分别是2,4,8,8,32,求平均滴度.7532lg8lg8lg4lg2lglg1G则:5份血清滴度的平均水平是1:7频数表资料的几何均数inniiifXfXfXffXfGlglglglglglg221111抗体滴度⑴人数,f⑵滴度倒数,X⑶lgX⑷f·lgX⑸1:2.51:101:401:1601:640合计141822126722.510.040.0160.0640.00.39791.00001.60212.20412.80625.570618.000035.246226.449216.8372102.10323.中位数(median,M)将一组观察值从小到大按顺序排列,居于中心位置的数值。在全部观察值中有半数的值比M大,另有半数的值比M小。适用于当大部分观测值比较集中,少数观测值偏向一侧时;或资料分布情况不清楚时;或数据的最大值(最小值)无准确测量数据时。如传染病的潜伏期。任何分布的定量数据均可用中位数描述其分布的集中趋势,尤其是偏态分布和一端或两端无确切数值的资料。当样本量为奇数时当样本量为偶数时例:0.842.855.468.589.60中位数是M=X3=5.46例:0.842.858.589.60中位数是M=1/2(X2+X3)=1/2(2.85+8.58)=5.72频数表法公式:50505050()2LinMPLff4.百分位数(Percentile,Px)将一组数据按照从小到大的顺序排列并等分为100等分,位于第x分位的数叫做第x百分位数,记做Px在一组数据中,全部观测值的x%小于Px,而1-大于Px.x%(%)XXXLXiPLnXffXL:第X百分位数所在组段下限

1 / 193
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功