医学统计学(医学检验检验总复习)1.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

总复习医学统计学是统计学的一门分支学科,它应用概率论和数理统计的原理和方法,研究医学领域数据资料的收集,整理分析和推断。它是进行医学科学研究所必需的主要手段。医学统计学的主要内容有:﹡统计描述﹡参数估计﹡假设检验﹡医学科研设计统计学基本步骤设计资料搜集整理分析调查设计实验设计资料来源质量控制审核合理分组统计描述统计推断统计工作的步骤——设计医学科研设计调查设计临床实验设计——搜集资料统计报表统计资料医疗卫生工作记录(经常性工作记录)专题调查或实验(一时性工作记录)——整理资料分组汇总资料核对检查原始数据整理资料统计描述统计指标、统计图、表统计分析参数估计统计推断假设检验——分析资料——计量资料观察单位某项指标测定值的集合。亦称变量值,是定量的指标,一般有单位。统计资料的类型——计数资料按性质和类别进行分组所得的资料。其变量值是定性的,可分二项分类和多项分类。——等级资料按某项指标的不同程度进行分组的资料。各组之间有量的差别亦为半定量的资料。根据分析的需要各类资料可以互相转化。三类数据间的关系例:一组2040岁成年人的血压以12kPa为界分为正常与异常两组,统计每组例数8低血压8正常血压12轻度高血压15中度高血压17重度高血压定量数据等级数据定性数据一、变量与变异变量:被观察单位的特征(即观察指标)。观察指标的测定结果则称变量值。变异:同质个体间测定结果的差异。医学统计学的几个基本概念二、总体和样本总体(population):根据研究目的而确定的同质的观察单位某项指标测定值的集合。有限总体无限总体总体样本(sample):从总体中随机抽取部分观察单位组成为使样本对总体具有代表性要求:﹡抽样必须遵循随机的原则﹡保证足够的样本含量三、抽样从总体中抽样必须遵循科学原则样本应具有:代表性、随机性、可靠性、可比性常用随机抽样方法:机械抽样、分层抽样、随机数字表完全随机设计:(两组或多组比较)配对设计:(同源或异源两两配对)随机区组设计:(两个以上受试对象组成一个配伍组)四、设计类型五、误差(error)系统误差、随机测量误差、抽样误差(smaplingerror):指样本统计量与总体参数之差,由抽样所造成,是不可避免的,但可以控制。抽样误差产生的原因:1、个体之间存在变异;2、样本是总体中的一部分。•是描述随机事件发生可能性大小的数值,用P表示。0≤P≤1﹡必然事件的概率为1(100%)﹡不可能发生事件的概率为0﹡随机事件的概率在0~1之间六、概率(probability)总体参数:,,统计学基本概念样本统计量:psx,,同质变异误差变量测量•P(A|B)=P(AandB)P(B)频率概率一、计量资料的统计描述——编制频数表——频数分布的特征﹡集中趋势变量值集中分布的位置﹡离散趋势变量值围绕集中位置的分布情况——频数分布的类型﹡对称分布某地区130名正常成年男子红细胞数(1012/L)的频数分布红细胞数划记频数(1)(2)(3)3.70~||23.90~||||44.10~正||||94.30~正正正|164.50~正正正正||224.70~正正正正正254.90~正正正正|215.10~正正正||175.30~正||||95.50~||||45.70~5.90|1合计——130﹡偏态分布正偏态分布238名正常人发汞值(μg/g)的中位数和百分位数的频数表计算发汞值频数累计频数累计频率(%)(1)(2)(3)(4)=(3)/2380.3~20208.40.7~668636.11.1~6014661.31.5~4819481.51.9~1821289.12.3~1622895.82.7~623498.33.1~123598.73.5~023598.73.9~4.33238100.0负偏态分布某地某年恶性肿瘤死亡率的年龄分布年龄组恶性肿瘤死亡率(1/10万)0~0.510~1220~1530~7640~18950~23460~38670~286二、集中趋势(Centraltendency)的描述平均数(average)常用于描述一组变量值的集中趋势,是反映同质资料的平均水平或集中位置的特征值。均数()常用平均数几何均数(G)中位数(M)X常用平均数:——均数(算术均数)(mean)﹡表示符号总体均数(μ)样本均数(χ)﹡应用对称分布资料,尤其是正态分布资料﹡计算方法χ1+χ2+……+χn∑χ直接法χ==nnf1χ1+f2χ2+……+fkχk∑fχ加权法χ==f1+f2+……+fkn常用平均数:——几何均数(geometricmean)﹡表示符号(G)﹡应用变量值呈倍数关系,对数正态分布资料﹡计算方法直接法G=n√x1·x2…xnlgx1+lgx2+…+lgxn∑lgx加权法G=lg–1=lg–1nnf1lgx1+f2lgx2+…+fklgxk∑flgxG=lg–1=lg–1nn常用平均数——中位数(median)﹡表示符号(M)偏态分布资料﹡应用变量值分布一端或两端无确定数值分布不明资料﹡计算方法直接用变量值计算M=Xn+1(n为奇数时)21或M=Xn+Xn+1(n为偶数时)222in用频数表计算M=L+(—∑fL)fx2附:百分位数(Percentile,Px)描述变量值序列在某百分位位置的水平,多个百分位数结合可更全面地描述变量值的分布特征。iPx=L+(n·x%—∑fL)fx三、离散趋势(fendencyofdispersion)描述变量值的离散趋势用变异指标全距(R)常用变异指标标准差(S)变异系数(CV)四分位数间距(Q)常用变异指标——全距(range,简记为R)﹡反映变量值的变异范围﹡R=最大值—最小值﹡各种类型资料都可应用,但只作参考资料常用变异指标——四分位数间距(quartile,简记为Q)﹡四分位数间距为特定的百分位数,可看作为中间1/2变量值的全距Q=Qu—QLQu=P75(上四分位数)QL=P25(下四分位数)﹡用途:用于表示偏态分布资料的变异程度,常与中位数配合使用常用变异指标——方差(variance)和标准差(standarddeviation)﹡定义公式∑(χ—μ)2∑(χ—μ)2σ2=σ=N√N∑(χ—χ)2∑(χ—χ)2S2=S=n—1√n—1﹡应用公式∑χ2—(∑χ)2/n直接法S=√n—1∑fχ2—(∑fχ)2/n加权法S=√n—1——方差和标准差﹡用途1.表示变量值的离散程度,用于两组变量值比较时,要求其性质相同,均数相差不大2.与均数结合,表示均数的代表性(χ±s)常用变异指标——变异系数(coefficientofvariation,简记为CV)﹡定义:CV=s/χ×100%﹡用途:比较两组或多组单位不同或均数相差较大资料的变异程度描述性统计小结:计量资料集中趋势离散趋势算术均值几何均值中位数全距,百分位数四分位数间距方差,标准差变异系数正态分布及其应用——正态分布的概念和特征﹡正态分布是以均数为中心呈对称的钟型分布﹡正态分布的特征有:1)正态分布曲线在均数处最高2)正态分布以均数为中心,左右对称且逐渐减少3)正态分布曲线的两个参数μ和σ,记作N(μ,σ)4)正态曲线下的面积为1(或100%)正态曲线下的面积分布规律:μ±1σ占正态曲线下面积的68.27%μ±1.96σ占正态曲线下面积的95.00%μ±2.58σ占正态曲线下面积的99.00%若样本含量较大(n100),则上式μ可用χ代替,σ用s代替。则上式可写为:χ±1S占正态曲线下面积的68.27%χ±1.96S占正态曲线下面积的95.00%χ±2.58S占正态曲线下面积的99.00%正态分布、标准正态分布•曲线的高度(概率密度)•面积(概率密度函数积分)•正态分布的特点:•曲线下面积规律:正态分布N(,2)标准正态分布N(0,1)xu——标准正态分布﹡标准正态分布为服从均数为0,标准差为1,即N(0,1)的正态分布其转换公式为:u=χ--μ/σ﹡标准正态曲线的面积分布规律:-1u+1占总面积的68.27%-1.96u+1.96占总面积的95.00%-2.58u+2.58占总面积的99.00%——正态分布的应用与临床参考值的确定﹡正态曲线面积分布规律可用于估计医学临床参考值与质量控制﹡临床参考值的确定方法1)正态分布法:用于正态分布的资料双侧参考值χ±uαS单侧参考值χ-uαS或χ+uαS2)百分位数法:用于偏态分布资料双侧参考值(α=0.05)P2.5~P97.5单侧参考值(α=0.05)P5或P95医学参考值估计:基本步骤抽样样本含量“正常人”测量/控制误差分组确定?单or双侧?分布类型百分界限估计方法正态分布法对数正态分布法百分位数法﹡用样本信息推断总体特征,称统计推断(statisticalinference)﹡统计推断包括总体均数估计和假设检验﹡样本的统计指标和总体指标是有差别的四、计量资料的统计推断——均数的抽样误差和标准误﹡概念:由于抽样造成的样本均数与总体均数之差别(χ-μ)抽样误差是不可避免的,但可以控制。﹡表示方法:标准误(standarderror)标准误为样本均数的标准差,是说明样本均数抽样误差的大小的指标。﹡计算公式σσχ=σχ:总体标准误√nSSχ=Sχ:样本标准误,√n为σχ的估计值——t分布﹡概念从正态总体N(μ,σ)中进行无数次样本含量为n的随机抽样,每次均可得到一个χ和一个s,通过式转换,可得无数个t值,t值的分布即为含量为n的t值的总体或称t分布。nsxt——t分布﹡特征以0为中心,左右对称t分布曲线的形状与自由度有关t分布曲线下面积为1t分布曲线下面积分布可由t值表中查出:双侧P(t≤-tα·υ)+P(t≥tα·υ)=α单侧P(t≤-tα·υ)=α或P(t≥tα·υ)=α——总体均数的估计﹡点估计(pointestimation)用样本均数估计总体均数﹡区间估计(intervalestimation)按一定的概率(可信度,1-α)估计总体均数所在范围,亦称总体均数的可信区间区间估计的方法:1)当σ未知时xStx2)当σ已知或未知但n足够大时xSx96.1——假设检验(hypothesistesting)﹡假设检验的基本思想先对总体的参数或分布作出某种假设,再用适当的方法根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。——假设检验(hypothesistesting)两组比较资料呈正态分布方差齐性t检验是否非参数统计样本与总体比较配对资料比较资料呈正态分布否是两样本t检验统计分分析目的可采用的指标统计和方法析类型统计了解变量值的平均水平或集中趋势均数几何均数中位数描述了解变量值的变异情况或离散趋势极差标准差方差变异系数了解客观事物或现象间相互关系的密切程度与方向相关分析了解某一变量随其他变量的变化而变化的数量关系回归分析统计估计总体均数的大小点估计区间估计推断样本均数与总体均数的比较t检验u检验两个样本均数的比较t检验u检验(秩和检验,t’检验)配对样本均数的比较配对t检验(秩和检验)计量资料常用的统计分析方法一、计数资料的统计描述——相对数率、构成比、相对比(率的标准化)二、计数资料的统计推断总体率的估计假设检验分类变量资料统计分析小结统计描述统计推断总体率的估计各类卡方检验有序分类秩和检验率、构成比、相对比(率的标准化)无序分类统计分分析目的可采用的统计析类型指标和方法统计反映某种随机事件发生的频率程度率描述反映某个指标上另一个指标的多少倍相对比反映某一事件内部各组成部分的比重构成比由样本率推断总体率点估计区间估计统计推断两个样本率或构成比的比较四格表X2检验(精确概率法)配对样本比较配对X2检验多个样本率或构成比的比较行×列表X2检验计数资料常用的统计分析方法非参数检验方法:适用于以下资料:1)分布为偏态或分布形式未知的定量资料(数值变量),尤其在n<30的情况下;2)等级资料(有序分类变量);3)个别数据偏大或数据的某一端无确定的数值。如“<0.01mg”、“150mg”等,只有一个下限或上限而没有具

1 / 64
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功