医学统计学重点

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

医学统计学11.变异:同质事物之间的差别。2.频数分布的两个特征:集中位置,离散趋势3.数据分布的类型:对称分布和非对称分布。非对称分布又称偏态分布,包括正偏态和负偏态。单峰分布,双峰分布,多峰分布。4.统计描述:用统计表、统计图和统计指标等方法对资料的数量特征与分布规律进行描述。5.集中位置的描述,集中位置指标又称平均数指标。有哪些及适用条件?(1)算数平均数:最适用于单峰对称分布资料的平均水平的描述,特别是正态分布资料(2)几何平均数:适用于①等比资料②对数正态分布资料(3)中位数和百分位数:适用于①偏态分布的资料②开口资料③资料分布不明等6.离散趋势的描述(1)全距亦称极差,适用于单峰小样本资料(2)四分位数间距,适用于单峰小样本资料(3)方差和标准差,适用于对称分布尤其是正态分布资料(4)变异系数,常用于①比较度量衡单位不同的两组或多种资料的变异度②比较均数相差悬殊的两组或多组资料的变异度7.常用相对数(1)率,是二分类指标(2)构成比(3)比8.正确应用相对数应注意几个问题:(1)计算相对数的分母不宜过小(2)分析时不能以构成比代替率(3)对观察单位数不等的几个率,不能直接相加求其总率(4)计算率时要注意资料的同质性,对比分析时应注意资料的可比性(5)也有抽样误差,需要假设检验。9.率的标准法(1)基本思想:采用统一的标准,以消除病情构成不同对治愈率比较的影响,使算得的标准化治愈率有可比性。(2)目的:控制混杂因素对研究结果的影响。10.正态分布(1)概念P16(2)标准正态分布,u变换:u=X,u是标准正态离差,μ是均数,σ是标准差。医学统计学2u~N(0,1)(3)正态分布的特征:①是单峰分布,高峰位置在均数X=μ处。②以均数为中心,左右完全对称。③取决于两个参数,均数μ和标准差σ。μ为位置参数,μ越大,则曲线沿横轴向右移动;μ越小,则曲线沿横轴向左移动。σ为形态参数,表示数据的离散程度,若σ小,则曲线形态“瘦高”;σ大,则曲线形态“矮胖”。④有些指标不服从正态分布,但通过适当的变换后服从正态分布,如对数正态分布。⑤正态分布曲线下的面积是有规律的:总面积恒定为1,对称区域面积相等,对应区域面积相等。(4)几个u界值:①90%:双侧u1.0=单侧u0.05=1.64②95%:双侧u05.0=单侧u025.0=1.96③99%:双侧u01.0=单侧u0.005=2.5811.二项分布(1)样本率的标准差p的估计值sp计算公式:sp=npp)1(,p是样本率(2)样本个数n和概率π如何影响二项分布的图形?给定n后,形状取决于π。当π=0.5时,分布对称;当π0.5时分布呈正偏态;当π0.5时分布呈负偏态。随n的增大,分布逐渐逼近正态分布。如果nπ或n(1-π)大于5时,则可用正态近似原理处理二项分布的相关问题。(3)应用条件:对立性,重复性,独立性。12.Poisson分布(1)概念,描述罕见事件发生次数的概率分布,是特殊的二项分布。(2)均数与方差相等,均为λ。(3)形状取决于λ的大小,为正偏态分布,λ越小分布越偏;随着λ的增大,分布逐渐趋于对称,当λ=20时,已基本接近对称分布;当λ≥50时,可按正态分布原理处理Poisson分布的有关问题。(4)Poisson分布具有可加性。(5)应用条件:对立性,重复性,独立性。即事件的发生是相互独立的,且发生的概率不变,医学统计学3结果是二分类的(发生或不发生)13.参考值范围(1)概念:绝大多数正常人某指标的波动范围。(2)正态分布法计算100(1—α)%正常值范围:双侧XuS单侧X—uS(高侧)X+uS(低侧)注意α取值:双侧95%X1.96S单侧95%高侧X—1.64S低侧X+1.64S(3)百分位数法:知道求得第几个百分位数P2614.抽样误差(1)概念:由于个体变异的存在,由抽样引起的样本统计量与总体参数间的差异。(2)产生的两个必备条件:①抽样研究②个体变异,是根本原因(3)中心极限定理的涵义①从均数为μ、标准差为σ的正态总体中独立、重复、随机抽取含量为n的样本,样本均数的分布仍为正态分布,其均数为μ,标准差为x。X~N(μ,x)→X~N(μ,2x)②即使从非正态总体(均数为μ、标准差为σ)中独立、重复、随机抽取含量为n的样本,只要样本含量足够大(如n≥50),样本均数也近似服从均数为μ,标准差为x的正态分布。(4)标准误意义:1.用来衡量抽样误差的大小2.x=n标准误与个体变异σ成正比,与样本含量n的平方根成反比(5)标准误的估计值的计算公式:样本标准差s代替总体标准差σ,sx=ns(6)标准差与标准误的关系医学统计学4区别标准差s标准误sx意义个体变异统计量的抽样误差用途正常值范围(x1.96s)总体均数的可信区间(x1.96sx)与n关系n,s趋于稳定n,sx趋于联系:①两者都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准误;②当样本量不足时,标准差大,标准误也大,均数的标准差与标准误成正比。sx=ns15.医学统计学:运用概率论和数理统计等数学的原理和方法,研究医学领域中资料的搜集、整理、分析和推断的一门学科。16.三类资料:①定量资料(数值资料)②定性资料(无序分类资料)③等级资料(有序分类资料)17.总体:按研究目的所确定的研究对象中,所有观察单位某项指标取值的集合。18.样本:从研究总体中,随机抽取具有代表性的部分观察单位某项指标取值的集合。19.同质性:具有相同性质的事物。20.参数:描述某总体特征的指标。21.统计量:描述某样本特征的指标。22.概率:随机事件发生可能性大小的一个度量,取值范围为0≤P≤123.小概率事件:发生概率≤0.05的事件。24.小概率原理:小概率事件发生的可能性很小,进而认为其在一次抽样中不可能发生。25.理解和解释可信区间26.统计推断:根据样本所提供的信息,以一定的概率推断总体的性质。包括两方面的内容:参数估计和检验假设。27.可信区间的两个要素:可靠性,精确性28.均数的可信区间:从正态分布总体N(μ,2)中随机抽取一个样本,则t=sx-X---服从自由度ν=n-1的t分布。总体均数的(1-α)可信区间定义为(X—t,sx,X+t,sx)。如n100,可用标准正态分布代替t分布,相应的100(1-α)%可信区间为(X—u医学统计学5sx,X+usx)。29.率的可信区间:(1)率的标准差又称率的标准误,为sp=npp)1((2)总体率π的区间估计用正态近似法的条件:样本含量n足够大,且样本率p和(1-p)都不太小时,如np和n(1-p)均大于5时,π的可信区间为(p—usp,p+usp)。30.事件数的可信区间:当X≤50也可以查附表7“Poisson分布λ的可信区间”,得到λ的95%或99%可信区间。31.假设检验(1)基本思想:(2)4个基本步骤:①建立检验假设:0H:1=2=3=……1H:1、2、3……之间不等或不全相等。②确定检验水准(拒绝0H时的最大允许误差α)③计算检验统计量并求P值④界定P值并作结论(要回下结论):P≤α,拒绝0H,接受1H;Pα,不拒绝0H。(3)Ⅰ型错误:0H真实时被拒绝。P0.05却拒绝H0接受H1(4)Ⅱ型错误:0H不真实时不拒绝。H1真实即P0.05却不拒绝H0(5)检验功效:Ⅱ型错误率β表示失去对真实的1H作出肯定结论之概率,故1-β就是对真实的1H作出肯定结论之概率,常被用来表达某假设检验方法的检验功效,即假设检验对真实的1H作出肯定结论之把握程度。(6)Ⅰ型错误与Ⅱ型错误的关系P51(7)单侧检验与双侧检验的关系(8)假设检验与可信区间的关系32.怎么做题?医学统计学6判断资料类型→设计方法→计算自由度→确定P值→下结论33.区分配对和成组配对:同质性差,要算差值①自身配对②一般有编号成组:①无原始数据(还有均数)②两组样本含量不等,不能配对③无编号34.t检验(1)应用条件:独立性,正态性,方差齐性(2)两样本均数比较方差不齐时t’检验(3)两样本几何均数比较:取对数,t检验,不用反对数35.方差分析,多个均数比较(1)总变异SS总:=SS组间+SS组内处理因素、个体差异、随机因素,共同导致的差异。(2)组间变异SS组间:多个组的处理因素不同和随机误差,导致的差异。(3)组内变异SS组内:组内个体差异和其他随机因素,导致的差异。(4)三种变异的关系:SS总=SS组间+SS组内,总=组间+组内FMS组间/MS组内(5)单因素方差分析表和两因素方差分析表36.多个样本均数的两两比较,对比的组数k大于2,分别t检验则需经过m=k(k-1)/2次比较,若每次比较的第一类错误率为α,则多次比较后,至少犯一次第一类错误的概率为1m-1)(,比预先设计的α要大。37.变量转换目的38.F值、t值、q值、q’值之间的关系(1)两样本均数比较时,F=t。用q检验或q'检验也得到同样的结论。说明在两样本均数比较时,t检验、F检验、q检验和q'检验是等价的。(2)当组数k2时,q'检验的检验功效高于q检验,所以当实验研究设计为一个对照组与多个实验组均数比较时,q'检验科得到较高的功效。定性资料的分析39.假设检验步骤P7340.2检验医学统计学7(1)基本思想:(2)应用条件:①n≥40,T≥5,用2检验②n≥40但1≤T5,需用校正2检验③T1或n40,改用确切概率法。(3)理论频数T的计算公式:TRC=nnnCR(4)R×C表的自由度ν=(行数-1)(列数-1),故四格表ν=1(5)要记的2界值:210.05,=3.8441.配对2检验的应用条件:b、c为结果不同部分(甲阳乙阴、甲阴乙阳)①b+c≥40时不用校正2=cbcb2ν=1②20≤b+c≤40时要校正2=cb1-c-b2ν=142.R×C表的应用条件:①多个率或构成比的比较,其自由度大于1②R×C表中不宜有51以上格子的理论频数小于5,或不宜有一个理论频数小于143.对理论频数太小的样本的处理办法:①增加样本例数②删去理论频数太小的行或列③将太小理论频数所在的行或列的实际频数,与性质相近的邻行或邻列的频数,合并。44.参数检验:以特定的总体分布(如正态分布、二项分布)作为前提,对总体的参数进行的假设检验,限制条件:总体正态分布、总体方差齐性。45.非参数检验:不依赖于总体的分布类型,不针对总体参数,只针对总体分布是否相同的检验方法;常用于解决总体分布未知的统计问题。46.秩和检验(1)基本思想:两组秩和相加等于N(N+1)/2。(1n+2n=N)(2)两组比较的秩和检验医学统计学8①基本思想:若A、B两组等级分布相同,则含量为1n的样本之实际秩和T与其理论秩和1n(N+1)/2之差2/)1(n1NT纯系抽样误差所致,因此差值不会很大,差值越大的概率越小。②方法步骤:P88仔细弄明白1°建立检验假设:0H:两组分布相同;1H:两组分布不同。α=0.052°编秩3°求秩和T4°确定检验统计量T5°确定P值,作出推断性结论(3)配对秩和检验:设n为非0差值的个数,则T+T=n(n+1)/2。(4)秩和检验的使用范围:理论上可用于任意分布的资料①等级资料②定量资料,开口资料③定量资料,分布极度偏态,或个别数值偏离过大而不属于“过失误差”者④定量资料,各组离散程度相差悬殊,即使经变量变换,也难以达到方差齐性⑤定量资料,分布型尚未确知⑥兼有等级和定量性质的资料(5)秩和检验的优缺点:P9547.直线相关(1)概念:用来描述两个呈正态分布的变量之间的线性共变关系。(2)应用条件:双变量正态分布48.相关系数(1)概念:表达两变量间线性相关的程度和方向的一个统计指标。(2)特征:①无量纲②取值范围为-1≤r≤1。相关系数小于0为负相关;大于0为正相关;等于0为零相关③相关系数的绝对值越大,表示两变量间的相关程度越密切;相关系数越接近于0,表示

1 / 11
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功