统计方法介绍docin/sundae_meng•根据不同的资料类型及不同的统计要求选择不同的统计方法。docin/sundae_meng资料类型:•资料一般可分成三大类:计量资料、计数资料和等级资料。•(1)计量资料:它是测量每个观察单位某项指标值的大小所得的资料。•(2)计数资料:将观察单位按某种属性或类别分组计数,得到各类别观察单位计数的资料,称为计数资料。•(3)等级资料又称为半定量资料:将观察单位按某种属性的不同程度分组计算所得出的各个不同程度的观察单位计数的资料。docin/sundae_meng统计分析方法:(1)统计描述:指用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行描述。(2)统计推断:指用样本推断总体,主要是假设检验,例如检验:两个总体均数是否有差异,两总体率是否有差异,两个因素之间是否有关。(3)因素之间的关系:如相关和回归分析等。docin/sundae_meng一.计量资料的描述性统计•1.计量资料的描述性统计指标包括:(1)集中位置的指标,用以描述观察值的平均水平。如算术均数、几何均数、中位数、百分位数等。(2)资料变异的指标,用以描述观察值间参差不齐的程度,即离散度或称变异度。如全距、标准差、方差、变异系数、四分位数间距等。docin/sundae_meng(1)算术平均数,简称为均数。观察值全部相加再除以总例数。均数适用于服从对称分布的计量资料,尤其是正态分布的资料(2)几何均数。用G表示,为观察值的总乘积开n次方根。常用对数计算,求对数值的均数。再查反对数得出G。几何均数适用于成倍数关系的资料,如抗体滴度、效价等,也用于对数正态分布的资料如某些传染病的潜伏期、细菌计数等。(3)中位数:用M表示,它将总体或样本的全部观察值分成两部分,每部分各有50%个观察值。docin/sundae_meng中位数计算方法为:先将原始观察值按由小到大顺序排列后,位次处于中间的那个观察值为中位数。观察值数为奇数时,处于中间的那个数为中位数,偶数时处于中间的两个数的均数为中位数。中位数适用于表示任何分布资料的平均水平。但常用于非正态分布资料。由于中位数不受个别特大,特小数值的影响,因此它比均数稳健,常用于资料分布不明,或明显偏态,或分布的一端无确定值的情况。docin/sundae_meng(4)百分位数:第X百分位数以Px表示,它将全部观察值分成二个部分,其中有x%个观察值小于Px,(100-x)%个观察值大于Px。用途:1.描述一组资料在各个百分位置上的水平,用一组百分位数如P5,P25,P50,P75,P95,可以描述总体或样本的分布特征,如集中位置、变异度等。2.确定医学正常值范围。docin/sundae_mengX%(100-X)%PXdocin/sundae_mengP25称为第1四分位数;记为Q1。P50称为第2四分位数;记为Q2,就是中位数MP75称为第3四分位数;记为Q3。docin/sundae_meng(5)全距:是最大与最小观察值之差。全距计算方便,但仅利用最大与最小二个数据来代表全部数据的离散程度,信息利用差。全距受特大与特小值影响大,不稳定。通常:最小值~最大值,如:3.980~5.875docin/sundae_meng(6)标准差与方差:标准差常用SD表示,方差是标准差的平方。标准差是一种常用的离散指标,结合均数能给出正态分布的特征。实际应用时常以均数±标准差的写法综合观察值的集中和离散特征。(7)变异系数:变异系数是一种离散指标,简记为CV,它是标准差与均数之比,用百分数表达。由于CV无量度单位,而且消除了原始资料的平均水平的影响,因此常用于比较量度单位不相同的指标或者平均水平相差悬殊的指标的变异程度。docin/sundae_meng(8)四分位数间距:四分位数间距是第3四分位数与第1四分位数之差,即P75–P25。四分位数间距受特大值或特小值影响小,较稳定。中位数和四分位数间距相结合常用于表示非正态分布资料的平均水平和离散程度。docin/sundae_mengt检验也称为Studentt检验。主要用于两组计量资料比较的显著性检验。包括:样本均数与总体均数的比较,两配对样本均数的比较和非配对两样本均数的比较。二.t检验docin/sundae_meng1.样本均数与总体均数比较的t检验检验样本是否来自均数为μ0的已知总体。如:要研究现在13岁男孩的身高是否比20年前的13岁男孩高。20年前的13岁男孩平均身高为1.30。现测量了13岁男孩100名平均身高为1.35,标准差为0.12,要检验现在13岁男孩身高的总体均数是否高于1.30。docin/sundae_meng2.配对t检验处理前后的比较例号用药前用药后1118112211098……10122108治疗前后舒张压的改变两种处理的比较对子号A药B药10.2-0.121.01.8……100.40.8两种药物治疗白细胞降低疗效的比较(表中为白细胞升高数)。docin/sundae_meng3.团体t检验用于非配对两样本均数的比较。如:两组雌鼠,分别饲以高蛋白和低蛋白饲料,8周后记录各鼠体重增加量(克)如下,问两组动物增重的均数差别是否显著?高蛋白组:1341461041191241611078311312997123低蛋白组:701181018510713294docin/sundae_mengt检验的条件1.样本均数和总体均数比较的t检验:样本来自正态分布的总体。2.配对t检验:差值的总体为正态分布。3.团体t检验:1)两个样本都来自正态分布的总体。2)两个总体方差相等。docin/sundae_mengt检验条件不满足时的对策1.进行变量变换,如对数变换,变换成正态分布后再进行t检验。2.用非参数检验的方法。3.两样本比较的t检验时,如正态分布但方差不齐,可用t’检验。docin/sundae_meng方差分析主要用于检验计量资料中两个或两个以上样本均数间差别的显著性。常见的错误是进行各组之间的两两t检验。这将增加第一类误差的概率。两组以上均数的比较不能用两两t检验,而必须用方差分析。如差别有统计学意义,然后再进一步用SNK等方法作两两比较。三.方差分析docin/sundae_meng例:小白鼠给药前后发生咳嗽的推迟时间(秒)─────────────────────复方Ⅰ复方Ⅱ可待因─────────────────────40506015-1030-510577┇┇┇─────────────────────例数151510均值31.674460.7─────────────────────docin/sundae_meng随机单位组设计方差分析:欲比较因素Ⅰ的K个水平的各变量均值,同时控制另一个因素的作用。试验设计时,先将受试对象按其它控制因素性质相同或相近者组成单位组,每个单位组有K个受试对象,分别随机分配至因素Ⅰ的K个水平上。这时每个水平的受试对象不仅数量相同,而且性质亦相同或相近,就能缩小误差,提高实验效率。它是两样本配对试验的扩大。docin/sundae_meng——————————————————————————单位组处理1处理2……...处理k——————————————————————————1X11X12……...X1k2X21X22……...X2k┇┇┇……...┇bXb1Xb2Xbk——————————————————————————docin/sundae_meng大白鼠注射不同剂量雌激素后的子宫重量(g)───────────────────────雌激素剂量(μg/100g)─────────────────大白鼠种系0.20.40.8───────────────────────A106116145B4268115C70111133D426387───────────────────────docin/sundae_meng欲比较一个因素中K个水平的各均数,同时要控制另二个因素作用时,可用拉丁方设计的方差分析。要同时研究几个因素的作用,同时要考察因素间的交互作用,可用析因设计的方差分析。docin/sundae_meng协方差分析:在各种试验设计中,对主要变量Y研究时,常希望其他可能影响Y的变量保持基本一致,以达到均衡可比。例如:比较几种药物的降压作用,各试验组在原始血压、性别、年龄等指标应无显著差异。有时这些变量不能控制,须在统计分析时,通过一定方法来消除这些变量的影响后,再对主要变量y作出统计推断。如果所控制的变量是分类变量时,可用多因素的方差分析。docin/sundae_meng当要控制的变量是连续型变量时,可用协方差分析。称这些影响变量为协变量,消除协变量的影响后,或将协变量化成相等后,对y的修正均数所作的方差分析称为协方差分析。例如:比较几种不同饲料对动物体重增加的作用,可把动物的进食量作为协变量。比较大学生和运动员的肺活量时,可把身高作为协变量。比较治疗后二组舒张压的大小,可把治疗前的舒张压作为协变量。docin/sundae_meng如:比较初生至三周岁儿童男女两组体表面积Y之间有无差异,以身高X1和体重X2为协变量比较对身高和体重修正后的体表面积修正均数。docin/sundae_meng四.计数资料的描述性统计:率和构成比是计数资料的主要描述性指标。率说明某种现象发生的频率或强度,其公式为:率=某现象实际发生的例数/某现象可能发生的例数。常见的率有发病率、患病率、死亡率、痊愈率、有效率等。构成比表示事物或现象内部各构成部分的比重,通常以100作为比例基数,故常称为百分比。构成比=事物内部某一构成部分的观察单位数/事物内部各组成部分的观察单位总数。如性别的构成比,病种的构成比,职业的构成比等。docin/sundae_meng构成比和率是两个不同的相对数,用途不一样,不能混淆。最容易犯的错误是把构成比当作率来用。用率作比较时,应注意其可比性。应审慎思考影响的因素,不能凭表面数值贸然下结论。对于内部构成不同的两个率,应先作标准化处理,才能进行比较,这称为率的标准化,经标准化后的率称为标准化率。docin/sundae_meng例:某医院门诊部近视眼患者情况:——————————————————————职业患者人数所占比例(%)——————————————————————工人150050.00农民100033.33学生2508.33干部2508.33——————————————————————结论为:工人患近视眼最多,其次是农民,学生和干部患近视眼都比较少。docin/sundae_meng正确的调查方法:——————————————————————职业调查人数患者人数患病率(%)——————————————————————工人20001005.00农民20001005.00学生100010010.00干部100010010.00——————————————————————docin/sundae_meng五.四格表和行×列表卡方检验四格表和行×列表卡方检验用于两个或多个率或构成比差异的显著性检验以及两种属性间独立性检验。docin/sundae_meng两种药物治疗某病有效率的比较──────────────────────药物有效无效合计有效率──────────────────────西药63167979.75中药4775487.04──────────────────────合计1102313382.71──────────────────────两组有效率的差异是否有统计学意义?docin/sundae_meng──────────────────────有效无效合计有效率───────────────────西药组63167979.75中药组4775487.04中西结合6536895.59───────────────────合计17526201──────────────────────do