1.总体:是指根据研究目的确定的同质研究对象的全体。2.样本:从总体中随机抽取的对总体有代表性的一部分,这部分就是样本。3.随机抽样原则—总体中每一个体被抽取的机会均等。抽样必须遵循随机化原则,样本只是手段,反映总体才是目的4.抽样误差:样本指标与总体指标的差异称为抽样误差。抽样误差愈小,用样本推断总体的准确性愈高。5.由于个体变异是客观存在的,抽样误差是不可避免的。6.数值变量(计数资料)——变量值用定量方法测量,表现为数值的大小,有计量单位。7.分类变量——变量值用定性方法得到,分为以下两种类型:⑴无序分类变量(计数资料)二项分类变量:治愈和未愈多项分类变量:血型⑵有序分类变量(等级资料)分等级8.概率——P,指事件发生的可能性,用符号“P”表示。P,取值范围在0—1之间,越接近1表明事件发生的可能性越大,越接近0表明事件发生的可能性越小。9.小概率事件:一般把P≤0.05或P≤0.01的事件称为小概率事件。(表示某事发生的可能性很小)10.必然事件:P=0,事件发生的概率为0;P=1,某事件必然发生100%。11.统计工作一般分为设计、收集资料、整理资料和分析资料4个步骤。12.设计,是后3个步骤的依据,是统计工作最重要的一个环节。13.统计分析包括统计描述和统计推断。14.频数分布的特征有集中趋势和离散趋势。15.频数分布的类型有对称分布和偏态分布。16.平均数是集中趋势的指标。17.常用的平均数有算术均数、几何均数和中位数。18.医学上的血清抗体滴度和血清凝集效价适用于几何均数描述其集中趋势。19.四分位数间距适用于描述偏态分布资料。20.样本标准差,用符号S表示,这是最常用的反映离散程度的指标。21.标准误是反映抽样误差的统计指标。22.我们把样本均数的标准差称为标准误。23.标准误差不可避免,但可以通过增加样本含量来。24.方差分析(F检验)用于两个或两个以上样本均数的比较,但通常用于两个以上样本均数的比较。25.相对数常用的指标有:率、构成比、相对比。26.卡方检验的是实际频数和理论频数之间的差异。27.多个均数非正态分布时用H检验;多个均数正态分布用方差检验。标准正态分布——是μ为0,δ为1的正态分布,又称U分布。中位数——将一组数据按大小顺序排列,居中数据之数值。医学参考值范围——指正常人的生理或生化常数。均数可信区间——是估计总体均数所在的一个数值范围。相对数——通常指两个相关数据或指标之比。率——说明现象或事件发生的强度指标。构成比——说明事物内部各部分所占的比重指标。率的标准化——消除总率相互比较时内部构成不同而作的统计处理。计量资料分布与集中趋势和离散程度的关系?(均数、几何均数和中位数的适用范围是什么?)资料分布类型首选集中趋势指标首选离散程度指标正态分布对数正态分布其他分布算术均数几何均数中位数标准差几何标准差四分位数间距制定医学参考值的基本原则:(1)调查对象为“正常人”。(2)n≥100。(3)统一测定,控制测量误差。(4)判断分组与否。(5)决定取单侧或双侧界值。(6)选择适当的百分界值。(7)选用恰当的统计方法。参考值范围与可信区间有何区别?(1)意义不同:参考值范围是大多数个体值分布范围的估计。可信区间指对总体均数所在区间的估计。(2)计算方法不同:参考值范围用SuX计算。可信区间用XStX,或XSuX计算。何谓假设检验?其基本原理是什么?假设检验,是根据小概率事件原理,判断所比较的样本指标是否源于同一总体的统计分析方法。率的标准化的基本思想?以标准化法消除资料内部构成不同,使资料具可比性。卡方检验的基本思想?基本思想:若无抽样误差,实际数与理论数应该相等。故χ2检验本质上是检验实际数与理论数之间的差异是否为抽样误差的一种假设检验。当不满足行×列表卡方检验条件时的资料处理方法?1、扩大样本继续调查,增大理论数以符合要求2、将性质相近的邻行或邻列合并,重新计算理论数以符合要求。3、将理论数不符合要求的行或列去除。相关分析与回归分析有何区别和联系?1、区别:(1)相关分析:判断事物有无关系及密切程度(2)回归分析:用数学方程表示事物间的关系,目的是从甲事物推测乙事物2、联系:先确立相关关系,后建立回归方程;回归系数与相关系数的假设检验等价;相关系数与回归系数的正负号相同。相关与回归分析时的注意事项?1、相关与回归分析应有实际意义。2、相关关系不一定是因果关系。3、应作假设检验确定相关关系是否成立。4、相关与回归的应用,仅限于原实测数据范围内,不得任意外延。5、正确地选择自变量X。6、作直线相关回归分析的资料应呈正态或近似正态分布。常用统计图的适用范围是什么?直条图:反映独立统计指标(均数或率)之间的比较线图:反映连续统计指标(均数或率)的变化趋势构成图:反映构成比资料。相关系数r的意义1、r数值上介于+1到-1之间│r│越接近0,相关越不密切(越不相关)│r│越接近1,相关越密切(越相关)│r│=1时,呈完全相关关系2、r为负数,表示呈负相关;r为正数,表示呈正相关。回归系数b的意义1、表示X每变动1个单位,Y平均变动b个单位2、│b│数值越大,表示X对Y的影响越大。3、b为负数,意味着负相关;b为正数,意味着正相关四、简答题1.标准差有以下四个方面的用途:答:⑴用于对称分布,特别是正态分布资料,表示观察值分布的离散程度。,在两组资料均数相近,度量单位相同的条件下,标准差大,表示观察值分布离散,反之,标准差小,表示观察值分布紧密。⑵结合均数描述正态分布的特征和估计医学参考值范围。⑶结合样本含量n计算标准误。⑷用以计算变异系数。2.标准误的应用答:⑴可用于反映样本均数的可靠性。标准误小表示样本均数与总体均数较接近,用样本均数代表总体均数的可靠程度较大;反之,标准误大,表示用样本均数代表总体均数的可靠程度较小。⑵可用于估计总体均数的置信区间。⑶可用于均数的假设检验。1、标准差与标准误有何区别与联系标准差是反映观察值变异程度的指标,标准误是反映均数抽样误差的指标。当n→∞时,标准差趋向稳定;而标准误→0。两者联系见公式:Sx=S/n2、简述对抽样误差的认识?抽样误差是指由于随机抽样引起的样本指标与总体指标,或样本指标之间存在的差别。抽样误差不可避免(因个体差异是客观存在,不可避免的),但可以通过增加样本含量使之缩小。其大小由标准误表示。3、假设检验步骤如下:①建立假设和确定检验水准:H0:无效假设,H1:备择假设;检验水准α一般取0.05;②计算统计量:根据资料选用适宜的公式计算;③确定P值,推断结论:通过相应的界值(查表)来确定P值。如P>α,则接受H0,;如P≤α,则拒绝H0。④以文字表达统计结论:如P>α,表达为差别无统计学意义等;如P≤α,则表达为差别有统计学意义等。4、假设检验的注意事项1、资料应具可比性2.根据资料选择适宜的统计方法3、判断结论不能绝对化4、统计指标差别应有实际意义5、相对数应用的注意事项?1、分母不宜过小2、正确区分构成比和率3、正确选择分子与分母4、正确计算总率5、资料应具可比性6、总率作比较时常需作率的标准化处理7、相对数作比较时应进行假设检验6、统计表的结构1、标题:是统计表的总名称2、标目:是表格内的项目,分为横标目(列在表的左侧)和纵标目(列在表的上端)3、线条:力求简洁,顶线、底线不能省4、数字:必须准确,用阿拉伯数字5说明:文字不列入表内7、下表为某地健康成人的第一秒肺通气量(正态分布)资料,如果研究目的是制订成人肺活量的医学参考值范围,简述怎样作统计分析?(解说统计分析思路即可,不必作详细的统计分析)FEV1人数男性女性2.0~2.5~3.0~3.5~4.0~4.5~5.0~5.5~6.0~合计143811232733362026101023010118100答:按性别分别计算X和S以男、女X作成组t检验P>0.05P≤0.05(可认为男女(可认为男女肺活量相同)肺活量不同)计算合并(不分性别)的X和S计算合并的按性别分别计算医学参考值范围医学参考值范围8、下表为具有代表性的临床研究方案,所获资料(正态分布)如下。如果想说明两种药物是否都有疗效?两种药物的疗效有无区别,简述怎样作统计分析?(解说统计分析思路即可,不必作详细的统计分析)甲、乙两药治疗前后的血沉(mm/h)组别甲药病人编号12345678910治疗前治疗后1013611107885969310842533乙药病人编号12345678治疗前治疗后91091386101143533582答:分别计算两组的d和Sd分别对两组作配对t检验两组均P>0.05一组P≤0.05,另一组P>0.05两组均P≤0.05(可认为两治疗均无效)(可认为一组有效,另一组无效)(可认为两治疗均有效)以两组的d作成组t检验P>0.05P≤0.05(可认为两治疗(可认为两治疗疗效相同)疗效不同)大题目:中位数、卡方检验、四格表各考一个题目平均数一、中位数频数表法101名电光性眼炎患者发病潜伏期发病潜伏期病例数累计频数(小时)(f)(Σf)0-772-12194-22416-25668-1410-912-414-216-218-020-122-124-2合计101(n)(1)计算出中位数的排列位置:用n×50%(或÷2)获得。以左表资料为例,共101个数据,101×50%=50.5,表示中位数排列在第50.5位。(2)找到中位数所在的组段:即第50.5位的数据所在的组段——“6-”组段。确定中位数所在组段,是频数表法计算的关键。从左表可见,数值<6的数据共累计了41个,排列在第42位的数据已经进入了组段“6-”;该组段共有数据25个(数值均>6但<8),它们的排列顺序分别是第42~66位。而中位数排在第50.5位,显然位于它们之中,即落在“6-”组段内。(3)根据下列公式计算中位数式中:Lm=中位数所在组段的下限(最小值)i=中位数所在组段的组距fm=中位数所在组段内的频数ΣfL=中位数所在组段之前的累计频数结果:电光性眼炎的平均发病潜伏期为6.76小时。二、U检验两样本均数比较的假设检验例:某医院研究劳动类型与血清胆固醇的关系,调查结果为脑力劳动组537人,平均胆固醇水平为4.8mmol/L,标准差为0.72mmol/L;体力劳动组643人,平均数为4.6mmol/L,标准差为0.81mmol/L。问两种劳动者的血清胆固醇水平是否有差别?作均数假设检验的步骤如下:已知:X1=4.8S1=0.72n1=537X2=4.6S2=0.81n2=6431、建立假设和确定检验水准H0:μ1=μ2(两种劳动者的血清胆固醇水平相同)H1:μ1≠μ2(两种劳动者的血清胆固醇水平不同)α=0.052、计算统计量3、确定P值∵│4.488│>1.96(U0.05值)∴P<0.05差别有意义---------4、用文字表达检验结果可以认为两种劳动者血清胆固醇水平不同。样本均数与总体均数比较的假设检验例:从大量调查得知,健康成年男性脉搏均数为72次/分钟(从大量调查中总结出来的均数,通常被认为是总体均数);调查某工厂100名成年男性工人脉搏的平均数为73.7次/分钟,标准差为8.8次/分钟。U=X1-X2S22n2S12n1+=4.8-4.60.8126430.722537+=4.488M=Lm+(n×50%-ΣfL)ifmM=Lm+(n×50%-ΣfL)=6+(101×50%-41)=6.76ifm225已知μ=72;X=73.7、标准差S=8.8、n=100。1、建立假设和确定检验水准H0:μ=μ0=72(该厂男性工人与健康成年男性的脉搏相同)H1:μ≠μ0(该厂男性工人与健康成年男性的脉搏不同)α=0.052、计算统计量3、确定P值∵│1.932│<1.96∴P>0.05-----4、用文字表达检验结果可以认为该厂男性工人与健康男性的脉搏相同。三、四格表卡方检验(X2检验)例一:为比较两种治疗方法哪一种较好,某医师用甲药治疗患者25例,治愈率80%;用乙药治疗同类患者30例;治愈60%。问两种治疗效果的