第2章统计描述1.对定量资料进行统计描述时,如何选择适宜的指标?定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合平均水平均数个体的平均值对称分布几何均数平均倍数取对数后对称分布中位数位次居中的观察值①非对称分布;②半定量资料;③末端开口资料;④分布不明众数频数最多的观察值不拘分布形式,概略分析调和均数基于倒数变换的平均值正偏峰分布资料变异度全距观察值取值范围不拘分布形式,概略分析标准差(方差)观察值平均离开均数的程度对称分布,特别是正态分布资料四分位数间距居中半数观察值的全距①非对称分布;②半定量资料;③末端开口资料;④分布不明变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较定性资料:阳性事件的概率,概率分布,强度和相对比。2.应用相对数时应注意哪些问题?答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。(2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。(3)观察单位数不等的几个相对数,不能直接相加求其平均水平。(4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。3.常用统计图有哪些?分别适用于什么分析目的?常用统计图的适用资料及实施方法图形适用资料实施方法条图组间数量对比用直条高度表示数量大小直方图定量资料的分布用直条的面积表示各组段的频数或频率百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数第3章概率分布1.服从二项分布及Poisson分布的条件分别是什么?二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数n很大,而所关心的事件发生的概率很小。2.二项分布、Poisson分布分别有什么特征?①二项分布、Poisson分布都是离散型分布。②二项分布的形状取决于π与n的大小。π=0.5时,不论n大小,对称分布。π≠0.5时,图形呈偏态,随n增大而逐渐对称。当n足够大,π或1-π不太小,二项分布近似正态。③Poisson分布μ越小,分布越偏。μ越大,分布越对称。当n足够大时,分布接近正态。4、正态分布应用①估计变量值的频数分布②制定参考值范围③质量控制④正态分布是很多统计方法的基础5.正态分布特征①以均数为中心,左右对称②正态曲线在横轴上方均数处取得最高点③正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)④正态曲线下面积有一定规律第4章参数估计1.标准误与标准差的区别(1)标准差反映个体值散布的程度;标准误反映估计总体参数的精确程度。(2)标准误小于标准差。(3)样本含量越大,标准误越小,其样本均数更有可能接近于总体均数,随着样本含量的增大,标准差有可能增大,也有可能减小。(4)用途不同。标准差的用途:①反映一组资料的离散程度②计算变异系数③结合均数与正态分布的规律,估计参考值范围标准误的用途:④衡量样本均数的可靠性⑤与样本均数结合,估计总体均数的置信区间⑥可用于进行均数的假设检验标准误与标准差的区别与联系标准差标准误区别含义描述个体观察值的离散程度反应总体参数被估计的精确程度范畴统计描述统计推断用途估计参考值范围估计置信区间nn越大,标准差越稳定n越大,标准误越小联系1.标准误大小与标准差成正比;2.n一定时,标准差越大,标准误也越大。3.简述置信区间与医学参考值范围的区别。区别置信区间参考值范围含义用途计算公式总体参数的波动范围,即按事先给定的概率100(1α)%所确定的包含未知总体参数的一个波动范围估计未知总体均数所在范围未知:/2,XXtS已知或未知但n≥30,有/2XXZ或/2XXZS个体值的波动范围,即按事先给定的范围100(1α)%所确定的“正常人”的解剖、生理、生化指标的波动范围供判断观察个体某项指标是否“正常”时参考(辅助诊断)正态分布:/2XZS偏峰分布:PX~P100X4何谓置信区间准确度与精确度?如何协调两者间的关系。置信区间有准确度与精密度两个要素。(1)准确度由置信度(1-α)的大小确定,即由置信区间包含总体参数的可能性大小来反映。从准确度的角度看,置信度愈接近于1愈好,(2)精密度是置信区间宽度的一半,意指置信区间的两端点值离样本统计量(如X、p)的距离。从精密度的角度看,置信区间宽度愈窄愈好。(3)在抽样误差确定的情况下,两者是相互矛盾的。为了同时兼顾置信区间的准确度与精密度,可适当增加样本含量。3、参考值范围估计的基本步骤①从正常人的总体中进行随机抽样②对选定的正常人进行准确的测定③确定取单侧还是双侧范围④确定范围常用95%。⑤根据资料的分布类型选用恰当的界值估计方法第5章假设检验1.试述假设检验中α与P的联系与区别。区别:(1)值是事先确定的一个小的概率值。为一次检验中,甘愿冒的风险。(2)P值是在0H成立的条件下,出现当前检验统计量以及更极端状况的概率。为一次检验中,实际冒的风险。联系:以t检验为例,P、都可以用t分布尾部面积大小表示。P≤时,拒绝0H假设。2.试述假设检验与置信区间的联系与区别。联系:区间估计与假设检验是由样本数据对总体参数做出统计学推断的两种主要方法。区别:置信区间用于说明量的大小,即推断总体参数的置信范围;假设检验用于推断质的不同,即判断两总体参数是否不等。3.怎样正确运用单侧检验和双侧检验?需要根据数据的特征及专业知识进行确定。若比较甲、乙两种方法有无差异,则应选用双侧检验。若需要区分何者为优,,则应选用单侧检验。在没有特殊专业知识说明的情况下,一般采用双侧检验即可。4.试述两类错误的意义及其关系。⑴Ⅰ类错误:如果检验假设0H实际是正确的,由样本数据计算获得的检验统计量得出拒绝0H的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设0H(弃真)的错误称为Ⅰ类错误。Ⅰ类错误的概率用表示。⑵Ⅱ类错误:若检验假设0H原本不正确(1H正确),由样本数据计算获得的检验统计量得出不拒绝0H(纳伪)的结论,此时就犯了Ⅱ类错误。Ⅱ类错误的概率用表示。在假设检验时,应兼顾犯Ⅰ类错误的概率()和犯Ⅱ类错误的概率()。犯Ⅰ类错误的概率()和犯Ⅱ类错误的概率()成反比。如果把Ⅰ类错误的概率定得很小,势必增加犯Ⅱ类错误的概率,从而降低检验效能;反之,如果把Ⅱ类错误的概率定得很小,势必增加犯Ⅰ类错误的概率,从而降低了置信度。为了同时减小和,只有通过增加样本含量,减少抽样误差大小来实现。5.试述检验功效的概念和主要影响因素。答:拒绝不正确的0H的概率,在统计学中称为检验功效(poweroftest),记为1。检验功效的意义是:当两个总体参数间存在差异时(如备择假设1H:0成立时),所使用的统计检验能够发现这种差异(拒绝零假设0H:0)的概率,一般情况下要求检验功效应在0.8以上。影响检验功效的四要素为总体参数的差异、总体标准差、检验水准及样本量n。6.简述假设检验的基本思想。假设检验是在H0成立的前提下,从样本数据中寻找证据来拒绝0H、接受1H的一种“反证”方法。如果从样本数据中得到的证据不足,则只能不拒绝0H,暂且认为0H成立,即样本与总体间的差异仅仅是由于抽样误差所引起。拒绝0H是根据某个界值,即根据小概率事件确定的。所谓小概率事件是指如果比检验统计量更极端(即绝对值更大)的概率较小,比如小于等于0.05,则认为零假设的事件在某一次抽样研究中不会发生,此时有充分理由拒绝0H,即有足够证据推断差异具有统计学意义。7.建设检验四步骤:⑦建立检验假设H0和备择假设H1(判断是单侧检验还是双侧检验再作假设)⑧确定检验水准⑨选定检验方法和计算检验统计量⑩确定P值和作出推断结论8.参数及非参数检验优缺点参数检验非参数检验适用条件资料正态分布,方差齐性1.分布未知或偏态分布资料2.总体方差不齐3.等级资料4.开口资料检验方法1.t检验2.u检验3.方差分析1.符号秩和检验(配对资料)2.秩和检验3.K-W检验(多组资料)优点:充分利用原始数据信息,检验效能高缺点:受资料总体分布限定优点:不受资料总体分布限定缺点:只利用秩次,损失原始数据,检验效能低。第6章两样本定量资料的比较1.对于完全随机设计两样本定量资料的比较,如何选择统计方法?答:完全随机设计两样本定量资料比较统计方法的选择最关键的是看是否满足正态性(样本量较大时不必进行正态性检验)和方差齐性。如果资料来自正态总体且总体方差齐,采用t检验;如果满足正态性但总体方差不齐,采用t′检验;当两者都不满足时,才考虑选用秩和检验。当然,我们也可采用变量变换的方法使其满足t或t′检验的条件。2.t检验有几种,适用条件是什么?t检验是以t分布为理论基础。小样本时,要求资料符合正态分布和方差齐性。一般有以下三种:⑪样本均数与总体均数的比较⑫配对资料的比较⑬两个样本均数的比较此外,还有相关系数,回归系数的t检验。3.两组定量独立样本的比较(1)两独立样本的t检验(满足正态性和方差齐性)(2)校正的t检验(正态但方差不齐)(3)u检验(大样本,且方差齐)(4)秩和检验(小样本,不正不齐){p值确定分为T值在范围内还是范围外}4.配对定量资料的比较(1)配对资料的t检验(差值服从正态)(2)符号秩和检验(不正){p值确定类似于t检验}第7章多组定量资料的比较1.方差分析的基本思想和应用条件是什么?基本思想将处理间平均变异与误差平均变异比较。根据试验设计的类型和研究目的,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。应用条件①各样本是相互独立的随机样本,均服从正态分布;②各样本的总体方差相等,即方差齐性。2.方差分析的步骤①建立假设检验和检验水准(H0:总体均数都相等)②计算统计量F③确定P值和作出推断结论④作两两均数之间的比较(若P0.05,可省略此步)3.多组定量资料比较时,统计处理的基本流程是什么?多组定量资料比较时首先应考虑用方差分析。(1)若方差齐性,且各样本均服从正态分布,选单因素方差分析。(2)若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis秩和检验,或通过某种形式的数据变换使其满足方差分析的条件。若方差分析或秩和检验结果有统计学意义,则需选择合适的方法(如Bonferonni、LSD法等)进行两两比较。4.方差分析的应用?①多组定量资料比较,即两个或两个以上均数的比较②方差齐性检验③两个或多个研究因素的交互作用④回归方程的线性假设检验第8章定性资料的比较1.简述2检验适用的数据类型,基本思想,检验步骤。答:⑴卡方检验是应用较广的一种定性资料的假设检验方法,用于①检验两个或多个样本率(或构成比)之间有无差别,②交叉分类资料两属性间的关联性检验③频数分布的拟合优度⑵χ2检验的基本思想:χ2值反映的是实际频数与理论频数的吻合程度,在检验假设H0成立的情况下,实际频数与理论频数差别仅由随机误差所致,其χ2值会比较小,反之亦然,χ2值越大,越有理由认为检验假设H0不成立。⑶检验步骤:①建立假设检验和检验水准(H0:总体分布/某情况/某率相等)②计算统计量2③确定P值和做出推断结论④作两两之间的比较(若P0.05,可省略此步)2.四格表资料χ2检验的条件有哪些?(注意T为理论频数)完全随机设计公式,χ2=(a