卫生统计学简答题方差分析的基本思想和应用条件是什么?答:方差分析的基本思想是,对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。不同之处在于变异分解的项目因设计不同而异。具体来讲,根据试验设计的类型和研究目的,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,从而推论各种研究因素对试验结果有无影响。其应用条件是,①各样本是相互独立的随机样本,均服从正态分布;②各样本的总体方差相等,即方差齐性。多组定量资料比较时,统计处理的基本流程是什么?答:多组定量资料比较时首先应考虑用方差分析,对其应用条件进行检验,即方差齐性及各样本的正态性检验。若方差齐性,且各样本均服从正态分布,选单因素方差分析。若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis秩和检验,或通过某种形式的数据变换使其满足方差分析的条件。若方差分析或秩和检验结果有统计学意义,则需选择合适的方法(如Bonferonni、LSD法等)进行两两比较。简述秩和检验的优缺点秩和检验的优点是(1)不受总体分布限制,适用面广;(2)适用于等级资料及两端无确定值的资料;(3)易于理解,易于计算。缺点是符合参数检验的资料,用秩和检验,则不能充分利用信息,检验效能低。试述假设检验与置信区间的联系与区别。答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。置信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即判断两总体参数是否不等。试述两类错误的意义及其关系。答:Ⅰ类错误(typeⅠerror):如果检验假设0H实际是正确的,由样本数据计算获得的检验统计量得出拒绝0H的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设0H(弃真)的错误称为Ⅰ类错误。Ⅱ类错误(typeⅡerror):假设检验的另一类错误称为Ⅱ类错误(typeⅡerror),即检验假设0H原本不正确(1H正确),由样本数据计算获得的检验统计量得出不拒绝0H(纳伪)的结论,此时就犯了Ⅱ类错误。Ⅱ类错误的概率用β表示。在假设检验时,应兼顾犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)。犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)成反比。如果把Ⅰ类错误的概率定得很小,势必增加犯Ⅱ类错误的概率,从而降低检验效能;反之,如果把Ⅱ类错误的概率定得很小,势必增加犯Ⅰ类错误的概率,从而降低了置信度。为了同时减小α和β,只有通过增加样本含量,减少抽样误差大小来实现。什么资料适合用秩和检验进行检验?简述秩和检验步骤。答:提示:进行有序资料的比较时宜采用秩和检验。(1)等级资料;(2)偏态资料;(3)分布不明的资料;(4)资料中各组方差不齐,且转换后不能达到方差齐性;(5)一端或两端无界。秩和检验步骤为:①建立假设H0和H1,并确定检验水准α;②根据不同的设计类型对资料进行编秩并计算秩和;③根据计算的秩和直接查表或计算相应的统计量再查表,确定P值下结论。进行有序资料的比较时宜采用秩和检验。服从二项分布及Poisson分布的条件分别是什么?答:二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数n很大,而所关心的事件发生的概率π很小。2.二项分布、Poisson分布分别在何种条件下近似正态分布?简答:二项分布的正态近似:当n较大,π不接近0也不接近1时,二项分布B(n,π)近似正态分布N(πn,)1(ππ−n)。Poisson分布的正态近似:Poisson分布)(λΠ,当λ相当大时(≥20),其分布近似于正态分布简述简单线性回归分析的基本步骤。答:①绘制散点图,考察是否有线性趋势及可疑的异常点;②估计回归系数;③对总体回归系数或回归方程进行假设检验;④列出回归方程,绘制回归直线;⑤统计应用。简述线性回归分析与线性相关的区别与联系。答:区别:(1)资料要求上,进行直线回归分析的两变量,若X为可精确测量和严格控制的变量,则对应于每个X的Y值要求服从正态分布;若X、Y都是随机变量,则要求X、Y服从双变量正态分布。直线相关分析只适用于双变量正态分布资料。(2)应用上,说明两变量线性依存的数量关系用回归(定量分析),说明两变量的相关关系用相关(定性分析)。(3)两个系数的意义不同。r说明具有直线关系的两变量间相互关系的方向与密切程度,b表示X每变化一个单位所导致Y的平均变化量。(4)两个系数的取值范围不同:-1≤r≤1,∞∞−b。(5)两个系数的单位不同:r没有单位,b有单位。联系:(1)对同一双变量资料,回归系数b与相关系数r的正负号一致。b>0时,r>0,均表示两变量X、Y同向变化;b<0时,r<0,均表示两变量X、Y反向变化。(2)回归系数b与相关系数r的假设检验等价,即对同一双变量资料,rbtt=。由于相关系数r的假设检验较回归系数b的假设检验简单,故在实际应用中常以r的假设检验代替b的假设检验。(3)用回归解释相关:由于决定系数2R=SS回/SS总,当总平方和固定时,回归平方和的大小决定了相关的密切程度。回归平方和越接近总平方和,则2R越接近1,说明引入相关的效果越好。例如当r=0.20,n=100时,可按检验水准0.05拒绝H0,接受H1,认为两变量有相关关系。但2R=(0.20)2=0.04,表示回归平方和在总平方和中仅占4%,说明两变量间的相关关系实际意义不大直线相关与回归有何联系与区别?联系:(1)对符合相关回归条件的资料,其相关系数与回归系数的正负号相同。(2)回归系数与相关系数的假设检验是等价的,对同一样本的资料,回归系数的t检验与相关系数的t检验其数值相等,即tr=tb。(3)可以用回归解释相关。r的平方称为决定系数(coefficientofdetermination)。区别:回归要求因变量Y是正态分布的随机变量;X可以是精确测量或严格控制的变量,也可以是呈正态分布的随机变量,当X是精确测量或严格控制的变量时,此时的回归称Ⅰ型回归。当X是呈正态分布的随机变量时,此时的回归称为Ⅱ型回归。相关要求变量X、Y都是呈正态分布的随机变量。当说明两变量间依存变化的数量关系时用回归,当说明两变量间的相关关系时用相关标准差与标准误有何区别和联系?标准差和标准误都是变异指标,但它们之间有区别,也有联系。区别:①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。③它们与样本含量的关系不同:当样本含量n足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0。联系:标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。(联系:1、二者都是表示变异度大小的统计指标2、标准误与标准差大小成正比,与抽样例数n的平方根成反比)何谓假设检验?其一般步骤是什么?所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后根据样本所提供的信息,借助一定的分布,观察实测样本情况是否属于小概率事件,从而对所提出的假设作出拒绝或不拒绝的结论的过程。假设检验一般分为以下步骤:①建立假设:包括:H0,称无效假设;H1:称备择假设;②确定检验水准:检验水准用α表示,α一般取0.05;③计算检验统计量:根据不同的检验方法,使用特定的公式计算;④确定P值:通过统计量及相应的界值表来确定P值;⑤推断结论:如P>α,则接受H0,差别无统计学意义;如P≤α,则拒绝H0,差别有统计学意义。常用统计图的适用范围是什么?常用的统计图及适用条件是:①条图,适用于相互独立的资料,以表示其指标大小;②百分条图及远圆图,适用于构成比资料,反映各组成部分的大小;③普通线图:适用于连续性资料,反映事物在时间上的发展变化的趋势,或某现象随另一现象变迁的情况。④半对数线图,适用于连续性资料,反映事物发展速度(相对比)。⑤直方图:适用于连续性变量资料,反映连续变量的频数分布。⑥散点图:适用于成对数据,反映散点分布的趋势。简述率的标准化法的基本思想当比较两个总率时,如果两组内部某种重要特征在构成上有差别,则直接比较这两个总率是不合理的;因为这些特征构成上的不同,往往造成总率的升高或下降,从而影响两个总率的对比。率标准化法的基本思想就是采用统一的内部构成计算标准化率,以消除内部构成不同对指标的影响,使算得的标准化率具有可比性。例如比较两人群的死亡率、出生率、患病率时,常要考虑人群性别、年龄的构成是否相同;试验组和对照组治愈率的比较时,常要考虑两组病情轻重、年龄、免疫状态等因素的构成是否相同。如其构成不同,需采用统一的标准进行校正,然后计算校正后的标准化率进行比较,这种方法称为标准化法。简述χ2检验的的基本思想χ2检验是检验理论频数与实际频数的吻合程度,从基本公式(TTA22)(−∑=χ)可以看出,在检验假设成立的情况下,T(理论频数)与A(实际频数)之差一般不会很大,此时χ2值也较小;反之,χ2值较大。当χ2值较大,且大于一定的界值时,就拒绝H0,接受H1,认为两样本率有统计学差异。当χ2值较小,且小于特定的界值时,就不拒绝H0,认为两样本率差异无统计学意义简述当不满足行×列的2χ检验的条件时的处理办法。当不满足行×列的2χ检验的条件(R×C表中不宜有1/5的格子数小于5,或有一个格子的理论频数小于1时,可采用下述方法处理:(1)增大样本例数,(2)删除理论数较小的行和列,(3)将理论数较小的行或列与性质相近的行或列合并,但在合并时应注意合并的合理性。(2)和(3)两种处理方法会丢失部分信息。请简述正态分布的特征1、曲线在横轴上方均数处最高;2、以均数为中心,左右对称;3、正态分布有两个参数:(1)μ:位置参数,确定曲线位置当σ一定时,μ越大,曲线越向右移动;μ越小,曲线越向左移动。(2)σ:离散度参数,决定曲线的形态:当μ一定时,σ越大,表示数据越分散,曲线越“胖”;σ越小,表示数据越集中,曲线越“瘦”。4、正态分布曲线下的面积有一定的分布规律简述直线相关与秩相关的区别Pearson积差相关Spearman秩相关双变量正态分布r为参数统计量原始数据偏峰分布、分布未知、等级资料rs为非参数统计量秩次都用于刻画两变量间线性相关的方向与密切程度都要求各个体间满足独立性参数检验与非参数检验有何区别,各有何优缺点?(1)区别:参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。非参数检验:不依赖总体分布的具体形式,检验分布位置是否相同。(2)优缺点:参数检验:优点是符合条件时,检验效能高。缺点是对资料要求严格,如等级资料、分布不明或末端有不明确数据的资料不能用参数检验,要求资料的分布类型已知且总体方差相等。非参数检验:优点是应用范围广、简便;缺点是对于符合参数统计的资料,如果用非参数统计会造成资料信息的丢失,致使检验效能下降,犯第二类错误的概率增大。故符合参数统计条件的资料,要首先选用参数统计的方法。当参数统计的应用条件得不到满足时,应选用非参数统计。