医学统计学重点简答题

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

一、平均水平常用的统计指标及其适用范围?常用统计指标包括算术均数,几何均数,中位数。算术均数适用于对称分布,特别是正态分布的数据;几何均数适用于经对数变换后频数分布对称或呈等比级数的数据;中位数主要适用于三种情形:非正态分布资料(对数正态分布除外)。频数分布的一端或两端无确切数据的资料。总体分布不清楚的资料。二、应用相对数的注意事项1.计算相对数时应有足够的观察单位数。例数太少会使相对数波动较大,这种情况下最好用绝对数表示。2.正确计算合计率。计算观察单位不等的几个率的合计率(平均率)时,不能将几个率直接相加求其平均率,而应分别将分子分母合计,再求出合计率。3不能以构成比代替率。构成比说明事物内部各部分所占的比重,不能说明某现象发生的频率或强度。4.注意资料的可比性。在比较相对数时,除了要比较的因素外,其余的因素应尽可能相同或相近。5.样本率或构成比的比较应做假设检验。由于样本率或构成比也存在抽样误差,比较两个或多个率或构成比时,不能凭样本率或构成比的差别作出结论,而必须进行差别的假设检验。三、正常值范围与置信区间的区别区别点总体均数置信区间参考值范围含义从同一总体中重复抽取若干个相互独立的样本,按(1-a)的置信度所计算的总体均数的可能范围。“正常人”的解剖、生理、生化某项指标的波动范围。总体均数可能所在的范围个体值的波动范围计算公式未知n较小:/2,XXtS已知/2XXZ,或未知但n较大/2XXZS正态分布:/2XZS偏态分布:Xp%~X(100p)%用途总体均数的区间估计医学参考值估计,即绝大多数(如95%)观察对象某项指标的分布范围四、标准误与标准差的区别与联系。区别点标准误标准差含义样本均数的标准差,描述样本均数的抽样误差,即样本均数与总体均数的接近程度。描述个体间的变异程度计算公式1k)xx(s2x1n)xx(s2用途总体均数的区间估计医学参考值范围估计相似点性质相似,都是用来说明变异程度五、简述四格表卡方检验统计方法的选择条件六、行×列表资料χ²检验的注意事项1.行×列表资料中各格的理论频数T均不应小于1,并且1≤T<5的格子数不宜超过格子总数的1/5,否则可能产生偏性。处理的方法有三种:增大样本含量,使理论频数增大;根据专业知识,删去理论频数太小的行或列或将理论频数太小的行或列与性质相近的邻行或邻列合并。改用双向无序R×C表的Fisher确切概率法。2.多个样本率比较,若所得统计推断为拒绝H0,接受H1时,只能认为各总体率之间总的来说有差别,但不能说明任两个总体率之间均有差别。要进一步推断哪些两总体率之间有差别,需进一步做多个样本率的多重比较。3.对于有序的R×C表资料不宜用χ²检验。因为行×列表资料的χ²检验与分类变量的顺序无关。七、参数检验和非参数检验的适用范围和优缺点参数检验适用范围:总体分布已知、总体方差齐的资料优点:能充分利用资料提供的信息,检验效能较高。缺点:对样本所对应的总体分布有比较严格的要求,这样就限制了它的适用范围。非参数检验适用范围:1总体分布类型不明确的计量资料2偏态资料3等级资料4不满足参数检验条件的资料,如个别数据较大或数据的一端或两端是不确定数值。5初步分析优点:1适用范围广,可应用于参数检验难以处理的资料。2受限条件少,不受总体分布的限制3具有稳健性4方法简便,易于理解和掌握。缺点:对于符合参数检验的资料,若采用非参数检验,会导致信息损失和检验效能下降,增加犯第二类错误的概率。八、卡方检验基本思想。X²反应的是实际频数与根据假设检验算得的理论频数吻合程度。若检验假设H0:π1=π2成立,四个格子的实际频数A与理论频数T相差不应该很大,即统计量不应该很大。如果X²值很大,即相对应的P值很小,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2。九、简述最小二乘法与最大似然函数法在原理及应用上的异同之处。(1)原理方面:最小二乘法是一种根据残差平方和最小来求解方程系数;最大似然法是一种非线性拟合方法,常用于Logistic回归分析中回归模型的估计,其基本思想是先建立似然函数和对数似然函数,再通过使对数似然函数最大来求解相应的参数值。(2)应用方面:最小二乘法用于在线性回归分析中回归系数的确定;最大似然法常用于Logistic回归,cox回归中回归系数确定。十、简述偏相关系数与复相关系数的区别一、概念不同:偏相关系数是在对其它变量的影响进行控制的条件下,衡量多个变量中某两个变量之间的线性相关程度和相关方向的指标;复相关系数是用来度量一个变量与其它多个自变量之间的线性相关程度的指标,而不能反映其互相之间线性相关的方向。用R表示。二、计算不同:偏相关系数等于两个相应的偏回归系数的几何平均数;复相关系数R=根号下R2=根号下SS回/SS总三、取值范围不同:偏相关系数取值范围为[-1,1];而复相关系数则为[0,1]四、假设检验不同:偏相关系数的假设检验等同于偏回归系数的t检验.;复相关系数的假设检验等同于回归方程的方差分析。十一、简述方差分析基本思想及应用条件基本思想:根据资料设计的类型及研究目的确定变异的来源、种类,将全部观察值之间的总变异分解为两个或多个部分,每个部分的变异可由某因素的作用来解释。通过比较要研究的处理因素所引起变异的均方与随机误差引起变异的均方,借助F分布做出统计推断,以判断该处理因素对效应指标是否有影响。应用条件:1各样本互相独立,均服从正态分布;2各样本的总体方差相等即方差齐性。十二、简述假设检验P与a的区别与联系。a与P均为概率,其中a是指拒绝了实际上成立的H0所犯错误的最大概率,是进行统计推断时预先设定的一个小概率事件标准。P值是由实际样本获得的,在0成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。在假设检验中通常是将P与a对比来得到结论,若P≤a,则拒绝H0,接受H1,有统计学意义,可以认为……不同或不等;否则,若P>a,则不拒绝H0,无统计学意义,还不能认为……不同或不等。十三、简述医学统计工作的基本步骤及其内涵。1统计设计:是对资料收集、整理和分析全过程的设想和安排,是影响研究成败的关键环节。2收集资料:是根据设计的要求,采集准确可靠的原始数据的过程。3整理资料:是将原始数据进行清理、核查、归纳的过程,以使其系统化、条理化,便于进一步的计算和分析。4分析资料:是根据研究的目的,计算有关统计指标,并进行统计学分析,再结合专业知识,做出科学合理的解释。主要包括统计描述与统计推断。十四、简述在均数比较的统计推断中,t检验和F检验的应用有何不同?t检验的基本思想是当总体方差未知时,用样本的标准差来代替总体的标准差,将标准正态变换(u变换)转化为t变换,利用t分布(与自由度v相关)进行统计推断。t检验与方差分析:(1)t检验与方差分析均用于总体均数间的比较;(2)t检验用于两个总体均数的比较,当比较多个总体均数时,t检验无能为力,此时只能用方差分析;(3)完全随机设计时,如果进行两样本均数的比较,F=t²。十五、简述检验效能的应用意义,影响检验效能估计的因素有哪些,这些因素是如何影响的。1-β称为假设检验的检验效能,也叫把握度。是指当所研究的两总体参数确有差别(即事实上Ho不成立)时,按检验水准α通过假设检验能发现它们有差别(即拒绝Ho)的概率。影响检验效能的影响因素有1总体差别、2检验水准α、3总体的变异程度(标准差)、4样本含量n、,三个正向一个反向。总体差别、检验水准、样本含量越大,检验效能越大。变异程度越大,检验效能越小。十六、多元线性回归、logistic回归与Cox比例风险模型在应用上有何不同。联系:三者均可研究应变量Y与多个自变量X间的数量依存关系,都可用于影响因素的识别和筛选,自变量类型基本相同,都可以有数值变量和分类变量十七、简述简单线性相关和简单线性回归的区别与联系区别:1资料要求不同:简单线性相关要求两个变量满足双变量正态分布;简单线性回归要求应变量Y是服从正态分布的随机变量,而X可以是固定的非随机变量(作I型回归模型),也可以是服从正态分布的随机变量(作II型回归)。2应用不同:简单线性相关用来说明两变量间的简单线性相关关系,没有依存关系;简单线性回归用来说明两变量间依存变化的数量关系。3r和b取值范围不同:-1≤r≤1;-∞b+∞。4r没有单位,b有单位。联系:1.对同一组数据,若同时计算b和r,其正负号是一致的。2.b和r的假设检验是等价的,即对同一样本,二者的t值相等,tr=tb。3.回归可解释相关。相关系数的平方r2(又称决定系数)是回归平方和与总的离均差平方和之比,故回归平方和是引入相关变量后总平方和减少的部分。4r和b可以互相换算r=).().(xybyxbb=rlxxlyy/

1 / 5
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功