统计学简答题汇总

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1、标准正态分布(u分布)与t分布有何异同?相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)不同点:t分布是一簇分布曲线,t分布的曲线的形状是随自由度的变化而变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为1。3、简述直线回归与直线相关的区别。1资料要求上不同:直线回归分析适用于应变量是服从正态分布的随机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布的资料。2两种系数的意义不同:回归系数是表明两个变量之间数量上的依存关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快;相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越大,两个变量的关联程度越大。第一章医学统计中的基本概念2、抽样中要求每一个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。(1)代表性:就是要求样本中的每一个个体必须符合总体的规定。(2)随机性:就是要保证总体中的每个个体均有相同的几率被抽作样本。(3)可靠性:即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异,只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。需要作“样本例数估计”。3、什么是两个样本之间的可比性?可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。实习一统计研究工作的基本步骤1、什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别?医学统计学:是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科统计学:是研究数据的收集、整理、分析与推断的科学。卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。生物统计学:是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计,取样,分析,资料整理与推论的科学。2、医学统计的资料主要来源于那些方面?有何要求?医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等。实验数据是指在试验过程中活的的数据;现场调查资料主要来源于大规模的流行病调查获取的资料;医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等;报表有卫生工作基本情况年报表、传染年(月、日)报表、疫情旬(年、月、日)报表等;报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等。这些资料的手机过程中,必须进行质量抗旨,包括它的统一性、确切性、可重复性。这些原始数据的精读和偏性应有明确的范围。3、医学统计学的资料类型有哪些?(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurementdata)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(countdata)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O四种血型的人数等。(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinaldata)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。4、常见的三类误差是什么?应采取什么措施和方法加以控制?常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。实习二单变量资料的统计描述1、试述频数表的要素及用途。要素:组段,频距。用途:①描述资料的分布特征和分布类型。频数分布有两个重要特征:集中趋势和离散趋势。大部分观察值向某一数值集中的趋势称为集中趋势,常用平均数指标来表示,各观察值之间大小参差不齐。频数由中央位置向两侧逐渐减少,称离散趋势,是个体差异所致,可用一系列的变异指标来反映。②便于进一步计算有关指标或进行统计分析。当数据较多且需手工计算时,常先编制频数表,再进行统计计算。③发现特大、特小的可疑值。如果频数表的一端或两端出现连续几个组段的频数为零后,又出现少数几个特大值或特小值,使人怀疑其是否准确,需进一步检查和核对并做相应处理。④当样本含量比较大时,可用各组段的平率作为概率的估计值。2、描述单变量资料的统计指标分哪两大类,分别是什么指标?分类:①描述数据分布集中趋势的指标:算术均数、几何均数、中位数。②描述数据分布离散程度的指标:极差、四分位数间距、方差、标准差、变异系数。3、试述平均数、标准差、变异系数的含义及用途?4、标准正态分布曲线下面积有何分布规律?所有的正态分布曲线,在υ左右的相同倍数的标准差范围内的面积相同。并且,在υ±σ范围内的面积约为68.3%;在υ±1.96σ范围内的面积约为95%;在υ±2.58σ范围内面积约为99%。5、同一资料的标准差是否一定小于均数?均数和标准差是两类不同性质的统计指标.标准差用于描述数据的变异程度,变异程度大,则该值大,变异程度小,则该值小.标准差可大于均数,也可小于均数。实习三单变量资料的统计推断1、标准差与标准误有何区别和联系?•区别:1.含义不同:⑴s描述个体变量值(x)之间的变异度大小,s越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。⑵标准误是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。2.与n的关系不同:n增大时,⑴sσ(恒定)。⑵标准误减少并趋于0(不存在抽样误差)。3.用途不同:⑴s:表示x的变异度大小,计算cv,估计正常值范围,计算标准误等⑵:参数估计和假设检验。•联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。2、简述Ⅰ型错误和Ⅱ型错误的区别和联系。·区别:Ⅰ型错误(弃真):拒绝实际成立的H0,型错误的概率记为α。(1-a)即置信度:重复抽样时,样本区间包含总体参数(μ)的百分数。当p≤α而拒绝H0时,只能犯Ⅰ型错误,不可能犯Ⅱ型错误。Ⅱ型错误(存伪):不拒绝实际不成立的H0,Ⅱ型错误的概率记为β。(1-β)即把握度(或检验效能:两总体确有差别,被检出有差别的能力。当p≥α而拒绝H0时,只能犯Ⅱ型错误,不可能犯Ⅰ型错误。·联系:对同一资料,α与β反方向变化,若要同时减小α与β,唯一的办法是增加样本含量。3、可信区间与参考值范围的不同点。应注意:可信区间与参考值范围的意义、计算公式和用途均不同。1.从意义和用途来看95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指按95%可信度估计的总体均数的所在范围。可信区间用于估计总体参数,总体参数只有一个。参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限。2.从计算公式看:若指标服从正态分布,95%参考值范围的公式是:±1.96s。总体均数95%可信区间的公式是:。前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。4、在统计推断中,如何区别单侧检验和双侧检验?如果将拒绝性概率平分于理论抽样分布的两侧,称为双侧检验。例如选定显著性水平α=0.05,双侧检验就是将α概率所规定的拒绝区域平分为两部分而置于概率分布的两边,每边占有=0.025。双侧检验只强调差异是否显著而不强调方向性。如果将拒绝性概率置于理论抽样分布的一侧(左侧或右侧),称为单侧检验(右侧检验或左侧检验)。单侧检验强调差异的方向性。在具体的假设检验中,选择双侧检验或单侧检验可分为以下三种情况:第一种:H0:μ=μ0:μ≠μ0双侧第二种:H0:μ≥μ0:μ<μ0单侧(左侧)第三种:H0:μ≤μ0:μ>μ0单侧(右侧)5、t检验、z检验的公式有那些类型,在应用上有何异同?t检验:当样本例数n较小时,要求样本取自正态总体。t检验的类型:单样本t检验,独立t检验,配对t检验z检验:样本例数较大,或n虽小而总体标准差已知。6、假设检验和总体均数区间估计有何联系?假设检验:是对总体做出某种假定,然后根据样本信息推断总体是否成立的一类统计学方法总称。假设检验有三个基本步骤:①建立假设和确定检验水准;②选择检验方法和计算检验统计量;③确定P值和做出统计推断结论。总体均数的估计:1、点估计:样本统计量直接作为总体指标的估计值。它未考虑抽样误差的大小。2、区间估计:按预先给定的概率(1-α)确定的包含未知总体参数的可能范围。实习四方差分析1、方差分析的基本思想是什么?方差分析(analysisofvariance,ANOVA)的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sumofsquaresofdeviationsfrommean,SS)和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断,判断各因素对各组均数有无影响。2、t检验和F检验的使用条件和应用范围有何异同?t检验适用于两个样本均数的比较,F检验适用于多个样本的比较。t检验的应用条件:要求各样本来自相互独立的正态总体且各总体方差齐。方差分析的应用条件(1)各样本是相互独立的随机样本,且来自正态分布总体。(2)各样本的总体方差相等,即方差齐性。实习五计数资料的统计推断与描述1、率的标准化的意义及基本思想。当比较的两组资料内部各小组率明显不同,且各小组观测例数的构成比也明显不同时,直接比较两个合计率是不合理的。因为期内部构成比不同,往往影响合计率的大小,需要统一的内部构成进行调整后计算标准化率,使其具有可比性,这种方法称为率的标准化。率的标准化的基本思想:要比较两个总率时,发现两组资料的内部构成(如年龄、性别构成等)存在明显不同,而且影响到了总率的结果,这时就不宜再直接比较总率,而应考虑采用标准化法。标准化法的基本思想,就是采用统一的标准(统一的内部构成)计算出消除内部构成不同影响后的标准化率(调整率),然后再进行比较。2、常用相对数指标有哪些?它们在计算和意义上有何不同?率(强度相对数,频率相对数)、构成比、相对比应用相对数时应注意的问题:⑴计算相

1 / 7
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功