一.名词解释1.样本(sample):是从总体中随机抽取的部分有代表性的观察单位变量值的集合。2.定量资料:又称计量资料(measurementdata),使用定量的方法测定观察单位某项指标数值的大小所得的资料称定量资料。3.参数:总体的统计指标。4.Ⅰ型错误:拒绝了实际上是成立的H。。5.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间差异以及各样本统计量之间的差异。6.标准化法:就是在一个指定的标准构成条件下进行率的对比的方法。7.相对数(relativenumber):是两个有联系的指标之比。8.变异(variation):由于生物个体的各种指标所受影响因素是极其复杂的,同质的个体间各种指标存在差异,这种差异称为变异。9.中位数(median,M):将一组变量值从小到大按顺序排列,位次居中的变量值称为中位数。10.实验研究:是使设计的实验因素或处理因素在其他干扰因素被严格控制的条件下,观察其他实验结果或实验效应的作用及影响。11.率:某现象实际发生的观察单位数与可能发生该现象的观察单位总数之比,用以说明某。现象发生的频率或强度。12.定性资料(qualitativevariable):将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料称为定性资料。13.实验设计:是指研究人员对实验因素做合理的,有效的安排,最大限度的减少实验误差,使实验研究达到高效,快速和经济的目的。14.构成比(proportion):说明某一事物内部各组成部分所占比重或分布。15.直线相关(linearcorrelation):当两事物或现象在数量上的协同变化呈直线趋势时则称为直线相关。16.率的标准化:两组或多组率之间比较,当各组内部的构成比,诸如年龄、性别、工龄、病情轻重、病程长短等明显不同时,则不能直接比较两组或多组的总率,得出结论。17.直线回归:在描述两变量间的关系式,若散点图呈直线趋势或有直线相关关系,可进行直线相关回归分析。18.总体(population):是根据所研究目的所确定的同质观察单位某项变量值的集合。19.盲法设计(blinding):是指使研究人员或病人不知道具体的研究设计方案。20.同质:是指观察单位间被研究指标的主要影响因素相同或基本相同。21.总体均数的可信区间:按一定的概率大小估计总体均数所在的范围。常用的可信度为95%和99%及其可信区间。22.假设检验(hypothesistest):是统计学的主要内容,是通过统计检验方法(如t检验、u检验、F检验、Χ²检验、秩和检验等)来推断两组或多组统计指标的差异是抽样误差造成的还是有本质的差别。23.随机化原则(randomization):是指总体中的每一个个体都有均等的机会被抽取或被分配到实验组或对照组中去。24.动态数列(dynamicseries):是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用来说明事物在时间上的变化和发展趋势。25.随机测量误差(randommeasurementerror):在消除了系统误差的前提下,由于非人为的偶然因素,对同一样本多次测定结果不完全一样,结果有时偏大有时偏小,没有倾向性,这种误差叫做随机测量误差。26.算数均数(arithmeticmean):描述一组数据在数量上的平均水平。27.极差(rangeR):即最大值与最小值之差,用于资料的粗略分析。28.方差(variance):表示一组数据的离散情况,由离均差的平方和除以样本个数得到。29.标准差(standarddeviation):是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料。30.变异系数(coefficientofvariation,CV):用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。31.正态分布(normaldistribution):若资料x的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。通常记为N(μ,σ²)表示均数为μ,标准差为σ的正态分布。32.标准正态分布:均数为0、标准差为1的正态分布。33.统计推断(statisticalinference):通过样本指标来说明总体特征,这种通过样本获取总体信息的过程称为统计推断。34.抽样误差(samplingerror):由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异。35.标准误:通常将样本统计量的标准差称为标准误。36.可信区间(confidenceinterval,CI):按预先给定的概率确定的包含未知总体参数的可能范围。37.参数估计(estimationofparameter):指用样本统计量估计总体参数,分为点估计和区间估计两种。38.假设检验中P的含义:指从H。规定的总体随机抽的等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。39.检验效能:1-β称为检验效能,是指当量总体确有差别,按规定的检验水准α所能发现该差异的能力。40.检验水准:是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时犯错误的概率称为检验水准,记为α。41.方差分析(analysisofvariance,ANOVA):就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过各变异来源的均方与误差均方比值的大小,借助F分布做出统计推断,判断各因素对观测指标有无影响。42.随机区组设计(randomizedblockdesign):实现将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对象随机的分配到各处理组,这种设计叫做随机区组设计。43.非参数统计(noparametrictest):针对某资料的总体分布难以用某种函数式来表示,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制,故称非参数统计法。44.相关系数:γ又称积差相关系数,以符号γ表示样本相关系数,ρ表示总体相关系数。是指具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。45.人口总数:是指一个国家或地区在某特定时间点上存活人口的总和。46.新生儿死亡率(neonatalmortalityrate,NMR):指某地平均每千名活产数中未满28天地新生儿死亡数。47.围产儿死亡率:胎儿体重达到1000克以上或孕期满28周至出生后7天以内的时期,在此期间的死亡。48.婴儿死亡率:指某年平均每千名活产中不满一周岁婴儿的死亡率。49.死因顺位:指按各类死因构成比从高到低排列的位次,说明死因的重要性,反映了各种死亡原因导致死亡的严重程度。50.生存分析(survivalanalysis):指将终点事件的出现与否和到达终点所经历的时间结合起来分析的一类统计分析方法。51.删失数据(censoreddata):在规定观察期内对某些观察对象由于某种原因未能观察到终点事件发生,并不知道确切的生存时间,称为生存时间的删失数据。其原意为:①研究结束时重点事件尚未发生②失访③病人死于其他原因等终止观察。52.寿命表(lifetable):通过计算一系列指标来反映各个年龄死亡水平和期望寿命的指标之一,寿命表分为定群寿命表和现实寿命表。53.可接受性因素:指被调查者对调查表的接受程度。54.死因构成比(proportionofdyingofaspecificcause),也称比例死亡比(proportionatemortalityrate,PMR):指全部死亡人数中,死于某死因者所占的百分比,说明各种死因的重要性。55.疾病统计(morbiditystatistics):是居民健康统计的重要内容之一,它从数量方面研究疾病在人群中的发生、发展和流行分布的特点与规律。为病因学研究、防治疾病和评价防治工作效果提供科学依据。简答1.频率分布表的用途:⑴描述变量的分布类型⑵揭示变量的分布特征⑶便于发现某些离群值或极端值⑷便于进一步计算统计指标和统计分析2.定量变量的使用条件:⑴算术平均数适用于对称分布,特别适用于服从于正态分布的变量⑵几何均数适用于可经对数转换为对称分布的变量⑶中位数适用于各种分布的变量,常用于描述偏峰分布,或分布的一端或两端无确定数值的资料。3.常用的描述定量变量变异程度的统计指标:⑴极差,只利用最大值和最小值的信息,易受样本含量的影响,不稳定⑵四分位数间距,适用于各种分布的变量⑶方差和标准差,适用于对称分布,特别是服从正态分布的变量⑷变异系数,常用于量纲不同或均数相差较大时变量间变异程度的比较。⑸常将算数均数和标准差结合描述服从正态分布的变量⑹常将中位数与上、下四分位数结合描述偏锋分布的变量4.应用相对数时的注意事项:⑴理解相对数的含义不可望文生义⑵频率性指标的解释要紧扣总体和属性⑶计算相对数时分母应有足够数量⑷正确计算合计频率⑸注意资料的可比性⑹样本相对数的统计推断5.应用标准化法的注意事项:⑴标准化法的应用范围很广⑵标准化后的标准率⑶标准化法的实质是找一个“标准”,使两组得以在一个共同的“平台”上进行比较⑷两样本标准化率是样本值,存在抽样误差。6.简述标准差S和均数的标准误Sₓ‾之间的区别与联系:标准差标准误区别意义:描述一组变量的离散程度并可以作为总体标准差的点估计描述样本均数的离散程度,并且是样本均数的标准差估计值应用:1.标准差越小,说明变量值围绕均值分布越紧密,均数的代表性越好2.x̅±ZₐS估计变量值的分布1-α范围1.标准误越小,说明样本均数和总体均数的平均差异越小,用样本均数估计总体均数的可靠性越大2.用x̅±tₐSₓ̶估计总体均数的1-α范围与n的关系:n越大,样本标准差S靠近总体标准差σ的可能性越大,即样本标准差越稳定n越大,标准误越小联系1.都是描述变异度的统计指标2.σₓ̶=σ/√n,σₓ̶与σ成正比,与√n成反比3.n一定时,同一组资料,标准差越大,标准误也越大7.置信区间有哪两个要素,在使用时应注意什么:两要素分别为:可信度和精确性在同一样本的情况下,可信度1-α越大,置信区间越宽,说明用此区间估计总体均数的可信度越高;精确性反应为置信区间的宽度,表示区间估计的精度,区间越窄,精度越高。8.简述直线回归与直线相关的区别:⑴.资料要求:相关,要求X、Y服从双变量正态分布,这种资料在进行回归分析时称为Ⅱ型回归资料;回归,要求Y在给定某个X值时服从正态分布,X是可以精确测量和严格控制的变量,称为Ⅰ型回归。⑵.应用:说明两变量间相互关系用相关分析,此时两变量的相互关系是平等的;而说明Y的总体均数与X间线性变化的数量关系用回归分析,用以说明Y如何依赖于X而变化。⑶.意义:r说明具有直线关系的两变量间相互关系的方向与密切程度;b表示X每变化一个单位所导致Y的平均变化量。⑷.计算:r与b可以相互换算。⑸.取值范围:–1≤r≤1,–∞≤b≤﹢∞。⑹.单位:r没有单位,b有单位。9.简述正态分布、二项分布、poisson分布三者间的区别与联系:二项分布、poisson分布是离散型概率分布,用概率函数描述其分布状况,而正态分布是连续型概率分布,用密度函数和分布函数描述其分布状况。Poisson分布可以视为n很大而p很小的二项分布。当n很大而nπ或n(1-π)都不是很小的时候。二项分布渐近正态分布,当λ≥20的时候poisson分布渐近正态分布。10.统计表与统计图的用途:⑴.描述变量分布类型⑵.解释变量分布特征⑶.便于发现某些离群值或极端值⑷.便于进一步计算统计指标和统计分析11.二项分布的使用条件:⑴.各次试验相互独立⑵.结果为二分类且恒定⑶.发生与不发生的概率为常数12.正态分布的分布特征:⑴.关于x=u对称⑵.在x=u处取得最大值,且在x±u处有拐点⑶.曲线下面积为1⑷.u决定曲线在