98卫生统计学复习题

hydegaogaiga
1 ℃
2020-05-28

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第一章绪论统计学（statistics）：就是收集数据、整理数据、分析数据，并由这些数据得到结论的原则和方法。是一门处理数据中变异性的科学与艺术，内容包括收集、分析、解释和表达数据，目的是求得可靠的结果。总体（population）：根据研究目的确定的同质研究对象的全体。样本（sample）：是指从研究总体中抽取的一部分有代表性的个体，这些个体组成样本。抽样（sampling）：是从研究总体中抽取少量有代表性的个体。同质(homogeneity)：总体中的个体具有相同的性质，它是进行统计分析的前提。变异(variation)：因个体差异引起的现象。同一总体中不同个体间存在的差异。计数资料：将全体观测单位按照某种性质或特征分组，然后再分别清点各组观察单位的个数。等级资料：介于计量资料和计数资料之间的一种资料，通过半定量方法测量得到。将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位称为等级资料。统计量（statistic）：在科研工作中，通过对样本中的观察单位的变量值进行统计分析所得到的统计指标。参数（parameter）：是反映总体特征的统计指标。概率（probability）：表示一个事件发生的可能性大小的数。（概率的统计定义：在一定条件下，重复做n次试验，nA为n次试验中事件A发生的次数，如果随着n逐渐增大，频率nA/n逐渐稳定在某一数值p附件，则数值p称为事件A在该条件下发生的概率。第二章定量资料的统计描述计量资料：通过度量衡的方法，测量每一个观察单位的某项研究指标的量的大小，得到的一系列数据资料。频数：对一个随机变量做出重复的观察，其中某变量值出现的次数。频数表：当变量值个数较多时，对各变量值出现的频率列表即为频率分布表（frequencydistributiontable），简称频率表。对称分布：频数集中位置在正中，左右两侧频数分布大体对称。偏峰分布：集中位置偏向一侧，频数分布不对称。峰向左侧偏移的分布为正偏峰分布，而峰向右侧偏移的分布称负偏峰分布。加权法：当资料中相同观察值较多时，可将相同观察值的个数，即频数f乘以该观察值x，以代替相同观察值逐个相加。各组段的频率称为权重系数。中位数（median,M）：是将一组观察值从小到大按顺序排列，位次居中的那个数。百分位数（percentile，P）：是一个数值，它将原始观察值分为两部分，理论上有x%的观测值比Px小，有（100-x）%的观测值比Px大。离散趋势：即个体值之间的变异程度，数据越分散，变异程度越高。极差（range，R）：也叫全距，表示一组观察值中最大值与最小值之差，反映个体差异的范围。方差（variance）：用来度量随机变量和数学期望（即均值）之间的偏离程度，由离均差的平方和除以样本个数得到。标准差（standarddeviation）：也称均方差，是各数据偏离平均数的距离的平均数，是描述反应正态分布计量资料离散程度的指标。是方差的正平方根，使用的量纲与原量纲相同，适用于近似正态分布的资料，大小样本均可，最为常用。变异系数（coefficientofvariation）：是衡量资料中各观测值变异程度的一个统计量，用标准差与平均数的比值来表示，用于量纲不同和变量间或均数相差较大的变异程度的比较。第三章定性资料的统计描述定性资料：观察结果表现为互不相容的类别或属性，资料整理时，按某种属性分类，然后清点每类的数据。定性变量分为多分类和二分类变量。相对数(relativenumber)：两个有联系的指标的比。率(rate)：描述某种现象发生的频率和强度的指标。构成比(constituentratio)：事物内部各组成部分所占整体的比重或分布，常用百分数表示，又称作百分比(percentage)。相对比(ratio)：两个有关指标的比，描述二者的相对水平，反映一个指标是另一个指标的几倍或几分之几。两个指标可以是绝对数，也可是相对数；可以性质相同或不同。标准化率：寻找一个统一的分布作为标准组，然后每个比较组均按该分布标准计算相应的率，所得到的率是相对于标准组的，故称为标准化率标准化法：常用于内部构成不同的两个或多个率比较的一种方法，基本思想是指定一个统计标准，按指定标准计算调制率，使之具有可比性以后再比较，以消除由于内部构成不同对总率比较带来的影响。标准化死亡比(standardmortalityratioSMR)：(或发病比、患病比等)，即被标化组实际死亡（发病、患病等）数与预期死亡（发病、患病等）数之比。期望寿命：指0岁时的预期寿命。一般用“岁”表示。即在某一死亡水平下，已经活到X岁年龄的人们平均还有可能继续存活的年岁数。实际人口：某一时点，某一地区调查时实际存在的人数（包括临时在该地的人）。法定人口：某一地区常住居民人数。性别比：男性人口与女性人口的比值。老龄人口比重：65岁及以上的人口称老龄人口。老龄人口占总人口的比例即为老龄人口比重。人口金字塔：是一种用几何图形来形象地表示人口性别年龄构成的方法。它以年龄为纵轴，由小到大从基底往上排列，以各年龄组男女人口各占总人口的百分构成（或人口的绝对数）为横轴，男性在左边，女性在右边来绘制的直方图，其图形形如金字塔，故称为人口金字塔。粗出生率（CBR)：指某年每千人口中的活产数总生育率（GFR）：也称普通生育率，是指某年的活产数与同年育龄妇女人口数之比，通常用千分率表示。年龄别生育率（ASFR)：也称年龄组生育率，是指某年每千名某年龄育龄妇女的活产数。总和生育率(TFR)：是一定时期，每岁一组的年龄别生育率总和。粗死亡率(简记为CDR）：也称普通死亡率，是指某年平均每千名人口中的死亡数。年龄别死亡率（ASDR）：也称年龄组死亡率，是指一年内某年龄组死亡人数与相应的平均人口数之比。婴儿死亡率（IMR）：是指某年不满1岁的婴儿死亡数与同年活产数之比。新生儿死亡率（NMR）：指某地某年活产儿中未满28天的新生儿死亡频数。某病病死率（CFR）：指在某一年间内（1年）换某病者因该病死亡的百分比。发病率（incidencerateIR)：表示在观察期内，可能发生某种疾病的一定人群中新发生该病的频率。患病率（prevalenceratePR）：又称现患率，表示在某时点上受检人数中现患某种疾病的频率。有效率：接受治疗的病人中治疗有效的频率动态数列(dynamicseries)：是一系列按时间顺序排列起来的统计指标（可以为绝对数，相对数或平均数），用以观察和比较该事物在时间上的变化和发展趋势。绝对增长量：是说明事物在一定时期增长的绝对值,即报告期指标值与基期指标值之差。平均发展速度：是各环比发展速度的几何平均数，说明某事物在一个较长时期中逐期（如逐年）平均发展的程度。平均增长速度：是各环比增长速度的平均数，说明某事物在一个较长时期中逐期平均增长的程度。第四章统计表与统计图简单表（simpletable）：只按单一变量分组，由一组横标目和一组纵标目组成复合表：又称组合表（combinativetable），是将两个或两个以上变量结合起来分组，即由一组横标目和两组及以上纵标目结合起来作为“主语”。统计图（statisticalchart）：是用点的位置、线段的升降、直条的长短、面积的大小等来表达统计数据的一种形式。第五章常用概率分布正态分布(normaldistribution)：又称高斯分布，是医学和生物界最常见的分布。该分布是以均数为中心，低于均数的频数与高于均数的频数大致相等，越接近均数，频数越多，离均数越远，频数逐渐减少，形成以均数为中心两侧基本对称的钟型分布。用N（μ、σ2）表示。正态曲线（normalcurve）：是一条高峰位于中央，两侧逐渐下降并完全对称，曲线两端永远不与横轴相交的钟形曲线。标准正态分布（standardnormaldistribution)：总体均数为0、总体标准差为1的正态分布。医学参考值范围（referenceranges）：亦称医学正常值范围，是指特定人群“正常人”的解剖、生理、生化及组织代谢产物含量等数据的波动范围。第六章参数估计基础总体分布(populationdistribution)：是总体中各元素的观察值所形成的频数或频率分布通常是未知的，可以假定它服从某种分布。样本分布(sampledistribution)：也称经验分布，是一个样本中各观察值的频数或频率分布。当样本容量n逐渐增大时，样本分布逐渐接近总体的分布抽样分布(samplingdistribution)：是某一样本统计量的全部可能取值的概率分布。抽样误差（Samplingerror）：由抽样引起的样本统计量与总体参数间的差异样本均数的标准差：称为样本均数的标准误(standarderrorofmean,SE)，简称均数标准误，它反映样本均数之间的离散程度，也反映样本均数抽样误差的大小。标准误（standarderror）：样本均数的标准差，即均数的标准误SEM，用于表示均数抽样误差的指标，反映样本均数之间的离散程度和样本均数抽样误差的大小。t分布：在实际的工作中，往往σ是未知的，常用s作为σ的估计值，为了与μ变换区别，称为t变换，统计量t值的分布称为t分布可信区间（CI）：按一定的概率或可信度（1－α）用一个区间来估计总体参数所在的范围，该范围通常称为参数的可信区间或者置信区间。中心极限定理(centrallimittheorem)：设从均值为，方差为2的一个任意总体中抽取容量为n的样本，当n充分大(通常n30)时，样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。参数估计：是指用样本指标（统计量）来估计总体指标（参数）点（值）估计（pointestimation）：即把样本统计量直接作为总体参数的估计值，如用样本均数来估计总体均数。这种方法虽然很简单，但是未涉及随机误差，而随机误差在抽样研究中是不可忽视的。区间估计（intervalestimation）：即按一定的概率估计总体均数在哪个范围，它把抽样误差引入估计量，确定具有特定概率意义的区间。参考值范围：指同质总体中大多数个体变量值的分布范围。95%参考值范围：指同质总体中95%的个体值分布在此范围内。它与标准差有关，各个体值变异越大，该范围越宽，分布也越分散。准确度(可信度)：反映在可信度1-的大小，即区间包含总体均数的概率的大小，当然愈接近1愈好；精度（精确度）：反映在区间的长度，当然长度愈小愈好。第七章假设检验基础统计推断（statisticalinference）：由样本信息对相应总体的特征进行的特征性进行推断。假设检验(Hypothesistesting)：亦称显著性检验(significancetest)，对所估计的总体首先提出一个假设，然后通过样本数据去推断是否拒绝这一假设。无效假设：或者叫做零假设(nullhypothesis)，假定两总体之间无差异，或者说差异仅由抽样误差造成的。自由度：n个变量中，可自由取值的变量的个数。P值：在零假设成立的条件下，出现统计量目前值更不利于零假设数值的概率。检验效能：当所研究的总体与H0确有差别时，按检验水平α能够发现它（拒绝H0）的概率。检验水准：是预先规定的，当假设检验结果拒绝H0接受H1下有差别的结论时犯错误的概率。变量变换：对资料数据进行数学变换，使得变换后的资料符合参数方法条件的一种方法。Ⅰ型错误：如果实际情况与H0一致，仅仅由于抽样的原因，使得统计量的观察值落到拒绝域，拒绝原本正确的H0，导致推断结论错误，称为Ⅰ型错误。Ⅱ型错误：如果实际情况与H0不一致，仅仅由于抽样的原因，使得统计量的观察值落到接受域，不能拒绝原本错误的H0，导致推断结论错误，称为Ⅱ型错误。第八章方差分析方差分析（ANOVA）：又称F检验，是通过对数据变异的分解来判断不同样本所代表的总体均值是否相同，用于比较两个或两个以上均数的差别。总变异：样本全部实验单位差异，其大小可以用全部观察值的均方表示组间变异：各处理组间观察值大小不等，这种变异为~，可用组间均方来表示组内变异：各处理组内部观察值大小不等，