第一章一、名词解释参数:指总体中全部观察单位的观测值所得的特征值,是一个固定的常数,通常是未知的。统计量:指由样本计算得到的反映样本资料特征的统计指标,为随机变量,取值在参数附近波动,可作为参数的估计值。同质:指观察单位通常具有某种共性,即相同的状况或属性等,观察单位之间常常“大同小异”。变异:指同质观察单位之间的差异。概率:是描述随机事件发生可能性大小的一个度量,为一个固定的常数,取值在0到1之间,常用p来表示。频率:在相同的条件下,独立地重复进行n次实验,随机事件A出现了f次,则称f/n为事件A出现的频率。抽样误差:指由抽样引起的样本统计量与总体参数之间的差异,或者不同样本统计量之间的差异。二、单项选择题1.E2.E3.B4.A5.D6.D7.B8.D9.C10.D三、简答题1.卫生管理统计的基本步骤一般分为统计设计、收集资料、整理资料和分析资料四个步骤。这四个步骤紧密联系,前一步是后一步的基础,每一个步骤的工作质量都会影响最终结论的正确性。2.卫生管理统计中通常将资料分为定量资料、定性资料和等级资料三种类型。定量资料是测量每个观察单位某项指标得到定量的测量值,表现为数值大小,且有度量衡单位,如某医院出院患者的住院日。定性资料是将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料,测量值为定性的,表现为互不相容的属性或类别,如某医院住院患者中A型、B型、AB型和O型人数。等级资料是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察档位数后得到的资料,具有半定量性质,表现为等级大小,如某病患者治愈、好转、无效、死亡的人数。第二章一、单项选择题1.C2.B3.E4.B二、简单题1.利用SPSS直接建立数据库一般分为两步,第一步变量设置,在变量视图(VariableView)中完成,第二步数据录入,在数据视图(DataView)中完成。在建立数据库过程中要注意以下问题:建立数据库之前应先确定研究中需要的指标,哪些是重要指标,哪些是次要指标,哪些是标识变量,尽量做到数据库中含有研究所需要的每一个指标,同时尽量避免冗余无用的指标。2.数据录入基本原则一个观测的数据在一行显示,一个指标即一个变量的数据在一列显示,录入完成后产生一个标准数据格式数据集。数据录入过程中要注意尽可能用数值变量代替字符变量,便于数据录入;要有标识变量,便于核查;对于多项选择题的录入要采用多重二分法或者多重分类法,切忌将多个选项录入一个变量。三、上机应用题在变量视图中做以下设置变量名数据类型小数点变量标签值标签资料类型No数值型0编号,标识变量NominalGender数值型0性别1=男,0=女NominalNation数值型0民族0=汉族,1=其它NominalIDno数值型0身份证号码NominalBirthd日期型0出生年月NominalAddress字符型0居住地NominalTel1数值型0电话(家)NominalTel2数值型0电话(手机)NominalTel3数值型0电话(其他)NominalRelative数值型0亲属关系1=子,2=女,3=其它人NominalA1数值型2身高ScaleA2数值型2体重ScaleA3数值型2腰围ScaleA4数值型2臀围ScaleA51数值型2SBP1ScaleA52数值型2SBP2ScaleA61数值型2DBP1ScaleA62数值型2DBP2ScaleA7数值型0服用降压药0=无,1=有NominalA8数值型0职业1=行政或其它管理,2=医护人员,3=教师,4=军警保安,5=文化艺术,6=理工技术人员,7=金融法律,8=文员或秘书,9=工厂工人,10=个体经营者,11=商业或服务人员,12=农民或渔民,13=家庭主妇,14=其它,99=不详Nominal注:其余各项默认即可。第三章一、名词解释1.单纯随机抽样:又称简单随机抽样,是按等概率原则直接从含有N个观察单位的总体中抽取n个观察单位组成样本。单纯随机抽样是最基本的抽样方法,也是其他抽样方法的基础。优点:均数(或率)及标准误的计算简便。缺点:总体较大时抽得的样本单元很分散,给实施调查带来困难。2.分层抽样:按与研究目的明显有关的因素(或特征),将观察单位分为若干的类型或组别(统计学上称“层”,stratum),然后从每一层中按比例抽取一定数量的观察单位组成样本。优点:抽样误差较小,样本对总体有较好的代表性;便于在不同的层内采用不同的抽样方法,有利于调查组织工作的实施;可以对各层独立进行分析。3.非抽样误差:指除抽样误差以外的,由各种非随机因素引起的误差,主要包括抽样框误差、无应答误差和计量误差。非抽样误差成因复杂,可产生于调查工作的各个阶段、各个环节。非抽样误差难以测度,但可以控制,比如设计科学的调查研究方案、开展预调查、调查人员严格选择与培训、加强调查实施过程的组织管理、监督和检查及资料整理录入加强编码及双录等措施均可减少非抽样误差。二、简答题1.调查研究的质量控制应贯穿于调查工作的各个阶段、各个环节,比如设计科学的调查研究方案、开展预调查、调查人员严格选择与培训、加强调查实施过程的组织管理、监督和检查及资料整理录入加强编码及双录等措施,以减少非抽样误差。2.(1)估计的容许误差。容许误差越大,估计精度越低,需要的样本量越小;反之,容许误差越小,估计精度越高,需要的样本量越大。(2)估计的置信度。置信度要求越高,即的取值越小,则样本含量要求越大。置信水平一般取95%。(3)总体的变异程度。当总体率越接近0.5,变异程度越大,需要样本量越大;值偏离0.5越远,变异程度越小,样本量越小。(4)应答率。在估算样本量时通常需要根据可能的应答率增加样本量。设估算出的样本量为0n,应答率为rp,则校正的样本量为rpnn/0。(5)设计效率。在估算样本量时,应考虑复杂抽样设计的设计效率对研究结果的影响,一般先按照单纯随机抽样设计估计出初始样本量,再乘以设计效率Deff得到最终的样本量。3.抽样调查中的误差有两大类:抽样误差和非抽样误差。抽样误差是由于抽样使样本统计量与总体参数之间的差异。由于每次抽取样本所包含的观察单位是随机的,所以,不同样本之间以及样本与总体之间会存在偏差,由此产生了抽样误差。非抽样误差产生比较复杂,有以下几类:由于抽样框不完善导致的抽样框误差;由于调查获得的数据与所欲调查项目的真值之间不一致而导致的计量误差;由于无应答导致的无应答误差等。非抽样误差不仅在抽样调查中,在全面调查中也是存在的。三、选择题1.D2.E3.B4.B5.E6.D7.A8.B四、应用题1.已知,2.0,02.0,05.0,96.12/05.0Z,代入公式(3-11)有68303.0)2.01(2.096.1)1(22222/Zn因此,需要调查683名6-11岁儿童。2.根据题意可以整理如下:年龄段(岁)iNiniWip2ips18-308002000.2290.0860.000376431-4510004000.2860.1820.000372246-6012004500.3430.3560.000509560以上5003000.1430.4630.0008288根据公式(3-5)(3-6)可计算总体两周患病率的估计值及标准误:iipWp=0.229*0.086+0.286*0.182+0.343*0.356+0.143*0.463=0.25922)1(ipiiipsWNns=0008288.0143.0)5003001(0003764.0229.0)8002001(22=0.008785两周患病率的95%置信区间为(0.259-1.96×0.008785,0.259+1.96×0.008785),即(0.242,0.276)。因此,该居民社区总的两周患病率为25.9%,95%置信区间为(24.2%,27.6%)。第四章一、单项选择题1.A2.A3.D4.C5.C6.E二、简答题1.定量资料频数分布表的编制:(1)求出全距(range)。(2)确定组段数(k)根据样本含量多少确定组段数,一般设8~15个组段,不宜过粗或过细。(3)求组距(classinterval):根据资料的分布类型,组距分为相等与不等两种。(4)确定组限:数量分组的组限一定要清楚明确,组间的衔接必须严密,不遗漏,也不重复:即要求第一个组段应包括资料中的最小值,最后一个组段应包括最大值;此外,应遵循“上限不在本组”的规则。规范的表示方法是采用半开半闭区间(右开左闭区间)的形式,即各组段只写明下限值,而不标出上限值,如0~,15~,30~,但是最后一个组段必须采用闭区间。(5)列频数表统计各组段频数,在此基础上计算频率、累计频数和累计频率。2.参见教材表4-4及4-5对集中趋势及离散趋势统计量的总结。3.中位数和均值都是数据集中趋势的描述统计量,中位数是位置代表值,不考虑极端值,可以适用于不拘分布或分布类型不明的资料;均值考虑全部数据,包括极端值,但是一般适用于对称分布资料,尤其是正态分布资料。4.这四个指标都是反映计量资料的离散程度。极差和四分位差可用于任何分布,后者比前者稳定,但均不能综合反映各观察值的变异程度;标准差最为常用,要求资料服从对称分布,尤其是正态分布。5.变异系数可用于多组资料间度量衡单位不同或均数相差悬殊时的变异程度比较。三、计算题1.根据原始数据资料,对数据进行排序、分组后,得到频数分布表如下:表4-9某地120名正常成年人血清铜含量(μmol/L)组段频数f频率P(%)⑴⑵⑶9.00~32.5010.00~43.3311.00~1210.0012.00~1310.8313.00~1714.1714.00~2218.3315.00~1815.0016.00~1310.8317.00~119.1718.00~54.1719.00~21.67合计120100.002.2107186174142222x38191118617414222222222x)/(58.175122107dlmgnxx)/(97.321)(2dlmgnxxs3.抗体滴度倒数的几何平均数为:53.7011)320lg160lg380lg240lg320lg2(lg1G故平均抗体滴度为1:70.53第五章一、名词解释相对数:是指两个有联系的指标之比。它可以是两个有联系的绝对数之比,也可以是两个统计指标之比。率:是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,用于说明某种现象发生的频率大小或强度,故又称频率指标。构成比:也称为构成指标,是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,用以说明某一事物内部各组成部分所占的比重或分布,常用百分数表示。相对比:是指两个有关联的指标之比,用以描述两者的对比水平,是对比的最简单形式。常以百分数或倍数表示,说明一个指标是另一个指标的百分之几或几倍。二、简答题(略)三、单项选择题1.A2.C3.A4.C5.D6.B7.D四、计算分析题1.(1)表1某中学各类口腔卫生状况者的患龋情况口腔卫生情况调查人数患龋人数患龋人数构成比(%)患龋率(%)良好者205636124.4717.56中等者216063543.0529.40不好者96347932.4849.74合计51791475100.0028.48(2)患龋人数百分比是构成比,患龋率是率,分别从构成比和率的定义上进行解释。2.表2某地2001~2011年医院床位统计数据年份(1)符号(2)年末床位数(3)绝对增长量发展速度(%)增长速度(%)累计(4)逐年(5)定基比(6)环比(7)定基比(8)环比(9)20010a36107——100.0100.0——20021a4174456375637115.6115.615.615.620032a50715146088971140.5121.540.521.