第八章安全生产统计分析第一节统计基础知识一、统计工作的基本步骤1.设计。制定计划,对整个过程进行安排。2.收集资料(现场调查)。根据计划取得可靠、完整的资料,同时要注重资料的真实性。收集资料方法有3种。统计报表、日常性工作、专题调查3.整理资料。原始资料的整理、清理、核实、查对,使其条理化、系统化,便于计算和分析。可借助于计算机软件进行(常用软件有EPI,美国疾病控制中心的流行病学统计分析软件等)核对整理。4.统计分析。运用统计学的基本原理和方法,分析计算有关指标和数据,揭示事物内部的规律。二、统计学基本知识(一)统计资料的类型统计资料(或称统计数据)有3种类型:计量资料、计数资料和等级资料。1.计量资料通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料,例如质量与长度。特点:有度量衡单位、可通过测量得到、多为连续性资料。(如职业有害因素浓度或强度)2.计数资料定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。特点:没有度量衡单位、通过枚举或记数得来、多为间断性资料。(如粉尘分散度、违章次数)3.等级资料定义:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同。(二)统计学中的重要概念1.变量研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量,变量的测得值叫变量值(也叫观察值)。2.变异变异是指同质事物个体间的差异。变异来源于一些未加控制或无法控制的甚至不明原因的因素,变异是统计学存在的基础,从本质上说,统计学就是研究变异的科学。3.总体与样本总体:根据研究目的确定的研究对象的全体。当研究有具体而明确的指标时,总体是指该项变量值的全体。样本:是总体中有代表性的一部分。现实研究中,直接研究总体的情况是很困难或者不可能的,因此实际工作中往往从总体中抽取部分样本,目的是通过样本信息来推断总体的特征。4.随机抽样是指按随机的原则从总体中获取样本的方法,以避免研究者有意或无意地选择样本而带来偏性。随机抽样是统计工作中常用的抽样方法。5.概率概率是描述随机事件发生的可能性大小的数值,常用P来表示。概率的大小在0和1之间,越接近1,说明发生的可能性越大,越接近0,说明发生的可能性越小。统计学中的许多结论是带有概率性质的,通常一个事件的发生小于5%,就叫小概率事件。6.误差统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下两种:(1)系统误差指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。特点:具有累加性。(2)随机误差由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。特点:随测量次数的增加而减小。随机误差包括随机测量误差和抽样误差。1)随机测量误差。在消除了系统误差的前提下,由于非人为的偶然因素,对于同一样本多次测定结果不完全一样,结果有时偏大有时偏小,没有倾向性,这种误差叫随机测量误差。其特点:没有倾向性,多次测量计算平均值可以减小甚至消除随机测量误差。2)抽样误差。是由于抽样原因造成的样本指标与总体指标之间的差别。其特点:抽样误差不可避免。统计上可以估计抽样误差,并在一定范围内控制抽样误差。通常可以通过改进抽样方法和增加样本量等方法来减少抽样误差。(2007)70.根据有关规定,统计资料有三种类型,它们是计量资料、计数资料和(A)。A.等级资料B.基础资料C.分类资料D.定性资料(2007)68.在抽样调查我国化工企业近年来职业中毒的发病情况时,减少抽样误差最为有效的方法是(D)。A.严格校验检查仪器B.修改职业因素诊断标准C.对所选企业反复多次调查D.增加所调查企业的样本量,提高样本的代表性(2008)67.统计工作的误差一般是指测量值与真值、样本指标与总体指标之差。由偶然因素造成的误差起(D),它是不确定的,不可预知的。A.系统误差B.人为误差C.主观误差D.随机误差三、统计图表的编制(一)统计表1.概念统计表是将要统计分析的事物或指标以表格的形式列出来,以代替烦琐文字描述的一种表现形式。2.统计表的组成标题:即表的名称。标目:横标目说明每一行要表达的内容,相当于句子的主语;纵标目说明每一列要表达的内容,相当于句子的谓语。3.统计表的种类简单表:表格只有一个中心意思,即二维以下的表格复合表:表格有多个中心意思,即三维以上的表格。4.制表原则和基本要求制表原则:重点突出,简单明了,主谓分明,层次清楚。基本要求是:(1)标题:位置在表格的最上方,应包括时间、地点和要表达的主要内容。(2)标目:标目所表达的性质相当于“变量名称”,要有单位。(3)线条:不宜过多,一般三根横线条,不用竖线条。(4)数字:小数点要上下对齐,缺失时用“-”代替(5)备注:表中用“*”标出,再在表的下方注出。(二)统计图1.概念统计图:用点、线、面的位置、升降或大小来表达统计资料数量关系的一种陈列形式。2.制图的原则和基本要求(1)按资料的性质和分析目的选用适合图形(见P222表8一1)(2)标题。标题要概括图形所要表达的主要内容,标题一般写在图形的下端中央。(3)统计图一般有横轴和纵轴。用横轴标目和纵轴标目说明横轴和纵轴的指标和度量单位。一般将两轴的起始点即原点处定为0,但也可以不定为0。横轴尽度从左向右,纵轴尽度从下到上。纵横轴的比例一般以5:7。(4)统计图要用不同线条和颜色表达不同事物或对象的统计指标时,需要在图的右上角空隙处或图的下方与图标题中间位置附图例加以说明。3.统计图的类型(1)条图。又称直条图,表示独立指标在不同阶段的情况,有两维或多维,图例位于右上方。(2)圆图或百分条图。描述百分比(构成比)的大小,用颜色或各种图形将不同比例表达出来。(3)线图。用线条的升降表示事物的发展变化趋势,主要用于计量资料,描述两个变量间关系。(4)半对数线图。纵轴用对数尺度,描述一组连续性资料的变化速度及趋势。(5)散点图。描述两种现象的相关关系。(6)直方图。描述计量资料的频数分布。(7)统计地图。描述某种现象的地域分布。四、统计描述和统计推断统计的主要工作是对统计数据进行统计描述和统计推断。统计描述:是统计分析的最基本内容。指应用统计指标、统计表和统计图等方法,对资料的数量特征及其分布规律进行测定和描述。统计推断:通过抽样等方式进行样本估计总体特征的过程,包括参数估计和假设检验两项内容。(一)统计描述1.计量资料的统计描述计量资料的统计描述主要通过编制频数分布表、计算集中趋势指标和离散趋势指标(P222错)以及统计图表来进行。(1)集中趋势。指频数表中频数分布表现为频数向某一位置集中的趋势。集中趋势的描述指标:1)算术平均数。2)几何平均数3)百分位数(percendle)与中位数(median)百分位数是一种位置指标,常用于描述一组观察值在某百分位置上的水平,多个百分位(如P25,P50,P75)结合使用,可更全面地描述资料的分布特征。中位数是一个特定的百分位数P50,用符号M表示。把一组观察值按从小到大(或从大到小)的次序排列,位置居于最中央的那个数据就是中位数。中位数也是反映频数分布集中位置的统计指标,但它只由所处中间位置的部分变量值计算所得,不能反映所有数值的变化,故中位数缺乏敏感性。中位数理论上可用于任何分布类型的资料,但实践中常用于偏态分布资料和分布两端无确定值的资料。其计算方法有直接法和频数表法两种。(2)离散趋势1)全距2)四分位数间距3)方差(标准差的平方)4)标准差2、技术资料的统计描述1)比2)构成比3)率(如:发病率、死亡率、万车死亡率)(二)统计推断通过样本信息来推断总体特征就叫统计推断。参数估计和假设检验是统计推断的两个重要方面。1.参数估计。参数估计就是通过样本估计总体特征,包括点值估计和区间估计两种方法。(1)点值估计。即直接用样本均数作为总体均数的估计值。(2)区间估计。置信区间2.假设检验。假设检验是基于小概率反证法思路,用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。小概率思路:小概率事件在1次试验中不会发生;反证法思路:先提出假设,再用反证法证明其可能性大小。(2008)70.根据事故统计分析的目的,选择合适的统计图。下列统计图适用于直观描述伤亡事故随时间变化趋势的是(C)。A.散点图B.圆图C.线图D.条图(2008)68.统计的重要工作之一就是对资料进行统计描述。对偏态分布的统计资料进行集中趋势统计描述的常用指标是(C)。A.算术平均数B.几何平均数C.中位数D.加权平均数第二节职业卫生统计基础一、职业卫生常用统计指标(单选)1发病率(中毒率):观察期内,可能发生某种疾病(或中毒)的一定人群中新发生该病(中毒)的频率。发病率=同期内新发生例数/观察期内可能发生某病的平均人数×100%2患病率:表示某时点检查时可能发生某病的一定人群中患有某病的病人总数。3病死率:在规定的观察期内,某种病患者中因该病而死亡的频率。4粗死亡率:也称普通死亡率,某年平均每千名人口中的死亡数。思考职业病发病率的基本定义是(C)。A.检出人数与受检人数之比B.检出人数占企业全体职工人数的比例C.检出人数与接触相应职业危害应检人数之比D.检出人数占企业一线工人人数的比例【解析】受检人数不一定是应检人数,因此选项A不对;全体职工不一定接触职业危害,因此选项B不对;一线工人也不一定是必然接触职业危害的员工,因此选项D也不对;只有选项C的定义较为科学、合理。二、职业卫生调查设计(一)调查研究的特点1研究过程中没有人为地施加干预措施,而是客观地观察记录某些现象的现状及其相关特征;2在调查中,欲研究的现象及其相关特征(包括研究因素和非研究因素)是客观存在的,不能采用随机分配的方法来平衡或消除非研究因素对研究结果的影响,这是调查研究区别于实验研究的重要特征;3混杂因素的控制常借助于标准化法、层次分析、多因素统计分析等方法;4调查研究多采用问卷调查,容易产生误差和偏倚,应特别注意设计技巧和质量控制。(二)调查设计的主要用途又称为横断面研究或横断面调查或现况研究,用于了解某一特定时间横断面上特定作业场所中职业危害因素或人群职业病的分布情况。(三)调查设计的基本原则和内容——步骤1.明确调查目的并将其具体化到指标明确调查目的是调查研究各个环节中最核心的问题。确定调查目的时应注意是要了解总体参数还是研究相关联系。指标要精选,尽量用客观、灵敏、精确的定量指标。2.确定调查对象和观察单位根据调查目的确定调查对象,即要确定调查总体及其同质范围,观察单位可为人、物、群体、地区等。3.确定并选择调查方法根据调查目的和要求确定并选择调查方法,有以下几种:(1)普查(overallsurvey)。对总体中所有的观察单位进行调查,一般用于了解总体在某一特定“时点”上的情况,如年中人口数、时点患病率。在医学领域的适用范围是:①发病率较高的疾病;②具有灵敏度和特异度较高的检查或诊断方法;③普查方法便于操作、易于接受;④具有实施条件。(2)抽样调查(samplingsurvey)。是医学研究中最常用的方法,是通过随机抽样方法从总体中随机抽取一定数量具代表性的观察单位组成的样本进行调查,然后根据样本信息来推断总体特征。(3)典型调查。亦称案例调查。即对事物进行全面了解的基础上,有目的选择典型的人和单位进行调查。如调查几个卫生先进或后进单位,用于总结经验教训。4.确定样本含量参考有关的统计学书籍。5.确定资料的搜集方式(1)直接观察法:直接观察、检查、测量。(2)采访法:调查者直接或间接与被调查者交谈,又分访谈、信访和开调查会三种。6.确定观察指标结合调查的实际问题,将调查目的转化为具体的调查指标。(四)常用的抽样方法1.单纯随机抽样:将调查总体全部观察单位编号,再用抽签法或随机数字表随机抽取部分观察单位组成样本。2.系统抽样:又称机械抽样、等距抽样,即先将总体的观察单位按某一顺序号分成