科研资料的整理与分析重庆医科大学护理学院周恒宇教学目标掌握1.科研资料整理的基本步骤2.科研资料类型及常用的统计学分析方法3.统计表的基本结构及制表的具体要求4.统计图的基本类型及绘制统计图的要求熟悉1.科研资料整理的目的2.概率和假设检验的概念和意义了解SPSS在护理研究中的应用•例1•例2•例3第一节科研资料的整理基本步骤:核校原始数据资料分组形成整理表目的在于使原始数据系统化、条理化一、核校原始数据初级核校:资料的准确性资料的完整性数据核校:--专业检查--统计检查--人工检查与计算机检查核校原始数据二、资料分组1.合理分组应考虑的要素:--研究目的--资料性质--样本量大小--拟采用的统计分析方法2.分组方法:--类型分组与数量分组--简单分组与复合分组资料分组吸烟与肺癌的成组病例对照研究资料整理表吸烟史肺癌病人对照合计有6886501338无215980合计7097091418(1)按类型分组药物A与药物B的疗效分析组别例数治愈人数有效人数无效人数治愈率(%)药物A1103671332.73药物B9752321353.61(2)按数量分组某市调查的120名8岁男孩身高(cm)资料3.分组的程序:--确定分组标志--确定分组方法--确定组数--划分组距--确定组的上、下线如0~、15~、30~、……资料分组案例学习•某医生收集了81例30-49岁健康男子血清中的总胆固醇值(mg/dl,1mg/dlh×0.0259=1mmol/L)测定结果如下,请同学们试着对这些数据分组,并统计每1组内包含几个原始数据。219.7184.0130.0237.0152.5137.4163.2166.3181.7176.0168.8208.0243.1201.0278.8214.0131.7201.0199.9222.6184.9197.8200.6197.0181.4183.1135.2169.0188.6241.2205.5133.6178.8139.4131.6171.0155.7225.7137.9129.2157.5188.1204.8191.7109.7199.1196.7226.3185.0206.2163.8166.9184.0245.6188.5214.397.5175.7129.3188.0160.9225.7199.2174.6168.9166.3176.7220.7252.9183.6177.9160.8117.9159.2251.4181.1164.0153.4246.4196.6155.481例健康男子血清总胆固醇(mg/dl)的频数分布表组段(mg/dl)频数频率(%)90-22.47110-33.70130-89.88150-1720.99170-2024.69190-1518.52210-89.88230-56.17250-22.47270-29011.23合计81100.00编制步骤如下:⒈计算全距:全距是一组资料的最大值和最小值之差。本例数据的全距为:278.8-97.5=181.3;2.确定组段数与组距:根据样本量的多少,选择适当的组段数,通常取8-15组为宜。组距=全距/组段数。例:本例全距为181.3,取组段数为10,则组距为181.3/10=18.13≈20,即以20作为本例的组距。⒊确定组段的上下限:每一个组段的起点和终点,分别称为该组段的上下限,第一组段必须包括最小值,最后一段必须包括最大值。如:本例的最小值为97.5,组距定为20,则第一组段的下限可取90,第一组段的上限为90+20=110。100名大学生性别的频数分布表(计数资料)性别频数频率(%)男4040.0女6060.0合计100100.030名大学生视力的频数分布表(等级资料)视力等级频数频率(%)差826.67中1240.00良1033.33合计30100.00三、形成整理表:1.手工归纳:--画记法--分卡法2.电子计算机汇总法--原始数据编码输入计算机,利用统计软件进行资料的检查、分组和运算。第二节科研资料的统计学分析1.概率(probability)是描述某一事件发生的可能性大小的一个度量,常用符号P表示,其值在0和1之间。一、统计学的几个基本概念必然事件P=1不可能事件P=0随机事件0<P<1小概率事件:P≤0.05(5%)或P≤0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。P的意义案例分析例:已知某人群男性色盲的构成比为0.025。假定该人群的男女比例为8:7。现从此人群的男性中随机抽取1人,问他是色盲的概率是多少?0.025×15/8=0.0472.假设检验:应用统计学的原理从样本之间的差别去推断样本所代表的总体之间是否存在差别的一个重要的推断方法,又称显著性检验。基本概念二、科研资料的类型计量资料计数资料等级资料1.计量资料定义:用仪器、工具等测量方法获得的数据,对各观察单位用定量方法测定某项指标量的大小,一般有度量衡单位。特点:有计量单位,如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(1012/L)2.计数资料定义:将全体观察单位按某种性质或特征分组,然后分别清点每组中观察单位的个数所得的数据称计数资料。特点:无固有计量单位,如肤色(黑、白)、血型(A、B、O)、性别(男、女)3.等级资料(Rankdata)定义:是介于计量资料和计数资料之间的一种资料类型,也称半定量资料、有序分类资料。如:①癌症分期:早、中、晚②药物疗效:治愈、好转、无效、死亡③尿蛋白:、、、++、+++及以上三类资料举例一组2040岁成年人的血压以12kPa为界分为正常与异常两组,统计每组例数12kPa轻度高血压15kPa中度高血压17kPa重度高血压计量资料计数资料等级资料三、常用的统计学分析方法•描述统计学:对数据资料的整理、汇总、归纳和计算,用统计图表对资料的数量特征及其分布规律进行描述。•推论统计学:通过抽样调查得到样本,利用样本数据推断总体特征。要想推断准确,就要解决如何抽样和减少推断误差的问题。2描述性统计推断性统计计量资料均数、几何均数、中位数、众数、方差、标准差、变异系数、相关与回归分析t检验、u检验、方差分析、或秩和检验计数资料率、相对比、构成比检验、二项分布等级资料率、构成比检验、秩和检验2注:当资料分布类型为不确定或者呈非正态分布时,可选用秩和检验常用统计分析方法正态分布和偏态分布计量资料的描述性分析:集中趋势众数(mode):在分布中出现频率最高的数值。中位数(median):是将一组观察值从小到大按顺序排列,住次居中的观察值。平均数(mean):反映一组观察值在数量上的平均水平。1.均数:即算术平均数的简称,反映一组观察值在数量上的平均水平。总体均数用希腊字母ū表示,样本均数用X表示。2.几何均数(geometricmeanG):适用于资料变量值呈倍数变化(等比资料)或偏态分布资料。平均数计量资料的描述性分析:离散趋势1.离散趋势:一组计量资料中各数据之间的参差程度。2.了解资料离散情况的常用指标有极差、方差、标准差和变异系数,最常用的是标准差和方差。标准差(S)一般都是计算样本的标准差。单用均数不能表达出实验数据的离散程序,还需要通过计算标准差值来反映均数中各值的波动范围(离散程度),标准差值越小,说明观察值(X)的变异程度越小,则均数的代表性越好,收集的资料可靠性大。在论文中均数和标准差以X±S的形式写出。计数资料的统计学描述相对比(ratioR):指两个有关指标之比,说明A是B的若干倍或百分之几.指标可以性质相同或不同相对比=A/B,护士数与床位数之比构成比(percentage):又称百分比,表示事物内部各组成部分在总和中所占比重的大小率(rate):指某种现象人数占调查人数的比例。例:某地区老年人640人,其中患病者为320人,有患者痴呆病患者8人,问患老年痴呆者的构成比和百分率各是多少。构成比=8/320×100%=2.5%百分率=8/640×100%=1.25%四、假设检验•假设检验的概念•假设检验的目的•假设检验的原理•假设检验的步骤•在实际工作中当遇到一个样本均数与一已知总体均数有差别时,或两个样本均数不相等时,存在两种情形,第一种情形是确实来自总体均数为的已知总体,有样本误差概念可知,即便在同一总体中抽样,样本统计量和总体参数之间也会存在差别。第二种情形是不是来自总体均数为的已知总体,即样本均数的差别反应的是总体均数的差别。假设检验的概念•判断是由于何种原因造成的不同,以做出决策。假设检验的目的•反证法:当一件事情的发生只有两种可能A和B,为了肯定其中的一种情况A,但又不能直接证实A,这时否定另一种可能B,则间接的肯定了A。•概率论(小概率):如果一件事情发生的概率很小,那么在进行一次试验时,我们说这个事件是“不会发生的”。从一般的常识可知,这句话在大多数情况下是正确的,但是它一定有犯错误的时候,因为概率再小也是有可能发生的。假设检验的原理/思想假设检验的步骤(1)建立假设:无效假设H0备择假设H1如:H0:两种扫床方法扫床后空气中菌落数无差别H1:两种扫床方法扫床后空气中菌落数有差别(2)确定显著性水平:显著性水平是用来判断小概率事件是否发生的标准,常用来表示。通常取值为0.05或0.01。(3)计算统计量:根据所选用的统计方法,公式计算相应的统计量,如t值、F值、值等22(4)确定概率值根据计算所得的统计量查相应的工具表可得出概率P的大小。计算机软件进行统计处理时会自动报告P值的大小(5)作出推断结论如果P>,则H0假设成立,即两种扫床方法扫床后空气中菌落数无差别。如果P<,则H1假设成立,拒绝H0接受H1,差别有统计学意义。即两种扫床方法扫床后空气中菌落数有差别。•接受检验假设•拒绝检验假设正确理解结论的概率性(都隐含着犯错误的可能性)。假设检验的结果计量资料的假设检验四、统计图和统计表1.统计表(statisticaltable)定义:是以表格的形式表达研究对象的特征、内部结构及研究项目分组之间的数量关系。结构:统计表由文字、数字和线条组成表1甲、乙两地某年HbsAg阳性率地区调查数阳性数阳性率(%)甲地5000110022.0乙地6000105017.5合计11000215019.5统计表的结构表号、表题横标目顶线分界线纵标目底线数据表2甲乙两种方法治疗压疮的效果处理轻中度压疮重度压疮总例数治愈治愈率总例数治愈治愈率甲法504080.00201260.00乙法402665.0018633.33合计906673.33381847.37统计表的结构分层线分层线统计表的绘制原则总原则:①重点突出,简单明了。避免包罗万象,一个表格说明一个中心问题为宜。②层次分明,排列合理。避免层次过多或结构混乱。绘制表格的基本要求1.标题:标题一般写在表格上方中央,扼要说明表的主要内容。2.标目:有计量单位者应注明单位。标目按序排列,层次应清楚。3.线条:统计表中只有横线,无竖线和斜线。通常为三线表,复合表可出现分层线4.数字:用阿拉伯数字表示,同一列小数位数一致,且位次对齐。表格中不应有空格,暂无记录或未记录用“···”表示,无数据用“—”表示,数据为零则填“0”。5.备注:不列入表中,特殊情况需要说明时可用“*”号标出,文字叙述写在表的下方。2.统计图(statisticalgraph)定义:是用图形将数据资料形象化,利用线条高低、面积大小等来代表数量。通俗易懂,便于理解和比较。统计图和统计表常用的统计图类型1.直条图2.百分条图、圆图3.线图、半对数线图4.直方图5.散点图6.统计地图等条图(barchart)适用资料:不连续的、有明确分组的资料。形式:单式(图1)复式(图2)绘制要点:横轴为观察项目,纵轴为数值;各直条等宽,等间距;间距宽度与条宽相等或等于条宽的1/2图1.三组标本血清阳性例数012345678甲乙丙组别阳性例数图2.某地1995年癌症、心血管疾病死亡率020406080100120