第一节数值变量资料的频数分布例8.1某地区2002年132名55~58岁健康成人的空腹血糖(mmol/L)测定值如下。5.175.564.864.874.745.245.514.464.964.824.905.305.225.584.484.804.604.025.165.364.344.244.644.274.254.444.464.624.874.344.905.254.774.855.074.164.664.704.203.954.094.644.335.214.614.985.244.604.254.785.003.604.114.614.084.784.264.444.384.404.794.764.924.604.785.034.354.184.684.654.574.274.994.214.894.714.724.414.384.064.794.964.834.454.514.274.504.315.055.595.085.163.744.365.364.645.094.574.464.564.395.244.614.214.964.344.454.864.504.904.454.494.424.684.565.384.344.464.164.984.294.834.273.683.853.864.564.564.555.165.155.16一、频数分布表及其制作1、找Xmax、Xmin,计算极差(range);2、确定组数、组距和组限;3、列表划记。•第一组段应包含观察的最小值,通常取一个比最小值略小的数作为起点;•每个组段只有下限,没有上限;•最后一个组段包括最大值,并等距标记上限。某地区2002年55~58岁健康成人的空腹血糖(mmol/L)测定值二、频数分布表的用途1、简化资料,便于分析;2、明确频数的分布类型;3、描述频数的分布特征;4、能够发现可疑变量值。频数分布类型对称分布偏态分布01020304050600~0.24~0.48~0.72~0.96~1.20~1.44~1.68~1.92~2.16~2.40~2.64~正偏态分布负偏态分布频数分布特征1、集中趋势2、离散趋势第二节集中趋势指标平均数(average):•算术均数(arithmeticmean)•几何均数(geometricmean)•调和均数(harmonicmean)•中位数(median)•众数(mode)一、算术均数()(一)计算方法:1、直接法:2、加权法:nxnxxxxn21ffxx,x附表空腹血糖(mmol/L)加权法计算均数血糖频数组中值3.6~33.73.8~33.94.0~84.14.2~234.34.4~244.54.6~254.74.8~204.95.0~125.15.2~105.35.4~5.645.5合计132-(二)特性:)(1xx、02)(2xx、2)(ax)(ax(三)应用:适用于对称分布资料,尤其是正态或近似正态分布资料。二、几何均数(G)(一)计算方法:1、直接法:2、加权法:nnxxxxGn21)lg(lg1nx)lg(lg1fxfGnnxxxxGn21nnxxxG21lglg)lg(121nxxxn)lglg(lg121nxxxnxnlg1(二)注意事项:•变量值不得有0;•变量值不得同时出现正、负数;•对数值的小数位数至少应保留四位。(三)应用:•对数正态分布资料;•等比级数资料。三、中位数(M)(一)定义:将一组观察值按由小到大的顺序排列,位次居中的变量值。(二)计算方法:1、直接法:(n为奇数)(n为偶数))21(nXM2)12()2(nnXXM2、频数表法:)2(LMMfnfiLM(三)应用:1.分布极度偏态或未知的资料;2.分布末端无确定数值的资料(开口资料)。(四)百分位数(Px):1、意义:百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的是中位数(M),多个百分位数可更全面地描述资料分布特征;2、计算:百分位数的计算与中位数基本相同,即:3、应用:百分位数可用于确定医学参考值范围,中位数常用于描述偏态分布资料的集中趋势,并与其它百分位数结合起来描述分布的特征(如四分位数间距)。)%(LxxxfxnfiLP第三节离散趋势指标•全距(range)•四分位数间距(quartileinterval)•离均差平方和(sumofsquares)•方差(variance)•标准差(standarddeviation)•变异系数(coefficientofvariation)一、全距(R)(一)计算:(二)优点:简单明了(三)缺点:1、不敏感;2、不稳定。(四)用途:主要用于编制频数表minmaxXXR二、四分位数间距(Q)(一)计算:(二)优点:较全距相对稳定(三)意义:(四)用途:与中位数结合全面描述资料分布特征2575PPQQQLUMP25P75P25(一)计算:(二)优点:全面反映一组变量值的变异(三)影响因素:(四)用途:多用于方差分析(ANOVA)中的变异分解三、离均差平方和(SS)2)(xSS||xN=100N=10degreeoffreedom四、方差()(一)计算:22,sNx22)(nxs22)(nxx2)(1)(2nxx(二)存在的问题:改变了度量衡单位1)(22nxxs1)(22nnxx1)(222fffxfxs五、标准差(σ,s)(一)计算:Nx2)(1)(1)(222nnxxnxxs1)(22fffxfxs(二)用途:•反映一组观察值的离散程度;•计算变异系数;•计算标准误;•与均数结合,全面描述资料分布特征。六、变异系数(CV)(一)计算:(二)用途:1、用于度量衡单位不同资料变异程度比较;2、用于均数相差悬殊资料变异程度比较。%100xsCV第四节正态分布和医学参考值范围AbrahamdeMoivre(1667-1754)CarlFriedrichGauss(1777-1855)Pierre-SimonLaplace(1749-1827)一、正态分布(normaldistribution)(一)正态分布的图形及函数222)(21)(xexf标准正态变换(二)标准正态分布222)(21)(xexfx02221)(ueuuxu二、正态分布的特征和分布规律(一)正态分布的特征1、正态曲线在横轴上方,均数处最高;2、正态分布以均数为中心左右对称;3、正态分布有两大参数;4、正态曲线有两个拐点;5、正态曲线下面积分布有一定规律。μμ:位置参数μ=0μ=1μ=2120σ:变异参数σ=1σ=2σ=301-12-23-3二、正态分布的特征和分布规律(二)正态分布的曲线下面积分布规律:68.27%95.00%99.00%(三)正态分布的应用:1、确定医学参考值范围;2、质量控制;3、众多统计分布的理论基础。196.158.2三、医学参考值范围(referenceranges)(一)意义:是绝大多数具有某种特定健康状况的人体各种生理、生化数据,组织或排泄物中各种成分的含量的波动范围。(二)步骤:1、选定样本;2、控制误差;3、合理分组;4、单、双侧选择;5、合理的百分范围;6、确定方法。(三)方法:1、正态分布法2、对数正态分布法3、百分位数法目的与要求•掌握三大平均数的计算、意义用应用•熟悉频数表的编制,分清频数分布特征与分布类型•重点掌握方差与标准差的计算、应用及意义,熟悉四分位数间距及变异系数的应用•掌握正态分布的一个变换、两大参数和三个区间及医学参考值范围