计量资料的统计描述

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2/13/2020Plan1-2-3-4-5:1-17-27-43-54-751数值变量资料的统计分析练习小结习题2/13/2020Plan1-2-3-4-5:1-17-27-43-54-752数值变量资料的统计描述一、频数分布二、集中趋势的描述三、离散趋势的描述四、正态分布五、医学参考值范围练习小结习题2/13/2020Plan1-2-3-4-5:1-17-27-43-54-753问题何为计量资料?何为统计描述?2/13/2020Plan1-2-3-4-5:1-17-27-43-54-754掌握:频数分布的基本特征与类型、集中趋势的常用指标。离散趋势的常用指标(标准差、变异系数);正态曲线下面积的分布规律;医学参考值范围的含义与制定方法。熟悉:频数分布表的编制方法和用途,百分位数的计算与含义。全距、四分位数间距、方差的计算与含义;正态分布的概念、特征、应用。大纲要求:2/13/2020Plan1-2-3-4-5:1-17-27-43-54-755一、频数分布(frequencydistribution)(一)频数分布表(frequencytable)2/13/2020Plan1-2-3-4-5:1-17-27-43-54-756例2-1测得130名健康成年男子脉搏资料(次/分)如下,试编制频数表和观察频数分布情况。757672696672576871726972738280826769736474587064607766776467767575716562767271606775757379666979787072707278726772806870617073727181706675716377747668657769777579647973766180646970736968657069668163648074787684667073607682736465737363806876707977647066697378762/13/2020Plan1-2-3-4-5:1-17-27-43-54-757(1)求极差(range):即最大值与最小值之差,又称为全距。R=84–57=27(次/分)(2)决定分组组数、组距:根据研究目的和样本含量n确定分组组数,通常分为8~15个组。组距=极差/组数,为方便计,组距为极差的十分之一,再略加调整。i=R/k=27/10=2.7≈3(3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值。每个组段均为半开半闭区间。56~59~……80~83~86(4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。频数表的编制步骤2/13/2020Plan1-2-3-4-5:1-17-27-43-54-758表2-1130名健康成年男子脉搏(次/分)的频数分布表N=∑ff频数,f脉搏组段频数(f)(1)(2)56~259~562~1265~1568~2571~2674~1977~1580~1083~861合计1302/13/2020Plan1-2-3-4-5:1-17-27-43-54-759(二)频数分布图脉搏(次/分)05101520253056~59~62~65~68~71~74~77~80~83~85图2-1130名正常成年男子脉搏的频数分布频数2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7510(三)频数分布的类型对称分布:集中位置在中间,左右两侧频数大体对称。偏态分布:集中位置偏向一侧,频数分布不对称。正偏态(左偏态)、负偏态(右偏态)。2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7511(1)对称分布血清总胆固醇(mmol/L)05101520252.453.053.654.254.855.456.10图2-1101名正常成年女子血清总胆固醇的频数分布频数2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7512是否为对称分布?变量0510152025303540452.453.053.654.254.855.456.10频数2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7513是否为对称分布?变量051015202530354045502.453.053.654.254.855.456.10频数2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7514(2)偏态分布1)左偏态分布(正偏态分布):频数分布高峰向左偏移,集中位置偏向数值小的一侧或者左侧,有较长的右尾部。2)右偏态分布(负偏态分布):频数分布高峰向右偏移,集中位置偏向数值大的一侧或者右侧,有较长的左尾部。2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7515表2-2115名正常成年女子血清转氨酶(mmol/L)含量分布转氨酶含量人数12~215~918~1421~2324~1927~1430~1133~936~739~442~453血清转氨酶(mmol/L)051015202513.519.525.531.537.543.5.图2-2115名正常成年女子血清转氨酶的频数分布人数2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7516表2-3101名正常人的血清肌红蛋白含量分布肌红蛋白含量人数0~25~310~715~920~1025~2230~2335~1440~945~502合计101血清肌红蛋白(μg/mL)05101520252.512.522.532.542.552.5图2-3101名正常人血清肌红蛋白的频数分布人数2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7517(四)频数分布表的用途1.揭示资料的分布类型;2.发现资料的集中趋势和离散趋势;3.便于发现某些特大或特小的可疑值;4.便于进一步计算统计指标和作统计处理组段频数f2.30~12.60~02.90~03.20~03.50~173.80~204.10~174.40~124.70~95.00~05.30~05.60~5.908合计842/13/2020Plan1-2-3-4-5:1-17-27-43-54-7518①集中趋势(centraltendency):变量值集中位置。数据集中(平均)的组段在68~73(次/分)之间,尤以组段的人数71~(次/分)最多。——平均水平指标②离散趋势(tendencyofdispersion):变量值围绕集中位置的分布情况。数据离散(变异)的范围在57~84(次/分),离“中心”位置越远,频数越小。——变异水平指标表2-1数据的频数分布特征:2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7519二、集中趋势指标(centraltendency)平均指标:平均数(average)(一)算术均数(arithmeticmean),简称均数(mean)(二)几何均数(geometricmean)(三)中位数(median)2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7520算术均数:简称均数(mean)意义:一组性质相同的观察值在数量上的平均水平。表示:(总体)(样本)应用:对称分布,正态分布或近似正态分布(一)算术均数x2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7521均数的计算方法公式:1323101836243X举例:试计算4,4,4,6,6,8,8,8,10的均数?nXnXXXXn21Σ为求和符号,读成sigma2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7522(二)几何均数(geometricmean)意义:N个数值的乘积开N次方即为这N个数的几何均数。表示:G适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7523几何均数的计算方法:nXGnXXXXnGXXXGnnnlglglg)lglg(lg1lg121212/13/2020Plan1-2-3-4-5:1-17-27-43-54-7524(3)中位数(median)11个大鼠存活天数:4,10,7,50,3,15,2,9,13,60,60,问平均存活天数?从小到大:2,3,4,7,9,10,13,15,50,60,60,问平均存活天数?2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7525中位数中位数是将一批数据从小至大排列后位次居中的数据值,符号为M,反映一批观察值在位次上的平均水平。适用条件:①偏态分布的资料;②资料有不确定数值;③资料分布类型不明。2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7526中位数计算公式与实例先将观察值按从小到大顺序排列,再按以下公式计算:为偶数为奇数nxxnxMnnn22/12/2/)1(特点:仅仅利用了中间的1~2个数据2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7527例2-39名中学生甲型肝炎的潜伏期分别为12,13,14,14,15,15,15,17,19天,求其中位数。8845122221415214.5()MXXXX+如果只调查了前八位中学生,则:+(+)(+)天)(155219天XXM2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7528均数、中位数、几何均数三者关系正态分布:均数=中位数正偏态分布:均数中位数负偏态分布:均数中位数对数正态分布:均数几何均数中位数≈几何均数2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7529反映数据的离散度(Dispersion)描述一组数据参差不齐的程度(一)全距(二)四分位数间距附:百分位数Px(三)方差(四)标准差(五)变异系数三、离散趋势指标习题2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7530(一)极差(Range)(全距)minmaxXXR优点:简便缺点:1.代表性差2.不稳定应用:任何分布4204404604805005205405605801204020简单,但仅利用了两端点值,稳定性差。2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7531(二)四分位数间距(quartilerange)四分位数间距,用Q表示:Q=P75-P25优点:比R稳定缺点:仍不能反映全部数据的变异度应用:偏态分布,末端无确定值50P25P100P0P75P2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7532%X(100)%XXP百分位数示意图百分位数(percentile)2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7533当时,即为中位数的计算公式50505050()2LinMPLff1%50%2X2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7534(三)方差(variance)优点:可反映全部观察值的变异情况。缺点:单位为原单位的平方。应用:对称分布,尤其是(近似)正态分布。也称均方差,样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。NX∑22)-(总体方差11)(2222∑nnXXnXXS=样本方差2/13/2020Plan1-2-3-4-5:1-17-27-43-54-7535(四)标准差(StandardDeviation)即方差的正平方根;其单位与原变量X的单位相同。Nx2)(特点:可

1 / 88
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功