医学统计_定量描述_规培_20150727.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第二章计量资料的统计描述卫生统计学教研室任艳峰Qualitativedataanalysis(ranked)QuantitativedataanalysisStatisticaldescriptionStatisticalInferenceStatisticalInferenceStatisticaldescriptionCollectionofdataStatisticalanalysisSortingdataDesignDesignCollectionofdataSortingdataStatisticalanalysisStatisticalanalysisStatisticaldescriptionStatisticaldescriptionStatisticalInferenceStatisticalInferenceParameterEstimationHypothesisTest熟悉频数表的划记步骤,频数表的用途。掌握集中趋势指标的定义、适用范围和计算。掌握离散趋势指标的定义、适用范围和计算。学习目标定量资料进行描述时,如果样本量较大,需要对原始资料进行整理,列出频数分布表,通过频数表以显示资料的分布类型。第一节频数分布表与频数分布图•频数(frequency)某数值在数据中出现的次数。•相对频数(frequency)也叫频率,数值在总观察例数中所占的比例。•频数表(frequencytable)将所有“互相排斥的情形”的频数毫无遗漏地排列在一起。由频数与组段组成。•如1998年某山区96名孕妇产前检查次数资料:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…4,7。•这是什么类型的资料?一、离散型定量资料的频数分布检查次数(1)频数(2)频率(%)(3)044.2177.321111.531313.542627.152324.0>51212.5合计96100.01998年某地96名孕妇产前检查次数分布某地96名妇女产前检查频率分布051015202530产前检查次数012345>5频率%图中横坐标表示产前检查次数,纵坐标表示各检查次数的孕妇例数占总孕妇数的频率(比例)。从直条高度和分布情况看出,产前检查次数分布呈负偏态分布。例抽样调查某地120名18~35岁健康男性居民血清铁含量(μmol/L),数据如下:7.4220.3818.3614.2714.8924.5217.1414.7721.7512.658.658.4023.0417.4018.3719.2613.7714.3719.4718.4823.0217.3224.2222.5519.5026.1312.5024.7515.5119.8321.6129.6424.1317.5517.0816.9920.4012.7310.8623.1221.3119.6921.5316.1018.1218.8920.3017.2527.8119.2221.4621.6911.0917.9826.0218.4619.3819.0921.6519.229.9723.9018.8920.1311.3420.8723.1116.7916.3216.7222.7317.4518.2621.0013.8117.5112.6717.1920.7527.9014.9419.0823.2914.5610.2513.1223.0219.3222.1111.7420.1820.5217.6719.8915.9411.7524.3619.5913.1724.6621.6224.1415.3819.8215.8317.4025.6119.1217.5514.1823.0723.7718.6117.4818.5421.3619.5315.3119.2616.52二、连续型定量资料的频数分布1.找出最大值和最小值minX64.29Xmax)L/mol(22.2242.764.29XXRminmax42.7XminmaxX(一)频数分布表的编制方法2.计算全距(range,R)也叫极差(1)根据数据多少,组段数一般5~15个左右(10);(2)根据(R/预计组段数)估计组距大小(22.22/10=2.22);(3)确定组段数和组距;两端的组段包含最大值和最小值;尽量取整数作为组段的端点;组距尽量取相等为宜。3.确定组段数和组距(classinterval)4.列表:根据下限≤X<上限的原则确定每一例数据所归属的组段。表××标题…………(单位)组段(1)划记(2)频数(3)频率(%)(4)累计频数(5)累计频率(%)(6)6-—18-3┆┆m-nnm合计N120100组段划记频数6~/18~///310~/,/////612~///,/////814~//,/////,/////1216~/////,/////,/////,/////2018~//,/////,/////,/////,/////,/////2720~///,/////,/////,/////1822~//,/////,/////1224~///,/////826~////428~30/1合计120最小值最大值标题组段(1)频数(2)频率(%)(3)累计频数(4)累计频率(%)(5)频率密度(%)(3)/组距6~10.8310.830.428~32.5043.331.2510~65.00108.332.5012~86.671815.003.3414~1210.003025.005.0016~2016.675041.678.3418~2722.507764.1711.2520~1815.009579.177.5022~1210.0010789.175.0024~86.6711595.833.3426~43.3311999.171.6728~3010.83120100.000.42合计120100.00120名正常成年男子血清铁含量(μmol/L)频数表1.揭示资料的分布特征;(1)集中趋势:大部分数据向中间集中,中间数据居多。(2)离散趋势:从中央到两侧,频数分布逐渐减少。2.揭示资料的分布类型;正态分布:中间高两侧低、左右对称的单峰分布。偏态分布:集中位置偏向一侧,分布不对称。3.便于发现某些特大或特小的可疑值;4.便于计算指标和统计分析。(二)、频数分布表的用途正偏态正态分布负偏态120例健康成年男子血清铁含量分布0246810127911131517192123252729血清铁含量(μmol/L)频数频数分布图第二节集中趋势的描述集中趋势指某计量资料大多数观察值所在的中心位置。常用指标有:1.算术均数(arithmeticmean),简称均数(mean)2.几何均数(geometricmean)3.中位数(median)算术均数(mean)1.定义:算术平均数是由所有数据之和除以数据个数所得的商数。反映一组同质的观察值在数量上的平均水平。总体均数用希腊字母μ,样本均数用表示。x2.适用范围:(1)描述对称分布资料的集中趋势;(2)描述正态分布资料的集中趋势。nXnXXXxn213.均数的计算公式:(1)直接法:(2)加权法nfXffXx00f为组段的频数X0为组段的组中值X0=(上限+下限)/2例:测得8只正常大鼠的血清中酸性磷酸酶(TACP)含量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试计算算数均数。)L/U(....x907538383436204120名正常成年男子血清铁含量(μmol/L)频数表组段(1)频数(2)频率(3)累计频数(4)累计频率(5)6~10.8310.838~32.5043.3310~65.00108.3312~86.671815.0014~1210.003025.0016~2016.675041.6718~2722.507764.1720~1815.009579.1722~1210.0010789.1724~86.6711595.8326~43.3311999.1728~3010.83120100.00合计120100加权法计算均数组段(1)组中值(X0)(2)f频数(3)fX0(4)6~7178~932710~1166612~13810414~151218016~172034018~192751320~211837822~231227624~25820026~27410828~3029129合计1202228)/(.LmolffXx571812022280)L/mol(.nXnXXXxn611821几何均数(geometricmean)1.定义:n个观察值的连乘积的n次方根,几何均数用G表示。2.适用范围:(1)成倍数关系或等比关系的资料(2)对数正态分布资料)lg(lg121nXGXXXGnn对数转化:3.计算公式:(1)直接法:(2)加权法:nXffXfGlglglglg11例:7名慢性迁延性肝炎患者的HBsAg滴度资料为:1:16,1:32,1:32,1:64,1:64,1:128,1:512。试计算其几何均数。64)7512lg32lg16lg(lg6451232321617GG或52例慢性肝炎患者的HBsAg滴度资料抗体滴度频数(f)滴度倒数(X)logXf(logX)1:162161.204122.408241:327321.051510.536051:6411641.8061819.867981:128131282.1072127.393731:256122562.4082428.898881:51275122.7092718.96489合计52--108.0697774705119520697710811..lgfXlgflgG4.几何均数的特点:(1)观察值不能同时存在大于和小于0的数据,不能有等于0的数据。(2)同一组资料所得几何均数小于等于均数。中位数(median)1.中位数:将一组观察值按照从小到大,或者大到小的顺序排列,位次居中的观察值水平。中位数用M表示。百分位数(percentile):一个位置指标,用Px表示。描述观察值序列在某百分位置的水平。XminXmaxP25P50P75PX(1)理论上适用于任何分布类型;(2)尤其偏态分布资料;(3)开口资料;(4)分布类型不清的资料;2.中位数的适用范围:(1)直接法3.计算公式:为偶数为奇数nxxnxM/n/n/)n(212221(2)加权法:)f100xn(fiLpLxx百分位数:Px:百分位数L:Px所在组段的下限值i:组距fx:Px所在组段的频数n:样本例数∑fL:该组段之前的累计频数)f10050n(fiLpMLx50中位数:例:某药厂观察9只小鼠口服山红景醇提物(RSAE)后在缺乏氧条件下的生存时间(分钟)如下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。试求其中位数。663921.XMnn,为奇数,中位数实例•10例正常人的发汞值:1.1,1.83.54.24.85.65.97.110.516.3M=(4.8+5.6)/2=5.2•对于某项风险较高的新手术术后的生存时间进行跟踪,共调查了7人,6人死亡之前分别生存了5天、6天、10天、16天、25天、29天,还有一人术后30天随访时仍存活。•本资料属于“开口”资料。•本例数据已经按从小到大的升序排列,n=7,为奇数,其中位数为16天。例:试对下表资料求其中位数M。120名正常成年男子血清铁含量(μmol/L)组段频数f累计频数∑f累计频率%6~110.838~343.3310~6108.3312~81815.0014~123025.0016~205041.6718~

1 / 57
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功