医学统计学第4版第4章定量资料

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第4章定量资料的统计描述卫生统计学教研室统计分析统计描述:是用统计图(表)、统计指标来描述群体的分布特征统计推断:抽样研究中,用观察得到的样本信息推断所代表的、未知的总体特征ID身高年龄父亲身高母亲身高周锻炼次数民族性别户口类别儿时健康状况202565517527171.5155.53汉男农村良好202565316022174.0155.05汉女城市一般202583015825168.0156.03藏女城市一般202254317623169.0155.06汉男农村一般202246616925172.0151.04羌男农村一般202453515727168.0152.04汉女城市较差…………………………201946416824170.5153.02汉男农村一般202578317429167.0157.06其它男农村一般2010年成都市“正常”人群身高及其影响因素调查第一节频数分布表和频数分布图原始资料以个体为对象收集的数据——排列杂乱无章很难发现、总结出群体的特征和规律分组整理,用简明扼要的形式来全面反映资料(群体)的特点频数分布表频数分布图——直方图频数表(frequencytable)的构成分组标志:或称组段,是将资料(群体)按照某种标准(标志)划分成不同的组别频数:统计不同组别内发生的观察值个数频数分布表性别频数频率(%)男4040.00女6060.00合计100100.00某班性别构成情况取值为某实数范围区间的特定值以变量取值为分组标志,并列出相应频数离散型定量变量频数表完成次数频数f频率(%)累计频数累计频率(%)232.9432.94376.86109.8041615.692625.4953332.355957.8462423.538381.3771413.739795.10843.9210199.02910.98102100.00合计102100.00——表4.12005年某市102名高中男生引体向上完成次数的频数分布标题纵标目横标目顶线底线纵标目下横线完成次数频数频率(%)累计频数累计频率(%)232.9432.94376.86109.8041615.692625.4953332.355957.8462423.538381.3771413.739795.10843.9210199.02910.98102100.00合计102100.00——表4.12005年某市102名高中男生引体向上完成次数的频数分布数字区引例1.7061.3261.6321.8762.1611.6841.5331.1751.8671.6762.0911.8471.2131.2770.9892.2351.6651.2891.7241.5481.6081.8901.7331.7961.2031.7361.4501.6331.5551.3521.8321.4441.7371.4591.4501.7821.5551.6341.5082.3431.5091.7451.9531.7441.6951.7071.9011.8251.5972.3381.7081.7111.8561.6441.7161.9781.5341.9001.5951.6461.9051.6101.6141.4222.3012.1271.3481.3171.0621.8301.9801.5701.4951.8642.1702.0001.7051.8631.4242.0222.0681.5761.8331.6592.2121.3992.1281.5431.5621.3821.2911.7961.6471.4151.8730.9961.9361.5261.4241.5891.6701.0561.9691.4812.4062.1231.9881.5121.0301.8861.9301.7251.3741.6541.6631.4381.6451.2141.1841.735例4.2在某市2005年进行的小学生体质评价研究中,测定了120名9岁男孩的肺活量(L),资料如下,根据该资料制作频数表。其值可以取在某个实数范围区间的任意值,即在某个实数范围区间连续存在人为分割成若干个组段,再求频数连续型定量变量的频数表求全距(range/R):观察值中的最大值与最小值的差值即为全距(或极差)R=2.406-0.989=1.417(L)。确定组数a公式法经验法:一般观察对象在50以下时可分5~8组,在50以上时可分9~15组本例拟分a=11组频数表的编制确定组距i(classinterval):即每个组段包含的距离不等距划分—专业意义等距划分—i=R/a原始数据精度向上四舍五入1位本例i=1.417/11=0.1290.13频数表的编制确定组段:即确定各组段的上下限,明确各组段含义穷尽原则(不漏)互斥原则(不重)频数表的编制确定最小组段下限最小组段必须包含最小值原始数据精度向上截取1位最小值0.989,取第一组段下限为0.98根据最小组段下限和组距确定各组段范围规定:半闭半开,含上限不含下限第一组段0.98~1.11,第二组段为1.11~1.24第一组段0.98~,第二组段为1.11~确定最大组段上限最大组段必须包含最大值最大值2.406,取2.28~2.41频数表的编制表4.22005年某市120名9岁男孩肺活量(L)频数分布组段频数(f)频率(%)累计频数累计频率(%)0.98~54.1754.171.11~54.17108.331.24~75.831714.171.37~1411.673125.831.50~1915.835041.671.63~2924.177965.831.76~1512.509478.331.89~1210.0010688.332.02~65.0011293.331.15~43.3311696.672.28~2.4143.33120100.00合计120100.00——统计各组段频数,计算频率和累计频率频数分布图—直方图图4.12005年某市120名9岁男孩肺活量频数分布0204060801000.850.981.111.241.371.501.631.761.892.022.152.282.412.54累计频率分布图图4.22005年某市120名9岁男孩肺活量累计频率分布累计频率(%)x频数分布类型(分布形式)揭示频数分布特征集中趋势——集中位置离散趋势——变异性便于进一步计算指标和统计处理便于发现某些特大或特小的可疑值频数表和直方图的用途频数的分布是否对称对称分布:集中位置在正中,左右两侧频数分布大致对称。偏态分布:指频数分布不对称,集中位置偏向一侧正偏态分布:集中位置偏向数值小的一侧负偏态分布:集中位置偏向数值大的一侧频数分布形式图4.12005年某市120名9岁男孩肺活量频数分布某年某地一次伤寒爆发潜伏期频数表219名乳腺癌患者康复期生存质量评分频数分布类型(分布形式)揭示频数分布特征集中趋势——集中位置离散趋势——变异性便于进一步计算指标和统计处理便于发现某些特大或特小的可疑值频数表和直方图的用途051015202530351.0451.1751.3051.4351.5651.6951.8251.9552.0852.2152.345频数图4.12005年某市120名9岁男孩肺活量频数分布集中趋势(centraltendency)一组数据向某一个位置聚集或集中的倾向该集中位置,反映一组数据的平均水平离散趋势(dispersiontendency)各个数据背离集中位置的倾向反映一组数据的分散性或变异度频数分布特征一组数据向某一个位置聚集或集中的倾向集中位置的刻画指标:平均数(Average)均数几何均数中位数统计学意义说明集中位置的准确水平说明数据的平均水平或中心位置常作为群体中最有代表性的值与其它群体进行比较第二节集中趋势的刻画指标是算术均数(arithmeticmean)的简称表示符号:总体均数用表示,样本均数用表示计算方法直接法频数表法均数(Mean)1…nXXXXnn111……kkkfXfXfXfXXfffnX表4.22005年某市120名9岁男孩肺活量(L)频数分布组段频数(f)频率(%)累计频数累计频率(%)0.98~54.1754.171.11~54.17108.331.24~75.831714.171.37~1411.673125.831.50~1915.835041.671.63~2924.177965.831.76~1512.509478.331.89~1210.0010688.332.02~65.0011293.331.15~43.3311696.672.28~2.4143.33120100.00合计120100.00——均数的特点优点计算简单、容易理解均衡的考虑了每个个体值的信息,利用信息全面一组单峰对称分布资料中最有代表性的值是正态分布的一个重要参数22()()XXXa()0XX缺点受极端值的影响大不适用于偏态分布或分布不明不适用于开口资料集中趋势的描述产生原因:测量工具的测量范围表现形式:一端或两端存在不确切值特点:在资料中所占比例不会太高均数的特点适用于描述单峰对称分布资料的集中趋势特别是正态分布或近似正态分布资料集中趋势的描述在描述正态分布特征方面具有重要意义—是正态分布的一个参数均数的应用均数的应用均数偏态分布有极端值的资料开口资料单峰对称分布正态分布分布不明例4.5某医院预防保健科用流脑疫苗为75名儿童进行免疫接种后,抗体滴度测定结果如下,求平均滴度。引例抗体滴度滴度倒数x频数f1:4441:8891:1616211:3232201:6464121:12812851:2562564合计—75表4.375名儿童的抗体滴度75名儿童的抗体滴度分布051015202505010015020025030075名儿童的对数抗体滴度分布75名儿童进行流脑疫苗免疫接种1个月后对数抗体滴度的均数为:11lg107.7676lg()lg()27.3575fxGfX正偏态分布观察值之间呈等比关系(或近似)lgX对称分布正态分布对数正态分布应用:观察值之间呈倍数或近似倍数变化(等比关系)资料,呈正偏态分布,但数据经过对数变换后呈对称分布,甚至正态分布的资料(对数正态分布)符号:用G表示计算方法几何均数(GeometricMean)11112212...lglglglglg()lg()...kkkfXfXfXfXGffff1112...lglglglglg()lg()nXXXXGnn计算几何均数时观察值中不能有0或负数观察值均为负数时,去掉符号进行计算,计算结果加上负号为所求几何均数观察值中有0或正负同时存在时,观测值同时加上实数k,使所有值均为正数后进行计算,计算结果减去实数k所求为几何均数几何均数注意事项平均数对数化后呈对称几何均数中位数均数偏态分布有极端值的资料开口资料分布不明中位数,用M表示是将资料从小到大排序后位置居中的数值使P(Xx)0.5与P(Xx)0.5同时成立的值计算方法直接法:例数较少时,排序后获得n为奇数时:n为偶数时:频数表法:例数较大时,不便排序累计频率中位数(Median)1()2nMX(1)()22[]2nnMXX完成次数频数f频率(%)累计频数累计频率(%)232.9432.94376.86109.8041615.692625.4953332.355957.8462423.538381.3771413.739795.10843.9210199.02910.98102100.00合计102100.00——表4.12005年某市102名高中男生引体向上完成次数的频数分布百分位数(Percentile)是一种位置指标一组数据由小到大按顺序排列后处于第x百分位置上的数值,用Px表示理论上有x%的观察值比它小,有(100-x)%的观察值比它大中位数:特殊的百分位数,即P50Pxx%(100-x)%

1 / 112
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功