第三讲 描述离散趋势的指标

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三讲描述离散趋势的指标Outline主要内容描述离散趋势的统计指标描述分布形态的统计指标只用平均数描述资料的弊病•甲组2629303134均数30kg•乙组2427303336均数30kg•丙组2628303234均数30kg24262830323436丙乙甲三组儿童体重的离散程度平均数与变异度•平均数所表示的集中性与变异度所表示的离散性,从两个不同的角度阐明计量资料的特征!•均数&标准差•中位数&四分位数间距•变异度小,则均数代表性好!•变异度大,数据分散,则均数代表性差!描述离散趋势的指标变异度极差(Range)四分位数间距(interquartilerange)方差(Variance)标准差(StandardDeviation)变异系数(coefficientofvariation)描述离散趋势的指标1:极差全距(range),极差R=max-min极差反映反映一组数据的变化范围极差适用于:任何分布资料计算极差:•甲组2629303134•乙组2427303336•丙组2628303234极差优点和缺点优点:简便缺点:1.只利用了两个极端值2.n大,R也会大3.不稳定描述离散趋势的指标2:四分位数间距•P75、P25分别表示上、下四分位数•四分位数间距(quartilerange)Q=P75-P25•四分位数间距反映数据的变异程度比极差稳定。•四分位间距适用于:任何分布资料。44.544.211625757525PPQPP组段(1)频数(2)频率(%)(3)累计频数(4)累计频率(%)(5)6~10.8310.838~32.5043.3310~65.00108.3312~86.671815.0014~1210.003025.0016~2016.675041.6718~2722.507764.1720~1815.009579.1722~1210.0010789.1724~86.6711595.8326~43.3311999.1728~3010.83120100.00合计120100.00描述离散趋势的指标3:方差X离均差2)(X离均差平方和NX2)(离均差平方和的均数方差方差、标准差适用于:对称分布的资料,尤其是正态分布资料。描述离散趋势的指标3:方差方差(variance)也称均方差,观察值的离均差平方和的算术均数。表示一组数据的平均离散程度。22XN总体方差只能取正值;方差越大,意味着个体间变异越大;反之亦然。1)(∑22nXXS样本方差122nnXX=描述离散趋势的指标4:标准差标准差(standarddeviation),方差的平方根21XXsn只能取正值;标准差越大,意味着个体间变异越大;反之亦然。总体标准差样本标准差NX∑2)(描述离散趋势的指标5:变异系数变异系数(coefficientofvariation,CV)•排除了平均水平的影响,并取消了单位。因此变异系数常用于:–比较量纲不同的变量间变异度–比较均数相差悬殊的变量间变异度。100%sCVX量纲不同变量间变异度的比较均数标准差变异系数青年男子身高170cm6cm3.5%体重60kg7kg11.7%均数差别较大的变量间变异度比较年龄组均数标准差变异系数3~3.5岁96.13.13.2%30~35岁170.25.00.3%不同年龄组男子身高(cm)的变异度描述分布形态的统计指标1、偏度系数:coefficientofskewness2、峰度系数:coefficientofkurtosis正确应用(1)•算数均数:适用于对称分布资料;•几何均数:适合于对数正态分布资料;•中位数和百分位数:适用于任何分布的资料;•中位数和百分位数在样本含量较少时不稳定,越靠两端越不稳定;因此,当资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。正确应用(2)•极差:适用于任何分布资料•四分位间距:适用于任何分布资料•标准差:适用于对称分布资料•变异系数:常用于量纲不同的变量间或均数相差较大的变量间变异度的比较本章小结1.频数表、频率分布图:描述资料的分布特征(集中趋势与离散趋势)分布类型(对称或偏峰)2.描述性统计量:定量地刻画统计分布的特征。(1)集中趋势:算术均数、几何均数、中位数;(2)离散趋势:极差、四分位数间距、方差(标准差)和变异系数;3.百分位数是一种位置参数描述集中趋势:P50;描述离散趋势P75-P25课后作业与思考题:作业:1、离散趋势指标的计算(书31页第1、2、3题)思考题1、离散趋势指标各自的适用条件是什么?2、如何对定性指标进行描述?本章结束谢谢卫生统计学第三章定性资料的统计描述关英辉沈阳何氏医学院管理系第四讲相对数指标、医学人口统计描述主要内容三类相对数指标医学人口统计常用的指标一、常用的相对数指标•除了用频率分布全面反映一个定性变量外,有时,也可用其它相对数指标从某个侧面来描述定性变量。相对数指标大致有三种类型:频率(Frequency)有的书称比率(Proportion)强度(intensity)有的书称速率(rate)相对比(ratio)(一)频率型指标•频率型指标:最常见,近似地反映某一事件出现的机会大小,如患病概率、病`死概率等。K是比例基数,取100%、1000‰、1万/1万和10万/10万特点:分子是分母的一部分;无量纲,在0~1范围内取值K数可能发生某事件的个体某事件发生的个体数频率型指标(二)强度型指标“强度”是流行病学、统计学术语----单位时段内某现象发生的频率。如率单位时间内新发病的概单位时间折合的观察人数新发病例数观察人时的总和新发病例数人时发病率例3-3在某医院的院内感染调查中,5031个病人共观察了127859人日(相当于127859人观察1日),其中有596人在医院发生感染。观察人年数=10日×120人+9日×240人+8日×380人+…+3日×890人+2日×920人+1日×1200人=127859人日人日人日人人院内感染率/0047.01127859596平均每天有0.47%的病人将在医院发生感染。一般地,其中比例基数K同上。•分母含有“时间”,并不是一般的速率,而是单位时间内的频率。统计学和流行病学本质:频率强度或概率强度的近似值。K时间某事件的个体数可能发生的个体数发生某事件强度型指标)((三)相对比型指标任何两个相关联的变量A与B之比•相对于B的一个(或十个、百个、千个等)单位,A有多少个单位•A和B可以是绝对数,也可是相对数•A和B的量纲可以不同,也可相同,但A和B互不包含BA相对比型指标(四)应用相对数应注意的事项1.防止概念混淆不少指标命名混乱:“某某率”满天飞!•某些指标,实质上只是相对比,其名称却是某某率;•更多指标以某某率的模式命名,笼统地称它们为“率”----分不清究竟是频率还是强度人口构成及其统计指标指标分子分母基数类型老年(人口)系数≥65岁人口数人口总数100%频率型少儿(人口)系数≤14岁人口数人口总数100%频率型总负担系数≤14岁人口数+≥65岁人口数15~64岁人口数100%什麽型?少儿负担系数老年负担系数≤14岁人口数≥65岁人口数15~64岁人口数15~64岁人口数100%100%相对比相对比老少比性别比≥65岁人口数男性人口数≤14岁人口数女性人口数100%100%相对比相对比指标分子分母基数类型某病发病率期内新发生的某病病例数年平均人口数×1年10万/10万强度(近似)时点患病率时点现患疾病人数检查人口数10万/10万频率期间患病率期内现患疾病人数检查人口数10万/10万频率残疾患病率残疾患者人数检查人数100%频率治愈率治愈人数接受治疗人数100%频率生存率活满特定时期的人数期初存活的人数100%频率发病率(incidencerate,IR):“时期”通常用年或月。发病率的分母泛指一般的观察人年数,可由平均人口数×1年来近似。新发病例数:新发生某种疾病,以第一次就诊为准。用于探讨疾病的危险因素,评价疾病防治效果。2.计算相对数时分母应有足够数量例甲医院治疗某类患者100人,40人有效;乙医院治疗同类患者5人,2人有效有效频率均为40%!?如果资料的总例数过少,计算得到的相对数偏差可能会很大,直接报告原始数据更为可取:甲医院有效率40%乙医院有效2/53.正确地合并估计例甲医院治疗某类患者100人,40人有效;乙医院治疗同类患者90人,30人有效如果两医院总体有效率的确相等,合并估计:不可将两个频率相加除以2:%8.36901003040有效率)(有效率903010040214.相对数间的比较要具备可比性注意以下几个方面:观察对象同质?研究方法相同?观察时间一致?粗死亡率的定义式近似地写成K年1当年平均人口数同年内死亡人数粗死亡率K年1当年年中人口数同年内死亡人数粗死亡率以上说明同样适用于年龄组死亡率、粗出生率和粗发病率等,不再赘述。比较不同时期或不同地区的粗死亡率,如人口的年龄及性别分布不一致,应按性别、年龄标准化后作比较(见第14章)。二、医学人口统计常用指标一、医学人口统计资料的来源二、人口数与人口构成三、生育与计划生育统计四、人口死亡统计课后作业与思考题作业:1、频率指标和强度型指标有什么区别?(书47页1(1)题)思考题:1、还有哪些描述定性资料的指标?本章结束谢谢第五讲疾病统计指标、动态数列及其指标主要内容疾病统计常用指标动态数列及其指标一、疾病统计常用指标疾病统计的意义疾病统计资料的来源疾病和死因分类常用疾病统计指标年份(1)符号(2)学生人数(3)绝对增长量发展速度%增长速度%累计逐年(4)(5)定基比环比(6)(7)定基比环比(8)(9)=(6)-100=(7)-1001992a04200--100.0---1993a14500300300107.1107.17.17.11994a24800600300114.3106.714.36.71995a34900700100116.7102.116.72.11996a45150950250122.6105.122.65.11997a553201120170126.7103.326.73.31998a655101310190131.2103.631.23.61998a757801580270137.6104.937.64.92000a859501750170141.7102.941.72.92001a96000180050142.9100.842.90.82002a1062002000200147.6103.347.63.3二、动态数列及其分析指标表3-10某大学1992-2002年本科专业招生动态变化一、绝对增长量二、发展速度与增长速度三、平均发展速度和平均增长速度平均发展速度=环比的几何均数平均增长速度=平均发展速度1nnnnnaaaaaaaa011201预测2004年前提:平均发展速度保持不变a12满足a12=1.04124200=6724人根据该大学1992-2002年的平均发展速度,如果今后保持这个速度,预计到2004年末学生人数可达6724人。预测2040年?1212420004.1a本章小结1.描述定性资料的相对数大致有三种类型:频率型、强度型和相对比型2.实践中许多指标都称为XX率,要注意每个指标的定义和性质,不可简单地望文生义。3.动态数列指标如发展速度和增长速度可描述事物在不同时期的发展水平和趋势。要注意:预测的前提条件是“平均发展速度保持不变”。课后作业与思考题:作业:1、教材47页第1(5)、(7)题思考题:1、直观的统计描述方法是什么?本章结束谢谢第六讲常用统计图表•统计表(statisticaltable)与统计图(statisticalchart)是应用广泛的统计描述方法。通过统计表和统计图可以对数据进行概括、对比或做直观的表达。统计表(statisticalta

1 / 90
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功