计量资料离散程度-预防医学-课件-06

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

计量资料的离散程度王晓明复习与回顾1、计量资料分布与平均数的选择:分布类型算术均数几何均数中位数正态分布对数正态分布其他分布2、计量资料的分布与统计分析:正态分布计量资料非正态分布可转换为正态不可转换应用手段丰富应用手段有限√××√√√√××(三)计量资料的变异指标246810资料甲246810资料乙两份资料的算术均数等于?两份资料的区别何在?统计学的发展史上,曾经使用全距表达资料的离散程度。资料甲、乙的全距各等于?全距=最大值-最小值全距对离散程度表达的意义和缺陷?此时,资料的离散程度发生了改变,但全距无法表达。又称离散程度指标,用于反映资料中数据的分散或集中情况。因此,需要更合理的指标。一、正态分布离散程度指标——标准差表示正态或近似正态分布计量资料的离散程度δ较大,数据分布离散δ较小,数据分布集中应用意义:反映资料变异程度,S大表示数据分散“矮胖”;总体标准差以δ表示,样本标准差以S表示S小数据集中“瘦高”标准差的计算246810资甲计算方法:有直接法和频数表法,均可用计算器计算。计算原理:X-μ表示某观察值与均数间的距离Σ表示所有X到μ的距离之和2消除正、负数值相抵现象n表示X到μ的“平均”距离()X=6(X-μ)2Σnδ=n-1Σ(X-X)2S=用X代替μ代入公式,得到的是样本标准差S。为使S能更好地代表δ,式中用n-1代替n1、直接法例:五女生身高(cm)分别为152,155,167,164,159求标准差=6.19(cm)S=X-XΣ()2n-1=ΣX2-(ΣX)2nn-1(152+155+167+164+159)25=5-1(1522+1552+1672+1642+1592)-2、加权法在频数表中,继续算出fx2130名12岁健康男孩身高(cm)资料组段组中值频数(cm)(X)(f)125~127.52255.0130~132.57927.5135~137.5212887.5140~142.5365130.0145~147.5405900.0150~152.5172592.5155~157.56945.0160~162.51162.5合计13018800.018800.0fX130fX22724312.2532512.50122893.75397031.25731025.00870250.00395356.25148837.5026406.252724312.25合计得Σfx2。计算标准差S=(ΣfX)2ΣfX2-nn-1=2--1130=6.56(cm)利用计算器计算当数据输入后,计算器已将均数和标准差同时算好,你所要作的仅仅是:二、非正态分布离散程度指标对数正态分布资料:类同于几何均数计算,将数据取对数后计算“几何标准差”,可用计算器计算。其他分布资料:可选用四分位数间距=P75-P25(四)计量资料统计指标的应用仅介绍正态或近似正态分布计量资料统计指标的常见应用。首先计算出统计指标——均数和标准差,两者结合方可进行各种统计应用,主要包括:1.计算变异系数;解说2.计算医学参考值范围;解说3.推断总体均数可信区间;解说4.均数假设检验等。解说谢谢光临1、变异系数(CV)变异系数用符号CV表示。CV=S×100%X不同资料间的变异情况用CV作比较。其计算公式如下:12.51.4092.85计算和应用例:某地150名3岁女孩的身高均数为92.85cm,标准差为4.50cm,体重均数为12.5kg,标准差为1.40kg,对3岁女孩身高和体重的离散程度作比较。身高CV=体重CV=因体重CV值较大,说明体重变异情况大于身高。×100%=4.85%S×100%=XS×100%=X4.50×100%=11.20%返回若以标准差作比较不合理。2、计算医学参考值范围临床上可据此判断某人某项体检或实验室指标是否正常。比如舒张血压的正常值范围为60—90mmHg。正态分布资料可用公式X±1.96S,计算双侧95%医学参考值范围(当n≥100时)。95%范围意味着仅能包含95%的正常人,因此,称为“参考”范围。X±1.96S=144.62±1.96×6.56=144.62-12.86~144.62+12.86=131.76~157.48(cm)例:调查120名12岁健康男孩身高(cm),得:X=144.62(cm),S=6.56,求95%医学参考值范围。95%医学参考值范围资料收集注意事项数据必须来源于健康人。样本含量需≥100。故前述样本已可代表总体应用于临床实践,即用于判断任何一个12岁男孩的身高正常与否。身高cm131.76144.62157.48如测得某12岁男孩身高为140cm,如何评价?如测得某12岁男孩身高为130cm,如何评价?95%正态分布身高、体重、血压等观察值形成的资料,均数和标准差都不同,所形成的正态分布也不同。标准差相同,均数不同(μ2>μ1)的两个正态分布μ2μ1均数相同,标准差不同(δ2>δ1)的两个正态分布δ2δ1标准正态分布标准正态分布中,面积分布呈现出规律性。标准正态分布的面积分布规律标准正态分布:又称U分布,μ=0,δ=1均数0100%+∞-∞1、轴对称2、面积常数标准正态分布标准正态分布中,面积分布呈现出规律性。标准正态分布:又称U分布,μ=0,δ=1标准正态分布的面积分布规律090%+1.64-1.64故1.64被称为U0.1值(双侧)标准正态分布标准正态分布中,面积分布呈现出规律性。标准正态分布:又称U分布,μ=0,δ=1标准正态分布的面积分布规律095%+1.96-1.961.96为U0.05值(双侧)标准正态分布标准正态分布中,面积分布呈现出规律性。标准正态分布:又称U分布,μ=0,δ=1标准正态分布的面积分布规律099%+2.58-2.582.58为U0.01值(双侧)标准正态分布标准正态分布中,面积分布呈现出规律性。标准正态分布:又称U分布,μ=0,δ=1标准正态分布的面积分布规律090%-1.64+∞-1.64为U0.05值(下限)标准正态分布标准正态分布中,面积分布呈现出规律性。标准正态分布:又称U分布,μ=0,δ=1标准正态分布的面积分布规律095%+1.64-∞+1.64为U0.05值(上限)正态分布与标准正态分布各种正态分布与标准正态分布可相互转化U=X-δμXS转化公式:当n≥100时,可以用X与S分别代替μ和δ。(n≥100)则:X=X+USX上限X+US下限X-US正态分布与标准正态分布各种正态分布与标准正态分布可相互转化U=X-μδ或X=X+USXX+US下限X-US上限正态分布与标准正态分布各种正态分布与标准正态分布可相互转化XX=X+USS2.58X±S2.58X+计算99%医学参考值范围(双侧)S2.58X-正态分布与标准正态分布各种正态分布与标准正态分布可相互转化XX=X+USS1.96X±S1.96X+计算95%医学参考值范围(双侧)S1.96X-正态分布与标准正态分布各种正态分布与标准正态分布可相互转化XX=X+US计算95%医学参考值范围(上限)S1.64X+S1.64X+正态分布与标准正态分布各种正态分布与标准正态分布可相互转化X计算95%医学参考值范围(下限)X=X+USS1.64X-S1.64X-返回总体标准误——反映抽样误差的统计指标概念:样本均数的标准差意义:数值大小与抽样误差呈正比μX数μ从总体中反复抽样,将X按数值大小在数轴上堆砌起来,形成分布。标准误——反映抽样误差的统计指标μX数μ来自同一总体的许多X围绕μ也呈正态分布。他们的均数X=μ;标准差δXδn=(理论公式)标准误——反映抽样误差的统计指标来自同一总体的许多X围绕μ也呈正态分布。他们的均数X=μ;标准差δXδn=(理论公式)(应用公式)SnSX=SX=如用S代替δ,可得SX代替δX应用于统计分析。例:120名12岁健康男孩身高(cm),得:S=6.56,求SX6.56120=0.6(cm)SX虽来自某个样本,却表示许多X彼此的离散程度标准误——反映抽样误差的统计指标U=X-μδXU=X-μδt=SX由X形成的分布为正态分布,因此也可逐一转换为U值,形成U分布。触发器转换得到为t值,形成t分布。但用SX代替δX,t分布的面积常数可以查表得到。常用的有t0.05值(双侧)。0+t0.05-t0.05t分布查表标准误与标准差的区别S反映观察值(X)间的离散程度——变异SX反映样本均数(X)间的离散程度——抽样误差3、推测总体均数可信区间仅用某个X很难直接代表μ,常用一个数值范围表示——μ可信区间。若两点间对应(包含)的面积为95%,其数值应等于?μ±t0.05SXμ+t0.05SXμ-t0.05SXX数μ区间内包含了95%的X3、推测总体均数可信区间仅用某个X很难直接代表μ,常用一个数值范围表示——μ可信区间。μ±t0.05SXX数μ故区间内包含了95%的X若n≥100时,可用1.96替代t0.05值。μ±1.96SX3、推测总体均数可信区间X数μμ±1.96SX每100个X中有95个落在两数值之间。如果某个X属于95%X中的一个,其数值应位于:仅用某个X很难直接代表μ,常用一个数值范围表示——μ可信区间。3、推测总体均数可信区间X数μX±1.96SX如果某X位于μ±1.96SX范围内,则X±1.96SX范围内一定含有μ。X如果某X位于μ±1.96SX范围外,则X±1.96SX范围内一定不含μ。X95%μ可信区间计算公式仅用某个X很难直接代表μ,常用一个数值范围表示——μ可信区间。3、推测总体均数可信区间X数μX±t0.05SX95%μ可信区间计算公式返回仅用某个X很难直接代表μ,常用一个数值范围表示——μ可信区间。若n<100时,则用t0.05值替换1.96。X±1.96SX4、均数假设检验原理:建立假设——均数差别属于抽样误差,即所比较的样本均数来源于同一总体。判断:当假设成立概率>0.05时,可以认为属于抽样误差当假设成立概率≤0.05时,则可认为属于本质差别-t0.050t0.05μ95%95%的X数值,经公式t=X-μSX换算所得之t值位于±t0.05之间均数分布t分布当n≥100时,可用1.96代替t0.05。-1.961.96U分布U4、均数假设检验-t0.050t0.05μ95%95%的X数值,经公式t=X-μSX换算所得之t值位于±t0.05之间均数分布t分布X1t值1若某个X换算所得之t值位于±t0.05值之间,则说明该X位于95%X所在范围之内,与μ数值不同是抽样误差。若某个X换算所得之t值位于±t0.05值之外,则说明该X位于95%X所在范围之外,与μ数值差异不能用抽样误差解释,可认为是本质不同。4、均数假设检验-t0.050t0.05μ95%t=X-μSX均数分布t分布X2t值2若某个X换算所得之t值位于±t0.05值之外,则说明该X位于95%X所在范围之外,与μ数值差异不能用抽样误差解释,可认为是本质不同。4、均数假设检验例:从大量调查得知,健康成年男性脉搏均数为72次/分钟;某工厂100名成年男工得脉搏平均数为73.7次/分钟,标准差为5.8次/分钟。问该单位男工与健康男性的脉搏有无不同?(即已知:μ=72X=73.7S=5.8n=100)-1.9601.962、计算U值假设脉搏X=73.7次/分钟的样本,来自于μ=72的总体。表达为μ1=μ0=721、U=2.933、判断并得出统计结论∵2.93>1.96∴P<0.054、文字描述可以认为该工厂男性工人的脉搏快于健康成人。U=X-μSX=73.7-725.8/100=2.93返回当n<100时,怎样作假设检验?自由度νt0.05值自由度νt0.05值自由度νt0.05值自由度νt0.05值自由度νt0.05值1234567891012.7064.3033.1822.7762.5712.4472.3652.3062.2622.228111213141516171819202.2012.1792.1602.1452.1312.1202.1102.1012.0932.08621

1 / 45
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功