2012预防专业卫生统计学幻灯片(2015.10) (2)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

卫生统计学主讲人李宏革卫生统计学教研室第一章绪论一.什么是统计学?二.什么是卫生统计学?三.统计学的基本概念。四.统计分析资料的基本类型。五.统计工作的基本步骤。一.什么是统计学?统计学(statistics)是运用概率论和数理统计的原理、方法,研究数据资料的搜集、整理、分析和推断的一门学科。理论基础:数理统计、概率论。目的:透过现象看本质。统计学statistics二.什么是卫生统计学?运用概率论和数理统计的原理、方法,结合公共卫生实际,研究数据资料的搜集、整理、分析和推断的一门学科。三.统计学的基本概念1.变量:观察对象的某项特征定义为变量。变量的观测结果变量值。根据变量值的特征,变量分为:(1)数值变量(2)分类变量(1)数值变量(定量变量)变量值既有大小又有度量衡单位。连续型数值变量:如身高、体重等。离散型数值变量:(2)分类变量(定性变量)变量值表现为互不相容的类别或属性。根据类别或属性之间有无程度性差别,分类变量分为:无序分类变量有序分类变量无序分类变量:两分类变量多分类变量有序分类变量:尿糖化验结果按-、±、+、++、+++分类;疗效按治愈、显效、好转、无效分类。连续型数值变量数值变量离散型数值变量变量两分类变量无序分类变量分类变量多分类变量有序分类变量(3)变量间的转化数值变量两分类变量有序分类变量分类变量数值化2.同质:根据研究目的,观察单位或个体对所研究指标有影响的非实验性因素相同。如:调查皇姑区5岁男孩身高情况。3.变异:同质基础之上个体被研究指标之间的差异。4.总体:根据研究目的所确定的同质观察单位全体。如:调查皇姑区5岁男孩身高情况。根据有无明确的时空,总体分为:(1)有限总体(2)无限总体统计学的任务:(1)了解事物或现象的总体情况。(2)了解事物或现象之间的关系。5.样本:按照随机化原则从总体中抽取部分个体组成的集合。样本容量样本的代表性6.参数:根据总体个体值计算出来的描述总体特征的指标称为参数。7.统计量:根据样本个体值计算出来的描述样本特征的指标称为统计量。统计量参数?8.抽样误差:由于个体变异的存在,在随机抽样的过程中,出现的统计量与参数、统计量间的差异称为抽样误差。9.概率:某随机事件发生可能性大小的量。用P表示P≤0.05或P≤0.01小概率事件四.统计分析资料的基本类型1.数值变量资料(计量资料)2.分类变量资料(计数资料无序分类变量资料)3.等级资料(半定量资料有序分类变量资料)五.统计工作的基本步骤1.设计2.搜集资料3.整理资料4.分析资料统计描述资料统计分析参数估计统计推断假设检验第二章数值变量资料的统计描述测得130名健康成年男子脉搏资料(次/分)如下:75767269667257687172697273828082676973647458706460776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876(1)求极差(R):即最大值与最小值之差,又称为全距。R=84–57=27(次/分)(2)确定分组组数(n)、组距(i):n通常为10~15组。组距=极差/组数,为方便计,组距为极差的十分之一,再略加调整。27/10=2.7≈3(3)确定组限(L):第一组的下限略小于最小值,最后一个组上限必须包含最大值。56~59~……80~83~85(4)划记计数:用划记法将所有数据归纳到各组,得到各组段的频数。一.频数表的编制130名健康成年男子脉搏(次/分)的频数分布表脉搏组段频数,f频率(%)累计频数累计频率(%)(1)(3)(4)=(3)/N(5)=(3)↓(6)=(5)/N56~21.5421.5459~53.8575.3862~129.231914.6265~1511.543426.1568~2519.235945.3871~2620.008565.3874~1914.6210480.0077~1511.5411991.5480~107.6912999.2383~8510.77130100.00合计130二、频数分布图---直方图脉搏(次/分)56~59~62~65~68~71~74~77~80~83~85130名正常成年男子脉搏的频数分布频率密度(%)三.描述集中趋势的指标----平均数平均数:描述一组同质观察值的平均水平,作为其代表值。均数几何均数平均数中位数众数调和平均数1.均数(算术均数):样本均数,总体均数(1)适用条件:变量值呈对称分布,尤其呈正态或近似正态分布。X(2)计算:直接法:用于样本含量较少时,其公式为:加权法:用于频数表资料或样本中相同观察值较多时,其公式为:nXXXnXXn21ffXfffXfXfXfXkkk......212211130名健康成年男子脉搏(次/分)的频数分布表脉搏组段频数,f频率(%)累计频数累计频率(%)(1)(3)(4)=(3)/N(5)=(3)↓(6)=(5)/N56~21.5421.5459~53.8575.3862~129.231914.6265~1511.543426.1568~2519.235945.3871~2620.008565.3874~1914.6210480.0077~1511.5411991.5480~107.6912999.2383~8510.77130100.00合计130测得130健康成年男子脉搏资料(次/分)如下:7576726966725768717269727382808267697364745870646077667764677675757165627672716067757573796669797870727072787267728068706170737271817066757163777476686577697775796479737661806469707369686570696681636480747876846670736076827364657373638068767079776470666973787632.711307678727675X130名健康成年男子脉搏(次/分)的频数分布表脉搏组段组中值(Xi)频数,ifiifX2iifX(1)(2)(3)(4)(5)56~57.52115.06612.559~60.55302.518301.362~63.512762.048387.065~66.515997.566333.868~69.5251737.5120756.371~72.5261885.0136662.574~75.5191434.5108304.877~78.5151177.592433.880~81.510815.066422.583~8584.5184.57140.3合计1309311.0671354.5257.5560.5184.5931171.62()251130X次分2.几何均数(geometricmean)用G表示(1)适用条件:变量值之间呈倍数或近似倍数关系;变量值呈对数正态分布,即数据经过对数变换后呈正态分布。(2)计算:直接法:加权法:(3)注意事项:观察值中不能有0,因0不能取对数;一组观察值中不能同时有正或负值。nnXXXG...21)lg(lg)lg...lglg(lg1211nXnXXXGn)lg(lg....lg...lglg(lg12122111fXffffXfXfXfGkkk测定10名伤寒病人血清抗体滴度分别为1:4,1:4,1:4,1:4,1:4,1:16,1:16,1:16,1:64,1:128,求其平均抗体滴度。以其滴度的倒数为原变量值,代入公式有:313708.11104359738.31286416161644444...101010321nnxxxxG11111log()log(4)log(4)...log(128)loglog1010.53605loglog[1.0.53605]11.31370810kiixGn平均抗体滴度为:1:1169例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均抗体滴度。表2-469例RA患者血清EBV-VCA-lgG抗体测定结果抗体滴度人数f滴度倒数XlgXlgfX⑴⑵⑶⑷⑸1:101:201:401:801:1601:3201:6401:128043101011151421020408016032064012801.00001.30101.60211.90312.20412.50512.80623.10724.00003.903016.021019.031024.245137.576539.28686.2144合计69——150.2778111lg150.2778lg()lg()lg(2.1779)150.669fXGf3.中位数(median)用M表示。(1)定义:一组由小到大按顺序排列的观察值中位次居中的数值。(2)适用条件:变量值呈非正态分布资料(对数正态分布除外);频数分布的一端或两端无确切数据的资料;总体分布不清楚的资料。是否为对称分布?变量0510152025303540452.453.053.654.254.855.456.10频数是否为对称分布?变量051015202530354045502.453.053.654.254.855.456.10频数转氨酶含量人数12~215~918~1421~2324~1927~1430~1133~936~739~442~453115名正常成年女子血清转氨酶(mmol/L)含量分布正偏态分布:血清转氨酶(mmol/L)051015202513.519.525.531.537.543.5.115名正常成年女子血清转氨酶的频数分布人数肌红蛋白含量人数0~25~310~715~920~1025~2230~2335~1440~945~502101名正常人的血清肌红蛋白含量分布g/mL负偏态分布:血清肌红蛋白(μg/mL)05101520252.512.522.532.542.552.5101名正常人血清肌红蛋白的频数分布人数(3)计算:直接法:n为奇数,n为偶数,2)1(nXM)(21122nnXXM例9名中学生甲型肝炎的潜伏期分别为12,13,14,14,15,15,15,17,天,求其中位数。8845122221415214.5()MXXXX+如果只调查了前八位中学生,则:+(+)(+)天)(155219天XXM19频数表法:用于频数表资料。百分位数(percentile)用Px表示。中位数是一个特定的百分位数,即M=P50。Px计算公式:)%.(LXfXnfiLPxPxxminxmax%X(100)%XXP百分位数示意图百分位数(percentile)频数表中位数的计算脉搏组段频数,f频率(%)累计频数累计频率(%)(1)(3)(4)=(3)/N(5)=(3)↓(6)=(5)/N56~21.5421.5459~53.8575.3862~129.231914.6265~1511

1 / 377
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功