《医学统计学》复习与总结统计学的内容结构1.统计基础:基本概念、术语、方法组成。2.统计基本方法:了解统计方法用途、对应资料的数据类型、设计、适用条件。3.统计学的内容:①描述样本特征。②用样本信息估计总体参数,检验总体间的差别。③了解变量间的关系。应用规则:必须考虑数据类型(计量或计数),分布类型,对比组类型(2组或多组,独立或配对)。学习方法:按知识点归纳,理解基本概念,掌握应用条件,正确表达(读书不背书)。统计学方法小结:计量资料资料的性质?计数或等级单变量统计描述:平均数、变异指标单变量的统计检验:t检验,F检验,秩和检验两变量:相关、回归原始数据、频数表原始数据整理为四格表、RC表数据整理形式?统计描述:率、构成统计检验:χ2检验,秩和检验样本或总体?统计方法统计方法第一—第三章1.统计学研究的对象是什么?有什么特点?2.总体与样本3.变量与资料类型4.参数与统计量5.什么叫配对设计或完全随机分组设计?掌握的基本概念表100例高血压患者治疗后临床记录患者年龄性别治疗组舒张压体温疗效编号X1X2X3X4X5X6137男A11.2737.5显效245女B12.5337.0有效343男A10.9336.5有效459女B14.6737.8无效。10054男B16.8037.6无效实验与观察研究要求掌握概念1.实验与观察研究二者的主要区别。2.实验设计的三原则及意义和作用。3.实验设计的三要素是什么?4.观察研究中有那几种概率抽样方法?5.观察研究有几种研究类型?主要回答那些问题?6.何为随机化分组与随机化抽样?第四、六章数据特征与统计描述单个变量的统计描述:1.计量数据:分布的描述:频数表特征的描述:平均数、变异指标2.计数资料:分布的描述:频数表特征的描述:率、构成比、相对比3.统计结果的表达:统计表和图第四、六章数据特征与统计描述掌握内容和概念:1.认识计量数据频数表及分布形态和计数数据的频数表。2.计量数据和计数数据描述的统计指标有那些,各自的适用条件、概念及计算。3.正态分布(X值)理论上常用的三个分布范围为多少?4.熟悉统计描述指标的符号和基本计算。表6.1某地正常成人腋下温度(C)的频数表腋温组段频数(f)f(%)35.6-35.8-36.0-36.2-36.4-36.6-36.8-37.0-37.2-37.4-37.614132442301510510.682.758.9616.5528.9620.6910.346.893.450.68合计145100频数表表达资料定性数据的频数表两组疗效的比较比较组疗效(y)(x)痊愈显效有效无效合计实验组202510257对照组251530521.计量资料统计描述指标正态或近似正态分布资料描述指标:、S、CV,表达:X偏态分布资料中位数(M)、四分位间距(QR)表达:M(QR)等比关系资料几何均数(G)1)描述计量数据(X)几个特征值:平均水平、变异程度指标xs正态分布法(正态或近似正态分布资料)百分位数法P2.5%-P97.5%(偏态分布资料)作用:①估计变量值分布范围②评价个体的指标正常与否2)描述计量数据变量值(x)分布范围2、计数资料统计描述指标相对数指标及含义:率指标:说明事物发生的频率和强度。构成比:说明各类别所占的构成比。说明事物的组成和分布情况。相对比:两事件的相对关系(增长速度)。掌握:①相对数指标意义及计算②应用时的注意问题例:某医院部分科室院内感染情况科室住院感染感染感染人数病人数人数率%构成比%呼吸内科1001010.026.32心血管内科10088.021.05泌尿外科40615.015.78胸外科42211.913.16普外科1001212.031.58合计382389.9100.00相对数指标不同职业各年龄(岁)组冠心病发病率比较年龄(岁)职业40-50-60-70病人数%病人数%病人数%干部2160925.7514.3工人1270423.515.9有人认为:该单位冠心病发病率随年龄增加在下降,该结论——。3、统计描述——统计表与统计图统计表要求掌握统计表的基本格式,正确将数据结果用统计表表达。统计表类型:简单表和组合表统计图:要求掌握图形选择.如线图、直条图、直方图、构成图例:简单表格式某地1980年男女HBsAg阳性率的比较性别调查例数阳性数阳性率%男42343037.16女45301814.00合计87644845.52例组合表的格式某地不同年龄、性别HBsAg阳性率(%)的比较年龄男性女性(岁)调查数阳性数阳性率调查数阳性数阳性率0-21181466.892719742.7220-12871169.011168827.0240-695375.32571234.036011243.577222.78合计42343037.1645301814.00表101592例口腔颌面部肿瘤、囊肿和瘤样病变例数和百分比病变性质例数百分比(%)良性674肿瘤恶性癌肉瘤其它43710120558123242.3435.0577.39囊肿瘤样病变总计192168159212.0610.55100.00原表:1.层次不清,结构混乱,难于理解2.线条过多,不符要求指出表的问题,并按统计表的规范进行修改表10口腔颌面部不同病变构成情况病变性质例数构成比(%)良性肿瘤67442.34恶性肿瘤﹡55835.05囊肿19212.06瘤样病变16810.55合计1592100.00修改后:﹡包括癌437例,肉瘤101例,其他恶性肿瘤20例。第七、八、十章参数估计和假设检验掌握概念:1.何为均数的抽样误差,统计上用什么表示?2.标准差和标准误的区别?3.均数的可信区间与参考值范围在计算和用途的区别4.何为假设检验,假设检验有何用途5.假设检验的步骤和概念6.统计检验中Ⅰ、Ⅱ型误差的概念7.区别配对和两独立样本的资料。8.假设检验(t检验)与可信区间的联系是什么?9.什么叫方差齐性检验,何时采用?10.单样本的可信区间与两个样本的差值的可信区间区别?名词解释:标准差,标准误,均数的可信区间方差齐性,参考值范围,Ⅰ、Ⅱ型误差计量数据统计的假设检验假设检验回答问题:比较组的样本均数、率的差别,差别是否由于抽样误差所致。(一)计量资料:1.两组数据的比较—t检验区别:*配对数据t检验(只要求正态)*两组独立样本t检验(例数少)资料要求:正态、方差齐性(两组独立样本t检验)计量数据比较的统计公式xSXt0ddSdt2121xxSXXt样本均数与标准值的比较*配对数据的比较(不做方差齐性检验*两样本均数的比较,例数较小时(做方差齐性检验)t检验与可信区间公式小结1212/2,()XXXXtS121212,2XXXXtnnS1-nn/S0dSdtdd0两独立样本均数的t检验公式两均数差值的可信区间公式/2,ddtS配对设计样本均数差值(d)的t检验公式差值均数的可信区间估计公式第11章多个样本比较的方差分析用途:方差分析(F检验)用于三组及以上的计量资料组间均数差别的比较,如F≥Fα,做多重两两比较检验。概念:1.为什么多组均数比较不能用t检验2.何为区组设计和完全随机设计的方差分析?3.两种设计方差分析变异分解几个部分,各部分变异的原因。4.方差分析和方差齐性检验区别方差分析与t检验的关系当比较两个样本均数时,从同一资料(配对设计或不配对设计),计算的F值与t值有如下关系:F=t2可见在两组均数比较时,方差分析与t检验的效果是完全一样的。第九章计数资料组间的比较检验方法:χ2检验χ2检验可以回答:1.差别:两组或多组组间样本率检验2.是否独立:两个变量的关联关系(行变量与列变量组间构成比的检验)掌握:1)独立性检验的数据表格形式2)不同X2的公式及使用条件和计算计数数据(RC表)的χ2检验统计公式TTA22)())()()(()(22dbdccabaNbcad))()()(()2/(22dbdccabaNNbcad基本公式两组设计四格表专用公式(不配对)两组设计四格表校正公式(不配对)cbcb22)1(配对设计两组四格表专用公式)1(22CRnnAN2K和RC表的专用公式两种疗法心血管病病死率比较疗法死亡人数生存数合计病死率%苯乙双胍26(21.3)178(182.7)20412.75安慰剂2(6.7)62(57.4)643.13合计2824026810.45假设:H0:1=2=c=10.45(两组总体率相等)H1:12(两组总体率不等)注意:进行卡方检验前,一定计算理论数理论数:T11=n1π=204×10.45=21.3(人)T12=204-21.3=182.7第12、13章线性回归与相关目的:探讨计量变量间相关关系(线性)(设计:变量(y、x)资料类型:变量为计量数据要求:有线性趋势方法:1.关系的描述指标:相关系数(r)、回归方程2.关系统计检验:t检验和方差分析本章节概念1.相关系数(r)、rs、回归系数(b)各自说明什么?2.相关系数(r)、rs、方差分析如F>Fα,p<0.05说明什么?3.SS回和SS剩表示含义?4.何为决定系数,在回归分析中有什么作用?第14章基于秩次的统计方法掌握概念:1)何为非参数统计?2)什么样数据适合采用秩和检验,以及秩和检验的优缺点。3)秩和检验有那几种检验方法?注意:结果(y)数据为等级时,两组比较采用秩和检验效率高于χ2检验,应首选秩和检验.表某病两组疗效的比较比较组无效有效显效痊愈合计试验组18(31.6)18(31.6)15(26.3)6(10.5)57对照组21(46.7)15(33.3)8(17.8)1(2.2)45Total3933237102(括号内为构成比)计算χ2=4.81,p=0.186,p>0.05计算两组秩和检验,u=2.64,p<0.011.样本与总体的概念(举例说明)2.统计资料的类型、概念(举例说明)3.标准差与标准误的概念。4.可信区间与参考值范围有区别5.统计检验中的p值和α的含义是什么?P<0.05,说明什么?6.何时考虑用t检验、F检验,资料满足检验的条件是什么?7.方差分析与方差齐性检验的区别?思考复习题8.何时考虑用秩和检验、χ2检验9.假设检验中的两类错误的概念是什么?10.相关分析和回归分析有何不同,何时考虑用相关,何时考虑用回归.11.实验设计的三要素和三个原则及意义概念例题练习一、选择题:1.判断下列资料的类型a.比较两组人的红细胞数(万/mm)b.某疗法治疗某病患者结果:结果:治愈显效好转无效c.血压指标分为>90,≤90d.某检查结果:-±+++++++++2.某地50岁以下女性血清铁蛋白数据的S=17.06(ng/ml)表示——表示——含义a.数据最大和最小的范围b.样本数据中个体值平均水平的指标c.表示均数的抽样误差大小d.表示该指标的个体间变异程度的指标SX96.1xvstX,05.071.1XS3.某医院收治某病患者的年龄情况如下:年龄(岁)10-20-30-40-50-60以上人数251060100501)本研究关心变量是a某病患者b某病患者年龄2)上述资料为:a原始数据b计量资料频数表c计数资料频数表3)应选择什么指标做统计描述:abM与四分位间距(QR)4)如绘制统计图应选择什么图形?a直条图b百分构成图c直方图d线图5)本例数据是否要做t检验?xs4.哪个公式是估计正态分布资料个体值95%的分布范围a.b.c.d.5.做两组独立样本t检验和方差分析的前提条件:a.无条件b.c.正态分布d.资料正态和方差齐性96.1sx96.1xsx96.1216.两配对样本t检验的前提条件:a.无条件b.方差齐性C.正态分布d.资料正态和方差齐性7.两样本均数比较,分别取以下检验水准,下列何者2型误差最小?a.0.05,b.0.01c.0.10d.0.208.测得18名正常人(晨尿)尿氟含