假设检验的基本步骤(三)假设检验的基本步骤统计推断1.建立假设检验,确定检验水准H0和H1假设都是对总体特征的检验假设,相互联系且对立。H0总是假设样本差别来自抽样误差,无效/零假设H1是来自非抽样误差,有单双侧之分,备择假设。检验水准,a=0.05检验水准的含义2.选定检验方法,计算检验统计量选择和计算检验统计量要注意资料类型和实验设计类型及样本量的问题,一般计量资料用t检验和u检验;计数资料用χ2检验和u检验。3.确定P值,作出统计推理P≤a,拒绝H0,接受H1Pa,按a=0.05水准,不拒绝H0,无统计学意义或显著性差异假设检验结论有概率性,无论使拒绝或不拒绝H0,都有可能发生错误(四)两均数的假设检验(各种假设检验方法的适用条件及假设的特点、计算公式、自由度确定以及确定概率P值并做出推断结论)u检验适用条件t检验适用条件t检验和u检验1.样本均数与总体均数比较2.配对资料的比较/成组设计的两样本均数的比较配对设计的情况:3点3.两个样本均数的比较(1)两个大样本均数比较的u检验(2)两个小样本均数比较的t检验(五)假设检验的两类错误及注意事项(Ⅰ和Ⅱ类错误)1.两类错误拒绝正确的H0称Ⅰ型错误-弃真,用检验水准α表示,α=0.05,犯I型错误概率为0.05,理论上平均每100次抽样有5次发生此类错误;接受错误的H0称Ⅱ型错误-存伪。用β表示,(1-β)为检验效能或把握度,意义为两总体有差异,按α水准检出差别的能力,1-β=0.9,若两总体确有差别,理论上平均每100次抽样有90次得出有差别的结论。两者的关系:α愈大β愈小;反之α愈小β愈大。2.假设检验中的注意事项(1)随机化:代表性和均衡可比性(2)选用适当的检验方法(3)正确理解统计学意义(4)结论不绝对(5)单侧与双侧检验的选择四.分类变量资料的统计描述(一)相对数常用指标及其意义1.率2.构成比3.相对比(二)相对数应用注意事项1.观察例数要足够多2.不能犯以比代率的错误3.计算加权平均率或合并率4.可比性,消除混杂因素的影响(可采用标准化方法或分层分析方法。)6.样本估计总体,假设检验五.分类变量资料的统计推断(一)率的抽样误差、总体率的可信区间及其估计方法1.率的抽样误差与标准误率的标准误计算2.总体率的可信区间及估计方法(1)正态近似法:n足够大,P或1-P均不太小,nπ和n(1-π)均大于5,或nP和n(1-P)均大于595%可信区间:P±1.96SP99%可信区间:P±2.58SP(2)查表法n较小,n≤50,P接近于0或1(二)u检验和χ2检验1.u检验:适用条件(1)样本率与总体率比较(2)两个样本率比较2.χ2检验(1)χ2检验适用范围:两个及两个以上率或构成比的比较;两分类变量间相关关系分析四格表资料四格表资料基本数据的构成,一定是相互对立的两组数据。四格表资料自由度永远为1。aba+bcdc+da+cb+da+b+c+d(2)四格表资料的χ2检验R行C列的理论数:TRC=(nR×nC)/nn40且每个格子T5,可用基本公式或专用公式,不用校正;n40但是出现只要有一个格子1T5,用校正值公式n40,或T1,用直接概率法(3)配对四格表资料的χ2检验两个率的比较采用u检验,亦可采用χ2检验,两者关系为u2=χ2。(4)行X列表资料χ2检验R>2,C=2;R>2,C>2多个率比较,若χ2>χ2a(v),P<α结论拒绝H0时,只能说明总体率之间没有差别。但不能认为它们彼此之间都有差别。注意事项:2点六.直线相关和回归(一)直线相关分析用途、相关系数和意义1.用途2.相关系数r:描述两随机变量是否具有直线型关系、关系的方向和密切程度。r为正,说明X与Y为正相关,变化趋势同向r为负,说明X与Y为负相关,变化趋势反向(二)直线回归分析的作用、回归系数及意义1.作用:研究两个连续变量X与Y之间的数量依存关系,找出最合适的直线回归方程2.直线回归方程Y=a+bXa为截距回归系数b:即斜率,描述变量X每变化一个单位,Y平均改变b个单位。相关系数确定直线回归方程的原理是最小二乘法,即保证各实测点至回归直线的纵向距离平方和最小。回归系数的统计学意义,确定回归方程的原理。七.统计表和统计图(一)统计表的基本结构和要求标题、标目、线条、数字、备注(二)统计图型的选择选择1.连续性资料――线图,最大值和最小值相差悬殊――半对数线图2.连续性资料,用升降表示动态变化速度――半对数线图3.数值变量频数表――直方图4.资料相互独立――直条图5.百分构成比――圆形图或百分直条图6.双变量连续性资料――散点图7.地区性资料—统计地图2.制图通则正确选择标题纵横轴坐标图例附表