1计量资料的统计推断一、实习目的1、正确理解抽样误差概念2、掌握总体均数的可信区间的估计方法3、掌握各种常见设计类型t检验的条件、方法2(一)参数估计(二)假设检验二、理论复习3(一)参数估计1、抽样误差概念、描述指标①概念②描述指标及其意义、用途2、总体均数的估计3、参考值范围与可信区间的区别4样本统计量与总体参数或样本统计量之间xxxxx1x2x3x抽样误差:由抽样而引起差异抽样研究:从总体中随机抽取样本进行研究,用样本指标(或特征)推断总体参数(特征)的方法。形成抽样误差的根本原因是个体差异5反映了样本均数的离散程度表示抽样误差的大小标准误1x2x3x4x抽样误差在抽样研究中是不可避免的,但有规律可循,数理统计学证明:两个定理:(1)从正态总体中随机抽取例数n的样本,样本均数也服从正态分布。(2)样本均数的总体均数仍为,标准差为x样本均数的标准差,称为标准误x6均数的标准误样本均数的标准差表示抽样误差的大小同一总体的样本均数的离散程度样本均数与总体均数的差异程度标准误大抽样误差大由样本推论总体的可靠性差标准误小抽样误差小由样本推论总体的可靠性好均数标准误的计算:nssnxx7增加总体的同质性,增大样本含量,可减小抽样误差。均数标准误的用途:1.表示抽样误差的大小:大抽样误差大由推论可靠性差小抽样误差小由推论可靠性好nssx大大xss小大xsn影响因素2.估计总体均数的可信区间3.用于均数的假设检验xsxsxx联系:二者均为变异指标,标准误可称为样本均数的标准差。当样本含量不变时,均数的标准误与标准差成正比。8(一)参数估计指样本统计量来估计总体参数,是统计推断的一个主要内容。1.点估计(pointestimation)直接用样本统计量作为总体参数的估计值,简单。2.区间估计(intervalestimation)按预先给定的可信度估计总体参数的可能范围。可信度用表示,常取95%或99%可信区间的含义:总体均数被包含在该区间的概率为(1)未知n不是很大,根据t分布的原理(2)已知或未知,但n足够大1xs119xxstxCIstxCI,01.0,05.0%99%9595%可信区间99%可信区间公式区间范围窄宽估计错误的概率大(0.05)小(0.01)特点精密度高精密度低准确度低准确度高XStX,05.0XStX,01.010XXXXSXCISXCIXCIXCIuuut58.2%9996.1%95:58.2%9996.1%95:58.2,96.1,,01.005.0未知已知大样本:11参考值范围与可信区间的区别:95%参考值范围:用途:判断观察对象的某项指标是否正常.95%可信区间:sx96.1xsx96.11xxxxxxxx1s1xs2x2s2xssxsx96.1~96.1xxsxsx96.1~96.1用途:估计总体均数所在的范围。12(二)假设检验1、假设检验的目的、基本思想、步骤2、假设检验的注意事项3、t检验13思想:对总体参数或分布作出假设选择检验方法验证假设确定是否支持假设(小概率原理)若实测样本在检验假设成立时出现的可能性很小,则认为这个样本不是来自所假设的总体,拒绝假设。7202.74x目的:判断已知均数的差别到底是仅由抽样误差引起的,还是由本质差别引起的。141.建立检验假设,确定检验水准及单双侧无效两总体参数相等备择两总体参数不等双侧检验若已知一侧不会发生单侧检验2.选择和计算检验统计量(t值,值,F值等)(按资料性质、设计方案和研究目的)3.确定P值,作出推断结论,自由度,查附表得若按水准拒绝H0,接受H1。按水准不拒绝H0作出统计结论和专业结论,ttP,ttP,t200:H01:H00或05.015P值的意义:在H0成立的条件下,获得到等于或大于该样本统计量的概率。即由抽样误差引起的概率大小若H0成立,t不会很大,P应较大;若H0不成立,t会很大,P应较小。P越小,越有理由拒绝H0,P越大,越有理由认为H0成立。P大到多少,可认为H0成立?水准按所取的检验水准不拒绝H0,差异是由抽样误差引起。按所取的检验水准拒绝H0,接受H1。P值越小,越有理由认为两总体均数不同。pp29x0sxt29,05.0tpt163.t检验①适用条件:样本例数较小,且来自正态分布的总体,总体标准差未知。两样本比较,要求两总体方差相同,即方差齐性。②类型样本均数与总体均数的比较的t检验配对资料的比较的t检验两样本均数的比较的t检验17样本均数与总体均数比较的t检验1.建立检验假设,确定检验水准及单双侧H0:H1:2.计算统计量:3.确定P值,作出推断结论:005.00nSxSxt/||||001n查t界值表,得,01.0,05.0tt或目的:推断样本所代表的未知总体均数μ与已知的总体均数μ0有无差别18配对设计:1、自身比较:指同一受试对象处理前后的比较,目的是推断处理因素的作用。2、同一样品两种方法检验的结果,目的是判断不同检验方法的结果是否相同。3、异体配对:将同质受试对象按品系、种属、性别、体重、窝别配成对子,每对中的受试对象分别给予不同的处理,观察处理结果之间的差异。基本原理假设两种处理的效应相同,即即对比两样本差值均数所代表的未知总体均数与0的比较。配对比较t检验02121dd190:0dH0:1dHdSdt|0|1.建立检验假设,确定检验水准及单双侧2.计算统计量:3.确定P值,作出推断结论:05.01n对子数-1查t界值表得,05.0t20两样本均数比较的t检验1建立检验假设,确定检验水准及单双侧210:H211:H05.0适用范围:完全随机分组设计的两个样本均数比较应用条件:两样本所属的总体服从正态分布。两总体方差相等。方差齐性检验)/1/1(212212121nnsxxsxxtcxx2计算统计量3确定P值,作出推断结论2)1()1(212222112nnnnsssc221nn查t界值表得,05.0t21(1)所比较的资料应具有代表性、均衡可比性。要有严密的实验设计。(2)根据资料性质和分析目的,选择合适的假设检验方法。(3)差别有无统计意义不代表实际差别的大小。(4)下结论不可绝对化。(5)据研究目的和专业知识选择单、双侧检验。(6)假设检验和可信区间的关系。可信区间用于说明量的大小,即推断总体均数的范围,假设检验用于推断质的不同,即判断两总体均数是否不同。它们之间既相互联系,又有区别,二者结合起来,可以提供更全面、完整的信息。2.假设检验的注意事项22Ⅰ型错误与Ⅱ型错误假设检验一定概率统计推断拒绝实际成立的H0,“弃真”错误Ⅰ型错误不拒绝实际不成立的H0,“存伪”错误Ⅱ型错误0111AB判断正确判断错误(Ⅰ)判断错误(Ⅱ)判断正确CDH0成立H0不成立23Ⅰ型错误与Ⅱ型错误客观实际拒绝H0不拒绝H0H0成立Ⅰ型错误()推断正确()H0不成立推断正确()Ⅱ型错误()11:根据研究要求确定,很难确切估计样本含量一定时,越大,越小,越小,越大。要同时减小和,唯一的办法是增大样本含量。检验效能或把握度:若两总体确有差别,按水准能发现该差异的能力。当不可能同时达到较小的和较大的时,一般先确定,然后决定。11124小结1、抽样误差和标准误的概念2、总体均数的可信区间的估计方法3、假设检验的基本步骤4、三种常见设计类型t检验的条件、方法5、Ⅰ型错误与Ⅱ型错误25数值变量资料的统计分析统计描述统计推断集中趋势——平均数离散趋势——变异指标算术均数中位数极差、四分位数间距方差、标准差变异系数CV参数估计假设检验点估计区间估计t检验方差分析几何均数26P331.95%CI2.②P461.2.dsdt0Exercise)/1/1(212212121nnsxxsxxtcxx2)1()1(212222112nnnnssscnSxSxt/||||00xsx96.127n1nX2xx计算器统计键的使用(S)1.进入统计模式MODE3SD2.清除机内数据KACshift,AC清除SD、LR模式下数据3.输入数据X1,DATA;X2,DATA;……4.重复数据的输入N个X:X×NDATA5.错误更正数据未输入DATA按C数据已输入DATA按shiftDATA6.显示结果shift1Kout12233n