第四章总体均数估计和假设检验统计推断(statisticalinference):由样本信息推断总体特征。抽样抽样研究:总体样本推断统计推断包括两个重要的方面:参数估计和假设检验。一、均数的抽样误差与标准误抽样误差(samplingerror):由个体变异产生的,抽样造成的样本统计量(如X)与总体参数()的差别,以及样本统计量(X)之间的差别。在抽样研究中,抽样误差是不可避免的,但有规律可循。抽样误差越大,样本统计量与总体参数的差异可能越大。因此了解样本统计量的分布及抽样误差规律便可由样本统计量估计总体参数。1.正态总体样本均数的分布:由于抽样误差,样本均数存在变异性:同一总体中抽取多份样本,计算出多个均数,互不相同!例:从正态分布总体)52.0,83.4(N抽样,样本量N=10,重复抽100份样本,结果见表4-1,图4-1。表4-1从总体N(4.83,0.522)中抽出100个样本的X、S、t值与的95%的可信区间XSt值95%可信区间XSt值95%可信区间14.580.38-2.014.31~4.85515.240.642.074.78~5.7024.900.450.594.58~5.22524.890.660.324.42~5.3634.760.49-0.394.41~5.11534.830.400.054.54~5.1144.660.49-1.004.31~5.02544.850.400.204.56~5.1354.900.390.624.62~5.17554.890.590.374.47~5.3164.920.301.054.71~5.13565.030.501.324.67~5.3974.630.43-1.374.32~4.94574.940.730.514.41~5.4684.960.650.664.49~5.42584.680.34-1.264.44~4.9394.830.450.054.50~5.15594.520.49-1.954.17~4.87104.540.67-1.324.06~5.02604.860.350.394.61~5.12114.900.500.494.54~5.26614.780.57-0.214.38~5.19124.880.700.264.38~5.38625.000.730.764.47~5.52135.040.441.544.72~5.35635.170.462.344.84~5.48*144.700.59-0.664.27~5.12644.830.860.024.21~5.44154.760.37-0.554.49~5.02654.990.461.164.66~5.31164.820.34-0.044.57~5.06664.430.59-2.064.01~4.86174.970.470.994.63~5.30674.850.520.184.48~5.22184.990.441.244.68~5.31685.110.671.374.63~5.59195.090.521.634.72~5.46695.150.522.004.78~5.53204.910.360.794.65~5.17704.500.81-1.233.92~5.08214.970.461.034.64~5.30715.110.432.124.80~5.42224.650.68-0.814.16~5.13725.170.462.434.84~5.50*234.780.60-0.234.34~5.21734.830.520.084.46~5.20244.850.580.154.43~5.27744.770.46-0.374.44~5.09254.780.55-0.224.39~5.17754.790.65-0.144.33~5.26264.880.460.394.55~5.20765.050.481.524.71~5.40274.770.41-0.354.48~5.06775.000.580.974.58~5.42284.720.42-0.764.41~5.02784.780.38-0.354.50~5.05294.920.520.614.55~5.30794.770.51-0.314.41~5.13304.820.340.034.58~5.07804.470.44-2.504.15~4.79*314.650.48-1.144.30~4.99814.890.670.324.41~5.37324.770.23-0.654.61~4.94824.790.51-0.174.43~5.15334.560.52-1.604.19~4.93834.820.430.004.51~5.13344.890.590.404.47~5.32844.290.65-2.573.82~4.76*354.810.43-0.074.51~5.11854.710.42-0.854.41~5.01364.710.29-1.224.50~4.91864.940.560.704.54~5.34374.680.61-0.724.24~5.12874.410.50-2.574.06~4.77*384.920.540.574.53~5.30884.970.431.124.66~5.28395.010.571.034.60~5.42894.920.330.934.68~5.15404.950.620.664.51~5.39904.900.680.394.42~5.39414.900.500.504.54~5.26915.000.491.164.65~5.35424.870.670.254.39~5.35924.680.72-0.594.17~5.20434.950.640.674.50~5.41935.090.701.224.59~5.59444.850.510.224.49~5.22944.620.52-1.184.25~5.00454.970.281.634.76~5.17954.640.44-1.314.32~4.95464.900.550.464.51~5.30964.750.39-0.534.47~5.04474.530.54-1.694.15~4.92974.630.64-0.924.17~5.09484.720.56-0.554.32~5.13984.930.231.494.76~5.09494.630.73-0.824.11~5.15994.870.590.284.45~5.30504.700.53-0.694.32~5.081004.790.39-0.224.51~5.07实验结果:①集中趋势--100个样本均数的均数为4.828,与总体均数4.83接近。②离散趋势--样本均数的标准差为0.18。③分布--将此100个样本均数绘制直方图,X的分布服从正态分布,见图4-1。理论上:①样本均数服从以为中心的正态分布。)n,(N~X2②样本均数的均数等于。③分布较原分布集中,即样本均数的标准差小于原变量的标准差。2.标准误(standarderror):样本均数的标准差或其他导出量的标准差统称为标准误。标准误的理论公式为:nXX的大小与成正比,与样本含量n的平方根成反比。在抽样研究中,一般是未知的,且在一般的抽样研究中仅进行一次抽样,即只有一个样本均数X和样本标准差S,故可用样本标准差S估计抽样误差的大小:标准误的计算公式为:nSSX标准误的意义:标准误反映了样本均数间的变异程度,也反映了样本均数与总体均数间的差异,也就是抽样误差的大小。抽样误差小,表示样本均数与总体均数越接近,即用样本均数估计总体均数的可靠性越大;抽样误差大,样本均数离总体均数就越远,用样本均数估计总体均数的可靠性就越小。例4.1随机抽取某地200名成年男性的红细胞数均数为4.95×1012/L,标准差为0.57×1012/L,估计其抽样误差。040.020057.0nSSX(1012/L)该样本的抽样误差为0.04×1012/L。3.中心极限定理:从非正态总体中抽样,样本量较大时(比如n50),样本均数的分布也接近正态分布。二、t分布1.标准正态变量和t变量:设),(~2NX,则),(~2nNX样本均数的标准正态变换:u=)1,0(~NnXt=tnsX~分布(当未知,用s代替)自由度ν=n-12.t分布的特征:①以0为中心,左右对称的单峰分布;②曲线形状相似于正态分布曲线,但更矮胖(变异更大)。③t分布曲线是一簇曲线,其形态变化与自由度的大小有关。自由度越小,则t值越分散,曲线越低平;④自由度逐渐增大时,t分布逐渐逼近u分布(标准正态分布);当趋于∞时,t分布即为u分布。双侧临界值u双侧临界值tν=20ν=5单侧尾部面积双侧尾部面积1.6451.7252.0150.050.101.962.0862.5710.0250.052.332.5283.3650.010.022.582.8454.0320.0050.01图4-2不同自由度下t分布t分布的用途:总体均数的可信区间估计,t检验。t0.000.100.200.300.40-5.0-4.0-3.0-2.0-1.00.01.02.03.04.05.0ν─∞(标准正态曲线)ν=5ν=1f(x)三、总体均数的估计设有一正态总体N(μ,σ2),μ和σ未知,现从中随机抽出一份样本,该样本的均数和标准差的数值用X和s表示。欲据此估计总体均数μ的大概范围。点估计:区间估计:1.总体均数的95%可信区间的计算:①σ未知,n较小时:XStX05.0②σ未知,n较大时:XSX96.1③σ已知:XX96.1例4.2由随机抽取某地9名健康成年男性,测红细胞数,X=4.68,S=0.57,试估计该地健康成年男性红细胞数的总体均数。n=9,=8,查t界值表,双侧30628050.t,.,1185242495703062684.~....该地健康成年男性红细胞数的总体均数的95%可信区间为4.242cm~5.118cm。2.可信区间的两要素:准确度:反映在可信度(1-)的大小上,即可信区间包含总体均数的可能性大小,从准确性的角度看,愈接近1愈好。精度:(1-α)的大小,即区间长度,长度愈小愈好。3.总体均数的95%可信区间的涵义:从理论上来说,从总体中作100次随机抽样,可算得100个可信区间,平均有95个可信区间包括总体均数(估计正确),只有5个可信区间不包括总体均数(估计错误)如表4-1所示。这种估计方法会冒5%犯错误的风险。5%是小概率事件,对一次试验而言出现的可能性小,因此,在实际应用中就认为总体均数在算得的可信区间内。四、假设检验的基本思想和步骤假设检验的目的:通过样本统计量的差别推断总体参数是否相等。样本统计量的差别有两种可能:(1)完全由抽样误差引起,即总体参数相等,称差别无统计学意义。(2)除了由抽样误差引起外,还由总体参数的差别引起,即总体参数不等,称差别有统计学意义。假设检验:用来判断两种或多种结果的差异是由抽样误差所致,还是其本身的差异。例4.4据大量调查得知健康成年男子脉搏的均数为72次/分,某医生在高原随机调查了100名健康成年男子,其脉搏均数为73.8次/分,标准差为6.6次/分,能否认为该高原成年男子脉搏均数与一般成年男子脉搏均数不同?μ0≠X(72≠73.8)①抽样误差(μ=μ0)②本质不同(μ≠μ0)1.建立检验假设,确定检验水准:720:H721:H=0.05目的:根据样本资料,拒绝0H?或不拒绝0H?注:对立假设01:H包含00和,称双侧对立假设。相应的检验称双侧检验。当且仅当凭借其他知识足以排除某一侧时,可采用单侧对立假设0101::HH或相应的检验称单侧检验。这时,P值应改为统计量当前值以外的单侧尾部面积。2.选定检验方法和计算检验统计量:根据研究分析目的要求、设计类型、资料