第四章假设检验统计推断研究的另一类基本问题是本章所讨论的统计假设检验问题。在数理统计中,通常称对有关总体分布所提出的某种推断为统计假设;称根据所获得的样本,采用合理的方法来判断这个假设是否成立为统计假设检验。统计假设检验的基本任务是根据来自总体的样本所提供的信息,对未知总体分布的某些概率特征(如总体数学期望,总体方差,总体分布,两个总体相互独立等)的统计假设作出合理的判断。为行文简便,以下将统计检验假设简写成假设检验。假设检验与参数估计一样,在数理统计的理论研究与实际应用中都占有极其重要的地位。本章主要介绍假设检验的基本思想和有关概念,正态总体数学期望和方差的显著性检验方法以及包括总体分布的拟合检验和两个总体独立性的检验在内的非参数的假设检验方法。4.1假设检验的基本思想和有关概念1.假设检验的问题本节我们通过实例来阐明假设检验的基本思想和有关概念。例1设某粮食加工厂用打包机包装大米,规定每袋净质量的标准为50kg。可以认为打包机所装大米的净质量服从正态分布,由已往的经验知其标准差kg,且打包机工作的稳定性能较好,即保持不变。某日完工后,为了检验打包机工作是否正常,随机抽取该机所装的16袋大米,测得其净质量(单位:kg)如下:50.548.849.450.351.549.551.249.648.450.250.848.649.050.448.550.1问该天打包机的工作是否正常?分析设为该粮食加工厂某日打包机所包装大米的净质量,由题意知服从20,N,其中2204.0已知。问题可以归结为根据来自总体的样本观测值,判断总体数学期望是否等于规定的标准500:若0,这就意味着打包机工作正常;否则,就要对打包机进行调整。例2某灯泡厂甲,乙两条流水线生产同一种灯泡,已知灯泡的使用寿命均服从正态分布。由于生产设备,技术,管理基本相同,可以认为它们的方差相同。现从甲,乙两条流水线生产的产品中分别随机抽取40知样品,50知样品,测得样品的使用寿命数据,并算得样品均值与样本方差的观测值为甲流水线:401n,1585xh,701sh,乙流水线:502n,1540yh,802sh,问该厂这两条流水线生产的灯泡寿命是否相同?分析设,分别表示该厂甲,乙两条流水线生产这种灯泡的使用寿命,由题意知服从21,N,服从22,N,其中2未知。问题可以归结为根据来自两个总体的样本观测值,判断总体的数学期望1是否等于总体的数学期望2:若21,这意味着甲,乙两条流水线生产的灯泡寿命相同;否则,就认为这两条流水线生产的灯泡寿命不同。例3据对上海市气象台自1875年至1955年间其中63年的夏天(指5到9月,每年夏季共有31+30+31+31+30=153天)气象资料统计,上海市夏季共有180天出现过暴雨。现将这63年中一年有k天发生过暴雨年数k的数据列表于下(满足kk63,kkk180):k:0123456789k:4814191042110试探索一年内夏季出现暴雨天数所服从的分布。分析设为一年内夏季出现暴雨的天数,运用概率论中关于二项分布的泊松逼近定理,可以定性地判断总体服从泊松分布。因此问题可以归结为根据来自总体的样本观测值,判断总体的分布与泊松分布P是否吻合。以上三个实验都是要根据来自总体的样本观测值判断关于一个总体或者两个总体,的某些论断是否成立。由上面的分析可以看出,解决这类问题的办法是:首先,对未知的或不完全知道的总体作出一些假设,通常称之为原假设。例如在例1中为50,在例2中为21,在例3中为服从P;然后,根据来自总体的样本观测值,运用抽样分布理论,按照一定的规则来看是否会有不合理的现象发生,从而判断原假设的真伪,决定是否拒绝这个假设。一般地,在统计假设检验问题中,其出发点是对总体作一个假设,称之为原假设或零假设(nullhypothesis),记为0H;而与之对立的假设称为备择假设(alternativehypothesis),记为1H。原假设和备择假设称为统计假设。而用来判断统计假设真伪的规则为检验法。必须强调指出,原假设0H通常是不轻易否定的一个被检验的假设,只有在样本提供足够不利于它的证据时才能拒绝它;如果样本提供的信息没有充分的理由否定原假设0H,则不能拒绝它。假设检验问题按照总体的状况通常分为参数假设检验与非参数假设检验两类:1.若总体的分布函数或者总体在离散情形的概率质量函数或在连续情形的概率密度函数的数学表达式为已知,只是分布中的参数有些是未知的,这时统计假设是针对未知参数而提出并需要检验的,这样的问题称为参数假设检验问题。例1中的备择假设为“50:1H”,它表示当备择设1H成立时,可能大于50,也可能小于50,通常称这种备择假设为双侧被择假设(two-sidedalter-nativehypothesis),与之相应的检验为双侧检验(two-sidedtest)。在实际问题中还会出现备择假设为“01:H”或“01:H”的情形。例如,某厂生产的固体燃料推进器的燃烧率服从正态分布),(200N,现采用新方法研究一批推进器,其目的是提高推进器的燃烧率。显然,越大效果越好。如果能判断新方法研制出推进器燃烧率的较以往正常生产的大,就考虑采用新方法生产。因此这时我们应提出如下的统计假设:00:H,01:H又如,在分析居民收入状况时,从共同富裕着眼,在普遍提高居民收入的同时,要不断缩小居民收入的差异,促进社会和谐。显然,居民收入的方差越2小越好。因此这时我们应提出如下的统计假设:2020:H,2020:H通常称形如“01:H”的备择假设为右侧假设(right-sidedhypothesis),与之相应的检验为右侧检验(right-sidedtest),称形如”2021:H”的备择假设为左侧假设(left-sidedhypothesis),与之相应的检验为左侧检验(left-sidedtest)。右侧假设和左侧假设统称为单侧假设(one-sidedhypothesis),右侧检验和左侧称为单侧检验(one-sidedtest)。一般地,当备择假设1H具有一侧倾向性时,就采用单侧检验。下面表4.1.1与表4.1.2分别是对一个总体单一的参数进行检验与对两个总体相应参数进行比较的原假设0H与备择假设1H。表4.1.1一个总体单参数检验的统计假设原假设0H备设假设1H0000000000表4.1.2两个总体相应参数比较的统计假设原假设0H备设假设1H212121212121212121212.若总体的分布函数或者总体在离散型情形的概率质量函数或在连续型情形的概率密度函数未知,这时统计假设0H是针对总体的分布(包括分布中待定的参数)而提出并需要检验的,这类问题称为非参数假设检验问题。对于上述介绍参数单侧检验的两个实例而言,所谓统计假设检验问题是两个关于总体真值的相互对立判断“0,1”的鉴定问题,其中0是参数空间的一个真子集,01\为0的余集。通常用1100::HH表示原假设0H对备择假设1H的假设检验问题,且问题一般是以“原假设0H是否成立”的方式提出。若i为单点集,则iH称为简单假设(simplehypothesis)(1,0i);否则称i为复合假设(compositehypothesis)。约定上述记号“”对其他参数假设检验问题以及非参数假设检验问题也适用。引入上述这种形式记号之后,就有上述右侧检验问题中的统计假设为0100::HH;上述左侧检验问题中的统计假设为20212020::HH;例1双侧检验问题中的统计假设为50:50:10HH;例2双侧检验问题中的统计假设为211210::HH;例3分布检验问题中的统计假设为:0H~:)(1HP不服从)(P。二、假设检验的基本思想下面我们结合例1来进一步说明构造检验法的基本思想。首先作统计假设50:50:0100HH。若(,1,2n,)为取自总体~)4.0,50(2N的样本,由§3.5知是的优效估计。由于随即因素的影响,样本均值的观测值x与0有一定的差异是不可避免的。因此,如果原假设0H为真,则x应该比较集中在0的附近,即x与0的差异不显著。反映在样本(,1,2n,)上,“|50|||0比较大”应该是一个小概率事件。衡量这个差异“比较大”的数值是一个临界值c,即c|50|||0是一个小概率事件,其中c是待定的正数。这个临界值由所服从的分布以及将多大的概率作为“小概率”这两个因素所决定。事实上,如果取05.0作为小概率事件的标准,当0H为真时,c|50|||0是小概率事件,此时有为真)00||(|HcP=05.0||50(|0为真)HP。当0H为真时,总体~)4.0,50(),(2200NN,所以222000.4~,50,50,0.1,16NNNn于是统计量0050~(0,1).0.1/UNn因此有000000()()0.05.//cPcHPHnn为真为真由标准正态分布的分位数定义,上式呈现为000.97500.05,/HPun即00.9750.05,HPUu从而得0.9750,/cun00.9750.11.960.196.cun现在由例1的实测数据易算得161149.8,16iixx此时500.20.196.xc由于0500.196是小概率事件(0.05),据概率论中的实际推断原理,若将抽得的一个样本观测值看成一次试验的结果,它可以认为基本上不会发生;现在这一现象既然发生了,这是不合理的。追根求源,发现问题在于原假设0H不能被接受,因此拒绝0H,即认为该天打包机的工作不正常,需要停机进行调整。下面对例1的解法作进一步的分析和引申。1..关于拒绝或接受原假设0H的判断由本例的解答过程可以看出:当500.196x时,拒绝0H;当500.196x时,接受0H。这就是检验例1中统计假设的检验法则。这种规定拒绝或接受0H的原则实际上是将样本空间——样本观测值的集合X划分为两部分:0012012(,,&,):,nXxxxXxun0112012(,,&,):.nXxxxXxun显然0101,,XXXXX于是在获得样本观测值12(,,&,)nxxx后:当120(,,&,)nxxxX时,拒绝0H;当121(,,&,)nxxxX时,接受0H。容易看出,上述检验法则等价于如下的描述:构造统计量00~(0,1),/UNn此时有012HPUu规定拒绝或接受0H的原则实际上是将由样本观测值所算得的统计量U的实测值00/xun的集合划分成12:Cuuu与*12:Cuuu两部分,这里12u叫做该检验法的临界值,于是当uC时,拒绝0H;当*uC时,接受0H。如此,就将样本观测值(n维)集合的划分问题转化为统计量U的实测值(一维)集合的划分问题来处理。一般地,对原假设0H进行检验,就是要选取一个用作检验的统计量12(,,&,)nTT,以此统计量构造一个检测法则,其实质是对将样本观测值所算得的统计量T的实测值t的集合划分成两部分C与*C,使得对于给定的小概率,满足0(