关于假设检验如何选择备择假设和原假设1.单侧检验原假设的选择疑问 就以往的概括性理论而言,在单侧检验中一般将研究者想收集证据予以支持的假设作为备择假设H1。这就是说一个研究者想证明自己的研究结论是正确的,备择假设的方向就要与想要证明其正确性的方向一致;同时将研究者想收集证据证明其不正确的假设作为原假设H0。 例1:一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立。按照前面的理论,研究者是想证明自己的研究结论(寿命延长)是正确的,于是备择假设的方向为“”(寿命延长),即建立的原假设与备择假设应为:H0:μ≤1500H1:μ1500 例2,一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立。根据研究者总是想证明自己的研究结论(废品率降低)是正确的,选择备择假设的方向为“”(废品率降低)。建立的原假设与备择假设应为H0:μ≥2%H1:μ2% 但在实际的操作中,这种以将自己想要证明的结论放在备择假设中的办法却会带来疑问。例3:某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果准备进一批货,怎样进行检验。 根据上面的理论,一种认为是:检验权在销售商一方。作为销售商,总是想收集证据证明生产商的说法(寿命在1000小时以上)是不是正确的。于是选取备择假设的方向为“”(寿命不足1000小时),建立的原假设与备择假设应为H0:μ≥1000H1:μ1000 但是这种看法会带来疑问,我为什么一定要证明生产商的说法是错误的呢?如果是一个关系稳定,长期合作的供货商,这种“找茬”的理念肯定会有破坏两家厂商合作的可能。并且这种方式有一个严重的隐患,即使确实是小于1000的,但如果幅度较小,假设检验会认为这个小于1000是不显著的,接受原假设。厂商还可能受损失。但如果将检验方式颠倒:H0:μ≤1000H1:μ1000 即使μ确实是大于1000的,但如果幅度较小,假设检验会认为这个大于1000是不显著的,接受原假设。厂商就可能“冤枉好人”。 也就是说这两种选择都不是完美无缺的,每种选择都是冒着一定得风险来完成的。因此必须合理的确定检验的方向,才能减小这种风险可能造成的损失。2.信息原则 我认为单侧检验方向的选择可以依据信息原则。所谓信息的原则,就是将一个不以本次检验为改变的一个先验的信息作为选择方向的基础。一般而言,我们都认为先验信息是正确的,普遍成立的,因此将其所代表的情况放入原假设。这就是说,我们认为先验信息一般是成立的,只有样本表现出足够的说服力来推翻先验信息时(即P值小于显著性水平时),我们才认为原假设被拒绝,新的结论成立。 以上面的例3为例:某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果准备进一批货,怎样进行检验。 根据信息原则,我们可以收集这个制造厂产品更多的先验信息来辅助。如果这个制造商的信誉优良并且合作的历史上从来没有发生质量低劣的记录,于是作为销售商我们可以从先验信息中认为,这批灯泡的质量应该是在1000小时以上。于是选取备择假设的方向为“”(寿命不足1000小时),建立的原假设与备择假设应为H0:μ≥1000H1:μ1000 这样选择认为就算μ确实是小于1000的,但如果幅度较小,假设检验会认为这个小于1000是不显著的,接受原假设。其意义表明即使你这次的灯泡略有些问题,但鉴于以往你的优秀纪录,我可以认为这种小幅度的质量下降仅仅是一次的偶然造成的,不影响我接受这批货。只是如果质量下降幅度太大,H1成立,我才考虑拒绝这批货。这就有一个依靠先验纪录确定了一个“宽进严拒”的原则。 同理,如果这个制造商的信誉很差并且合作的历史上经常发生质量低劣的记录,于是作为销售商我们可以从先验信息中认为,这批灯泡的质量应该不在1000小时以上。于是选取备择假设的方向为“”(寿命大于1000小时),建立的原假设与备择假设应为H0:μ≤1000H1:μ1000 这样选择认为就算μ确实是大于1000的,但如果幅度较小,假设检验会认为这个大于1000是不显著的,接受原假设。其意义表明即使你这次的灯泡没有问题,但鉴于以往你的极差的纪录,我可以认为这种小幅度的质量上升仅仅是一次的偶然造成的,我还是要拒绝这批货。只是如果质量上升幅度太大,H1成立,我才考虑接受这批货。这就有一个依靠先验纪录确定了一个“严进宽拒”的原则。 从上述例子可以看出,先验的信息可以对假设方向的选取有指导性的作用,我们可以利用这种指导,建立起一个假设。 这种先验信息也衍生出了一个原则就是保守原则,就是我们习惯于把既成的、稳定的、公认的情况放入原假设中,把新研究的情况放入备择假设中。因为前者一般也是先验信息所支持的。例1,例2的假设方式也可以用这个理论来解释。3.样本先验信息原则 我认为先验信息理论可以指导绝大部分的问题,但是还存在一个有意思的现象。 例4,一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(α=0.05) 按照先验信息的理论,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里为先验信息,于是进行假设为,H0:μ40000H1:μ≤40000 计算统计量得: 在α=0.05时t=1.96的水平上不拒绝H0,不能认为制造商的产品同他所说的标准不相符。 这个检验看起来没有任何问题,看我觉得其实是多余的。因为在该检验的拒绝域是在()中,也就是说拒绝域是小于40000的,而样本均值为41000,肯定不会在拒绝域中,故检验结果也肯定为接受原假设。 所以我认为,样本的统计量也是一种先验信息,因为按照定义就是一个不以本次检验为改变的一个信息就可以认为是先验信息。只是这种信息不是自然获得的,而是依靠对样本进行计算得来的。如果样本信息计算结果均值为大于40000,则样本均值大于40000本身就可以看作是一种先验信息。 由于我们所使用的拒绝域的计算规则认为是在原假设的另一侧,即: 所以我认为样本的均值实际上传达了这样一个信息:样本一定支持μ40000,样本一定反对μ≤40000。样本绝对不会落在拒绝域中,所以备择假设是绝对不会成立的,这个检验过程没有就进行的必要。 反之,如果检验换成H0:μ≤40000H1:μ40000 检验的情况就变成了 计算统计量得: 在α=0.05时t=1.96的水平上不拒绝H0 这就产生了矛盾,不是说样本支持μ40000的么?,为什么现在检验不能支持H1:μ40000? 我认为可以这样解释,样本虽然支持μ40000,但是不能认为样本显著的支持它。样本不支持μ≤40000是绝对的,但是样本支持μ40000却是相对的,这依赖于我们所给出的显著性水平α。如果显著性水平高,拒绝域增大,统计量落入拒绝域,则表明样本显著的支持μ40000。如果显著性水平低,拒绝域减小,统计量落入接受域,则表明样本虽然支持μ40000,但是不显著。4.总结 单侧检验方向的选择可以依据信息原则。就是将一个不以本次检验为改变的一个先验的信息作为选择方向的基础。先验信息有两种:一种是自然的先验信息,我们都认为这种先验信息是正确的,普遍成立的,因此将其所代表的情况放入原假设。另一种是样本的统计量提供的先验信息,它表明了样本支持和反对的结论,若样本反对的结论出现在备择假设中,则备择假设必然不会成立,检验不必进行。若样本支持的结论出现在备择假设中,则备择假设成立与否依赖于选取的显著性水平。大同网站建设