统计推断典型的统计推断问题:如果研究者对某条河流中的多氯联苯(PCB)含量感兴趣,他只能从中采集数量有限的样品加以测定。一方面,这样的监测只是针对少数样本进行,另一方面又要求就河水中PCB含量的总体特征得出某些结论。统计推断包括:参数估计、假设检验该河流两个或多个断面上PCB含量是否有显著差异?不同季节河水中PCB含量有没有差别?河水中PCB含量服从正态分布?对数正态分布?指数分布?PCB含量与其他参数(SS含量、PH值、腐殖酸含量等)有无共同消长关系?假设检验在总体的分布函数完全未知或只知其形式不知其参数的情况下,为推断总体的某些未知特性,提出关于总体特性的假设,然后,根据样本来推断是接受该假设,还是拒绝该假设。概率事件发生,则否认假设H0;否则,接受假设H0.小概率推断原理:小概率事件采用概率性质的反证法:05.00α基本原理和思想(概率接近0的事件),在一次试验中,实际上可认为不会发生(这是人们长期积累起的普遍经验!).据一次抽样所得到的样本值进行计算.若导致小先提出假设H0,再根例1某制样机制得的土样重量是一个随机变量,服从正态分布。当机器正常时,其均值为0.5公斤,标准差为0.015公斤。某日为检验制样机工作是否正常,随机地抽取它所制得的土样9块,称得净重为(公斤)0.4970.5060.5180.5240.4980.5110.5200.5150.512问机器是否正常?)015.0,5.0(),015.0,(~22NNXX的土样重服从而正常工作的机器制得故定实践表明标准差比较稳仍服从正态分布,长期设这一天土样重?还是?==否,关键要看因此,判断机器正常与005.05.0:00H01:H假设H0为真)015.0,(~20NX则)1,0(~/0NnX在什么情况下拒绝H0一般不应太大。为真,则若00xH。为真的正确性而拒绝太大,则可怀疑若000HHx00/Hknxxk就拒绝-满足,当观察值适当选择如何选择适当的K这种假设推断的方法可能的错误有几种弃真错误取伪错误选取适当k的原则是使犯弃真错误的概率越小越好为真拒绝00HHP为真拒绝00HHP只允许犯这类错误的概率最大为knXPHHP/0000为真拒绝)1,0(~/0NnX222zk0020,/HHzknxx反之则接受则拒绝满足若观察值96.12.2/511.0,015.0,9,96.1,05.00025.02nxxnzzk则本例中取接受H0拒绝H0几个概念原假设H0备择假设H1拒绝域统计量取某个值时,拒绝原假设H0显著性检验只对犯弃真错误加以控制的检验显著性水平双边假设检验01:H显著性检验的步骤(1)给出原假设与备择假设;(2)确定一个统计量;(3)确定一个拒绝原假设的原则;(4)求出拒绝域(5)将样本观察值代入,以决定是接受原假设还是拒绝。为真拒绝00HHPH0:0;H1:0。。求检验问题的拒绝域给定显著性水平为的样本。是来自已知,设总体XXXXNXn,...,),,(~212kx拒绝域形式)1,0(~/NnXkXPHHPH000为真拒绝nknXPnknXPkXPH////000000=令nknXP//00znk=得/0znk=/0znk0znx0拒绝域为。。求检验问题的拒绝域给定显著性水平为的样本。是来自已知,设总体XXXXNXn,...,),,(~21201,00::HH单个正态总体均值的假设检验检验)的检验已知,关于)若(Z(12检验)的检验未知,关于)若(t(22)1(~/ntnSX统计量为。。求检验问题的拒绝域给定显著性水平为的样本。是来自未知,设总体XXXXNXn,...,),,(~2120100:,:HH)1(/20ntknsx拒绝域为:课本例1(t检验)0010:,:HH两个正态总体均值差的假设检验(t检验)2)1()1(21222211nnSnSnSwknnsyxw2111)(拒绝域形式为:knnSYXPHHPwH210011)0(:为真拒绝)1(212nntk得210:H211:H拒绝域)2(21nntt两个实验室用同种方法测定某一PM10样品中锌的含量,分别作了四次和三次重复,得下列数据(mg/kg)实验室1:14.7,14.8,15.2,15.6实验室2:14.6,15.0,15.2问两实验室对该样品的测定结果是否一致?即两实验室的这种测定方法间有没有系统误差某废水处理工段采用传统工艺去除废水中的氰。为节约运转费用,对设备及工艺采取了一些改造措施,减少了据认为不重要的步骤。分别在改造前后测定了氰的去除率,得到以下重复测定值(%)改造前:0.9,0.85,0.92,0.87改造后:0.86,0.91,0.82,0.79问:降低运转费用是否造成处理效率的降低?210:H211:H基于成对数据的检验(t检验)例3有两台光谱仪,用来测量材料中某种金属的含量,为鉴定它们的测量结果有无显著差异,制备了9件试块(成分、金属含量、均匀性等均不相同),分别用两台仪器对每一试块测量一次,得到9对观察值。x(%)0.200.300.400.500.600.700.800.901.00y(%)0.100.210.520.320.780.590.680.770.89d=x-y(%)0.100.09-0.120.18-0.180.110.120.130.11问两台仪器的测量结果是否有显著差异?(取a=0.01)),(~.,,...,,2222111DDinnnNDYXDYXDYXD且服从同一分布相互独立,0:,0:10DDHH)1(~/0:ntnsdD统计量为)1(/:2ntnsdD拒绝域为)1(/:2ntnsdD拒绝域为3554.3467.19/1227.006.0/1227.006.03554.3/3554.3)8(,01.0,9005.0nsdsdnsdtnDDD,由样本观察值:拒绝域为:故接受H0,认为两台仪器的测量结果无显著差异。为降低城区交通噪声污染,某市环保局规定自某日起在特定区域内不得使用高音喇叭。在开始执行此规定前后,分别在这一区域的8个代表性地段测定了噪音水平L90,获得如下数据(dB)执行规定前:5148526264515560执行规定后:4645534857554250根据上述数据判断规定在降低交通噪音方面是否有效210:H211:H单个正态总体方差的假设检验。。求检验问题的拒绝域给定显著性水平为的样本。是来自均未知,设总体XXXXNXn,...,,),,(~21220212020:,:HH)1(~)1(222nSn22021202)1()1(ksnksn或拒绝域形式:)1(~)1(2202nSn))1(())1((220212020020ksnksnPHHP为真拒绝2))1((2))1((220212022020=,=取ksnPksnP)1(),1(2222211nknk得22122例:正常情况下,用一台气象色谱仪多次重复测定某标准氯仿水溶液的结果为(峰高)服从正态分布:)022.0,00.1(N为试验一根新装的色谱柱,在改用新色谱柱后,对同一标准样做了四次重复测试,结果如下:0.98,1.05,0.97,1.01,更换新柱后测定精度是否发生明显变化?022.0:,022.0:2120HH175.0022.00129.01-4)1(~)1(2202)(为:nSn35.93)1(216.03)1(2025.022222211975.0)()(nknk而:0.1750.216,故拒绝原假设,更换新柱后测定精度发生明显变化。22021202)1()1(ksnksn或拒绝域形式:两个正态总体方差比的假设检验(F检验))1,1(~2122212221nnFSS构造统计量:kSSPkSSPHHP22212221222100//22212221为真拒绝=令kSSP22212221//2221)1,1()1,1(21222121nnFssnnFk拒绝域为:得例:两种型号脱硫装置的脱硫效率十分接近,进行4-5次重复试验后得到以下数据,比较两个装置的运行稳定性(两个样本的离散程度)装置1:98%,81%,96%,89%装置2:92%,95%,88%,90%,89%2221122210:,:HH2221ssF)1,1()1,1(2121212nnFFnnFF或拒绝域:56.7000748.000593.0,000748.0,00593.02221Fss98.9)4,3(025.0F)4,3(025.0FF故在显著性水平0.05下,接受原假设H0,未发现两种设备的运行稳定性有明显差别。某实验室用阳极溶出伏安法测定水样铅含量。传统做法采用180秒预电解时间。为提高分析速度,希望将预电解时间缩短至120秒。分别用180秒和120秒两种预电解时间重复测定一个水样,得如下结果(微克/升)120秒预电解:7.58.08.18.5180秒预电解:8.07.88.37.98.0判断缩短电解时间是否造成分析精度的明显下降22210:H22211:H