粒子物理与核物理实验中的数据分析陈少敏清华大学第四讲:统计检验2本讲要点假设,检验统计量,显著水平,功效两种假设下的统计检验纽曼-皮尔森引理如何构造一个检验统计量Fisher甄别函数与神经网络3概率与统计统计的含义可以通过比较概率理论来理解概率统计(参量测定与假设检验)从理论到数据从数据到理论通过计算某些可观测量(例如,平均值,分布等)来给出预期的实验分布。例如:若宇称守衡,对一特定衰变分布有什么影响?进行所谓的假设检验,比较理论预期的参量值或分布。从观察的实验数据给出所研究参数的观测值和误差,并且在某一置信水平上检验理论的正确与否。例如:观测到一特定衰变分布,是否可断定宇称守衡?4统计分析的目标假设检验参数拟合检验数据是否与某一特定理论相符(注意,该理论可包含一些自由参数)。利用数据确定自由参数的大小。相符的程度由显著水平来表示。参数的准确由相关的误差大小来表示。5例子:标准模型的检验标准模型是描述基本粒子之间相互作用的理论,包含十九个参数。其中包含电子,μ,τ等粒子的质量。它预言了费米弱作用藕合常数具有普适性ννττμτμμτeFFBttmmGG→⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛52GF:费米藕合常数m:轻子质量t:轻子平均寿命Bτ:τ纯轻子衰变的百分比北京正负电子对撞机上的北京谱仪实验通过寻找产生τ-轻子对的最低能量阈,测量了τ-轻子质量参数0085.09886.02±=⎟⎟⎠⎞⎜⎜⎝⎛FFGGμτ在1.3个标准偏差范围内与模型预言1符合。在1.3个标准偏差范围内与模型预言1符合。6假设检验;数目喷注产生的;粒子的平均横动子;产生的带电粒子数321===xxx01,:,,()(|),(,|)xnfxfxHfxH−GGGG这里服从在维空间的某些与产生事例类型有关的联合概率密度函数例如正负电子对撞原子核与原子核碰撞等等。那么这些联合的概率密度函数取决于采取何种假设。等等12(,,...,),nxxxx=G假如测量结果为例如:正负电子对撞后所产生的事例中,对于每个事例,有下列测量量αα);(:)(:含未定参数复杂假设无未定参数简单假设xfxfGG。xt,,,x成为精简后的数据样本使得力的条件下不失去甄别各种假设能在验常常构造低维的统计检因此问题维的通常情况下很难处理多)(,GG01(|),(|),...tgtHgtH那么此时的统计量具有概率密度函数7拒绝域、第一与第二类误差010,,.(|)(|.,).tgtHgtHHt考虑统计检验量服从定义拒绝域使得假设为真时,不大可能发生)|(0Htg)|(1Htg接受H0拒绝H0∫∞=cuttdtHtg)|(0α∫∞−=cuttdtHtg)|(1β)(tg(1-β=功效)(显著水平)tcuttcuttt,≥例如,在上述情况下00,,obstHH如果观测量在拒绝域时拒绝否则接受。0,H假若为真但被拒绝的第可能性构成一类误差01,HH假若接受但实际情况却是为真的可能性构成第二类误差8例子:选择不同粒子一束包含K/π粒子的束流穿过2厘米厚的闪烁体,因电离所产生的能损可以用来进行粒子鉴别。构造能量沉积测量量t,并假设只有两种可能KπH0=π(信号)H1=K(本底)tg(t)tcut1(|)gtH0(|)gtH通过要求ttcut来选择π粒子,选择效率为(|)1(|)cutcuttKtgtdtgtKdtπεπαεβ−∞+∞==−==∫∫松选择:效率很高,但K本底高;严选择:信号样本纯,但效率低。π的份额aπ可从t分布估计(;)(|)(1)(|)ftaagtagtKππππ=+−9粒子鉴别的概率问题对于一个具有测量值t的粒子,如何估计是K还是π的概率?)|()|()|()|()|()|()|()|(πππππππtgaKtgatgathtgaKtgaKtgatKhKKK+=+=贝叶斯定理通常情况下,需要给出选择样本的纯度(|)(|)()()()[(|)(1)(|)]()(,]cutcutcutcutttcutttallcutcutagtdthtftdtNttpNttagtagtKdtftdttπππππππππ−∞−∞−∞−∞===+−=−∞∫∫∫∫粒子在区间的概率注意:h(π|t)有时会被解释为检验统计量。注意:h(π|t)有时会被解释为检验统计量。对于贝叶斯论者:上式为粒子是K或π的可信程度对于频率论者:给定t条件下,粒子是K或π的比率两种解释均有道理两种解释均有道理10纽曼-皮尔森引理与拒绝域考虑一个多维检验统计量t=(t1,…,tm),有信号假设H0与本底假设H1。问题:如何选择一个最佳的拒绝域或者cut?纽曼-皮尔森引理:在给定效率条件下,要得到最高纯度的信号样本,或者在给定的显著水平下得到最高的功效,可以选择下列接受域来实现用以决定效率的常数)|()|(10=cHtgHtgGG对于不含未定参量的最优化一维检验统计量,)|()|(10HtgHtgrGG=简单假设H0与H1的似然之比实际应用中,r最好是单值函数。11如何构造一个检验统计量根据纽曼-皮尔森引理,为了选择事例,可选择拒绝域),...,(1nxxx=G)|()|()(10HxfHxfxtGGG=问题:如何知道这两个不同假设下的概率密度函数?问题:如何知道这两个不同假设下的概率密度函数?实际应用中,可以利用蒙特卡罗方法模拟物理过程与探测器响应,通过产生大量的样本,可以近似地得到上述概率密度函数的表达方式。)|()|(10HxfHxfGG在只考虑两种可能性的情况下,对于每个事例,测量。M,M。nx,n单元数为则总为每个分量的区间数如果维直方图并填入测量量得到对每个事例−,G分别产生信号与本底事例,并经过探测器模拟但是如果n太大时,实际运用会很困难。但是如果n太大时,实际运用会很困难。12例子:蒙特卡罗近似求二维p.d.f.M.C.函数曲面M.C.分格子统计每个格子的频数近似的二维函数如两者不相关两个一维边缘分布(,)()()fxyfxfy=13线性检验统计量1()nTiiitxaxax===∑GGG拟设:01(|),(|)agtHgtHG给定一个,可以得到相应的概率密度函数01(|)(|)agtHgtHG通过选择最大地区分与的目的。当维数2时,用蒙特卡罗法找出多维概率密度函数依然较复杂。假设每一维研究均需要分M个区间,对于n-维问题,需要Mn个格子方能将密度度函数近似确定下来。为了简化处理此类问题,可以采用拟设的方法给出包含少量参数的检验统计量形式,通过确定参数(例如采用蒙特卡罗方法),最大限度地区分H0与H1。(即把测量量做线性叠加)必须定义所谓的区分量。必须定义所谓的区分量。14线性检验统计量(续一)首先对各测量量,我们可以计算对应的期待值与协方差)(,...,1,)|()()()()(1,0)|()(分量假设xnjixdHxfxxVkxdHxfxkjkikijkkiikGGGGG=−−===∫∫μμμ∫∑∫=−===aVaxdHxfxtaxdHxfxtkTkkkkTkkGGGGGGGGGG)|())(()|()(22τμτ220101,pdfsττ−∑∑要求大的与小的使得分布集中在均值附近。(),txG类似地我们还可以导出计算平均值与方差的公式15线性检验统计量(续二)Fisher定义了一个甄别法∑∑+−=2120210)()(ττaJG0101,1,1()()nnTijijijijijijaaaaBaBaμμμμ===−−==∑∑GG01,1()nTijijijaaVVaWa==+=∑GG则()TTaBaJaaWa=GGGGG令0=∂∂iaJ101()()aWμμ−∝−GGG证明见习题因此定义了Fisher线性甄别函数。16线性检验统计量(续三)∑=+=niiixaaxt10)(G用任意标度和偏置a0去固定τ0,τ1∑∑−+−=+2021211200])[(])[(ττtEtE与假设对应的期待值)(txG若将写成()2012201(),Jaττ−=+∑∑G求的最大值意味着要将下式最小化Fisher()JaG求函数的最大值就是以后介绍的最小二乘法原理中的一种。17Fisher定理与高斯变量0μG1μG为假设H0的均值为假设H1的均值而且,两者的协方差矩阵为V0=V1≡V含偏置的Fisher甄别量为xVaxtTGGGG1100)()(−−+=μμ利用前面所述的似然比对给定效率条件下的最大纯度11000111(|)11exp()()()()(|)22TTtfxHrxVxxVxfxHeμμμμ−−⎡⎤==−−−+−−⎢⎥⎣⎦∝GGGGGGGGGGt∝log(r)+常数(单调变化)Fisher甄别量与似然比等效。Fisher甄别量与似然比等效。如果不是多变量高斯分布,上式不成立。(|)kfxHG假设是多变量高斯分布,具有平均值18Fisher定理与高斯变量(续)000100110(|)()1(|)()(|)()(|)()1()fxHPHPHxPHfxHPHfxHPrHPH==++GGGG贝叶斯定理选择恰当的偏置a0,上式可写为)(11)|(0tsexHPt≡+=−G也就是所谓的“逻辑σ”函数ts(t)xG具有相同协方差矩阵的多变量还可给出的简单表达验后概率式,例如验前概率19神经网络(一)神经网络可应用在神经生物学,模式识别,理财预测等等方面,这里它仅作为一种类型的检验统计量。假设可表示为)(xtG∑=+=niiixaasxt10)()(G激活函数=+=−−1)1()(ueusnxxx..21输入层)(xt()Stx输出节点(可以有多个)G是单层的感知器。是单调的,因性的此等效于线20神经网络(二)推广到多层感知器nxxx..21)(xt隐含层输出定义为)]([)(10xhaasxtiniiGG∑=+=上一层节点函数可写为∑=+=njjijiixwwsxh10)()(G,iijaw为权重或者联结强度。越多节点神经网络越接近优化的)(xt但需要定更多的参数!21神经网络(三)参数取值通常根据误差函数的最小化结果来决定])[(])[(2)1(12)0(0ttEttE−+−=ε这里t(0),t(1)为目标值,例如选0和1的逻辑σ函数值实际应用中,通常以蒙特卡罗的训练样本平均值来取代期待值。(调整参数值=神经网络的学习过程)在核物理与粒子物理研究中,是通过定义信号与本底两个样本,从样本中给出每个事例的相关测量量(例如,动量,飞行时间…),然后直接调用欧洲粒子物理实验室(CERN)提供的物理分析软件包ROOT(基于C++)PAW(基于Fortran),得到训练后的参数与输出量,并将它们用于待分析的事例来决定其是本底还是信号。具体应用参见下列网站ROOT用户:用户:例子:超新星爆发中微子距离L因中微子质量造成的时间延迟Δt2eV12EMeV10pc101.51Lt)())((1ννβmkms≈−=Δ根据中微子到达的时间差,可以给出中微子质量测量。1987A超新星距地球52±5kpc...,MeVeeνν的产生平均能量为十几个23中微子在纯水中的反应+−−+→++→+enpeeeeeννν::非弹散射弹性散射eνeν−eeνH11+en光子MeV2.2反β衰变24在超级神冈探测器的接受情况10610710810-1110Time(sec)Numberofneutrino(1050/sec)νeν–eνXL=10kpc242243MeV101075.9)(;MeV10109.0)(cmEenpcmEeeeee⎟⎠⎞⎜⎝⎛×≅+→+⎟⎠⎞⎜⎝⎛×≅+→+−+−−−νννσννσ非弹性散射比弹性散射大两个量级。非弹性散射比弹性散射大两个量级。25反β衰变过程的影响当能量大于10MeV时,存在大量非弹散射过程,严重影响SN的方向及最初到达时刻的确定。当能量大于10MeV时,存在大量非弹散射过程,严重影