粒子物理与核物理实验中的数据分析陈少敏清华大学第十讲:矩方法2本讲要点矩的几种定义简单的矩方法一般的矩方法矩方法与最大似然法和最小二乘法的比较3自旋宇称在实验中的确定问题−++→+→ΨKKXXJ,/γ注意:X可以包含有几个粒子(如左图)。已知:与自旋宇称有关的概率密度函数包含三个实验观测角度和一个不变质量。问题:能否存在一种简单而又不失精确度的方法确定自旋?)1525('2f)1710(X实验上通常观测的是几种态的叠加,需要用几方面的实验观测来区分各种可能的自旋取值以及相应分布范围,例如矩方法。不可能从质量范围来定义单一的粒子态!4概率分布中的矩定义∫−=dxxPxxkk)()(0μ如果令x0=0,则一阶矩就是随机变量x的期待值定义(也称作一阶代数矩)1)(][μμ′===∫dxxxPxE如果令x0=E[x],随机变量x围绕期待值的二阶矩就是随机变量x的方差定义(也称作二阶中心矩)222)(])[(][μσ==−=∫dxxPxExxV代数矩∫=′dxxPxkk)(μ0()Pxxxk考虑一个服从概率密度函数的连续随机变量。定义围绕一矩固定值的第阶或简单矩为5代数矩与中心矩的关系代数矩中心矩222101μσμμμμ+=′=′=′221001σμμμ===222μμμ−′=低阶矩之间的关系一般情况下,它们的关系可以有如下表示llkklkklllkklklk)()(1001μμμμμμ′⎟⎟⎠⎞⎜⎜⎝⎛=′′−′⎟⎟⎠⎞⎜⎜⎝⎛=−==−∑∑高阶矩对研究概率密度函数在|x-μ|大值区间的行为很有帮助。对称分布的所有奇数中心矩为零。高阶矩对研究概率密度函数在|x-μ|大值区间的行为很有帮助。对称分布的所有奇数中心矩为零。6统计样本矩的定义假设观测值x=(x1,…,xn),则k阶样本代数矩定义为相应的一阶样本代数矩与二阶样本中心矩就是通常定义的样本平均值与无偏的样本方差μˆ11==∑=niixnx∑==′nikikxnm112211()1niisxxn==−−∑而k阶样本中心矩定义为∑=−−=nikikxxnm1)(11若µ已知∑=−niixn12)(1μkμ′是的无偏估计量7用简单矩方法测定待定参数rrmm′=′′=′)()(11λμλμr个方程r个未知数λ解出待定参数可以证明样本矩的协方差矩阵为)(11),cov(lklklkklxxxnmmV⋅−−≅′′=+参数的误差1(rxrrrλλ=,...,考虑采用计算随机变量自身代数矩的简单方法,对含有个参数的概率密度函数情况,可以通过使个不同阶代数矩与对应的样本矩相等,建)立方程组8角分布理论的简单验证在实验中,理论预言角分布为−+−+→μμee将角分布归一化变为cosθ的概率密度函数,则其二阶代数矩期待值θ)cos1(cos2θθ+=nddnn=事例数为了验证理论,我们计算cosθ二阶代数样本矩平均值4.0cos)cos1(cos)cos1(cos][cos11221122=++⋅=∫∫+−+−θθθθθθdndnE∑==niin122cos1cosθθ假设的统计检验可以通过简单比较二阶代数矩的期待值与样本矩平均值来完成。假设的统计检验可以通过简单比较二阶代数矩的期待值与样本矩平均值来完成。9简单验证中的误差估计在前面例子中对于不含参数的简单情形cosθ二阶代数矩平均值的误差估计可以按下列方法进行4.0][cos2=θE已知真值样本矩的方差为∑=−=niiEnS12222])[cos(cos1θθ样本矩平均值的方差可以证明为nSV/]cos[22=θ0.39±0.01观测值在一个标准误差范围内与理论预期相符。210000.390.1,5,Sθ==2假设实验观测次,并计算出则实验cos结果报告为10含参数情况举例在上例中,假设已知理论中包含一未知参数α,例如和前例一样,计算出cosθ二阶代数矩的理论期待值)cos1(cos2θαθ+=nddn)3(535cos)cos1(cos)cos1(cos][cos11221122ααθθαθθαθθ++=++⋅=∫∫+−+−dndnE][cos53)1][cos3(522θθαEE−−=则参数α与二阶代数矩的关系为θθα22cos53)1cos3(5ˆ−−=只要函数是可积的,采用矩方法原则上就可以测定参数。只要函数是可积的,采用矩方法原则上就可以测定参数。11简单矩方法应用的其它问题非物理解问题:利用矩方法测定参数,可能会出现非物理结果。例如前例的二阶代数矩中,如果2cos0.6θα→⇒→∞在矩方法中,我们无法加上限制条件使得参数的测定值保持在物理允许的范围内。假设检验问题:利用矩方法测定参数,由于只比较积分值并解方程得到参数估计值,信息含量不足,因此无法判断所得到的参数是否合理。实际应用中需要辅之以其它方法来检验。适用范围问题:矩方法虽然简单,但在处理多参数问题中,由于涉及更高阶的积分,使研究变得复杂。在这种情况下,可以考虑采用所谓的“一般的矩方法”。12一般的矩方法简单矩定义一般的矩定义∫=′dxxPxkk)(μ∫=dxxPxfkk)()(γ把对随机变量求平均推广到对随机变量的函数求平均。把对随机变量求平均推广到对随机变量的函数求平均。13一般的矩方法(续一)对于有k个参数情形,可以选用一组自变量为x的k个线性独立函数来构造矩,其函数矩的期待值与估计值为krdxxPxfrr,...2,1,)|()()(==∫λλγ估计值为函数的样本平均值,相应的协方差矩阵元为krxfnxfniirrr,...,2,1),(1)()(ˆ1===∑=λγ()()111ˆ[]()()()()(1)1()()()()(1)nrsrirsisinrisirsiVfxfxfxfxnnfxfxnfxfxnnγ==≅−−−⎧⎫=−⋅⋅⎨⎬−⎩⎭∑∑14一般的矩方法(续二)例如,假设一角分布为⎟⎠⎞⎜⎝⎛−−−+−=−φθρφθρθρρπφθcos2sinRe22cossincos)13(21)1(2143),(cos1021120000P如果定义与角度有关的三个函数00111cos1,02θφπρρρ−−≤≤+≤≤10这里,,,Re为待定参数。可以计算出相应函数的样本平均值22123(cos,)cos,(cos,)sincos2,(cos,)sin2cosfffθφθθφθφθφθφ===2100122111310111(12)cos541sincos25412Resin2cos5niiniiiniiifnfnfnρθρθφρθφ=−===+==−==−=∑∑∑fSc+≡ρˆ简记为三个参数可以从三个不同的样本矩平均值中直接得到。三个参数可以从三个不同的样本矩平均值中直接得到。15一般的矩方法(续三)}0,0,2/1{},,{}Re,,{ˆ321101100−===−cffffρρρρ⎟⎟⎟⎠⎞⎜⎜⎜⎝⎛−−=24/50004/50002/5S其中由于矩的估计值就是函数的样本平均值,因此满足)()ˆ(fVVrsrs=γ可以证明参数估计值的方差矩阵可以确定为⎟⎟⎟⎟⎠⎞⎜⎜⎜⎜⎝⎛−−−−==3323132322121312112222242248)()ˆ(VVVVVVVVVSfSVVTρ16一般的矩方法(续四)如果概率密度函数可以表示成1(|)(),krrrPxFgxλλ==+∑这里F为归一化常数,gr(x)代表一组k个正交函数,满足()(),()0,1,2,...,rsrsrgxgxdxgxdxskδΩΩ===∫∫那么从gr(x)的样本估计值可直接给出参数估计值与方差krxgnxgniirrr,...,2,1),(1)(ˆ1===∑=λ2221111ˆˆˆ()()(1),1,2,...,11nrrrirriVgxrknnnλλλ=⎛⎞=−≅−=⎜⎟−−⎝⎠∑17一般的矩方法(续五)在粒子物理与核物理研究中,所涉及的末态粒子角分布大都可以表示成球谐函数的形式。''''44()()*()0mmjjjjmmmjYYdYdππδδΩΩΩ=ΩΩ=∫∫因此,常常采用矩方法来从实验上测定粒子的自旋。为了减少因矩方法经过积分后,可能因信息不全而带来的影响,通常计算比待定参数的还要多的矩,比较对应的样本矩来构造最小二乘函数,得到反映实验数据与理论模型之间拟合优度的定量表述,给出参数的估计值。18一般的矩方法确定粒子自旋在北京正负电子对撞机中产生的一个物理过程过程光子(γ)e+共振态(X)e-θK+K-J/Ψ实验原理:根据角动量守恒,粒子X的自旋取值与其衰变的末态粒子角分布有关。通过计算不同自旋取值、系统轨道角动量和自旋在系统动量方向的投影所对应的函数矩,并与样本矩比较来确定粒子的自旋。实验原理:根据角动量守恒,粒子X的自旋取值与其衰变的末态粒子角分布有关。通过计算不同自旋取值、系统轨道角动量和自旋在系统动量方向的投影所对应的函数矩,并与样本矩比较来确定粒子的自旋。19确定粒子的自旋(续一)−++→+→ΨKKXXJ,/γ注意:X可以包含有几个粒子(如左图)。)1525('2f)1710(X实验观测量:γ,Κ+与Κ-的能动量,因此22()cos,|()|()(),()()()||zppEEKEKppKpKmKKEpγθγ+−+−+−==+=+=−X,Κ+的能动量可给出K+在X质心系的极角与方位角Ω=′′),(φθ能否观察自旋取值随质量的变化关系?能否观察自旋取值随质量的变化关系?20确定粒子的自旋(续二)光子θ+exyrx′y′z′+KX粒子方向θ′φ′)0,,(θφ′′=Ω在任一X不变质量区间与角度相关的概率密度函数与矩函数为(,|)WθλΩ构造函数矩*0,,0Re[(0,,0)()]jlmmDDθ−Ω*(,,)0,,0(,|)Re[(0,,0)()]cosjljlmmmTWDDddθλθθ−=ΩΩΩ∫⊗(,,):jlm是与自旋、轨道角动量、轨道角动量第三分量有关的量。PRL77,3959(1996)λ是表征动力学因子的参数21确定粒子的自旋(续三).35104~),15103(1054~),86(1054~),46(218~],52172[564~],523)233(71[54~],521)(71[58~],51)22(71[8~],)2[(54~],)[(8~1210)2,4,2(12111110)1,4,2(212211210)0,4,2(212211210)0,4,0(10121210)2,2,2(101112111110)1,2,2(1010212211210)0,2,2(1010212211210)0,2,0(210212211210)0,0,2(210212211210)0,0,0(AATAAAATAAATAAATBAAATBAAAAATBAAAATBAAAATBAAATBAAAT++−+−+−+−+−−+−+++−+++αααα自旋=0++:B10自旋=2++:A10,A11,A120++与2++干涉因子:α原则上五个参数有五个矩方程即可。构造额外的矩只是为了尽可能包含数据的所有信息。各种可能情况下任意一个质量区间的矩与参数A与B(螺旋度振幅)有关原则上五个参数有五个矩方程即可。构造额外的矩只是为了尽可能包含数据的所有信息。22确定粒子的自旋(续四)实验观测的样本矩为∑Ω⋅=′−eventslmjmmljDDN)]()0,,0(Re[*0,,0),,(θ由于探测效率的缘故,必须对上述样本矩进行修正,使得1NCNT−⎯′=⎯⎯→对应于样本矩:函数矩:考虑到任一给定的不变质量和角度,经过探测器探测以后,其质量与角度值会发生改变。这种改变可通过效率矩阵来反映)]()0,,0(Re[)2()]()0,,0(Re[1*0,,001*'0,''',0)',',';,,(Ω−⋅Ω=−=−∑lmjmmNilmjmMCmljmljDDDDNCAccθδθNMC:产生的事例数NACC:接收的事例数23确定粒子的自旋(续五)该研究为了利用所有矩的信息,没有简单进行解方程求解参数值,而是,将所有十个含参数的矩与对应的样本矩进行比较,构造χ2量,即与测量量相关的协方差矩阵