24/02/20091粒子物理与核物理实验中的数据分析陈少敏清华大学第一讲:基本概念24/02/20092本次讲座的要点概率随机变量与函数期待值误差传递24/02/20093实验的目的是什么?ee观察某一过程的n个事例实验测量给出每个事例的特征量(能动量,末态粒子数…)。理论预言给出上述各特征量的分布,而且可能还会包含自由参数。24/02/20094数据背后的物理图像是什么?原初物理分辨率探测效率本底噪音实验数据数据分析专业术语:事例选择,粒子鉴别,CUT条件,信噪比优化,无偏选择,效率修正,卷积分辨率,解谱(像)还原…24/02/20095如何科学地给出物理结论?收集数据估计参数值与相应的误差范围,检验在何种程度上理论与实验数据相符。问题:如何评价这种检验?数据分析举例:测量闪烁体衰减长度24/02/20096光在闪烁体中传播时,具有下列衰减关系01021102200021012200.25exp(/),2ln(,0.5exp(/),0.5exp(/)0.5,0.5/),QEQQLLQQLLLLzLQQQLLLzQQLz00exp(/)QQLL其中,L0是闪烁体的衰减长度,它是表征闪烁体质量的一项重要指标。实验上测量衰减长度的方法如下图所示Q1Q2LL2L1zˆz举例:测量闪烁体衰减长度(续)24/02/20097212000120.25exp(/),2ln(/)QQQLLLzQQ实验采用恒定光源,因此Q0为常数,对待测闪烁体L0也为常数。理论上只要在给定一个位置z,测量闪烁体两端的电荷输出量即可。但在实际中,往往需要做多点测量。频数Q2Q1Q2测量次数使用概率来量化结论!理论上是不变的Q1Q2值,为什么每次测量都不相同?能否认为L0不是常数?24/02/20098随机事例在一定的实验条件下,现象A可能发生,也可能不发生,并且只有发生或不发生这样两种可能性,这是偶然现象中一种比较简单的形态,我们把发生了现象A的事例称为随机事例A,简称事例A。24/02/20099随机事例之间的相互关系A与B之并事例A与B之积(交)事例ABA之逆事例AB指事例A与B中至少有一个出现的事例指事例A与B中同时出现的事例A指事例A不出现的事例AAABAB如果A与B互斥,则ABAB0AA24/02/200910文恩图(Venndiagram)检验()()()()()()()()()ABABAABAABABAABABABABABCABACAB24/02/200911概率的定义柯尓莫哥洛夫公理:考虑一全集S具有子集A,B,…,()0()10()()()ASPAPSABPABPAPB()1()()1()()()()()()PAPAPAAABPAPBPABPAPBPAB从该公理与文恩图给出的结论可以导出下列概率公式ABCSP(A)称为事例A的概率24/02/200912条件概率假设B出现的概率不为零,在给定B的情况下出现A的条件概率定义为()(|)()PABPABPB如果则表明A与B相互独立。()()()PABPAPB如果A与B相互独立,则有()()(|)()()PAPBPABPAPB注意:与不相交的子集定义不同AB结果与B无关24/02/200913贝叶斯定理根据条件概率的定义()()(|)(|)()()PABPBAPABPBAPBPA与而,故()()PABPBA(|)()(|)()PBAPAPABPB贝叶斯定理由ReverendThomasBayes(1702-1761)首先提出。24/02/200914全概率事例与贝叶斯定理考虑在样本空间S中有一子集B。将样本空间分为互斥的子集Ai,使得B1A2A3AiAiiiiAAS因此,()()iiiiBBSBABA表示成概率的形式为()(())()iiiiPBPBAPBAiAB得到全概率事例公式()(|)()iiiPBPBAPA(|)()(|)(|)()iiiPBAPAPABPBAPA贝叶斯定理S24/02/200915例子:如何利用贝叶斯定理假设对任意一个人而言,感染上AIDS的概率为AIDSnoPAIDSP999.0)(前之验检何任即,率概前验001.0)(考虑任何一次AIDS检查的结果只有阴性(-)或阳性(+)两种率概性的阴者患染感AIDS02.0)(率概性的阳者患染感AIDS98.0)|(AIDS|PAIDSP率概的性阴者染感未AIDS97.0)(率概的性阳者染感未AIDS03.0)|(AIDSno|PAIDSnoP如果你的检查结果为阳性(+),而你却觉得自己无明显感染渠道。那么你是否应担心自己真的感染上了AIDS?24/02/200916例子:如何利用贝叶斯定理(续)利用贝叶斯定理,阳性结果条件下是AIDS患者的概率为)率概后验(032.0999.003.0001.098.0001.098.0)()|()()|()()|()(AIDSnoPAIDSnoPAIDSPAIDSPAIDSPAIDSPAIDSP也就是说,你可能没什么问题!?AIDS患者阳性所有为阳性结果的人涉及到如何诠释结果(概率)的问题!从你的观点上看:对自己染上AIDS结果的可信度为3.2%。从医生角度上看:象你这样的人有3.2%感染上了AIDS。24/02/200917概率含义的诠释相对频率(频率论者)假设A,B,…是一可重复实验的结果,则概率就是()limnAPAn结果为次实验主观概率(贝叶斯论者)如果A,B,…是假设(是真或是假的各种陈述),那么概率()PAA对为真的信心程度两种解释皆与柯尔莫哥洛夫公理相符。概率的频率解释在数据分析中用起来比较自然,但是…24/02/200918频率概率中的问题实际问题中,统计量总是有限的。P(A)完全取决于A的划分与总统计量的大小。概率大小会出现波动。例如:我们可以说“明天有雨”。但是,如果我们根据概率频率定义说“明天可能有雨”,却是一个毫无科学意义的预报。该定义不适用于某些特殊情况需要解决好•A的定义•适当的误差24/02/200919贝叶斯理论与主观概率(|)()(|)()PPPP实验理论实验理论实验理论如果实验证明P(实验|理论)=0,则表明理论不能接受。大的P(实验|理论)会增加对理论的信任度。通过实验结果可以修改P(理论)。改进的P(理论)可应用于对重复实验结果的预测。P(实验|理论)对先验理论的依赖将最终消失。贝叶斯理论通常用于主观概率问题通过实验结果改进基于某一理论的信念(后验性的)()(|)(|)PPP先验概率:理论;验后概率:理论实验似然性:实验理论24/02/200920主观概率中的问题主观性:在对同一随机现象的描述中,我的P(理论)与你的P(理论)可能不同理论家甲之理论A理论家乙之理论B•出于绝望•出于无知•出于懒惰使用主观概率的原因24/02/200921主观概率的一些特点主观概率有一些吸引人的地方,例如对于不可重复现象的处理中,显得比较自然系统误差(重复实验时仍保持不变);在该事例出现的粒子是正电子;自然界是超对称的;明天将下雨(将来事件的不确定性);公元1500年元月一日北京下雨(过去事件的不确定性)。结论中包含了主观上对事件为真的信念!24/02/200922频率论者与主观概率质子质量的不确定性与从100只球中有68只白球的球筐里能拿出白球的不确定性一样。频率论者:质子或非质子(不知道是哪个)主观主义者(贝叶斯论者):68%是质子(对知识的陈述)P(938.27195质子质量938.27211MeV)是什么?对主观概率而言,意味着当以质量来判断一实际为质子的粒子类别时24/02/200923频率论者与主观概率(续)能否在频率定义中将质子质量在938.27195-938.27211MeV内理解成:在整个宇宙中,自然界给出了各种不同的质子质量,而它们中有68%在938.27195与938.27211MeV之间?没问题…只不过这是对信心程度的一种表达。那么上述论断的68%就应该理解为结果为真的概率。如果大多数贝叶斯论者说巴西赢得2010年足球世界杯冠军的概率为68%质子质量在938.27195-938.27211MeV内的概率为68%大陆中国人2020年获诺贝尔奖的概率为68%艾滋病检验结果再认识24/02/200924()0.001()()0.032()PAIDSPAIDS验前概率验后概率对于个人而言,0.032是主观概率。如果没有其它额外的信息时,应把0.001当作相对频率解释。但是往往在病毒检验前,该相对频率被当作一种信念来处理个人是否患病。如果还有其它额外的信息,应该给出不同的先验概率。这种贝叶斯统计的特点必定是主观的。例如,受检者有过吸毒历史。一旦验前概率改变,贝叶斯定理就会告诉患病的可能性。对阳性结果的诠释就会改变。问题:能否构造含自变量的概率?24/02/200925随机变量与概率密度函数假设实验结果为x(记作样本空间中元素)dxxfdxxxxP)()内围范],[在到测(观那么概率密度函数p.d.f.定义为,它满足)(xf1)(dxxf定义累积分布函数为xxdxfxF)()(对于离散型随机变量xxiniiiiixPxFfxPf)()(,1),(1)(xf)(xFxx24/02/200926直方图与概率密度函数概率密度函数p.d.f.就是拥有无穷大样本,区间宽度为零,而且归一化到单位面积的直方图。度宽的间区数例事总的图方直入添)()()()(xnxNxnxNxf频数数例事的间区个每)(xN)(xN)(xN)(xfxxxx直方图在统计分析中非常重要,应准确理解它的含义。24/02/200927多变量情形如果观测量大于一个,例如与yx1),(.f.d.p的合联),(),()(dxdyyxfyxfdxdyyxfBAP24/02/200928边缘分布将联合概率密度函数p.d.f.投影到轴(如图所示)yx,.f.d.p的)(),(义定),()(),()(边缘yfxfdxyxfyfdyyxfxfyxyxy)(yfyx)(xfxyx24/02/200929条件概率密度函数利用条件概率的定义,可得到dxxfdxdyyxfAPBAPABPx)(),()()()|(定义条件概率的密度函数p.d.f.为)(),()|(,)(),()|(yfyxfyxgxfyxfxyhyx则贝叶斯定理可写为)()()|()|(yfxfxyhyxgyx若相互独立,则可构造2-维p.d.fyx,)()(),(yfxfyxfyxh(y|x)yyxdxdx24/02/200930名词总汇随机事例概率条件概率相对频率与主观概率贝叶斯定理随机变量概率密度函数条件密度函数直方图24/02/200931问题()(|)()PABPABPB条件概率如果A与B相互独立,则从文恩图上得到0AB因此()(|()0)()0???()PABPABPBPAAPB24/02/200932解答:概率都是条件概率由柯尓莫哥洛夫公理,我们定义了概率P(A)。但在实际应用中,我们总是对A相对于许多样本空间的概率感兴趣,而不仅仅只是一个空间。因此,通常以记号(|)PAS来表示所进行的研究是在特定的样本空间S中,也就是A相对于S的条件概率。因此,所有概率在实际应用中都是条件概率。只有当S的选择是明白无误时,才能简单记为(|)PAS()PA24/02/200933解答:互斥与相互独立互斥的定义为ABAB也就是两个事例的定义没有交集。所给出的推论为0()()()ABPABPAPB相互独立的定义为()()()PABPAPBAB如果则与相互独立。因此,根据定义两个相