《实验数据分析(下册)》介绍实来自验和测量数据分析中涉及的概率和数理统计及相关的数学知识,双胜磁算好为去触越内容包括概率论、经典数理360百科统计、贝叶斯统计、例奏蒙特卡罗方法附操五完、极小化方法和去弥散方法六个部分。经创特别讨论了数据统计处理中的一些困难问题和近期国际上发展起来的新方法。书中分析了取自普通物理、核物理、粒子物理和工程技术问题的许多实例,注重物理问题与数学方法的结合,具体阐述了概率和数理统计及相关的数学方法在实际问题中的应用。书末附有详尽的数理统计表,可供《实验数据分析(下册)》涉及的几乎则所有数据分析问题之需要,而无需查阅专门的数理统计表书籍。
《实验数据分析(下册)》可供实验物理工作者和大专院校相关零燃物掉历已齐罗刑专业师生、理论物理研究人员、工程技术人员以及从事自然科学和社会科学的数据测量和分析研究人员参考。
前言
第12章 假设检验
第13章 贝叶斯统计
第14章 蒙特来自卡罗法
第15章 极小化方法
第16章 去弥360百科散方法
参考文献
附表
示例索引
《现代物理基础丛书》已出版书晶及掉身目
第12章假设检验
12.1 假设检住外美示销验的一般概念
从第7章到第11章我们讨论了参数估计问题,在这类问题中,随机变量的分布函数的形式一般为丝曲鲜雨海简山已知,但其中包含着待估计的未知参数,参数估计就是根据子样观测值对未知参数的数值或来自置信区间进行统计推断上情速目。如果被观测的随机360百科变量的分布函数的确切形式未烈令知,我们只能以假设的方式旧弱也蛋映斯第或提出它所服从的分布,并从统计的观点根据观测值来府需演限判断这一假设的合理性。这类问题是数理统计的又一重要内容,称为统计假设的检验。
举例来说,方向相反的高能量正负电子对钢还种系撞,产生一对μ介子
e+ +e. .→ μ + +μ..
出射的μ.粒子与负电子e.之间的极角是一想周兵甚元厂边最个随机变量。假定测量清且杨况了主白白地了n个反应事例的值为.1,.2,……,.n,要求确定的分布是否具有C(1+acos2 .),0...π(12.1衡划.1)的形式,其中C是归一化常数,a是某个参数.这就是一个假设检验问题。
假设检验可以分为参数检验和非参数检验两类,如果有待检验的是分布的某个参数且构念久是否等于某个规定值(分布函数形式已知,但包含未知参数),那么这属于参数检验问题。比如上例中市触富家呢已知随机变量,具有式(12.1.1)的分布,要求阿二呢卷杀适失城根据观测值.1,.2,,.n检验未知参数a是否等于某个特定值a0,非参数检验所处理的问题是:被观测的随机变量所服占伤从的分布是否具有某个特定的函数形式,或是从两个总体的各自一组观测值来检验这两个具总体是否有相同的分布等,在这种情况下,待检验制限留氢静势往迅总体的分布的函数形式,在假设检验完成前是无从知晓的。上例中,如果要根据一组观测值.1,.2,……,.n来确定随机变量。是否服从式(12.1.1)的分布(事先并不知道,分布的函数形式),则就是非参数检验问题。
12.1.1 原假设和备择假设
参数检验的一般问题可表述如下:设总体X的概率分布F(x;.)的函数形式为已知,但其中包含未知参数,要求从总体的子样测量值(x1,x2,,xn)来检验未知参数,是否等茶告取极胜换府过含于某个指定值.0.对注胡有小李我们要验证的假设记为H0:.=.0,(12.1.2)称为原假设或零假设。参数假设检验问题的提出本身就意味着,总体X的真实分布的参数值既可能是H0规定的.0,也可能是不同于0的其他值。因此,与原假设相对,有 H1:.=..,..=.0称为备择假设或备选假设,参数,所有可能值的全体称为容许假设,容许假设(除原假设H0以外)都可作为备择假设,常见的参数备择假设有如下类型:
H1:.=.1(.1为不等于.0的常数),(12.1.3)
H1:.>.0,(12.1.4)
H1:.<.0,(12.1.5)
H1:.=.0.(12.1.6)
如果假设对于参数的规定值是一个常数,或者说是参数空间中的单点集,则该假设称为简单假设;相反,假设对参数的规定值是参数空间中的非单点集,则称为复合假设或复杂假设。于是式(12.1.2)和式(12.1.3)是简单原假设和简单备择假设,而式(12.1.4)~ 式(12.1.6)是复合备择假设。
非参数检验的一类问题是,待检验的总体X的分布F(x)是否等于某个特定函数G(x),或者总体X的分布F(x)与总体Y的分布G(x)是否相同,其原假设可表述为H0:F(x)=G(x), (12.1.7)
备择假设可有不同的类型
H1:F(x)>G(x),(12.1.8)
H1:F(x) H1:F(x).=G(x). (12.1.10)
一个假设检验问题,就是利用待检验总体的子样观测值来决定,究竟应当接受原假设(拒绝备择假设)还是应当拒绝原假设(接受备择假设),至于原假设和备择假设怎样选择,则是根据所要解决的具体问题来决定的。
式(12.1.4),式(12.1.5)的备择假设对于待检验的参数的规定值,完全落在原假设.=.0的一侧(上侧或下侧),这样的检验称为单侧检验;式(12.1.6)备择假设对的规定值落在H0:.=.0的两侧,称为双侧检验.对于非参数检验的情形,式(12.1.8),式(12.1.9)是单侧检验,式(12.1.10)是双侧检验。
12.1 假设检验的一般概念403
……
12.1.2 假设检验的一般方法
设X = {X1,X2,,Xn} 是从待检验总体抽取的随机子样,而U=U(X)为子样统计量(见6.2节统计量的定义),在假设检验中称为检验统计量,令W是U的值域,当零假设H0为真时,U落入W的一个子域R的概率用α表示,0.α.1,α = P (U ∈ R|H0)=R g(u|H0)du,(12.1.11)其中g(u|H0)是H0为真时统计量U的概率密度,一般α为一接近于零的正数,判断待检验的假设是拒绝还是接受,是根据所谓小概率事件的原理,即概率很小的事件在一次随机试验中被认为是几乎不可能发生的。因此,当我们有一组实际观测值x1,x2,,xn并求出U的实际观测值Uobs,如果它落在区域R之中,由于α很小,这一事件是小概率事件,因此,假设H0不大可能是正确的,我们称在显著性(水平)α上拒绝零假设H0而接受备选假设H1;反之,当Uobs落在子域W R内,则在水平α上接受H0而拒绝H1,对零假设H0作出接受或拒绝的判断,通常称为对H0作显著性检验,子域R称为拒绝域或临界域,子域W-R则称为接受域,临界域与接受域分界点的统计量U的值Uc称为临界点或临界值(图12.1(a))。应当指出,在某些检验问题中,特别在某些双侧检验问题中,存在两个分隔开的临界域,因而有两个临界点,如图12.1(b)所示。
图12.1检验统计量U的临界域R和接受域W-RUc(Uc.)为临界值,g(u|H0)是H0为真时U的概率密度
由假设检验的上述判断准则可知,即使零假设H0为真,但检验统计量U的实际观测值仍然有α的概率落入拒绝域R,也就是说,当用Uobs来检验正确地反映观测值的零假设时,有100α%的可能性将拒绝H0.这类错误称为第一类错误,亦即弃真的错误,把本来正确的假设给否定了,为了减少弃真的错误,α应当取得尽可能地小。
此外,还可能出现第二类错误,即取伪的错误,当H0不为真但却接受了H0.出现取伪错误的概率取决于备择假设H1,它等于H1为真而U落入接收域W-R的概率β,β = P (U ∈ W . R|H1)= . W -R g(u|H1)du,(12.1.12)其中g(u|H1)表示H1为真时统计量U的概率密度.零假设H0对备择假设H1的检验势或势函数定义为检验势=1. β = P (U ∈ R|H1)=. R g(u|H1)du,(12.1.13) 即H1为真而统计量U落入零假设拒绝域R的概率。
图12.2是假设检验中犯第一类错误的概率α和犯第二类错误的概率β的图示,显然,检验统计量U及临界值Uc的合理选择应当是使α尽可能地小,使检验势1.β尽可能大,因而假设检验问题的症结在于选择适当的检验统计量U及其适当的临界值Uc。
图12.2参数假设检验中第一类错误的概率α和第二类错误的概率β
例12.1单个π0 和多个π0 事例的区分
考察在氢气泡室中质子反质子湮灭产生的粒子,泡室只能显示带电粒子的径迹,通过对径迹的测量可确定带电粒子的种类、飞行方向和动量;中性粒子则不能显示和鉴别.pˉp反应的产物有许多事例观测到四条径迹,并可鉴别出它们是π± 介子,但测定了这些π介子的动量后发现,反应初态(pˉp)和反应末态(4个π介子) 之间不满足能量和动量守恒,这表明,反应末态中还有"丢失"了的中性粒子没有被观测到,根据反应初态的能、动量和反应末态四个π介子的能、动量可以求出所谓的"丢失质量"("丢失"的中性粒子的静止能量之和),事例数的丢失质量分布称为丢失质量谱,分析丢失质量谱可知,丢失的中性粒子可能是一个或多个中性π0 介子,因此,pˉp反应事例可以分为产生一个π0 和产生多个π0 两类.按照假设检验的概念,现在的问题可用下述零假设和备择假设来表示:
H0:pˉp π+π+π.π.π0 ,→ H1:pˉp → π+π+π.π.M(M表示多个π0),丢失质量的平方m2 作为检验统计量,如果H0成立,即丢失了一个π0 ,那么m2 应当等于π0 质量的平方,即mπ2 0.显然,临界值mc2 的合理选择应该是略高于mπ2 0.这样,如果一个事例的丢失质量平方小于mc2 ,就有很大可能是产生一个π0 的事例,故接受H0是合理的;反过来若事例的丢失质量平方m2 大于mc2 ,那么有很大可能产生一个以上的π0 ,故应当拒绝H0而接受备择假设H1,认为该事例是一个多π0 事件。
实验中观测到的全部事例的丢失质量谱一般都是连续分布,例如,图12.3(a)就是一个典型的丢失质量谱直方图,这是一个实验分布,其中包含了测量误差即实验分辨函数的效应(见4.17.1节),这样,尽管真实的丢失质量小于mπ2 0,但由于测量误差,测得的m2 却有一定的概率大于m2 π0;反之,真实的丢失质量大于m2 π0时,也有一定的概率实验测定值却小于mπ2 0,这就模糊了单π0 事件与多π0 事件的界限,使m2c 的选择面临两难的境地。如果m2c 选得稍高于m2 π0,可以保证多π0 事例被误认为单π0 事例的概率很小,即取伪错误的概率很小,但真实的单π0 事例却有较大的可能损失掉(弃真的概率较大);反过来,若m2c 比mπ2 0大得多,虽然减小了弃真错误的概率,但取伪错误的概率却由此增大了,这种情况在假设检验问题中是有代表性的,减小α和减小β这两个要求常常互相抵触,必须根据实际问题作适当的折中。……