摘要概率论是在一定条件下,通过人类的社会实践、生产活动发展起来的。而正态分布族是概率论的基础,很多问题也依赖于正态分布族。正态分布族,又称自然指数分布族,是统计学中最重要的分布族,在统计学的许多方面有着极其重大的影响力。正态分布族不仅在数学、物理及工程等领域具有非常重要的作用,且广泛应用于生产、生活等各个领域。因为正态分布族在概率论与数理统计的理论研究和实际应用中都占有十分重要的地位,因此对正态分布族性质研究具有很强的现实意义。我们平时常见的连续型概率分布如正态分布、指数分布、伽马分布,离散型概率分布如泊松分布、二项分布、负二项分布都属于正态分布族。本论文主要是研究并概括正态分布族的性质,然后分别介绍这些属于正态分布族的概率分布,并对他们的特征和性质分别研究介绍。关键词:统计学,正态分布族,概率分布,性质1/38ABSTRACTProbabilitytheoryisundercertainconditions,throughthehumansocialpracticesandtheproductionactivities.Thefamilyofnormaldistributionisthebasisofthetheoryofprobability,thefamilyalotofproblemsalsodependsonthenormaldistribution.ThefamilyofnormaldistributionalsocalledNaturalexponentialdistribution.Itisoneofthemostimportantfamilyofdistributionsinstatistics,andithasasignificantinfluenceonmanyaspectsofstatistics.Thefamilyofnormaldistributioninmathematics,physicsandengineering,andotherfieldshasaveryimportantrole,andarewidelyusedintheproductionandliving.Becausethefamilyofnormaldistributionintheprobabilitytheoryandmathematicalstatisticstheoryresearchandpracticalapplicationareoccupiesveryimportantposition,wetothefamilyofnormaldistributionpropertieshaveverystrongpracticalsignificance.Weusuallycommoncontinuousprobabilitydistributionsbelongtothefamilynormaldistribution,suchasNormaldistribution,Exponentialdistribution,Gammadistribution,thediscreteprobabilitydistributionsuchasPoissondistribution,Binomialdistribution,Negativebinomialdistribution.Thispaperismainlystudiedandsummarizedthenatureofthenormaldistribution.Thenthepaperrespectivelyintroducestheprobabilitydistributionofthesebelongtonormaldistribution.Thefinalpaperfortheircharacteristicsandpropertiesoftheresearchisintroducedrespectively.KEYWORDS:statistics,Thefamilyofnormaldistribution,probabilitydistribution,properties2/38前言正态分布又名高斯分布,最早是由棣莫弗提出的,并由高斯等人引进到统计学,正态分布是应用最为广泛的连续型概率分布,其特征是钟形曲线,是一个在数学、物理及工程等领域都极其重要的概率分布.正态分布族,又叫自然指数分布族,是统计学中最重要的分布族,在统计学的许多方面有着重大的影响力,并同时广泛应用社会生产生活中.该分布族包含着很多重要的概率分布,常见的概率分布如正态分布、指数分布、伽马分布、二项分布、负二项分布、泊松分布都属于正态分布族.本论文旨在汇总概括研究正态分布族的几个性质,并证明一些常见概率分布是否属于正态分布族,并对属于正态分布族的概率分布概括研究,证明其数字特征,即求出各个分布的数学期望和方差,并对其作出证明.然后对这些概率分布图形特性及线性性质进行探索研究,如正态分布图像的对称性,二项分布、伽马分布的可加性,指数分布、泊松分布的无记忆性等等.并对这些概率分布的特殊形式进行逐一介绍,如标准正态分布就是期望为0,标准差为1的正态分布;两点分布就是n=1时的二项分布等.并研究属于正态分布族的概率分布共有的特征以及其所属概率分布之间的相关联系.3/38第一章自然指数分布族1.1自然指数分布族定义及其性质1.1.1自然指数分布族的定义如果存在H⊂R上的实值函数φ(θ)以及不依赖于θ的函数h(x),非退化的随机变量x有概率分布或概率密度函数f(x,θ)=exp{θx−φ(θ)}h(x)𝑥∈𝐺,𝜃∈𝐻则称x服从自然指数分布族分布(正态分布族),其中θ为自然参数,H为自然参数空间,φ(θ)称为累积量母函数,𝐺为支撑集,且𝐺不依赖于θ.1.1.2自然指数分布族的性质定理1.1:假设随机变量x服从自然指数分布族分布,f(x,θ)=exp{θx−φ(θ)}h(x)𝑥∈𝐺,𝜃∈𝐻则m=E(x)=φ′(θ),𝑉=𝐷(x)=φ′′(θ)证明:在连续情形下,令G=(0,+∞),则有∫exp{𝜃𝑥−φ(θ)}h(x)dx=1+∞0从而有:φ(θ)=ln∫𝑒𝜃𝑥ℎ(x)dx+∞0可证φ(θ)有各阶连续导数,于是φ′(θ)=∫𝑥𝑒𝜃𝑥ℎ(𝑥)𝑑𝑥/∫𝑒𝜃𝑥ℎ(𝑥)𝑑𝑥+∞0+∞04/38=∫𝑥𝑒𝜃𝑥−𝜑(𝜃)ℎ(x)dx=E(X)+∞0φ′′(θ)=∫𝑥[x−φ′(θ)]+∞0𝑒𝜃𝑥−𝜑(𝜃)ℎ(𝑥)𝑑𝑥=∫𝑥2𝑒𝜃𝑥−𝜑(𝑥)ℎ(𝑥)𝑑𝑥+∞0−𝜑′(𝜃)∫𝑥𝑒𝜃𝑥−𝜑(𝜃)ℎ(𝑥)𝑑𝑥+∞0=E(𝑋2)−[E(X)]2=𝐷(𝑋)m=E(x)=φ′(θ)成为均值参数M={m|m=φ′(θ),θ∈H}称为均值空间D(x)=φ′′(θ)|𝜃=𝜃(𝑚)=V(m)称V(m)为x的方差函数。定理1.2:设{𝑋𝑡}独立同分布于自然指数分布族分布,𝑦T⊂𝑀(𝜇=μ(ϑ);θ∈Θ),则𝜇−1(1𝑇∑𝑋𝑡𝑇t=1)=argmaxθ∈Θ{𝜃∑𝑋𝑡𝑇t=1−𝑇𝜑(𝜃)+𝑇∑𝑐(𝑋𝑡)𝑇t=1}其中𝑐(𝑋𝑡)=lnℎ(𝑥)证明:{𝑋𝑡}独立同分布于自然指数分布族分布,令𝑐(𝑋𝑡)=lnℎ(𝑥),则对数似然函数为𝐿𝑇(𝑋;𝜃)=𝜃∑𝑋𝑡𝑇t=1−𝑇𝜑(𝜃)+𝑇∑𝑐(𝑋𝑡)𝑇t=1求其微分得𝜕𝐿𝑇(𝑋;𝜃)𝜕𝜃=∑𝑋𝑡𝑇t=1−𝑇𝜑(𝜃).令𝜕𝐿𝑇(𝑋;𝜃)𝜕𝜃=0则𝜃̂𝑇=𝜇−1(1𝑇∑𝑋𝑡𝑇t=1)因为当θ=𝜇−1(1𝑇∑𝑋𝑡𝑇t=1)时,对数似然函数一阶导数为0,因此在样本均值空间𝑦T中,θ=𝜇−1(1𝑇∑𝑋𝑡𝑇t=1)时,对数似然函数𝐿𝑇(𝑋;𝜃)取最大值。因此为了最小值5/38也超过均值空间M,则不是M=𝑦T就是𝑦T⊂𝑀。6/381.2属于自然指数分布族的概率分布我们常见的概率分布中有很多都是属于自然指数分布族分布的,比如连续型概率分布中的正态分布、指数分布、伽马分布,离散型概率分布中的泊松分布、二项分布、负二项分布等等都属于自然指数分布族分布,下面让我们对这些概率分布分别进行讨论证明。1.2.1连续概率分布1.正态分布设X(μ,2),其概率函数为(x;θ)=1√exp(−(𝑥−𝜇)22)=1√𝑒𝑥(𝑥μ2−𝜇22−𝑥22)=1√exp(−𝑥22)exp(μ2x−𝜇22)其中θ=μ2φ(θ)=𝜇22h(x)=1√exp(−𝑥22)2.指数分布设XE(λ),其概率函数为f(x)=𝜆𝑒−𝜆𝑥=𝜆exp(−𝜆𝑥−0)其中θ=−𝜆h(x)=𝜆φ(θ)=03.伽马分布7/38设XGa(α,λ),其密度函数为𝑓(𝑋;α,λ)=𝜆𝛼Γ(α)𝑥𝛼−1𝑒−𝜆𝑥其中h(x)=𝜆𝛼Γ(α)𝑥𝛼−1𝛉=−𝜆φ(θ)=01.2.2离散型概率分布1.泊松分布设X(λ),其概率函数为(x,λ)=pλ(X=x)=λxe−λ=1𝑥exp{𝑥ln𝜆−𝜆}其中h(x)=1xθ=lnλφ(θ)=λ2.二项分布设X(n,θ),其概率函数为(X)=𝜃(𝑋=𝑥)=𝑥𝜃𝑥(1−𝜃)−𝑥=𝑥exp(𝜃𝑥(1−𝜃)−𝑥)=𝑥exp[xln𝜃+(−𝑥)ln(1−𝜃)]其中θ=ln𝜃h(x)=𝑥φ(θ)=−(−𝑥)ln(1−𝜃)3.负二项分布设X𝑏−(𝑟,),其概率函数为8/38(X)=𝑝(X=x)−1𝑥−1𝑥(1−p)−𝑥=−1𝑥−1exp(𝑥(1−)−𝑥)=−1𝑥−1exp[xln+(−𝑥)ln(1−p)]其中𝜃=ln𝜃ℎ(x)=−1𝑥−1𝛗(θ)=−(−𝑥)ln(1−p)9/38第二章连续型自然指数分布族2.1正态分布及其性质正态分布的概念是由德国的数学家、天文学家棣莫弗在1733年率先提出的,但由于德国数学家高斯首次将其应用于天文学的研究,所以正态分布又名高斯分布。正态分布不仅在数学、物理及工程等领域起着非常重要的作用,且在统计学的很多方面有着重大的影响力。2.1.1正态分布定义与数字特征1.正态分布定义如果随机变量X服从一个位置参数为μ、尺度参数为的概率分布,且概率密度函数为(X)=1√exp(−(x−μ)22)则这个随机变量就称为正态随机变量,正态随机变量服从的分布就称为正态分布,记作(,),读作X服从(,),或服从正态分布。2.正态分布数字特征正态分布的数学期望E(X)=μ,方差D(X)=2证明:E(X)=∫𝑋+∞−∞1√exp(−(x−μ)22)𝑑𝑥=1√∫(μ+)𝑒−𝑡2+∞−∞d=μ1√∫𝑒−𝑡2+∞−∞𝑑+√∫𝑒−𝑡2+∞−∞𝑑=μD(X)=∫(𝑥−𝜇)2+∞−∞𝑓(𝑥)𝑑𝑥10/38=∫(𝑥−𝜇)2𝑓(𝑥)𝑑𝑥+∞−∞=∫(𝑥−𝜇)2+∞−∞1√exp(−(x−μ)22)𝑑𝑥令𝑥−=,得D(X)=2√∫2𝑒−𝑡2+∞−∞d=2√([−𝑒−𝑡2)]−∞+∞+∫𝑒−𝑡2d)+∞−∞=0+2√√=22.1.2正态分布性质1.正态分布的图形性质(1)变换:正态分布有两个参数,分别是均值μ和标准差,记作(μ,2):均值μ决定曲线的中心位置,而标准差则决定着曲线的陡峭或扁平程度。如果μ固定,而去改变的值,则当X=μ时,f(x)=1√2。越小,曲线表现的越陡峭;越大,曲线表现的越扁平。图2.1:f(x)OμX11/38(2)μ变换:参数μ称为正态分布的位置参数,描述了正态分布集中趋势的位置。正态分布以X=μ为对称轴,左右完全对称。当不变后,而改变μ的值,则f(x)的图形沿x平行移动,但正态曲线的形状不改变。μ变大,正态曲线沿x轴向