统计学知识简介.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

一、总体、样本与随机变量统计学知识简介二、随机变量的分布三、总体分布的数字特征——参数四、样本分布的数字特征——统计量五、几个重要的连续型随机变量的分布六、正态总体的样本平均数和样本方差七、估计量的评价标准八、参数估计九、假设检验统计学是研究随机现象的统计规律的一门科学,已被广泛地应用于自然科学和社会科学的各个领域中,成为定量分析的一种有力工具。一、总体、样本与随机变量统计学知识简介总体——所研究对象的全体。总体中的每个元素称为个体,总体中个体的数目称为总体容量,用N表示。分:有限总体——N为有限数,无限总体——N为无限数。样本——由总体中的若干个体组成的集合样本中个体的数目称为样本容量,用n表示。样本是总体的子集。根据样本的信息来推测总体的情况,并给出这个推断的可靠程度,称为统计推断。统计推断要求从总体中抽取样本须满足随机原则,即抽样时总体中的每个个体都有同等的机会成为样本中的元素。不重复抽样——每次抽取一个个体不放回去,再抽取第二个个体,连续抽取n次。重复抽样——每次抽取一个个体又放回去,再抽取第二个个体,连续抽取n次。对无限总体,不重复抽样等价于重复抽样,当N很大时,不重复抽样则近似于重复抽样一、总体、样本与随机变量统计学知识简介随机变量——按一定的概率取不同数值的变量,用ξ、η等表示。一个随机变量的完全信息是包括它的取值范围及取每个数值的概率,称为随机变量的分布。随机变量按其取值情况分为两大类:离散型随机变量——所有可能值为有限个或至多为无穷可列个。连续型随机变量——所有可能取值不能够一一列举出来,其值域为一个或若干个有限或无限区间。二、随机变量的分布统计学知识简介随机变量是用它的分布来表示的。若ξ为随机变量,x为任意实数,则称F(x)=P(ξ≤x)为随机变量ξ的分布函数,即ξ≤x的概率。分布函数F(x)满足:0≤F(x)≤1,F(-∞)=0,F(+∞)=1,P(x1≤ξ≤x2)=F(x2)-F(x1)xxiiP)x(F对离散型随机变量ξ,可以用概率函数Pi=P(ξ=xi)表示,即ξ=xi的概率,其中i=1,2,…。P满足:Pi≥0,∑Pi=1对连续型随机变量ξ,可以用密度函数f(x)表示,近似于ξ在x附近单位长区间上取值的概率。f(x)满足:f(x)≥0,badx)x(f)bxa(P1dx)x(f,xdt)t(f)x(F对离散变量:对连续变量:二、随机变量的分布统计学知识简介随机变量是用它的分布来表示的。分量为随机变量的向量称为多元随机变量,其联合分布函数定义为:F(x1,…,xn)=P(ξ1≤x1,…,ξn≤xn)。若随机变量ξ、η满足F(x,y)=Fξ(x)•Fη(y),即联合分布函数等于各自分布函数的乘积,则称随机变量ξ与η相互独立。若ξ为随机变量,η=f(ξ)称为随机变量函数,通常也是一个随机变量。三、总体分布的数字特征——参数统计学知识简介总体分布是由它的某些数字特征决定的,称之为参数。常用的参数有期望、方差、协方差1、数学期望(MathematicalExpectation)离散型随机变量ξ的期望值定义为:也称均值,表示总体的平均水平,记为μ或E(•)连续型随机变量ξ的期望值定义为:dx)x(xf)(EiiixP)(E期望值满足:(1)若a为常数,ξ随机变量,则E(a)=a,E(aξ)=aE(ξ)(2)若ξ、η为随机变量,a、b为常数,则E(aξ+bη)=aE(ξ)+bE(η)(3)若ξ、η为相互独立的随机变量,则E(ξ•η)=E(ξ)•E(η)三、总体分布的数字特征——参数统计学知识简介2、方差(Variance)定义为:表示总体相对均值的离散程度,记为σ2或Var(ξ)由期望值的性质,可得:22)(E)(E)(Var2)(EE)(Var方差满足:(1)若a为常数,ξ随机变量,则Var(a)=0,Var(aξ)=a2Var(ξ),Var(a+ξ)=Var(ξ)(2)若ξ、η为相互独立的随机变量,a、b为常数,则Var(aξ+bη)=a2Var(ξ)+b2Var(η))(Var为总体标准差,与总体的数量指标有相同的量纲。显然,参数不是随机变量。总体分布是由它的某些数字特征决定的,称之为参数。常用的参数有期望值、方差、协方差三、总体分布的数字特征——参数统计学知识简介3、协方差(Covariance)是两个随机变量与各自数学期望离差之积的期望,记为:可简化为:)(E)(E)(E),(Cov)(E)(EE),(Cov协方差满足:(2)Cov(ξ,ξ)=Var(ξ)(1)若ξ和η独立,则Cov(ξ,η)=0协方差可用于度量两个随机变量之间相关关系的密切程度。显然,参数不是随机变量。总体分布是由它的某些数字特征决定的,称之为参数。常用的参数有期望值、方差、协方差(3)Cov(a+bξ,c+dη)=bdCov(ξ,η)四、样本分布的数字特征——统计量统计学知识简介样本分布的数字特征称为统计量。1、样本平均数样本平均数表示样本的平均水平。若为一个样本,定义为:n1iiXn1X样本方差表示样本相对其样本平均数的离散程度,定义为:为样本标准差,它与样本观测值的数量指标有相同的量纲。显然,由不同的样本可以得到不同的样本平均数和样本方差,因此统计量是随机变量。可以证明:n1i2i2)XX(1n1Sn1x,,x2、样本方差2SS22)S(E,)X(E四、样本分布的数字特征——统计量统计学知识简介样本分布的数字特征称为统计量。22n1i2i2)S(E)XX(1n1S,则若220n1i2i20)S(E)XX(n1S,则若2、样本方差3、样本协方差无偏n1iii)YY)(XX(1n1有偏n1iii)YY)(XX(n1五、几个重要的连续型随机变量的分布统计学知识简介1、正态分布若随机变量ξ的密度函数正态分布在统计中具有重要的理论和实践意义,现实中的许多随机现象都服从或近似服从正态分布;随着样本容量的增大,很多统计量近似于正态分布(如t分布);许多离散型随机变量可用正态分布来近似(如二项分布)。正态分布满足:(1)E(ξ)=μ,Var(ξ)=σ2222)x(e21)x(f其中μ、σ为常数,σ0,则称ξ服从正态分布,记为ξ~N(μ,σ2)当μ=0,σ=1时,称ξ服从标准正态分布,记为ξ~N(0,1)(2)若ξ~N(μ,σ2),则)1,0(N~)()a,a(N~a0a,,a),(N~,)3(n1in1i2i2iiin1iiin12iin1i则,不全为,相互独立,,若随机变量xμf(x)五、几个重要的连续型随机变量的分布统计学知识简介2、χ2分布若ξ1,…,ξn为服从N(0,1)的正态总体的样本,χ2分布满足:(1)E(ξ)=n,Var(ξ)=2n则称ξ=ξ12+…+ξn2为服从n个自由度的χ2分布,记为ξ~χ2(n))n(~)n(~,)3(n1ii2n1iii2in1,则相互独立,,若随机变量n1ii2n1i2iin1n1)1n(~)()1,0(N~,)2(,其中则,相互独立,,若随机变量服从χ2分布的随机变量,可以表示为独立的标准正态随机变量的平方和。正态总体的样本方差服从χ2分布。x0f(x)n=4n=10五、几个重要的连续型随机变量的分布统计学知识简介3、t分布若随机变量ξ~N(0,1),η~χ2(n),ξ与η相互独立,则称可以证明:(1)E(t)=0为服从自由度为n的t分布,记为t~t(n)。n/t(2)Var(t)随着n的增加而减少,且Var(+∞)=1(3)当n30时,t(n)近似于N(0,1)。x0f(x)t分布正态分布五、几个重要的连续型随机变量的分布统计学知识简介4、F分布若随机变量ξ~χ2(n1),η~χ2(n2),且ξ与η相互独立,则称21n/n/F为服从第一个自由度为n1、第二个自由度为n2的F分布,记为F~F(n1,n2)。易知,若F~F(n1,n2),则1/F~F(n2,n1)。x0f(x)Fα(n1,n2)F分布的上侧分位数α六、正态总体的样本平均数和样本方差统计学知识简介(1)若总体服从N(μ,σ2),x1,…,xn为一个样本,则)1,0(N~n/x)n/,(N~x2,相互独立与,且2222Sx)1n(~S)1n()1n(t~n/Sx(2)若x1,…,xn和y1,…,yn是分别取自正态总体N(μ1,σ12)、N(μ2,σ22)的样本,则)1n,1n(F~/S/SF2122222121其中,S12、S22分别为两个样本的样本方差。六、正态总体的样本平均数和样本方差统计学知识简介(3)中心极限定理:若随机变量x1,…,xn相互独立,且服从同一分布,则nnxyn1iin随机变量的极限分布(n→∞)为标准正态分布,其中μ、σ2分别为xi的均值和方差。中心极限定理说明,当样本容量n充分大时,相互独立随机变量和的分布将是正态的,即:)n/,(N~x)n,n(N~x22n1ii或七、估计量的评价标准统计学知识简介1、无偏性)ˆ(E利用统计量的信息可以对未知参数进行估计,作为θ的估计量,其优劣有一些评价的标准。2、有效性3、一致性ˆ若,则称为θ的无偏估计量。ˆ通常称为系统误差,无偏估计意味着无系统误差。)ˆ(E22)S(E,)x(E如:若为θ的所有无偏估计量中方差最小的,则称为θ的有效估计量。ˆˆ的有效估计量是如:x若依概率收敛于θ,即对任意ε0,ˆ1)|)ˆ(|Plimn则称为θ的一致估计量。ˆ通常把样本容量n30的样本看做大样本,一致性在大样本时才起作用。的一致估计量为如:x在样本容量相同的情况下,有效估计量的值在θ的附近最为集中八、参数估计统计学知识简介1、参数的点估计统计推断中包括参数估计和假设检验。参数估计又分为点估计和区间估计。(1)矩估计法选择一个适当的统计量,把其观测值作为未知参数θ的估计值,称为点估计。统计量的选取有不同的方法。ˆ随机变量x的r阶原点矩定义为E(xr),r阶中心矩定义为E[(x-E(x))r]。特例:一阶原点矩为数学期望E(x),二阶中心距为方差Var(x),即E[(x-E(x))2]。矩估计法中,把样本矩作为对应总体矩的估计量,例如:n1i2in1ii)XX(1n1Sˆ,Xn1Xˆ八、参数估计统计学知识简介1、参数的点估计统计推断中包括参数估计和假设检验。参数估计又分为点估计和区间估计。(2)极大似然估计法选择一个适当的统计量,把其观测值作为未知参数θ的估计值,称为点估计。统计量的选取有不同的方法。ˆ设x1,…,xn为由未知参数θ确定的总体的一个样本,n1iin1),x(P),x,,x(L对离散型随机变量,定义对连续型随机变量,定义n1iin1),x(f),x,,x(L称L为似然函数。极大似然估计法中,把使样本出现概率最大的估计量作为所选,即关于θ极大化L,得到等价于极大化lnL,通过lnL关于θ的一阶导数为0来求,ˆ。ˆ八、参数估计统计学知识简介1、参数的点估计统计推断中包括参数估计和假设检验。参数估计又分为点估计和区间估计。(3)最小二乘估计法选择一个适当的统计量,把其观测值作为未知参数θ的估计值,称为点估计。统计量的选取有不同的方法。ˆ已知一组样本观测值(Xi,Yi)(i=1,2,…,n),要求样本回归函数尽可能地拟合这组值,即样本回归线上的点与真实观测点Yi的“总体误差”尽可能地小。最小二乘法给出的判断标准是:二者之差的平方和最小,即:在给定样本观测值之下,选出的,使Yi与之差的平方和最小。iYˆn1i2i10in1i2ii)]Xˆˆ(Y[min)Yˆ

1 / 30
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功