问题8、对于概率密度的不连续点。如何从分布函数求得

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

问题8、对于概率密度)(xf的不连续点。如何从分布函数)(xF求得)(xf?答:由概率密度性质,若)(xf在点x处连续,则有)()(xfxF。如果)(xf在点x处不连续时,可以补充定义0)(xf,因为这并不会影响分布函数的取值。因此,除有限个点外,如果)(xF存在且连续,则概率密度)(xf可以用下面方法确定:不存在时当存在时当)(0)()()(xFxFxFxf问题9、不同的随机变量,它们的分布函数一定不相同吗?答:不一定。例如抛均匀硬币,令出现反面出现正面111X,出现反面出现正面112XX1与X2在样本空间上的对应法则不同,是两个不同的随机变量,但它们却有相同的分布函数11112110)(xxxxF问题10、目前国内教材中,对分布函数有两种定义方法:(1)}{)(1xXPxF,(2)}{)(2xXPxF这两种定义有何异同?答:相同之处:1)(0xFi;,0)(iF1)(iF;)(xFi单调不减)2,1(i不同之处:)(1xF右连续,而)(2xF左连续。如果X是连续性随机变量。这两个定义实际上没有差别;如果X是离散型随机变量,差异在于能否取到x这一点。问题11、为什么说正态分布是概率论中最重要的分布?答:正态分布有其广泛的实际背景。例:测量的误差、炮弹的弹着点的分布,人体生理特征的数量指标(身高、体重等),产品的数量指标(直径,长度,体积,重量等)。飞机材料的疲劳应力等,都服从或近似服从正态分布。可以说,正态分布是自然界和社会现象中最常见的一种分布。一个变量如果受到大量微小的,独立的随机因素的影响,那么,这个变量一般是一个正态随机变量。另一方面,有些分布(如二项分布,泊松分布)的极限分布是正态分布;有些分布(如2分布,t分布)又可通过正态分布导出,所以,无论在实际中,还是在理论上,正态分布是概率论中最重要的一种分布。问题12、设X、Y相互独立,且都服从参数为p的两点分布,则一定有YX吗?答:不对,因为这是误认为YX.只能取0,1两个值,而取0,1的概率都是p1和p,因此YX,这是错误的。事实上,YX.都是“随机”取值的。当X取0时,Y可能取0也可能取1,而同时取0或同时取1的可能值为1221)1(222pppp问题13、边缘分布与联合分布的关系如何?答:(X,Y)的联合分布全面反映了(X,Y)的概率分布状态以及数字特征,而边缘分布只反映分量X和Y的概率分布;联合分布能确定边缘分布,但边缘分布却不能确定联合分布。例:其它01,0),(yxyxyxf,其它01,0)21)(21()(yxyxxg均为联合密度函数,显然),(),(yxgyxf,但容易验证)()(xgxfXX,)()(ygyfYY,但当X,Y相互独立时,不仅联合分布决定它们的边缘分布,边缘分布也决定联合分布,反映在概率密度上也是如此。特别地,若nXXX,,,21是n个独立同分布)(xF的随机变量,则niinxFxxxF121)(),,,(,niinxfxxxf121)(),,,(问题14、相关系数XY反映X和Y的什么特征?答:XY是一个用来反映X和Y之间线性关系程度的数字特征。当X和Y存在线性函数关系)0(bbXaY时,则)()])([().cov(XbDExxEXXEYX).()(2XDbYD从而bbYDXDYXCovXY)()(),(,1XY另一方面。若1XY,则X和Y之间以概率1存在着线性关系,即存在常数a和b,使1}{bXaYP。若XY越接近1,X和Y的线性相关程度越好,若XY越接近0,X和Y的线性相关程度越差,若0XY,则称X和Y不相关。问题15、独立性与不相关有何关系?答:YX,的二阶矩存在且当0)(,0)(YDXD时,若YX,独立,则X与Y不(线性)相关,但反之不然,例如),(YX的联合概率密度1),(yxf,122yx易知0)()(YEXE,于是12201)(),(yxxydxdyXYEYXCov,此则YX,不相关。而X的边缘概率密度1121),()(211122xxdydyyxfxfxx同理Y的边缘概率密度112)(22yyyf)()(),(21yfxfyxf即),(YX不相互独立。但对于两个正态变量,相互独立性与不相关是等价的。问题16、随机变量X的期望不存在,则方差)(XD一定不存在吗?随机变量X的期望存在,则方差)(XD一定存在吗?答:随机变量X的期望不存在,则方差)(XD也不存在。2)()(EXXEXD,故当EX不存在时,)(XD也不存在,例如:分布xxxf)1(1)(2而当随机变量X的期望存在时,方差)(XD不一定存在。例:分布yxyxyxf,,)1(1),(222同理0)(YE,因此)()(YEXE均存在)0)1(1(222dxdyyxxEXdxdyyxxXEEXXEXD222222)1()()()(drrrd2002232)1(cos1drrrrrd022220)1()1()2cos1(211drrrrr0222)1(102222202]11)1[ln(21)1()1(111(21rrrdrr同理可得)(YD。即)(),(YDXD都不存在。问题17、依概率收敛与高等数学中的收敛有什么区别?答:在高等数学中,}{nx为确定性变量。若有xxlinnn。即对任意0,可找到0N,使得当Nn时,就有xxn成立,而绝不会有xxn在概率论中,}{nX依概率收敛于X,只意味着对任意给定的0,当n充分大时,事件“XXn”的概率很大,接近于1;并不排除“XXn”的发生,而只是说它发生的可能性很小。相比较,依概率收敛要比高等数学中普通意义下的收敛弱些。问题18、大数定律和中心极限定理之间,有什么联系?答:大数定律是研究随机变量序列}{nX依概率收敛的极限问题,而中心极限定理是研究随机变量序列}{nX依分布收敛的极限定理,它们都是讨论大量的随机变量之和的极限行为。当,,,1nXX,相互独立又同分布;并且有大于0的有限方差时,大数定律和中心极限定理同时成立:设0,2iiDXEX,则由切比雪夫大数定律知,对任意给定的.0有1})(1{lim1niinXnP而由独立同分布的中心极限定理有:nXnPXnPniinii11)(1)(11)(2)()(nnn可见,在所假设的条件下,中心极限定理比大数定律更为精确。问题19、大数定律说明什么问题?答:在实践中人们发现事件发生的“频率”具有稳定性,在讨论数学期望时,也看到在进行大量独立重复试验时,“平均值”也具有稳定性。大数定律正是以严格的数学形式证明了“频率”和“平均值”的稳定性,同时表达了这种稳定性的含义,即“频率”或“平均值”在依概率收敛的意义下逼近某一常数。问题20、中心极限定理的意义是什么答:中心极限定理是阐明有些即使原来并不服从正态分布的一些独立的随机变量,它们的总和的分布渐近地服从正态分布。一般地说,这些随机变量受到大量独立的因素影响,且每项因素的影响均匀,没有一项因素起特别突出的影响,那么就可以断言,这些随机变量的和的分布,近似于正态分布。问题21、数理统计中流行样本方差的两种形式:2121)(11XXnSnii;2122)(1XXnSnii这两种形式在统计中会发生哪些不同的效应?答:由于221)(SE,所以21S是总体X方差2的无偏估计,因此,一般都是以21S作为2的估计量。而22S的数学期望2221)(nnSE,因此22S就不是总体方差2的无偏估计。又22122)()1(SESnnE故当样本容量n很大时,21S和22S两者相差很小,对于大样本来说,可以用22S来估计总体方差2,因此,有时把22S称为大样本方差,而称21S为样本修正方差。问题22、2分布,t分布,F分布,正态分布之间有那些常见关系?答:1)正态分布与2分布:若nXXX,,,21是相互独立且服从标准正态分布)1,0(N,则)(~212nXnii2)正态分布,2分布,t分布:如果)1,0(~NX,)(~2nY,且X,Y相互独立,则)(~ntnYX。3)2分布,F分布:如果)(~),(~2212nYnX,且X,Y相互独立,则),(~2121nnFnYnX。4)2分布与2分布:如果)(~),(~2212nYnX,且X,Y相互独立,则)(~212nnYX。5)t分布与F分布:如果)(~ntT,则),1(~2nFT。6)F分布与F分布:如果),(~21nnFF,则),(~112nnFF。7)2分布与正态分布:如果,2,1),(~22nnn,则当n时,nnn22渐近服从标准正态分布)1,0(N。8)t分布与正态分布:如果,,2,1),(~nntTn则当n时,nT渐近服从)1,0(N。9)F分布与正态分布:如果XZln,),(~21nnFX,则当21,nn时,Z渐近服从正态分布))11(21),11(21(2121nnnnN问题23、一个未知参数的无偏估计一定唯一吗?答:不一定。例如:设nXXX,,,21是一个来自均值为(未知参数)的总体X的样本,则niEXXEi,,2,1,,)(令iniinXaY1,其中ia是满足11niia的常数。则)()(1iniinXaEYE故),,2,1(,,niXXi,nY都是的无偏估计量。问题24、为未知参数,如何评价一个区间估计量)ˆ,ˆ(21的优劣?答:评价一个区间估计量]ˆ,ˆ[21的优劣有两个因素:一是精度,可以用区间之长12ˆˆ来刻画,长度愈大,精度愈低。二是可靠度,它可以用上述事件的概率(即}ˆˆ{21P来衡量)。一般地,在样本容量n一定的前提下,精度和置信度是彼此矛盾的。例:设nXX,,1是来自正态总体),(20N的一组样本,则置信度为0.95的的置信区间为)96.1,96.1(2020nXnX置信度为0.99的的置信区间为)58.2,58.2(2020nXnX,即可靠性提高了,但精度降低了。著名的统计学家奈曼提出了处理此矛盾的原则:先照顾可靠度,即要求区间估计)ˆ,ˆ(21不低于某个数1的置信度,即要求1}ˆˆ{21p,在这个前提下,使]ˆ,ˆ[21的精度尽可能的高。问题25、如何理解置信区间中提到的概率1)},,,(),,,({2121nnxxxxxxP?答:首先1}{P与一般概率1}{baP的含义有所不同,后者区间),(ba为确定的一个数值区间,为随机变量,它表示的取值落在),(ba内的概率为1,而1)},,,(),,,({2121nnxxxxxxP式中的区间),(是随机区间,是客观存在的一个未知常数值,它的含义是随机区间),(包含未知常数的概率是1.换言之,设05.0,如果抽取了1000n的样本,每一组样本观察值代入到),,,(1nXX),,(1nXX中,就得到一个随机区间,1000个样本就得到1000个随机区间,那么,在这1000个置信水平为0.95的置信区间里,平均有950个包含真值,只有50个不包含真值,这就是说可能有5%的置信区间被误认为包含真值而犯

1 / 12
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功