大数据的统计学05

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区大数据的统计学基础——第5周大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区法律声明【声明】本视频和幻灯片为炼数成金网络课程的教学资料,所有资料只能在课程内使用,不得在课程以外范围散播,违者将可能被追究法律和经济责任。课程详情访问炼数成金培训网站专业数据分析社区关注炼数成金企业微信提供全面的数据价值资讯,涵盖商业智能与数据分析、大数据、企业信息化、数字化技术等,各种高性价比课程信息,赶紧掏出您的手机关注吧!大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区导数基本初等函数求导公式(1)0)(C(2)1)(xx(3)xxcos)(sin(4)xxsin)(cos(5)xx2sec)(tan(6)xx2csc)(cot(7)xxxtansec)(sec(8)xxxcotcsc)(csc(9)aaaxxln)((10)xxee)((11)axxaln1)(log(12)xx1)(ln,(13)211)(arcsinxx(14)211)(arccosxx(15)21(arctan)1xx(16)21(arccot)1xx大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区不定积分积分与求导互为逆运算1、ckxkdx2、caxdxxaa113、cxdxxln14、cxdxxarctan1125、cxdxxarcsin1126、cxxdxsincos7、cxxdxcossin8、cxxdxdxxtanseccos1229、cxxdxdxxcotcscsin12210、cxxdxxsectansec11、cxxdxxcsccotcsc12、cedxexx13、caadxaxxln大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区简单定积分计算牛顿——莱布尼兹公式:其中,F(x)为f(x)的原函数,即𝐹′𝑥=𝑓(𝑥)分部积分公法:设u(x)、v(x)在[a,b]上具有连续导数,则()()|()()bbaafxdxFxFbFa,则)(),(xvxubababaxduxvxvxuxdvxu)()()()()()(大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区回顾上周的作业中,解答这道题我们设立了两个随机变量:用X记录甲投中的次数,Y记录乙投中的次数。我们写出了它们各自的分布律:X0123P0.0640.2880.4320.216Y0123P0.0270.1890.4410.343大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区回顾这次我们尝试将X、Y取值的不同情况下的概率都计算出来为了方便计算,我们把X与Y的分布律的数据改一下有了上表,再计算题目中的问题就变得简单了X0123P0.10.30.50.1Y0123P0.10.20.50.2联合分布律大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区二维随机变量一般,设E是一个随机试验,它的样本空间是S={e},设X=X{e}和Y={e}是定义在S上的随机变量,由X与Y构成的向量(X,Y)叫做二维随机向量或是二维随机变量(Two-dimensionalrandomvector)大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区分布函数设(X,Y)是二维随机变量,对于任意实数x,y,二元函数:F(x,y)=P{(X≤x)∪(Y≤y)}=P{X≤x,Y≤y}称为二维随机变量(X,Y)的联合分布函数(Jointprobabilitydistribution)大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区分布函数的性质1.F(x,y)是对于x和y的不减函数,即2.0≤F(x,y)≤1,且对于任意固定的y,F(-∞,y)=0;对于任意固定的x,F(x,-∞)=0F(-∞,-∞)=0,F(∞,∞)=11212(,)(,)xxFxyFxy1212(,)(,)yyFxyFxyy2xy1(x,y1)(x,y2)x1x2(x1,y)(x2,y)y大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区分布函数的性质3.F(x,y)关于x右连续,关于y右连续,即4.对于任意(x1,y1),(x2,y2),x1x2,y1y2,下述不等式成立:F(x2,y2)-F(x2,y1)+F(x1,y1)-F(x1,y2)≥00(,)(,)limFxyFxy0(,)(,)limFxyFxy大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区例3.1设随机变量(X,Y)等可能地取值:(0,0),(0,2),(2,0),(2,2),求X,Y的联合分布函数.o(2,0)(0,2)解:I.IIIIIIIIVVx0,或y0时,0)(),(),(PyYxXPyxFII.0≤x2,0≤y2时,41)}0,0(),{(YXPIII.0≤x2,y≥2时.214141)}2,0(),{()}0,0(),{(YXPYXP例子),(),(yYxXPyxF),(),(yYxXPyxF大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区IV.x≥2,0≤y2时,214141V.x≥2,y≥2时,141414141例子),(yxF),(yYxXP)}0,2(),{()}0,0(),{(YXPYXP),(),(yYxXPyxF)}2,2(),{()}0,2(),{()}2,0(),{()}0,0(),{(YXPYXPYXPYXP大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区例子综上所述,得随机变量(X,Y)的分布函数为F(x,y)=0,x0或y0;1/4,0≤x2,0≤y2;1/2,0≤x2,y≥2及x≥2,0≤y2;1,x≥2,y≥2.大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区离散与连续.如果二维随机变量(X,Y)全部可能取到的值是有限对或是可列无限对,则称(X,Y)为离散型的二维随机变量。如果对于二维随机变量(X,Y)的分布函数F(x,y),存在非负可积函数f(x,y)使得对于任意x,y有Fx,y=−∞𝑥−∞𝑦𝑓𝑢,𝑣𝑑𝑢𝑑𝑣称(X,Y)为连续型的二维随机变量。函数f(x,y)称为二维随机变量(X,Y)的联合概率密度(Jointprobabilitydensity)。大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区联合分布律对于离散型的二维随机变量(X,Y)的所有可能取值为(xi,yi),I,j=1,2,……,称P{X=xi,Y=yi}=pij,i,j=1,2,……为随机变量X和Y的联合分布律(Jointdistributionlaw)性质:y1y2…yj…XYp11…p12p1j…p21…p22p2j…pi1…pi2pij………………………1x2xix10,1,2,ijpij,1121ijijP大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区例子一个口袋中有三个球,依次标有数字1,2,2,从中任取一个,不放回袋中,再任取一个.设每次取球时,各球被取到的可能性相等.以X,Y分别记第一次和第二次取到的球上标有的数字,求X,Y的联合分布律.解:(X,Y)的可能取值为(1,2),(2,1),(2,2))}2()1{()}2,1(),{(YXPYXP312231312132)2/1()2()}1,2(),{(XYPXPYXP)1/2()1(XYPXP312132)}2,2(),{(YXP大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区例子故X与Y的联合分布律XY12101/321/31/3o1221(2,2)(2,1)(1,2)大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区联合概率密度联合概率密度的性质:1.f(x,y)≥02.−∞∞−∞∞𝑓𝑥,𝑦𝑑𝑥𝑑𝑦=𝐹∞,∞=13.设G是xOy平面上的区域,点(X,Y)落在G内的概率为PX,Y∈G=𝐺𝑓𝑥,𝑦𝑑𝑥𝑑𝑦4.若点f(x,y)在点(x,y)连续,则有𝜕2𝐹(𝑥,𝑦)𝜕x𝜕y=𝑓(𝑥,𝑦)大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区例子大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区例子大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区多维随机变量二维随机变量可以推广到多维的情况:设E是一个随机试验,它的样本空间是S={e},设X1=X1{e},X2={e},……,Xn=Xn{e}是定义在S上的随机变量,由Xi构成的向量(X1,X2,……,Xn)叫做多维随机向量或是多维随机变量(Multidimensionalrandomvector)对于任意x1,x2,……,xn,函数F(x1,x2,……,xn)=P{X1≤x1,X2≤x2,……Xn≤xn}称为n维随机变量的分布函数大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区边缘分布在多维随机变量中,将X,Y各自的分布称为边缘分布函数(Marginaldistribution),分别记为𝐹𝑋,𝐹𝑌𝐹𝑋=PX≤x=PX≤x,Y∞=F(x,∞)𝐹𝑌=PY≤y=PX∞,Y≤y=F(∞,y)大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区边缘分布律设(X,Y)是二维离散型随机变量,其(联合)分布律为:{,}(,1,2,)ijijPXxYypij则关于X的边缘分布律为:{}(1,2,)iiijjpPXxpi关于Y的边缘分布律为:{}(1,2,)jjijipPYypj大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区边缘分布律边缘分布律具有一维分布律的性质联合分布律唯一决定边缘分布律.具体求法是将联合分布律写成表格形式,然后各行分别相加得关于X的分布律;各列相加得Y的分布律…………………………p11…p12p1j…p1·1xp21…p22p2j…p2·2xpi1…pi2pij…pi·ixXYy1y2…yj…iPXxp·1p·2p.j……1jPYy大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区例子已知(X,Y)的联合分布律如图求X与Y的(边缘)分布律.将联合分布表中的各行概率分别相加得X的分布律:即:同理可得YX3213213023063023063063033023030613023030)1(XP63306306303)2(XP62302306302)3(XP626361321ipX626361321jpY大数据的统计学基础讲师何翠仪DATAGURU专业数据分析社区边缘概率密度对于连续型随机变量(X,Y),它的联合概率密度为f(x,y),则关于X和关于Y的边缘概率密度(Marginalprobabilitydensity)如下:边缘分布函数与边缘概率密度的关系:()(,)()(,)XYfxfxydyfyfxydx()XFx(,)Fx(,)xfuvdvdu()xXfudu()YFy(,)Fy(,)yfuvdudv()y

1 / 48
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功