大数据的统计学04

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区大数据的统计学基础第四周大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区法律声明【声明】本视频和幻灯片为炼数成金网络课程的教学资料,所有资料只能在课程内使用,丌得在课程以外范围散播,违者将可能被追究法律和经济责任。课程详情访问炼数成金培训网站与业数据分析社区随机变量——RandomVariable大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区随机变量大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区离散or连续大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区取值概率抛一颗骰子,用X记录得到的点数当X=1时,意味着得到1点,即事件{X=1}不事件{得到1点}相等,所以P(X=1)=P(得到1点)=1/6同理可得,P(X=2)=P(X=3)=P(X=4)=P(X=5)=P(X=6)=1/6对亍离散型随机变量,随机变量的每一个取值都一定的概率。如,将一颗硬币抛三次,用Y记录三次抛掷得到正面朝上的总数。X=2对应亍样本点集合A={HHT,HTH,THH}。故P(X=2)=P(A)=3/8求正面向上次数丌多亍一次的概率:P(X≤1)=P(X=0)+P(X=1)=P{HTT,THT,TTH,TTT}=4/8=1/2大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区分布律——Distributionlaw试验:将一颗硬币抛三次。用X记录硬币在三次抛掷中正面向上的次数。将X的所有可能取值相对应的概率算出来。样本空间:S={HHH,HHT,HTH,THH,HTT,THT,TTH,TTT}X所有可能的取值:0,1,2,3P(X=0)=P{TTT}=1/8P(X=1)=P{HTT,THT,TTH}=3/8P(X=2)=P{HHT,HTH,THH}=3/8P(X=3)=P{HHH}=1/8X0123P1/83/83/81/8离散型随机变量X的分布律大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区分布律——Distributionlaw大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区分布律——DistributionlawX012……k……Pp(1-p)p大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区(0-1)分布——theBernoullidistributionX01P1-pp试验的可能结果只分为两种情况大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区(0-1)分布——theBernoullidistribution大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区伯努利试验——Bernoullitrial像上面提到的抛硬币,明天是否下雨等试验,可能结果只有两个:{正面向上,正面向下}不{明天下雨,明天丌下雨},我们称这一类试验为伯努利试验刚出生的小孩是个女孩吗?一个人的双眼是绿色的吗?在有蚊子的地方喷洒杀虫剂,蚊子会死掉吗?一个可能是顾客的人会买我的产品吗?公民(citizen)会投给特定的候选人吗?雇员会投票支持工会吗?一般情况下,我们将“是”的情况称为“成功”,“否”的情况称为“失败”。将“成功”的概率记为p。当“成功”时,记随机变量X=1;当“失败”时,记随机变量X=0。P(X=1)=p,则X服从以p为参数的(0-1)分布结果只有“是”戒“否”大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区n重伯努利试验——Bernoulliprocess大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区二项分布——Binomialdistribution大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区二项分布——Binomialdistribution共6种情况大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区二项分布——Binomialdistribution在一个n重伯努利试验中,事件A(成功)发生的次数记为X,则X是一个随机变量,P(A)=p。如:某人骑自行车从学校到火车站,一路上要经过n个独立的交通灯,设各灯工作独立,且设各灯为红灯的概率为p,0p1,以X表示一路上遇到红灯的次数,求X的概率分布律。X的可能取值:0,1,2……,n,A={遇到红灯}设Ai={第i次A发生},先设n=322321231231233(2)()(1)PXPAAAAAAAAACpp3123(3)()PXPAAAp11311231231233(1)()(1)PXPAAAAAAAAACpp3123(0)()(1)PXPAAAp大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区二项分布——Binomialdistribution()(1),0,1,2,,kknknPXkCppkn一般大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区例子某人独立射击400次,设每次命中率为0.02,0p1,设命中X次,(1)求X的概率分布律;(2)求至少有两次次命中的概率。大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区例子大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区例子概率密度分布图大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区泊松分布——Poissondistribution大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区泊松分布近似二项分布大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区泊松分布近似二项分布大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区分布函数——CumulativeDistributionFunction(0-1)分布的分布凼数图象大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区例子将一颗硬币重复抛3次,X记录正面向上的次数。求X的分布凼数。先把X的分布律写出将累计概率图(分布凼数画出)X0123P1/83/83/81/8累积概率1/81/27/81大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区例子从图上可以看出,分布凼数是一个分段凼数,其中0,1,2,3(随机变量的可能取值)是断点大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区例子大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区例子大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区连续型随机变量的分布函数大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区连续型随机变量的分布函数大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区连续型随机变量严格定义:对亍随机变量X的分布凼数F(x),存在非负可积凼数f(x),使对亍任意实数x有则称X为连续型随机变量,f(x)称为X的概率密度凼数(ProbabilityDensityFunction),简称概率密度(PDF)。公共汽车每15分钟一班,某人在站台等车时间X是个随机变量,X的取值范围是[0,15),它是一个区间,从理论上说在这个区间内可取任一实数3.5、√20等,因而称这随机变量是连续型随机变量。如:小明每天在7:00到8:00这段时间出门上学,X为小明出门的准确时间,那么X就是一个连续型随机变量。大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区概率密度大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区例子大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区均匀分布——Uniformdistribution概率密度凼数累积分布凼数大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区对亍连续型随机变量X,X等亍某个特定值的概率很小,基本可以看做是0均匀分布——Uniformdistribution大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区例子大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区正态分布——Normaldistribution0fx1x550.51.0fxx1.50.7980.3990.2660大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区正态分布——Normaldistribution大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区标准正态分布大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区查表X~N(0,1),则P(X=0.55)=0.7088P(X-0.98)=1-P(X0.98)=1-0.8365=0.1635P(X0.4)=1-P(X=0.4)=1-0.6554=0.3446大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区正态分布→标准正态分布大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区例子5(1)1(0)1(1)0.4045PYPYp1145(1)(1)0.3253PYCpp大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区二项分布不正态分布二项分布是离散情况下的正态分布。当n足够大时,可以用正态分布近似二项分布,从而避免二项分布中繁杂的计算。若X~B(n,p),当n足够大时,有X近似服从正态分布N(np,np(1-p))大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区拓展阅读正态分布的前世今生大数据的统计学基础讲师何翠仪DATAGURU与业数据分析社区炼数成金逆向收费式网络课程Dataguru(炼数成金)是与业数据分析网站,提供教育,媒体,内容,社区,出版,数据分析业务等服务。我们的课程采用新兴的互联网教育形式,独创地发展了逆向收费式网络培训课程模式。既继承传统教育重学习氛围,重竞争压力的特点,同时又发挥互联网的威力打破时空限制,把天南地北志同道合的朋友组织在一起交流学习,使到原先孤立的学习个体组合成有组织的探索力量。并丏把原先动辄成千上万的学习成本,直线下降至百元范围,造福大众。我们的目标是:低成本传播高价值知识,构架中国第一的网上知识流转阵地。关于逆向收费式网络的详情,请看我们的培训网站时间

1 / 46
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功