项目2概率论、数据统计与区间估计实验1概率模型实验目的通过将随机试验可视化,直观地理解概率论中的一些基本概念,从频率与概率的关系来体会概率的统计定义,并初步体验随机模拟方法.通过图形直观理解随机变量及其概率分布的特点.基本命令1.调用统计软包的命令进行统计数据的处理,必须调用相应的软件包,首先要输入并执行命令statistics`以完成数据统计的准备工作.2.调用作图软件包的命令Graphics\Graphics.m用Mathematica作直方图,必须调用相应的作图软件包,输入并执行Graphics`这时可以查询这个软件包中的一些作图命令的用法.如输入??BarChart则得到命令BarChart的用法说明;如果没有,则说明调用软件包不成功,必须重新启动计算机,再次调用软件包.实验举例频率与概率例1.1(高尔顿钉板实验)自高尔顿钉板上端放一个小球,任其自由下落.在其下落过程中,当小球碰到钉子时从左边落下的概率为p,从右边落下的概率为,1p碰到下一排钉子又是如此,最后落到底板中的某一格子.因此任意放入一球,则此球落入哪个格子事先难以确定.设横排共有20m排钉子,下面进行模拟实验:(1)取,5.0p自板上端放入一个小球,观察小球落下的位置;将该实验重复作5次,观察5次实验结果的共性及每次实验结果的偶然性;(2)分别取,85.0,5.0,15.0p自板上端放入n个小球,取,5000n观察n个小球落下后呈现的曲线.作出不同p值下5000个小球落入各个格子的频数的直方图,输入Statistics`Graphics`Graphics`Galton[n_Integer,m_Integer,p_]:=Module[{},dist={};For[l=1,l=n,l++,k=0;t=Table[Random[BernoulliDistribution[p]],{i,1,m}];Do[If[t[[i]]==1,k++,k--],{i,1,m}];dist=Append[dist,k];pp=Frequencies[dist];];Histogram[dist,BarStyle-{RGBColor[0,0,1]}];]p=0.15;n=5000;m=20;Galton[n,m,p]p=0.5;n=5000;m=20;Galton[n,m,p]p=0.85;n=5000;m=20;Galton[n,m,p]则输出-15.-10.-5.0.20040060080010001200p0.15-15.-10.-5.0.5.10.200400600800p0.55.10.15.20.20040060080010001200p0.85图1-1由图1-1可见:若小球碰钉子后从两边落下的概率发生变化,则高尔顿钉板实验中小球落入各个格子的频数发生变化,从而频率也相应地发生变化.而且,当,5.0p曲线峰值的格子位置向右偏;当,5.0p曲线峰值的格子位置向左偏.几何概型例1.2甲、乙二人约定八点到九点在某地会面,先到者等20分钟离去,试求两人能会面的概率.由于甲、乙二人在[0,60]时间区间中任何时刻到达是等可能的,若以X,Y分别代表甲乙二人到达的时刻,则每次试验相当于在边长为60的正方形区域}60,0);,{(YXYX中取一点.设到达时刻互不影响,因此),(YX在区域内取点的可能性只与区域的面积大小成正比,而与其形状、位置无关.于是,会面问题可化为向区域随机投点的问题.所关心的事件“二人能会面”可表示为}20||);,{(YXYXA(图1-2)于是,所求概率的理论值为)(AP(A的面积)/(的面积)556.095图1-2下面,我们作如下模拟试验:(1)模拟向有界区域投点n次的随机试验,取100n,统计每次投点是否落在图1-2所示区域A中,若是则计数1次.(2)改变投点数,10000,5000,1000n统计落入区域A的次数.输入meet[n_Integer]:=Module[{x},x[k_]:=x[k]=Abs[Random[Integer,{0,60}]-Random[Integer,{0,60}]];pile=Table[x[k],{k,1,n}];times=Count[pile,x_/;0=x=20];Print[times];frequence=N[times/n]]n=100;meet[n]n=1000;meet[n]n=5000;meet[n]n=10000;meet[n]则输出所求结果,为方便比较,将输出结果列于表1-1中表1-1约会次数约会成功次数约会成功频率理论约会成功概率100580.5810005570.5570.556500028420.56841000055290.5529从上表结果可见,当约会次数越来越大时,试验约会成功频率与理论约会成功概率越来越接近.离散型随机变量及其概率分布例1.3(二项分布)利用Mathematica绘出二项分布),(pnb的概率分布与分布函数的图形,通过观察图形,进一步理解二项分布的概率分布与分布函数的性质.设20n,,2.0p输入Statistics`Graphics`Graphics`n=20;p=0.2;dist=BinomialDistribution[n,p];t=Table[{PDF[dist,x+1],x},{x,0,20}];g1=BarChart[t,PlotRange-All];g2=Plot[Evaluate[CDF[dist,x]],{x,0,20},PlotStyle-{Thickness[0.008],RGBColor[0,0,1]}];t=Table[{x,PDF[dist,x]},{x,0,20}];gg1=ListPlot[t,PlotStyle-PointSize[0.03],DisplayFunction-Identity];gg2=ListPlot[t,PlotJoined-True,DisplayFunction-Identity];p1=Show[gg1,gg2,g1,DisplayFunction-$DisplayFunction,PlotRange-All];则分别输出二项分布概率分布图形(图1-3)与分布函数图形(图1-4).51015200.050.10.150.2图1-351015200.20.40.60.81图1-4从图1-3可见,概率}{kXP随着k的增加,先是随之增加,直到4k达到最大值,随后单调减少.而从图1-4可见,分布函数)(xF的值实际上是xX的累积概率值.通过改变n与p的值,读者可以利用上述程序观察二项分布的概率分布与分布函数随着n与p而变化的各种情况,从而进一步加深对二项分布及其性质的理解.连续型随机变量及其概率密度函数例1.4(正态分布)利用Mathematica绘出正态分布),(2N的概率密度曲线以及分布函数曲线,通过观察图形,进一步理解正态分布的概率分布与分布函数的性质.(1)固定,1取,2,0,2观察参数对图形的影响,输入Statistics`Graphics`Graphics`dist=NormalDistribution[0,1];dist1=NormalDistribution[-2,1];dist2=NormalDistribution[2,1];Plot[{PDF[dist1,x],PDF[dist2,x],PDF[dist,x]},{x,-6,6},PlotStyle-{Thickness[0.008],RGBColor[0,0,1]},PlotRange-All];Plot[{CDF[dist1,x],CDF[dist2,x],CDF[dist,x]},{x,-6,6},PlotStyle-{Thickness[0.008],RGBColor[1,0,0]}];则分别输出相应参数的正态分布的概率密度曲线(图1-5)及分布函数曲线(图1-6).-6-4-22460.10.20.30.4图1-5-6-4-22460.20.40.60.81图1-6从图1-5可见:(a)概率密度曲线是关于x对称的钟形曲线,即呈现“两头小,中间大,左右对称”的特点.(b)当x时,)(xf取得最大值,)(xf向左右伸展时,越来越贴近x轴.(c)当变化时,图形沿着水平轴平移,而不改变形状,可见正态分布概率密度曲线的位置完全由参数决定,所以称为位置参数.(2)固定0,取,5.1,1,5.0观察参数对图形的影响,输入dist=NormalDistribution[0,0.5^2];dist1=NormalDistribution[0,1];dist2=NormalDistribution[0,1.5^2];Plot[{PDF[dist1,x],PDF[dist2,x],PDF[dist,x]},{x,-6,6},PlotStyle-{Thickness[0.008],RGBColor[0,0,1]},PlotRange-All];Plot[{CDF[dist1,x],CDF[dist2,x],CDF[dist,x]},{x,-6,6},PlotStyle-{Thickness[0.008],RGBColor[1,0,0]},PlotRange-All];则分别输出相应参数的正态分布的概率密度曲线(图1-7)及分布函数曲线(图1-8)-6-4-22460.250.50.7511.251.5图1-7-6-4-22460.20.40.60.81图1-8从图1-7与图1-8可见:固定,改变时,越小,在0附近的概率密度图形就变得越尖,分布函数在0的附近增值越快;越大,概率密度图形就越平坦,分布函数在0附近的增值也越慢,故决定了概率密度图形中峰的陡峭程度;另外,不管如何变化,分布函数在0点的值总是0.5,这是因为概率密度图形关于0x对称.通过改变与的值,读者可以利用上述程序观察正态分布的概率分布与分布函数随着与而变化的各种情况,从而进一步加深对正态分布及其性质的理解.随机变量函数的分布例1.5设X,Y相互独立,都服从(0,1)上的均匀分布,求YXZ的概率密度.理论上,我们可用卷积公式直接求出YXZ的密度函数:其它,021,210,)(zzzzzg下面,我们作如下模拟试验:(1)产生两组服从(0,1)上均匀分布的相互独立的随机数,,,2,1,,niyxii取n,1000计算;iiiyxz(2)用数据iz作频率直方图,并在同一坐标系内画出用卷积公式求得的密度函数图形作比较.输入Statistics`Clear[g1,t,t1,t2];t={};n=1000;g1[x_]:=50*Which[0=x=1,x,1=x=2,2-x,True,0];pic1=Plot[g1[x],{x,0,2},PlotStyle-{Thickness[0.01],RGBColor[0,0,1]}];t1=RandomArray[UniformDistribution[0,1],n];t2=RandomArray[UniformDistribution[0,1],n];Do[t=Append[t,t1[[i]]+t2[[i]]],{i,n}];p1=Histogram[t];Show[pic1,p1,DisplayFunction-$DisplayFunction];则在同一坐标系中输出所求频率直方图与密度函数的图形(图1-9).0.511.521020304050图1-9中心极限定理的直观演示例1.6本例旨在直观演示中心极限定理的基本结论:“大量独立同分布随机变量的和的分布近似服从正态分布”.按以下步骤设计程序:(1)产生服从二项分布),10(pb的n个随机数,取2.0p,50n,计算n个随机数之和y以及)1(