统计学导论习题解答2

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

答疑时间地点:30日,9-11,2-5,教八,313疑难习题解答练练练习习习2.3.1试证明任何开区间、闭区间和单点集都是Borel可测集.证明:对于任何实数ab,(a;b)=1∪n=1((1;b)(1;a+1n))2B;[a;b]=1∩n=1((1;b+1n)(1;a))2B;fag=1∩n=1((1;a+1n)(1;a))2B;即任何开区间、闭区间和单点集都是Borel可测集.练练练习习习2.3.13若的密度函数为p(x)=ex;如果x00;如果x60试求的数学期望和方差.解:E()=∫10xexdx=1;E(2)=∫10x2exdx=22;D()=E(2)(E())2=12:练练练习习习2.5.3设XU(0;1),其30次重复观测结果为X1;;X30,记X,13030∑k=1Xk;Z,p30(X0:5)√112用计算机模拟Z的重复观测结果1000次,将Z的经验分布函数F1000(x)与(x)在点x=3+0:5k;06k612的值相比较,并解释此比较结果.解:记xk=F1000(3+0:5k)(3+0:5k);x=(x0;x1;;x12);利用MATLAB模拟计算结果为x=(0:0013;0:0012;0:0012;0:0042;0:0087;0:0035;0:0060;0:0235;0:0083;0:0058;0:0058;0:0022;0:0003)即标准正态分布函数与Z的经验分布函数模拟计算结果中的平均最大误差不超过0.0087,这说明标准正态分布函数能够很好地近似Z的分布函数。练练练习习习3.1.5某人向你咨询统计量和参数的不同。a.你的回答应包含什么样的信息。b.你将用什么样的理由去解释为什么人们用统计量的值来代替(总体)的参数。解:a.参数是总体的某种特征,它是一个未知的我们感兴趣的数。统计量是能够由样本数据计算出的量,人们常用一个特定的统计量来估计总体参数。b.参数是想要了解的对象。虽然在有限总体下可以通过所有个体的观测来计算参数,但是用统计量的值来代替参数可以节省成本,有时还能避免对总体中所有个体的破坏;对于无限总体,只能通过样本得到有关参数的信息,即只能用一个好的统计量来代替参数。练练练习习习3.2.3一个随机样本可能是非常难得到的。为什么?解:随机样本要求每个个体都以确定的概率被选到样本之中,这有时又很难实现,会遇见一些困难。如1).无法编制抽样框:不能确定完整总体的名单,有些个体在制作名单时可能离开了这个总体,或者又有一些个体进入了这个总体;2).成本不容许:没有足够的成本获取样本中所有个体的数据;3).测取样本数据具对于个体有破坏性,导致不能获得需要的样本:如袋装奶的细菌含量;4).无法完成抽样的实施步骤:如对于没有抽样框的无限总体;5).抽样框中个体的重复编制和个体的遗漏;……。练练练习习习4.1.1对于连续型总体变量,为什么可以用频率直方图近似它的密度函数?解:连续型总体变量的密度函数可以用阶梯函数任意逼近,而根据密度函数的概率含义和频率近似概率的思想,这个阶梯函数的每个阶梯又可以用相应的频率矩形的顶边近似,所以可用频率直方图的顶边近似密度函数。练练练习习习4.1.2当样本容量趋于无穷时,频数直方图的高度会趋向于什么?解:固定分组数的频数直方图的高度随着样本容量的增加而趋于无穷或永远为0。练练练习习习4.2.2可以用频率条形图来近似离散型随机变量的分布密度图像吗?为什么?解:可以,由大数定律,频率条形图上各个条形的高度随着样本容量的增加趋于相应密度的概率为1。2练练练习习习4.2.3在什么情况下使用点图或茎叶图来分析观测样本数据?解:在获取数据的过程中可以使用点图或茎叶图来分析观测数据。练练练习习习5.1.3极大似然法的原理是什么?解:极大似然法的原理:结论要使得样本出现的概率最大。练练练习习习5.2.2若XN(;1),X1;;Xn为X的重复观测样本.对于假设检验问题H0:=0若用样本均值X作为检验统计量,取D=fx:x4gD可以作为显著水平0.05的检验的拒绝域吗?问D所对应的检验规则犯第二类错误的概率是不是最小?解:此时D是有利于H1的事件,且XN(;1n)PH0(X2D)=P0(X4)=1(4pn)0:05;所以D可以作为显著水平0.05的拒绝域。但是,D所对应的检验规则犯第二类错误的概率不是最小的,显著水平0:05的拒绝域~D=fx:jxj4g所对应的检验规则犯第二类错误的概率更小。练练练习习习5.2.3若XN(;1),X1;;Xn为X的重复观测样本.对于假设检验问题H0:0若用样本均值X作为检验统计量,取D=fx:1x1:05g请估算PH0{X2D}.进一步,D可以作为检验的拒绝域吗?若用D作为拒绝域得到的检验结果是拒绝原假设,那么我们可以认为原假设不成立吗?解:因为{X2D}不是与原假设相矛盾的事件,所以不能用D作为此假设检验的拒绝域。若用D作为拒绝域,得到的检验结果是拒绝原假设,按D的定义,这样的结果应该认为是“原假设成立”,而不是“原假设不成立”。练练练习习习5.4.1在什么样的假设下,各个样本点(x1;Y1);;(xn;Yn)到回归曲线y=f(xj)的距离的平方和等于n∑i=1(Yif(xij))2?3解:当样本数据中的诸x1;;xn为解释变量的精确值时,样本点(xi;Yi)到曲线y=f(xj)的距离为点(xi;Yi)与点(xi;f(xij))之间的距离,即√(xixi)2+(Yif(xij))2=jYif(xij)j:此时各个样本点到曲线的距离的平方和等于n∑i=1(Yif(xij))2:练练练习习习5.4.4如果用回归模型Y=a+bx+cx2+;E()=0;D()=2;来拟合表5-19中的数据,能不能得到比例5.4.1解答中更好的拟合效果?解:记(xi;Yi)为(x;Y)的第i组观测数据,则在本题中模型参数a;b;c的最小二乘估计为函数Q(a;b;c)=30∑k=1(Yi(a+bxi+cx2i))2的最小值点,而例5.4.1中模型参数的最小二乘估计为函数Q1()=30∑k=1(Yixi)2:由于Q(0;0;)=Q1();所以Q(^a;^b;^c)Q1(^);其中^a;^b;^c为本题中模型参数a;b;c的最小二乘估计,^为例5.4.1中模型参数的最小二乘估计。注意到Q(^a;^b;^c)恰为本题模型的残差平方和,而Q1(^)恰为例5.4.1中模型的残差平方和,可得结论:本题模型的残差平方和更小。因此在残差平方和或R2的衡量标准之下,本题的模型能够得到更好的拟合效果。4练练练习习习5.4.5某快餐店外卖部经理想要了解完成一份订单所需要的时间和送货距离之间的关系.他随机抽取了20份订单,获取了完成这些订单的送货距离和完成订单任务所需要的时间,将所得数据列入表0.1.试建立送货时间和送货距离的经验方程.表0.1:送货距离与所用时间的观测样本数据序号12345678910距离6.10.30.32.05.90.73.76.47.27.0时间23.34.45.39.822.87.115.521.526.227.0序号11121314151617181920距离0.94.64.53.61.66.87.07.34.85.6时间8.316.717.814.68.323.625.926.019.120.9解:用s表示距离,T表示相应的送货时间,由观测数据可以得到(s;T)的散点图0.1。散点图中各个012345678051015202530sT图0.1:距离与送货时间散点图点的分布呈直线的形状,因此可以通过线性回归模型拟合距离和送货时间之间的关系。由题目所给观测数据,利用MATLAB函数regress的计算结果得经验方程^T=4:2220+3:0088t:5

1 / 5
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功