1北京大学现代远程教育《统计学》平时作业答案一、填空题(括号中的页码表示该页或有原题或有相应的知识点)1、设A、B、C为3个事件,则A、B、C中至少有两个发生的事件可以写成ABUACUBC。(p115,掌握例题5.8和5.9)(注:我们使用的教材是《应用经济统计学》第二版。虽然我们手上的书都是第二版,但是可能存在印刷次数不同的问题。我的书是2008年8月第1次印刷。如果你的书不是第1次印刷,那么我标识的页码就会有所出入。不过,相差不太大,也就前后一两页的差距。)2、必然事件的发生概率为1,不可能事件的发生概率为0。(p119)3、调查表由表头、表体、表脚三部分组成。(p22)4、统计学数据是统计分析和研究的基础,获取统计数据有两种途径原始资料搜集、次级资料搜集。(p12)5、已知10个灯泡中有3个次品,现从中任取4个,问取出的4个灯泡中至少有1个次品的概率是5/6。(p120,重点掌握例题5.17的解法二)6、已知一组数据的期望为12,各变量平方的期望为169,则标准差为5。(p163)7、若X服从参数为n和p的二项分布,则它的数学期望为np,方差是npq。(p165,掌握0-1分布、二项分布、泊松分布、均匀分布、指数分布及正态分布的期望和方差)8、以报告期的销售量为权数的综合指数称为帕氏指数。(p406,掌握拉氏质量指标综合指数、帕氏质量指标综合指数、拉氏数量指标综合指数、帕氏数量指标综合指数的具体计算公式)9、一组数据的均值、众数、中位数都是相等的,则这个数据是对称的。(p82,掌握图4.3的其它两种情况)10、样本是指从总体中按随机原则抽出的的个体组成的小群体。(p181,掌握总体和样本的概念)11、利用最小平方法求解参数估计量时,剩余残差之和等于0。(p324,还要掌握其它4个性质)12、当X和Y相互独立时,它们之间的协方差为0。(p175,但逆命题不一定成立,也就是说,当X和Y的协方差为0时,它们不一定相互独立)13、一副不包括王牌的扑克有52张,从中随机抽取1张,则抽出红桃或抽出K的概率是16/52。(p122)14、一个完整的统计指标应该包括两个方面的内容:一是指标的名称,二是指标的数值。(p50)15、发展速度可分为定基发展速度和环比发展速度。(p387,本页的相关其它概念也需要掌握)16、标准正态分布的期望为0,方差为1。(p167)二、选择题1、在参数的假设检验中,是犯(A)的概率。(p230,是犯第二类错误的概率)(A)第一类错误(B)第二类错误(C)第三类错误(D)第四类错误2、当资料分布形状呈对称时,则约有(D)的观测值落在三个标准差的区间内。(p95,课本上写的是97%,是错误的)(A)50%(B)68%(C)95%(D)99%3、检验回归模型的拟合优度的标准是(A)。(p328)(A)判定系数(B)相关系数(C)协方差(D)均值4、在数值型数据中,最大值是109,最小值是-11,我们准备分10组,请问组距为(B)。(p41)(A)10.9(B)12(C)10(D)1125、设总体分布为标准正态分布,从该总体中抽取容量为100的样本,则样本平均值的期望值等于(A)。(p184定理6.3,其它三个定理不需要掌握)(A)0(B)1(C)1(D)1006、检验回归系数是否为零的统计量是(B)。(p331)(A)F统计量(B)t统计量(C)开方统计量(D)方差统计量7、累计增长量是(A)。(p387)(A)相应的各个逐期增长量之和(B)报告期水平与前一期水平之差(C)各期水平与最初水平之差(D)报告期水平与最初水平之差加报告期水平与前一期水平之差8、下列哪个数一定是非负(B)。(涉及知识点较多,没有具体页码)(A)均值(B)方差(C)偏态系数(D)众数9、下列哪一个指标不是反映离中趋势的(D)。(p89-91)(A)全距(B)平均差(C)方差(D)均值10、下面哪个选项不是小样本情况下评判点估计量的标准(C)。(p188-191,一致性是大样本情况下的评价标准)(A)无偏性(B)有效性(C)一致性(D)最小均方误差三、计算题1、甲、乙、丙三人向同一架飞机射击。设甲、乙、丙击中飞机的概率分别为0.4、0.5、0.7;又假设若一人击中,飞机坠毁的概率为0.2;若两人击中,飞机坠毁的概率为0.6;若三人击中,飞机必坠毁,求飞机坠毁的概率。(p126)答:记B=“飞机坠毁”,Ai=“有i个人击中”,其中i=0、1、2、3。显然,A0,A1,A2,A3是完备事件组,运用概率乘法和加法定理,P(A0)=0.60.50.3=0.09P(A1)=0.40.50.3+0.60.50.3+0.60.50.7=0.36P(A2)=0.60.50.7+0.40.50.7+0.40.50.3=0.41P(A3)=0.40.50.7=0.14根据题意可知,P(B/A0)=0,P(B/A1)=0.2,P(B/A2)=0.6,P(B/A3)=1利用全概率公式,则有:P(B)=3ii0P(A)P(B/A)i=0.090+0.360.2+0.410.6+0.141=0.458。2、某企业对生产中某关键工序调查后发现,工人们完成该工序的时间(以分钟计)近似服从正态分布N(20,32),问:(1)从该工序生产工人中任选一人,其完成该工序时间少于17分钟的概率是多少?(2)要求以95%的概率保证该工序生产时间不多于25分钟,这一要求能否满足?(3)为鼓励先进,拟奖励该工序生产时间用得最少的10%的工人,奖励标准应定在什么时间范围内?(p155,课本上是使用3软件命令来做的,我要求大家按照我给出的答案来做)答:已知2(20,3)XN,(1)1720(17)()(1)1(1)10.84130.15873PX从该工序生产工人中任选一人,其完成该工序时间少于17分钟的概率是15.87%。(2)因为2520(25)()(1.67)0.95253PX即有95.25%的概率保证工序生产时间不多于25分钟,显然,已经慢足了95%的概率保证要求。(3)设奖励标准的时间为x,有20()()0.13xPXx查标准正态分布表,可知(1.28)0.1,即201.283x,解得16.16x即应奖励生产时间少于16.16分钟的工人,这样就能保证只有10%的人能得奖。3、为了调查北大网络学院学生的身高,随机在北京抽查了10位同学的身高,分别如下(单位:cm);152187165168172158155180169174(1)试分别求出样本均值以及样本方差。(2)如果已知网院学生的身高的总体方差160,试确定总体均值的95%的置信区间。(3)如果未知总体方差,试确定总体均值的95%的置信区间。(重点掌握p199-204中的例题6.8、6.9、6.13和6.14,解题步骤依照我的答案)答:(1)样本均值为168,样本方差为121.33。(2)如果已知总体方差,那么Z=2(0,1)/XNn给定置信水平95%,有/2/22()0.95/XPZZn,这里0.05。查表0.05/21.96Z,所以有1681.961.96160/10解得160.16175.84,即置信区间为【160.16,175.84】。(3)如果未知总体方差,则有2(1)/XtnSn给定置信水平95%,有4/2/22()0.95/XPttSn其中2S=121.33,查表得到0.05(9)2.262t所以有1682.2622.262121.33/10解得160.12175.88,即置信区间为【160.12,175.88】。4、下面是一个家庭的月收入情况与月消费情况:收入(元)90008000100001100012000消费(元)800072008800960010400(1)利用回归的方法求该家庭的消费函数,其边际消费倾向是多少?(2)如果月收入为13000元,请预测其消费量是多少?(p320例10.3,不需要画图和列表)答:(1)设消费为y,收入为x,根据公式1121()()()niiiniixxyyxx=0.801yx=8800-0.8×10000=800所以有y=800+0.8x。边际消费倾向为0.8。(2)如果收入x为13000,那么消费的预测额为800+13000×0.8=11200元。5、某保险公司自投保人中随机抽取36人,计算出此36人的平均年龄为39.5岁,已经投保人年龄分布近似正态分布,标准差为7.2岁,试求所有投保人平均年龄99%的置信区间。(p200)答:由题设可知,2(,7.2)XN,39.5X,36n,10.99,则:239.5(0,1)7.2/36ZN当0.01时,有/20.0052.575ZZ,所以22{39.52.5757.2/3639.52.5757.2/36}0.99P即总体的置信区间为【36.41,42.59】。56、经验表明某商店平均每天销售250瓶酸奶,标准差为25瓶,设销售酸奶瓶数服从正态分布,问:(1)在某一天中,购进300瓶酸奶,全部售出的概率是多少?(2)如果该商店希望以99%的概率保证不脱销,假设前一天的酸奶已全部售完,那么当天应该购进多少瓶酸奶?(p155,同类型的题)答:(1)由于每天销售酸奶数量的均值为250,标准差为25,并且销售数量服从正态分布,所以将300瓶酸奶全部售出的概率为250300250(300)()(2)1(2)10.977250.022752525XpXpp即全部售出的概率仅为2.275%。(2)设为了保证不脱销,需要购进x瓶酸奶。根据题意我们可以得到:()0.99pXx于是:250250()0.992525Xxp而(2.325)0.99,所以有250()(2.325)25x即2502.32525x,解得2.32525250308.125x所以,当天应该购进309瓶酸奶才能以99%的概率保证不脱销。四、问答题1、请解释以下概念,总体,样本,频数,频数密度,比例相对指标,动态相对指标,强度相对指标。答:我们把被观察对象的全体称作总体。(p181)样本是指从总体中按随机原则抽出的的个体组成的小群体。(p181)频数指在数据分组后,每组数据的个数。(p34)频数密度=频数/组距。(p47)将总体内部的部分与部分对比所得到的指标称为比例相对指标。(p52)若将同一内容的指标在不同时间上的数值进行对比,就可以得到动态相对指标。(p52)若将同一时期内容不同,但有一定联系的两个总量指标对比,可以得到强度相对指标。(p52)2、足球队10名足球队员的身高如下:(单位,cm)153176168178151188168162173163(1)根据以上资料求出以下几个统计量:均值、中位数、众数、全距、方差、标准差、平均差和变异系数。(2)请把以上资料从150开始分组,以十为组距,分为4组,求出每组的组中值、频数及累计次数分配百分比。答:(1)均值=(153+176+…..+173+163)/10=1680/10=168(p73)中位数=(168+168)/2=168(p78)众数为=168(p80)全距=188-151=37(p89)6方差=116.40(p91)标准差=10.79(p91)平均差=每个数与均值之差的绝对值的平均=8.6(p90)变异系数=标准差/均值=10.79/168=0.064(p96)(2)(注:上组限不包括在内,比如第一组为150x160。组中值为上限和下限的平均。频数为落入该区间的身高的个数。累计次数计算详见课本48页表3.4)组距组中值频数累计次数分配百分比150-160155220%160-170165460%170-180175390%180-1901851100%3、以下是某个班的成绩的