1第五章统计量及其分布习题5.11.某地电视台想了解某电视栏目(如:每日九点至九点半的体育节目)在该地区的收视率情况,于是委托一家市场咨询公司进行一次电话访查.(1)该项研究的总体是什么?(2)该项研究的样本是什么?解:(1)总体是该地区的全体用户;(2)样本是被访查的电话用户.2.某市要调查成年男子的吸烟率,特聘请50名统计专业本科生作街头随机调查,要求每位学生调查100名成年男子,问该项调查的总体和样本分别是什么,总体用什么分布描述为宜?解:总体是任意100名成年男子中的吸烟人数;样本是这50名学生中每一个人调查所得到的吸烟人数;总体用二项分布描述比较合适.3.设某厂大量生产某种产品,其不合格品率p未知,每m件产品包装为一盒.为了检查产品的质量,任意抽取n盒,查其中的不合格品数,试说明什么是总体,什么是样本,并指出样本的分布.解:总体是全体盒装产品中每一盒的不合格品数;样本是被抽取的n盒产品中每一盒的不合格品数;总体的分布为X~b(m,p),xmxqpxmxXP−⎟⎟⎠⎞⎜⎜⎝⎛==}{,x=0,1,…,n,样本的分布为nnxmxnxmxxmxnnqpxmqpxmqpxmxXxXxXP−−−⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⋅⎟⎟⎠⎞⎜⎜⎝⎛====LL2211212211},,,{∑∑⋅⎟⎟⎠⎞⎜⎜⎝⎛===−=∏nitnitxmnxniiqpxm111.4.为估计鱼塘里有多少鱼,一位统计学家设计了一个方案如下:从鱼塘中打捞出一网鱼,计有n条,涂上不会被水冲刷掉的红漆后放回,一天后再从鱼塘里打捞一网,发现共有m条鱼,而涂有红漆的鱼则有k条,你能估计出鱼塘里大概有多少鱼吗?该问题的总体和样本又分别是什么呢?解:设鱼塘里有N条鱼,有涂有红漆的鱼所占比例为Nn,而一天后打捞出的一网鱼中涂有红漆的鱼所占比例为mk,估计mkNn≈,故估计出鱼塘里大概有kmnN≈条鱼;总体是鱼塘里的所有鱼;样本是一天后再从鱼塘里打捞出的一网鱼.5.某厂生产的电容器的使用寿命服从指数分布,为了了解其平均寿命,从中抽出n件产品测其使用寿命,试说明什么是总体,什么是样本,并指出样本的分布.解:总体是该厂生产的全体电容器的寿命;样本是被抽取的n件电容器的寿命;总体的分布为X~e(λ),p(x)=λeλx,x0,样本的分布为11212(,,,)eeeeninixxxxnnpxxxλλλλλλλλ=∑=⋅=LL,xi0.6.美国某高校根据毕业生返校情况纪录,宣布该校毕业生的年平均工资为5万美元,你对此有何评论?解:返校的毕业生只是毕业生中一部分特殊群体,样本的抽取不具有随机性,不能反应全体毕业生的情况.2习题5.21.以下是某工厂通过抽样调查得到的10名工人一周内生产的产品数149156160138149153153169156156试由这批数据构造经验分布函数并作图.解:经验分布函数0,138,0.1,138149,0.3,149153,()0.5,153156,0.8,156160,0.9,160169,1,169.nxxxFxxxxx⎧⎪≤⎪⎪≤⎪=≤⎨⎪≤⎪≤⎪⎪≥⎩作图略.2.下表是经过整理后得到的分组样本组序12345分组区间(38,48](48,58](58,68](68,78](78,88]频数34832试写出此分布样本的经验分布函数.解:经验分布函数0,37.5,0.15,37.547.5,0.35,47.557.5,()0.75,57.567.5,0.9,67.577.5,1,77.5.nxxxFxxxx⎧⎪≤⎪⎪≤⎪=⎨≤⎪⎪≤⎪≥⎪⎩3.假若某地区30名2000年某专业毕业生实习期满后的月薪数据如下:9091086112099913201091107110811130133696715728259149921232950775120310251096808122410448711164971950866738(1)构造该批数据的频率分布表(分6组);(2)画出直方图.解:(1)最大观测值为1572,最小观测值为738,则组距为15727381406d−=≈,区间端点可取为735,875,1015,1155,1295,1435,1575,频率分布表为组序分组区间组中值频数频率累计频率1(735,875]80560.20.22(875,1015]94580.26670.46673(1015,1155]108590.30.76674(1155,1295]122540.13330.935(1295,1435]136520.066670.96676(1435,1575]150510.033331合计301(2)作图略.4.某公司对其250名职工上班所需时间(单位:分钟)进行了调查,下面是其不完整的频率分布表:所需时间频率0~100.1010~200.2420~3030~400.1840~500.14(1)试将频率分布表补充完整.(2)该公司上班所需时间在半小时以内有多少人?解:(1)频率分布表为组序分组区间组中值频数频率累计频率1(0,10]5250.10.12(10,20]15600.240.343(20,30]25850.340.684(30,40]35450.180.865(40,50]45350.141合计2501(2)上班所需时间在半小时以内有25+60+85=170人.5.40种刊物的月发行量(单位:百册)如下:59545022146676582687018402662450812083852618300812681978796320483077993353142631714111276926204771459236006142671697138764001228012231257913588731545381330416158612(1)建立该批数据的频数分布表,取组距为1700(百册);(2)画出直方图.解:(1)最大观测值为353,最小观测值为14667,则组距为d=1700,区间端点可取为0,1700,3400,5100,6800,8500,10200,11900,13600,15300,频率分布表为组序分组区间组中值频数频率累计频率1(0,1700]85090.2250.2252(1700,3400]255090.2250.453(3400,5100]425050.1250.5754(5100,6800]595040.10.6755(6800,8500]765040.10.7756(8500,10200]935010.0250.87(10200,11900]1105010.0250.8258(11900,13600]1275030.0750.99(13600,15300]1445040.11合计301(2)作图略.46.对下列数据构造茎叶图472425447377341369412399400382366425399398423384418392372418374385439408429428430413405381403479381443441433399379386387解:茎叶图为34135369,6377,2,4,9382,4,5,1,1,6,7399,8,2400,5,3412,9,8,8,3,9425,5,3,8,9,8439,0,3447,3,14546472,97.根据调查,某集团公司的中层管理人员的年薪(单位:千元)数据如下:40.639.637.836.238.838.639.640.034.741.738.937.937.035.136.737.137.739.236.938.3试画出茎叶图.解:茎叶图为34.735.136.2,7,937.0,1,738.639.6,6,240.6,8,041.742.43.844.9,545.4习题5.31.在一本书上我们随机的检查了10页,发现每页上的错误数为:4560314214试计算其样本均值、样本方差和样本标准差.5解:样本均值3)41654(101=+++++=Lx;样本方差7778.3])34()31()36()35()34[(91222222≈−+−++−+−+−=Ls;样本标准差9437.17778.3≈=s.2.证明:对任意常数c,d,有11()()()()()()nniiiiiixcydxxyynxcyd==−−=−−+−−∑∑.证:∑∑==−+−−+−=−−niiiniiidyyycxxxdycx11)]())][(()[())((∑=−−+−−+−−+−−=niiiiidycxdyxxyycxyyxx1)])(())(())(())([())(()()()()())((111dycxnxxdyyycxyyxxniiniiniii−−+−−+−−+−−=∑∑∑===))(())(())((00))((11dycxnyyxxdycxnyyxxniiiniii−−+−−=−−+++−−=∑∑==.3.设x1,…,xn和y1,…,yn是两组样本观测值,且有如下关系:yi=3xi−4,i=1,…,n,试求样本均值x和y间的关系以及样本方差2xs和2ys间的关系.解:4343431)43(111111−=−=⎟⎟⎠⎞⎜⎜⎝⎛−=−==∑∑∑∑====xxnnxnxnynyniiniiniinii;212121229)(19)]43()43[(11)(11xniiniiniiysxxnxxnyyns=−−=−−−−=−−=∑∑∑===.4.记∑==niinxnx11,∑=−−=niinxxns122)(11,n=1,2,…,证明)(1111nnnnxxnxx−++=++,21221)(111nnnnxxnsnns−++−=++.证:)(111111111111111111nnnnnnniiniinxxnxxnxnnxnxnnnxnx−++=+++=++⋅+=+=+++=+=+∑∑;⎥⎦⎤⎢⎣⎡−+−−=−=++=+=++∑∑21112112121))(1()(1)(1nnnininininxxnxxnxxns⎥⎦⎤⎢⎣⎡−+⋅+−−+−=++=∑2122112)()1(1)1()()(1nnnnninixxnnxxxxn2122112)(111)(1)(11)1(1nnnnnninixxnsnnxxnnxxnnn−++−=⎥⎦⎤⎢⎣⎡−++−−−=++=∑.65.从同一总体中抽取两个容量分别为n,m的样本,样本均值分别为1x,2x,样本方差分别为21s,22s,将两组样本合并,其均值、方差分别为x,s2,证明:12nxmxxnm+=+,)1)(()(1)1()1(22122212−++−+−+−+−=mnmnxxnmmnsmsns.证:mnxmxnxxmnxxmnxmjjniimjjnii++=⎟⎟⎠⎞⎜⎜⎝⎛++=⎟⎟⎠⎞⎜⎜⎝⎛++=∑∑∑∑====211211121111;⎥⎦⎤⎢⎣⎡−+−−+=∑∑==mjjniixxxxmns1221212)()(11⎥⎦⎤⎢⎣⎡−+−+−+−−+=∑∑==221222211211)()()()(11xxmxxxxnxxmnmjjnii⎥⎥⎦⎤⎢⎢⎣⎡⎟⎠⎞⎜⎝⎛++−+−+⎟⎠⎞⎜⎝⎛++−+−−+=221222221121)1()1(11mnxmxnxmsmmnxmxnxnsnmn2212222122221)()()(111)1()1(mnxxmnxxnmmnmnsmsn+−+−⋅−++−+−+−=)1)(()(1)1()1(2212221−++−+−+−+−=mnmnxxnmmnsmsn.6.设有容量为n的样本A,它的样本均值为Ax,样本标准差为sA,样本极差为RA,样本中位数为mA.现对样本中每一个观测值施行如下变换:y=ax+b,如此得到样本B,试写出样本B的均值、标准差、极差和中位数.解:bxabxnanbxanbaxnynyAniiniiniiniiB+=+⋅=+=+==∑∑∑∑====11111)(1)(11;AniAiniAiniBiBsaxxnabxa