统计学例题

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1统计学例题计算题最有可能出现在以下几章第2章统计数据的描述重点题型:根据组距分组数据计算众数和中位数。已知两个总体的数据,计算比较哪个总体的均值的代表性或稳定性或均衡性的好坏。第4章抽样和抽样分布重点题型:根据相关抽样分布的定理计算样本均值x抽样分布的均值和标准差;描述抽样分布的特征。第5章参数估计重点题型:正态总体、总体方差已知时的总体均值的区间估计。非正态总体、大样本(n≥30)时的总体均值的区间估计。正态总体、总体方差未知、小样本(n30)时的总体均值的区间估计。总体比例的区间估计。样本容量的确定。第6章假设检验重点题型:双侧检验的检验。正态总体、总体方差已知时总体均值的假设检验——Z检验法。非正态总体或总体分布未知、大样本时总体均值的假设检验——Z检验法。正态总体、总体方差未知、小样本是总体均值的假设检验——t检验法。总体比例的假设检验——Z检验法。可能的怪题:左侧检验或右侧检验。第8章相关与回归分析重点题型:一元线性回归方程的拟合、回归估计标准误差的计算、样本可决系数的计算、回归系数的显著性检验、一元线性回归预测、样本单相关系数的计算。根据Excel输出结果进行一元线性或多元下线性回归分析。具体考题可能会将以上内容中的两项或多项整合在一题之中。第9章时间序列分析重点题型:间断时点序列计算序时平均数。相对数时间序列计算序时平均数。增减量、平均增减量、发展速度、增长速度、平均发展(增长)速度的计算。直线趋势方程的拟合及其预测。第10章统计指数重点题型:拉氏综合指数和帕氏综合指数的编制。拉氏平均指数的编制(帕氏平均指数实际中很少应用故不必掌握)。利用指数体系,进行总量变动的两因素分析。利用指数体系,进行平均数变动的两因素分析。例1:已知某地区120家企业的利润分组资料如下:按利润分组(万元)企业数(个)向上累计频数200——300300——400400——500500——600600以上1930421811194991109120Σ120——要求:分别计算这120家企业利润的众数和中位数。例1解:(1)计算众数MO。•因为400—500这一组的频数42最多,所以400——500这一组即为众数组。于是可知:L=400f=42f-1=30f+1=18i=100,则众数:2(2)计算众数Me。•中位数位置=ΣF/2=120÷2=60,因为向上累计频数91刚好大于中位数位置60,所以向上累计频数91所在组即为中位数所在组。于是可知:•L=400Sm-1=49fm=42i=100则中位数:例2:某财经大学成人脱产1班100名学生统计学期中考试成绩及有关计算如下表:考试成绩分组人数F组中值XXFXXFXX260以下60—7070—8080—9090以上820402845565758595440130030002380380-20-100102032002000028001600Σ10075009600另知:该大学成人脱产2班统计学期中考试的均值782X(分),标准差122(分),试问两个班考试成绩的均衡性哪一个班较好。例2解:根据表中计算可知:因为:VV21所以成人脱产1班统计学期中考试成绩的均衡性较成人脱产2班好。例3:一个具有n=64个观察值的随机样本抽自于均值等于20,标准差等于16的总体。(1)给出的x抽样分布(重复抽样)的均值和标准差。(2)描述x的抽样分布的形状。你的回答依赖于样本容量吗?(3)计算标准正态统计量Z对应于5.15x的值。(4)计算标准正态统计量Z对应于23x的值。例3解:(1)样本均值的抽样分布的均值=样本均值的数学期望=总体均值。即:在重复抽样的情况下,样本均值的方差为总体方差的1/n。即:(元)33.433.........100184230423042400.........111ifffLfffMO(元)19.426100424960400........21iFLfSMmme7510075001FXFX8.9100960021FFXX1307.0758.9111XV1538.07812222XV20μxE3(2)因为属于大样本,所以根据中心极限定理可知,样本均值的抽样分布近似服从均值为20,方差为4的正态分布。我的回答是依赖于样本容量的。(3)当时,标准正态统计量的值:(4)当时,标准正态统计量的值:例4:(正态总体、总体方差2已知的情形)某种零件的长度X服从15.02,N,现从该产品中随机抽取9件,测得其平均长度为21.4厘米,试以95%的置信度估计该种零件平均长度的置信区间。例4解:依题意得:零件长度X服从N(µ,0.152)•n=9,4.21xσ=0.151-α=0.95α=0.05查P367的“标准正态分布表”得出“临界值”为:96.12Z抽样平均误差:抽样极限误差:所以,所求零件平均长度µ在95%的置信水平下的置信区间为:计算结果表明:在95%的置信度(概率保证)下该种零件的平均长度在21.302厘米至21.498厘米之间。例5:(总体分布未知、n≥30且2已知的情形)某财经大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟,。又知:总体方差2为36,试以95%的置信度估计该财经大学全体学生平均参加体育锻炼的时间的置信区间。例5解:由于总体的分布形式未知,且总体方差362已知,且样本容量n=10030为“大样本”,故可以近似地认为:总体X服从nN2,,依题意知道:26x,1-α=0.95,96.12Z抽样平均误差:05.0915.0nx098.005.096.12xxZ.........498.21302.21........098.04.21098.04.21xxxx6.010610036nx464n16σσ222x3064n15.5x2.2524.564162015.5nσμxZ23x1.52364162023nσμxZ4抽样极限误差:所以,全校学生平均每天参加体育锻炼时间µ的置信区间为:计算结果表明:在95%的概率保证下该财经大学全校学生平均每天参加体育锻炼的时间在24.824分钟至27.176分钟之间。例6:(总体分布未知、n≥30且总体方差2未知的情形)在大兴安岭林区,随机抽取120块面积为1公顷的样地,根据调查测量求得每公顷地平均出材量为88立方米,标准差为10立方米,试以99%的置信度估计大兴安岭林区每公顷地平均出材量的置信区间。例6解:总体分布形式和总体方差均2未知,但由于n=12030,属于“大样本”,故可近似地采用“正态分布”处理,并用“样本方差”代替“总体方差”。依题意又知:88x(m,S=10,1-α=0.99,α=0.01查表得:58.22Z抽样平均误差:抽样极限误差:所以,大兴安岭林区每公顷地平均出材量的置信区间为:计算结果表明:在99%的概率保证下大兴安岭林区每公顷地平均出材量在85.645m3至90.355m3之间。例7:(正态总体、总体方差2未知且小样本n30)设某上市公司的股票价格服从正态分布,为了掌握该上市公司股票的平均价格情况,现随机抽取了26天的交易价格进行调查,测得平均价格为35元,方差为4,试以98%的置信度估计该上市公司股票平均交易价格的置信区间。例7解:因为总体服从正态分布,但n=2630属于“小样本”,总体方差σ2未知,此时可以用“样本方差S2”近似代替。1-α=0.98,α=0.02,查“t分布表”得出:4851.212nt样本均值35x,样本方差42SS2=4。于是:抽样平均误差:抽样极限误差:所以,该公司股票交易价格µ的置信区间为:176.16.096.12xxZ......176.27824.24.....176.126176.126xxxx9129.012010nSnx355.29129.058.22xxZ........355.90645.85.....355.288355.288xxxx3922.0264nSx964.03922.04581.212xxnt5计算结果表明:在98%的置信度下该上市公司股票交易的平均价格在34.04元至35.96元之间。例8:(总体比率区间估计)为了控制某生产线的废品率,现随机从产品中抽取60件进行调查,结果发现有9件废品,试以98的置信度估计该生产线产品废品率的置信区间。例8解:依题意知:n=60,样本比例p=9/60=0.15,np=60×0.15=95,n(1-p)=60×0.85=515,因此,本题属于“大样本”,故而“样本产品废品率”服从“正态分布”,1-α=0.98,α=0.02,查表得:33.22Z样本比例的抽样平均误差:样本比例的抽样极限误差:1074.00461.033.22ppZ所以,在98%的置信度下该生产线废品率的置信区间为:计算结果表明:在98%的置信度下该生产线产品废品率在4.26%至25.74%之间。例9:(样本容量的确定-重复抽样)一家广告公司想估计某类商店去年所花费的广告费用有多少。根据经验,总体方差约为1,800,000,如果置信度取95%,并要使估计值(x¯)处在总体均值(µ)附近500元的范围内,问这家广告公司应抽取多大容量的样本?例9解:由于N未知,故可以视为“重复抽样”,18000002,1-α=0.95,α=0.05,96.12Z,500x计算结果表明:这家广告公司至少应抽取28个商店作为样本,才能满足调查的要求。例10:(样本容量的确定-不重复抽样)若例8中已知该类商店共有10000家,即N=10000,则:......964.35036.34.....964.035964.035xxxx0461.06085.015.01nppp..........2574.00426.0...........1074.015.01074.015.0................PPpPppp2865.27180000050096.1222222xZn285859.271800000110000180000010000196.150096.12222222222ZZxNNn6例11:(估计总体比率时样本容量的确定)某企业对一批产品进行质量检验,过去同类调查所得的产品合格率为93%、95%和96%,为了使合格率的误差不超过3%,在95%的置信度下应该抽取多少件产品?例11解:已知Δ(p)=3%,1-α=0.95,Zα/2=1.96•因为p(1-p)=0.93×0.07=0.0651(方差最大)•p(1-p)=0.95×0.05=0.0475•p(1-p)=0.96×0.04=0.0384•所以,应取P=0.93计算结果表明,至少应抽取278件产品才能满足调查要求。例12:(估计总体比率时样本容量的确定)一家市场调查公司想估计昆明市拥有汽车的家庭所占的比例。该公司希望对P的估计误差不超过0.05,要求的置信度为95%,问该市场调查公司至少应抽取大大容量的样本,才能满足调查的要求?例12解:由于没有可利用的P的估计值,也不知道总体的比例P,所以可直接取P=0.5,其方差达到最大值。又知:Δ(p)=0.05,1-=0.95,α=0.05,96.12Z计算结果表明:

1 / 20
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功