统计学简答题总结第六章抽样与抽样分布6.1解释总体分布、样本分布和抽样分布的含义(或三种不同性质的分布)总体分布:总体中各元素的观测值所形成的相对频数分布,称为总体分布。样本分布:从总体中抽取一个容量为n的样本,由这n个观测值形成的相对频数分布,称为样本分布。抽样分布:在重复选取样本量为n的样本时,由该样本统计量的所有可能取值形成的相对频数分布。6.2解释中心极限定理的含义从均值为、方差为2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≧30),样本均值x的抽样分布近似服从均值为、方差为2/n的正态分布。6.3重复抽样和不重复抽样相比,抽样均值抽样分布的标准差有何不同?重复抽样:从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止。不重复抽样:一个元素被抽中后不再放回总体,而是从所剩元素中抽取第二个元素,直到抽取n个元素为止。样本均值的方差:重复抽样不重复抽样6.4样本均值的分布与总体分布的关系是什么?样本均值与总体分布的关系:a无论是重复还是不重复抽样,样本均值的数学期望始终等于总体均值;b在重复抽样条件下,样本均值的方差为总体方差的1/n;在不重复抽样条件下,样本均值的方差为6.5样本方差和两个样本的方差比各服从什么分布?对于来自正态总体的简单随机样本,则比值的抽样分布服从自由度为)1(n的2分布,即)1(~)1(222nsn两个样本方差比的抽样分布,服从分子自由度为(11n),分母自由度为(12n)的F分布,即)1,1(~212221nnFss6.62分布和F分布的图形各有什么特点?nx22nx22122NnNnx122NnNnx122NnNnx122NnNnx2分布的性质特点:1.分布的变量值始终为正2.分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称3.期望为E(2)=n,方差为D(2)=2n(n为自由度)4.可加性:若U和V为两个独立的服从2分布的随机变量,U~2(1n),V~2(2n),则U+V这一随机变量服从自由度为1n+2n的2分布F分布图形的特点:1、它是一种非对称分布;2、它有两个自由度,即n-1和m-1,相应的分布记为F(n–1,m-1),n–1通常称为分子自由度,m-1通常称为分母自由度;3、F分布是一个以自由度n–1和m-1为参数的分布族,不同的自由度决定了F分布的形状。4、F分布的倒数性质:Fα,df1,df2=1/F1-α,df2,df1第七章参数估计7.1解释估计量和估计值。估计量:用来估计总体参数的统计量名称,用符号表示估计值:用来估计总体参数时计算出来的估计量的具体数值。7.2简述评价估计量好坏的标准1.无偏性:指估计量抽样分布的数学期望等于被估计的总体参数。2.有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效。3.一致性:指随着样本容量的增大,点估计量的值越来越接近被估总体的参数。7.3解释置信水平的含义。将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平。表示为(1-为是总体参数未在区间内的比例7.4怎样理解置信区间?由样本统计量所构造的总体参数的估计区间,称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。7.5解释95%的置信区间。有95%的区间包含了总体参数的真值,而5%则没有包含,则95%这个值被称为置信水平。95%的置信区间指用某种方法构造的所有区间中有95%的区间包含总体参数的真值。7.6nz2的含义是什么?Za/2是标准正态分布上侧面积为a/2的z值ˆˆnz2是估计总体均值时的边际误差,也称为估计误差或误差范围。7.7均值的置信区间估计和新观测值的预测区间估计有什么不同?(1)预测随机变量未来的观察值,并希望求出各某个未来观察值的取值范围,这个范围就是对某个未来观察值的预测区间估计。(2)未来观察值经标准化后服从标准正态分布,当用样本方差s2代替总体方差2后,则服从t分布7.8解释独立样本和匹配样本的含义。独立样本:如果两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样本中的元素相互独立。匹配样本:一个样本中的数据与另一个样本中的数据相对应。7.9在对两个总体均值之差的小样本估计中,对两个总体和样本都有哪些假定?(1)、两个总体都服从正态分布(2)、两个随即样本独立地分别抽自两个总体7.10简述样本容量与置信水平、总体方差、边际误差的关系。样本容量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本容量也就越大;样本容量与总体方差成正比,总体的差异越大,所要求的样本容量也越大;样本容量与边际误差的平方成反比,即可以接受的边际误差的平方越大,所需的样本容量就越小。第八章假设检验(重点问题的答案)8.1解释原假设和备择假设。原假设:研究者想收集证据予以反对的假设,表示为H0备择假设:研究者想收集证据予以支持的假设,表示为H18.2什么是标准化检验统计量?为什么要对统计量进行标准化?根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。点估计量的抽样标准差假设值—点估计量标准化检验统计量8.3怎样理解显著性水平?显著性水平:假设检验中犯的第︱类错误的概率,记为8.13分别列出大样本情形下总体均值左侧检验、右侧检验及双侧检验的拒绝域。总体均值的检验(大样本检验方法的总结)见书本P269假设双侧检验左侧检验右侧检验假设形式检验统计量拒绝域P值决策8.14分别列出小样本情形下总体均值左侧检验、右侧检验及双侧检验的拒绝域。总体均值的检验(小样本检验方法的总结)见课本P270假设双侧检验左侧检验右侧检验假设形式检验统计量拒绝域P值决策8.17简述假设检验的一般步骤。1.陈述原假设和备择假设2.从所研究的总体中抽出一个随机样本3.确定一个适当的检验统计量,并利用样本数据算出其具体数值4.确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5.将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策8.18总结不同情形总体均值检验的基本程序。第十三章指数13.1解释指数的含义。指数最早起源于测量物价的变动。广义上,是指任何两个数值对比形成的相对数;狭义上,是指用于测定多个项目在不同场合下综合变动的一种特殊相对数。实际应用中使用的主要是狭义的指数。13.2加权综合指数和加权平均指数有何区别与联系?加权综合指数:通过加权来测定一组项目的综合变动,有加权数量指数和加权质量指数。使用条件:必须掌握全面数据(数量指数,测定一组项目的数量变动,如产品产量指数,商品销售量指数等)(质量指数,测定一组项目的质量变动,如价格指数、产品成本指数等)拉式公式:将权数的各变量值固定在基期。帕式公式:把作为权数的变量值固定在报告期。加权平均指数:以某一时期的价值总量为权数对个体指数加权平均计算的指数。使用条件:可以是全面数据、不完全数据。因权数所属时期的不同,有不同的计算形式。有:算术平均形式、调和平均形式13.3解释零售价格指数、消费价格指数、生产价格指数、股票价格指数。零售价格指数:反映城乡商品零售价格变动趋势的一种经济指数。消费价格指数:反映一定时期内消费者所购买的生活消费品价格和服务项目价格的变动趋势和程度的一种相对数。生产价格指数:测量在初级市场上出售的货物(即在非零售市场上首次购买某种商品时)的价格变动的一种价格指数。股票价格指数:反映某一股票市场上多种股票价格变动趋势的一种相对数,简称股价指数。其单位一般用“点”(point)表示,即将基期指数作为100,每上升或下降一个单位称为“1点”。13.4消费者价格指数有哪些作用?消费价格指数除了能反映城乡居民所购买的生活消费品价格和服务项目价格的变动趋势和程度外,还具有以下几个方面的作用:(1)用于反映通货膨胀状况(2)用于反映货币购买力变动(3)用于反映对职工实际工资的影响(4)用于缩减经济序列13.5在构建多指标综合评价指数时,指标的转换方法有哪几种形式?有以下3种形式:(1)统计标准化。(2)极值标准化。(3)定基与环比转换