应用统计(专业学位)432统计学考研题库(一)一、简答题1.说明条形图和直方图的区别和联系。【答案】(1)条形图与直方图的区别@形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。@由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。@条形图主要用千展示分类数据,而直方图则主要用于展示数值型数据。(2)联系两者都是用矩形表示数据分布清况;当矩形的宽度相等时,都是用矩形的高度来表示数据的分布情况。2.回归分析中的误差序列有何基本假定?模型参数的最小二乘估计a和6具有哪些统计特性?若模型用千预测,影响预测精度的因素有哪些?【答案】(1)误差项8是一个服从正态分布的随机变量,且独立,即B~N(O,a-2�独立性意味着对千一个特定的叶直,它所对应的8与其他对直所对应的8不相关。误差项8是一个期望值为0的随机变量,即E(e)=0。对于所有的x值,8的方差(72都相同。(2)模型参数的最小二乘估计a和6的统计特性:@线性,即估计量d和6为随机变量y;的线性函数;@无偏性,8和6分别是a和b的无偏估计;@有效性,a和b是所有线性无偏估计量中具有最小方差的估计量。(3)影响预测精度的因素有:©预测的信度要求。同样情况下,要求预测的把握度越高,贝应的预测区间就越宽,精度越低;@总体y分布的离散程度6气矿越大,相应的预测区间就越宽预测精度越低@样本观测点的多少n。n越大,相应的预测区间就越窄,预测精度越高@样本观测点中,解释变量X分布的离散度。X分布越离散,预测精度越高;@预测点打离样本分布中心t的距离预测点越远离样本分布中心预测区间越宽,精度越低越接近样本分布中心元,区间越窄,精度越高。3.简述古典概率法和经验概率法如何定义事件发生的概率。【答案】概率的古典定义是,如果某一随机试验的结果有限,而且各个结果出现的可能性相等,则某一事件A发生的概率为该事件所包含的基本事件数m与样本空间中所包含的基本事件数n的比值,记为:P(A)=事件A所包含的基本事件的个数m样本空侚所包含的基本事件的个数n应用统计(专业学位)432统计学考研题库(二)一、简答题I(t;::匕···,n)其中E(s)=O;E(矿)=62xf气1.若有线性回归模型y,=价+凡x,+£{(t;::1.2E(c尼.)=0(t-:t:s),间:(1)该模型是否违背古典线性回归模型的假定,请简要说明。(2)如果对该模型进行估计,你会采用什么方法?请说明理由。【答案】(1)该模型违背了古典线性回归模型的假定。古典线性回归模型要求误差项具有等?2方差性,即对千不同的自变量X具有相同的方差。而由题意可知,误差项$,的方差为6日x,与自变量斗有关。(2)如果对该模型进行估计,会采用加权最小二乘法。加权最小二乘法是在平方和中加入权1数亏,以调整各项在平方和中的作用。即寻找参数份fJ2的估计值队,凡使得离差平方和x,Q(凡P2)=I3仅-护肛)2达到最小。这样,就消除了异方差性的影响。闰斗2.简述时间序列的组成要素。【答案】时间序列的组成要素分为4种,即趋势或长期趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。(1趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;(2)季节性也称季节变动它是时间序列在一年内重复出现的周期性波动;(3)周期性也称循环波动它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动;(4)随机性也称不规则波动是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。3.简述相关系数和函数关系的差别。【答案】变量之间的关系可分为两种类型:函数关系和相关关系。(1)函数关系设有两个变量吓印变量Y随变量X一起变化,并完全依赖千入,当变量X取某个数值时'y依确定的关系取相应的值,则称Y是X的函数。由此可见函数关系是—种—一对应的确定性关系。(2)相关关系相关关系是指变量之间确实存在的但关系值不固定的相互依存关系。在这种关系中,当一个(或几个)变量的值确定以后,另一个变量的值虽与它(或它们)有关,但却不能完全确定。这是一种非确定的关系。应用统计(专业学位)432统计学考研题库(三)一、简答题1.概述相关分析与回归分析的联系与区别。【答案】(1)相关分析和回归分析的联系它们具有共同的研究对象,都是对变量间相关关系的分析,二者可以相互补充。相关分析可以表明变量间相关关系的性质和程度,只有当变量间存在相当程度的相关关系时,进行回归分析去寻求变量间相关的具体数学形式才有实际的意义。同时,在进行相关分析时,如果要具体确定变量间相关的具体数学形式,又要依赖于回归分析,而且在多个变量的相关分析中相关系数的确定也是建立在回归分析基础上的。(2)相关分析和回归分析的区别©从研究目的上看,相关分析是用一定的数量指标(相关系数)度量变量间相互联系的方向和程度回归分析却是要寻求变量间联系的具体数学形式,是要根据自变量的固定值去估计和预测因变量的平均值。@从对变量的处理看,相关分析对称地对待相互联系的变量,不考虑二者的因果关系,也就是不区分自变量和因变量相关的变量不一定具有因果关系,均视为随机变量;回归分析是在变量因果关系分析的基础上研究其中的自变量的变动对因变量的具体影响,必须明确划分自变量和因变量,所以回归分析中对变量的处理是不对称的,在回归分析中通常假定自变量在重复抽样中是取固定值的非随机变量,只有因变量是具有一定概率分布的随机变量。2.简述概率抽祥与非概率抽样的区别。【答案】(1)概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。非概率抽样是相对千概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。(2)概率抽样与非概率抽样的区别:概率抽样是依据随机原则抽选样本,这时样本统计量的理论分布是存在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在进行抽样设计时,对估计的精度提出要求,计算为满足特定精度要求所要的样本量。而非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。3.要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析方法?【答案】方差分析不仅可以提高检验的效率,同时由千它是将所有的样本信息结合在一起,也增加了分析的可靠性。应用统计(专业学位)432统计学考研题库(四)一、简答题1.简述复合型时间序列的预测步骤。【答案】复合型序列是指含有趋势性、季节性、周期性和随机成分的序列。对这类序列预测方法通常是将时间序列的各个因素依次分解出来,然后再进行预测,分解法预测通常按下面的步骤进行:(1)确定并分离季节成分。计算季节指数,以确定时间序列中的季节成分。然后将季节成分从时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数,以消除季节性;(2)建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测;(3)计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。2.什么叫变异、变噩和变噩值,试举例说明。【答案】标志在同一总体不同总体单位之间的差别称为变异。例如:人的性别标志表现为男、女;年龄标志表现为20岁、30岁等。变异标志又称为变量,是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或变化。变量的具体取值称为变量值。具体包括:(1)分类变量,如性别”就是分类变量,其变量值为男”或女”;(2)顺序变量,如产品等级”就是顺序变量,其变量值可以为"一等品”、“二等品'、“三等品'、"次品”等;(3)数值型变量,如年龄”是连续数值型变量变量值为非负数;“企业数是离散数值型变星,变量值为1,2,……3.在单个总体均值的假设检验中,检验统计量要根据总体是否服从正态分布、总体方差是否已知,以及祥本量的大小来确定。说明在不同情况下分别需要使用何种检验统计量。【答案】在对单个总体均值进行假设检验时,采用何种检验统计量取决于所抽取的样本是大样本但30)!还是小样本(n30),此外还需要区分总体是否服从正态分布、总体方差是否已知等几种情况。(1)在大样本情况下,样本均值的抽样分布近似服从正态分布。设总体均值为µ(),总体方差为矿。当总体方差62已知时,总体均值的检验统计量为:r-µ。=.可丘当总体方差矿未知时,可以用样本方差s2来近似代替总体方差,此时总体均值检验的统计量为:应用统计(专业学位)432统计学考研题库(五)一、简答题1.解释总体分布、样本分布和抽样分布的含义。【答案】总体分布就是总体中所有个体关千某个变量(标志)的取值所形成的分布。假设X为总体随机变量,那么总体分布就是指X的分布。很显然,同一变量不同的总体或同—总体不同的变量,其分布是不同的。样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布。假设x为总体随机变量X在样本中的体现,那么样本分布就是指X的分布,或者说是关千《个观测值的分布。同样,同一变量不同的样本或同一样本不同的变量,其分布是不同的。一般意义上说,抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率组成。如果说样本分布是关于样本观测值的分布,那么抽样分布则是关于样本统计量的分布,而样本统计量是由样本观测值计算而来的。具体地说,抽样分布就是从容最为W的总体中抽取容量为n的样本时,所有可能的样本统计量所形成的分布。假设从容量为W的有限总体中最多可以抽取m个容量为n的不同样本,那么把所有m个样本统计值形成频率分布,就是抽样分布。可以说,抽样分布是研究样本分布与总体分布之间的桥梁。2.简述统计分组的原则。【答案】采用组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组,不能在其他组中重复出现;不漏是指组别能够穷尽。即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。为解决不重的问题,统计分组时习惯上规定'上组限不在内"。即当相邻两组的上下限重叠时,恰好等千某一组上限的变量值不算在本组内,而计算在下一组内。而对千连续变量,可以采取相邻两组组限重叠的方法,根据“上组限不在内"的规定解决不重的问题,也可以对—个组的上限值采用小数点的形式,小数点的位数根据所要求的精度具体确定。3.统计分组标志选择的原则。【答案】在进行统计分组标志选择时要遵循三个原则:(1)应根据研究目的与任务选择分组标志。同一研究总体,研究的目的不同,可选用的分组标志也不同。(2)要选用能反映事物本质或主要特征的标志。—般清况下,社会经济现象有多种特征,在选择分组标志时可以使用这种标志,也可以选择另一种标志,这就需要根据被研究对象的特征,选择主要的、能抓住事物本质的标志进行分组。(3)要根据现象所处的历史条件及经济条件来选择标志。由千社会是不断发展的,在不同的