统计学简答题1、统计的含义与本质是什么?(1)“统计”一词可以有三种含义:统计活动、统计数据、统计学统计活动是对各种统计数据进行收集、整理并做出相应的推断、分析的活动,通常被划分为统计调查、统计整理、和统计分析三个阶段;统计数据是通过统计活动获得的,用以表现研究现象特征的各种形式的数据;统计学则是指导统计活动的理论和方法,是关于如何收集、整理和分析数据的科学。(2)统计的本质是关于为何统计,统计什么,和如何统计的思想。2、统计学的学科性质:1、统计学就其研究对象而言,具有数量性、总体性和差异性的特点。统计学的研究对象是各种现象的数量方面。2、统计学就其学科范畴而言,具有方法性、层次性和通用性的特点。3、统计学就其研究方式而言,具有描述性和推断性的特点。3、总体、样本、个体三者关系如何?试举例说明。总体:就是统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体,有时也称为母体;样本:就是从总体中抽区的一部分个体所组成集合,也称为子样;组成总体的每个个别事物就称为个体,也称为总体单位。(1)总体与个体的关系(可变性)总体容量随着个体数的增减可变大或变小;随着研究目的的不同,总体中的个体可发生变化;随着研究范围的变化,总体与个体的角色可以转换/(2)样本与总体的关系样本是所要研究的对,而样本则是所要观测的对象,样本是总体的代表和缩影。样本是用来推断总体的。总体和样体的角色是可以改变的。4、理解标志、指标、变量三者的含义?标志与指标的联系与区别?标志是用以描述或体现个性特征的名称;统计指标简称指标,是反映现象总体数量特征的概念及其数值;从狭义上看,变量是指可变的数量标志;从广义上来看,变量不仅指可变的数量标志,也包括可变品质标志,因此,可变标志就是变量。(1)标志与指标的区别:指标和标志说明的对象不同,指标说明总体的特征,标志则说明个体的特征;指标与标志的表现形式不同,指标是用数值来表现的,而标志则既能用文字来表现品质标志,也能用数字来表现数量标志。(2)标志与指标的联系:标志是计算统计指标的依据,即统计指标数值是根据个体的标志综合表现而来的;由于总体与个体的确定是相对的,可以换位的,因而指标与标志的确定也是相对的、可以换位的;指标与标志同属于变量的范畴。5、什么是统计指标体系?有哪些表现形式?同一总体多个反面数量特征的、一系列相互联系的统计指标所形成的体系称为统计指标体系表现形式:数学等式关系:若干统计指标之间可以构成一个等式关系相互补充关系:各个指标相互配合,相互补充,从不同方面开说明现象的数量特征相关关系:各个指标之间的存在着一定的相关关系原因、条件和结果关系:若干指标中有的是原因,有的是条件有的则为结果6、如何设计统计数据收集方案?(1)统计数据的收集包括四个环节:确定数据收集目的;设计数据收集方案;开展数据收集活动;评估数据收集质量。(2)统计数据收集方案包括以下一些方面:数据收集目的;数据及其类型;数据收集对象和观测单位;观测标志和调查表;数据收集方式和方法;数据所属时间和数据收集期限;数据收集地点;数据收集的组织。7、统计数据整理有哪些基本步骤?整理方案的设计;数据项处理;统计分组和汇总;整理数据的显示;整理数据的保存与公布。8、简述统计分组的含义、性质和作用。(1)含义:统计分组就是根据统计研究的目的和事物本身的特点,选择一定的标志(一个或多个),将研究现象总体划分为若干性质不同的组或类的一种统计研究方法。(2)性质:统计分组兼有分与合的双重功能,是分与合的对立统一;统计分组必须遵循“穷尽原则”和“互斥原则”;统计分组的目的是要在同性质的基础上研究总体的内在差异性;统计分组在体现分组标志的组间差异的同时,却可能掩盖了其他标志的选择是核心问题。(3)作用:揭示现象所属类型;解剖总体内在结构;分析现象之间关系。9、在统计数据收集过程中,可能存在哪些误差?(1)观测性误差也叫登记性误差或调查性误差。它是在调查观测的各个环节因工作粗心或被观测者不愿很好配合而造成的所收集数据与实际情况不符合的误差。(2)代表性误差是指在抽样调查中,因样本不能完全代表总体而产生的估计结果与总体真实数量特征不符的误差。系统性代表性误差,是由于抽样框不完善、抽样时违反随机原则、被调查者无回答等因素引起的误差。观测性误差与系统性代表性误差合在一起称为非抽样误差。偶然性代表性误差,是由于抽样的随机性引起的样本结构与总体结构不完全相符而产生的估计结果与总体真值不一致的误差,这种误差在随机抽样中不可避免,但可以计算和控制。10、什么是变量分布的集中趋势、离中趋势和分布形状?集中趋势:反映变量分布中各个变量值向中心值靠拢或聚集的程度;离中趋势:反映变量分布中各个变量值远离中心值的程度;变量分布的形状:反映变量分布的偏斜程度和尖陡程度。11、什么是平均指标?有什么作用?常用的平均数有哪些?(1)平均指标是将变量的各个变量值差异抽象化、以反映变量值一般水平或平均水平的指标,也就是反映变量分布中心值或代表值的指标。(数值平均数、位置平均数)(2)平指标的作用:通过反映变量分布的一般水平,帮助人们对研究现象的一般数量特征有一个客观的认识;利用平均指标可以对不同空间的发展水平进行比较,消除因总体规模不同而不能直接比较的因素,以反映他们之间总体水平上存在的差距,进而分析产生差距的原因;利用平均指标可以对某一现象总体在不同时间上的发展水平进行比较,以说明这种现象发展变化的趋势或规律性;利用平均指标可以分析现象之间的依存关系或进行数量上的推算;平均指标还可以作为研究和评价事物的一种数量标准或参考。(3)常用的平均数:数值平均数(算术平均数、调和平均数、几何平均数);位置平均数(中位数与分位数、众数)12、算术平均数、中位数和众数三者的数量关系说明什么样的变量分布特征?中位数、算术平均数、众数三者完全相等时,变量分布完全对称(正态分布)中位数、算术平均数、众数三者存在差异时,变量分布不对称在轻微偏态时,众数与算术平均数的距离约等于中位数与算术平均数距离的3倍13、什么是离散指标?有什么作用?常用的离散指标有哪些?(1)离散指标就是反映变量值变动范围和差异程度的指标,即反映变量分布中各个变量值远离中心值或代表程度的指标,亦称为变异指标或标志变动度指标。(2)离散指标的作用:可以用来衡量比较平均数的代表性;可以用来反映各种现象活动过程的均衡性、节奏性或稳定性;为统计推断提供依据(3)全距(亦称极差)、四分位差、异众比率、平均差、标准差、离散系数等。14、什么是总体分布和样本分布?两者有什么联系?总体分布就是总体中所有个体关于某个变量(标志)的取值所形成的分布;样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布。联系:抽样估计,就是要以可知但非唯一的样本统计值去估计唯一却未知的总体参数的值。15、什么是抽样分布?它首哪些因素影响?(1)抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率所组成。(2)影响因素:①总量分布;②样本容量;③抽样方法;④抽样组织形式;⑤估计量构造。抽样误差与非抽样误差有什么区别?抽样误差是由抽样的非全面性与随即性所引起的偶然性误差非抽样误差是随即抽样的偶然性因素以外的原因所引起的误差16、影响抽样误差的因素有哪些?(1)所谓抽样误差是由于抽样的非全面性和随机性所引起的偶然性误差,即因抽样估计值随样本不同所造成的误差。抽样误差的表现形式一般有三种:抽样实际误差,抽样标准误差,抽样极限误差。(2)影响抽样标准误差的因素,就是影响抽样分布的因素:①总量分布;②样本容量;③抽样方法;④抽样组织形式;⑤估计量构造。17、什么是相关关系?简述相关关系的种类。(1)相关关系也称统计相关,指现象之间存在的非确定性的数量依存关系。(2)相关关系的种类:①按照相关关系涉及的因素(变量)多少,可分为单相关和复相关;②按照相关关系的表现形式不同,可分为线性相关与非线性相关。对于一元相关,即为直线相关和曲线相关;③对于单相关,按照现象数量变化的方向不同。可分为正相关和负相关;④按照相关程度不同,可以分为完全相关,不完全相关和无相关。18、相关分析与回归分析有何区别与联系?(1)相关分析:广义上讲,对两个或两个以上现象之间数量上的不确定性依存关系进行的统计分析。(2)回归分析:对具有相关关系的的两个或两个以上变量之间数量变化的一般关系进行测定,确定因变量和自变量之间数量变动关系的数学表达式,以便对因变量进行估计或预测的统计分析方法。(3)区别:①回归分析必须根据研究目的的确定其中一个为因变量,其余为自变量;相关关系可以不区分。②在相关分析中,两个变量要求都是随机的;而在回归分析中,要求因变量是随机的,而自变量的值则是给定的。③若变量之间互为因果,或是没有明显因果关系,则可以求出两个回归方程;对于相关分析来说,两个变量之间只能求出一个相关系数。④回归方程有较强的应用性。(4)联系:相关分析的主要任务是研究变量间相关关系的表现形式和密切程度,而回归分析师在相关分析的基础上,进一步研究现象之间的数量变化规律。19、序时平均数(动态平均数)与静态平均数(一般平均数)有何异同?共性:都反映现象的一般水平或者代表性水平,都是平均数。差别:①一般平均数把同质总体某一数量标志在某一时间上的水平抽象化,从静态反映现象的一般水平或代表性水平,而序时平均数则把同一现象在不同时间上的差异抽象化,从动态上反映现象的一般水平或代表性水平;②静态平均数是根据变量数列计算的,而序时平均数则根据时间数列来计算【回忆:动态指标和静态指标】①静态指标是反映现象总体在某一时点或相对静止时间上数列特征的指标,包括一般的总量指标、静态相对指标和一般水平指标②动态指标是反映现象总体在不同时期或者时点上发展变化情况的指标,包括增长量指标、动态相对指标和序时平均指标等。20、简述时期数列与时点数列的概念和区别。(1)时期数列是指同类的时期指标按时间先后顺序形成的数列,数列中的各期指标值反映社会经济现象在一堆时期内累计达到的总量。(2)时点数列是指时点指标按时间时间先后顺序排列而行成的统计数列,其指标反映经济现象在某一时点或某一瞬间所达到的水平。(3)区别:①时期数列中不同时间的指标数值可以累计;时点数列中不同时点上数值不可以累计(或相加没有意义)。②时期数列指标值的大小和时期长短有直接关系。一般来说,时期越长,数值越大;时点数列指标数值的大小和时间长短无直接关系。①时期数列指标值一般是通过连续登记获取的;时点数列时点指标的数值一般是通过不连续登记取得的。【时期指标与时点指标有哪些区别?】②时期指标是反映现象在意的时期内累计达到的总量,其数值大小与时间长短有直接短信,不同时间上的数值可以累加,数值需要通过连续登记取得(企业产量、地区GDP)。③时点指标是反映现象在某一时点(时刻、瞬间)所达到的总量,其数值大小时间长短无直接关系,不同时间上的数值不可以累加,数值通常不需要通过连续登记取得(企业人数、地区居民存款余额)。环比发展速度与定基发展速度之间有什么关系?定基发展速度等于个期环比发展速度的连乘积相邻两个定基发展速度的商等于相应的环比发展速度21、什么是数量指标指数和质量指标指数?试举例说明。(1)数量指标指数就是指数化指标为某一数量指标的指数,也即反映总体某种数量指标变动的指数,如产品产量指数、商品销售量指数、能源消耗量指数等。(2)质量指标指数就是指数化指标为某一质量指标的指数,也即反映总体某种数量指标变动的指数,如商品零售价格指数、产品单位成本指数、股票价格指数、劳动生产率指数等。什么是同度量因素?它与指数化因素有什么关系?该如何选择同度量因素?同度量因素:计算综合指数的分子和分母都是由两个或两个以上因素所决定的总量指标,其中一个因素就是指数化因素或指数化指标,其他因素则是把不能直接相关的指数化因素转化为能直接相加的量的因素关系:他们互为同度量因素;在编制综合指数时,同度量因素的时间或空间必须固定,才能反映指数化因素的变化情况;同度量因素起到同度量的同时