2015中级统计师考试重点

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第一章统计和数据●统计是用来处理数据的,是关于数据的一门学问。1、统计学:是用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法。2、统计分析数据的方法分为:(1)描述统计(2)推断统计3、描述统计:是研究数据搜集、处理和描述的统计学方法。4、推断统计:是研究如何利用样本数据来推断总体特征的统计学方法。5、推断统计包括:(1)参数估计(2)假设检验6、定性变量的特点:只反映现象的属性特点,不能说明具体量的大小和差异。●定性变量包括分类变量和顺序变量。●只反映现象分类特征的变量称分类变量。分类变量没有数值特征,所以不能对其数据进行数学运算。●如果类别具有一定的顺序,这样的变量称为顺序变量。顺序变量不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。7、定量变量的特点:可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异。2●数值型数据(定量数据)作为统计研究的主要资料,其特征在于它们都是以数值的形式出现的,有些数值型数据只可以计算数据之间的绝对差,而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差。其计量精度远远高于定性数据。在统计学研究中,数值型数据有着最广泛的用途。8、数据按获取的方法不同分为:(1)观测数据(2)实验数据9、观测数据:是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。10、实验数据:一般是在科学实验环境下取得的数据。11、统计数据资料的来源:(1)通过直接的调查或实验获得的原始数据,这是统计数据的直接来源;(2)别人调查的间接数据,并将这些数据进行加工和汇总后公布的数据,这是数据的间接来源。12、数据的直接来源:(1)统计调查(2)实验法●通过统计调查得到的数据,一般称为观测数据。●运用实验法时,实验组和对照组的产生应当是随机的。13、数据的间接来源:(1)公开出版的统计数据(2)尚未公开发表的统计数据14、搜集数据的方法:(1)普查(2)抽样调查(3)统计报表3(4)重点调查(5)典型调查15、普查:是专门组织一次性的全面调查,用来调查属于一定时点或时期内的社会现象总量。●普查适用于搜集某些不能或不适宜于定期的全面统计报表搜集的统计资料,以摸清重大的国情、国力。16、普查的特点:(1)是一种全面调查,具有资料包括范围全面、详尽、系统的优点。(2)是一次性的专门调查,因为普查的工作量大,耗资也多,时间周期较长,一般不宜经常举行。17、抽样调查的特点:(1)样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响。(2)能够根据部分调查的实际资料对调查对象的总体的数量特征进行推断,从而达到对调查总体的认识。(3)在抽样调查中会存在抽样误差,但是这个误差可以事先计算并加以控制。18、在实际调查中抽样的方法:(1)概率抽样(2)非概率抽样19、常用的概率抽样形式有:(1)简单随机抽样(2)分层抽样(3)整群抽样(4)系统抽样420、分层抽样:是先将总体各单位按主要标志加以分层,然后在每一层内进行抽样。21、系统抽样:又称等距抽样,是在总体的名录框中每隔一定距离抽选一个被调查者。22、统计报表:是按照国家统一规定的调查要求与文件自下而上的提供统计资料的一种调查方式。23、统计报表按照报送范围分为:(1)全面报表(2)非全面报表24、统计报表的内容包括:(1)表式(2)填表说明25、重点调查:是在调查对象中选择一部分对全局具有决定性作用的重点单位进行的一种非全面调查。●当调查的任务只要求掌握事物的基本状况与基本的发展趋势,而不要求掌握全面的准确资料,而且在总体中确实存在着重点单位时,进行重点调查是比较适宜的。26、典型调查:是一种非全面的调查,是根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。27、典型调查的作用:(1)补充全面调查的不足(2)在一定条件下可以验证全面调查数据的真实性5●典型调查具有灵活机动、通过少数典型即可取得深入详实的统计资料的优点,但是易受人们主观认识上的影响,必须同其他调查结合起来使用,才能避免出现片面性。第二章数据描述1、定性数据的图形表示有:(1)饼图(2)条形图(3)环形图●饼图是利用圆形及圆内扇形面积来表示数值大小的图形。●条形图是用宽度相同的条形的高度或长度来表述数据多少的图形。●如果想比较不同变量之间的结构差异,可以通过环形图来实现。●定性数据的图示表示方法,也都适用于定量数据。但定量数据还有一些特定的图示方法,它们并不适用于定性数据。2、频数:是指频数分布表中落在某一特定类别的数据个数。3、生成定量数据的频数分布表的步骤:(1)对数据进行分组(2)确定组距(3)统计出各组的频数及频数分布表●组距是每个组变量值中的最大值与最小值之差,也就是上限与下限之差。4、在确定组距时应掌握的原则:(1)要考虑各组的划分是否能区分总体内部各个组成部分的性6质差别。(2)要能准确地清晰地反映总体单位的分布特征。●在确定组距时,在研究的现象变动比较均匀的情况下,可以采用等距分组;而当研究的现象变动很不均匀时,一般采用不等距分组。●在统计各组频数时,恰好等于某一组的组限时,则采取上限不在内的原则,即将该频数计算在与下限相同的组内。5、定量数据的图形表示有:(1)直方图(2)折线图(3)散点图●直方图的横坐标代表变量分组,纵坐标代表各变量值出现的频数。6、统计表的五个组成部分:(1)表头(2)行标题(3)列标题(4)数字资料(5)表外附加7、数据的分布特征:(1)集中趋势,即一组组数据的数值向其中心值的靠拢程度(2)离散程度,即一组数据的各个数值远离其中心的趋势和程度8、定性数据的集中趋势常用的计算方法:(1)百分比(2)中位数(3)众数9、中位数:是数据按照大小排列之后位于中间的那个数。如果样本量为偶数,则是中间两个数的平均。710、众数:就是数据中出现次数或出现频率最多的数值。11、反映定量数据特征的统计量有:反映数据集中趋势的水平度量:(1)平均数(2)中位数(3)众数(4)分位数反映数据离散程度的差异度量:(1)极差(2)四分位差(3)标准差(4)方差●平均数易为多数人理解和接受,实际中用的也较多,但主要缺点是更容易受少数极端数值的影响。中位数和众数提供的信息不像平均数那样多,但具有统计上的稳健性,当数据为偏态分布,特别是偏斜程度较大时,中位数和众数的代表性要比平均数好。12、极差:又称全距,是一组数据中的最大值和最小值之差。●极差非常容易受数据中极端值的影响。●方差用2表示,总体标准差用表示,样本标准差用s表示,离散系数用表示,标准分数用Z表示。●标准差是方差的平方根,它与方差相比更具量纲性。●在一个统计样本中,其标准差越大,说明它的各个观测值分布的越分散,它的趋中程度就越差。反之,其标准差越小,说明它的各个观测值分布的越集中,它的趋中程度就越好。●标准差的大小会受到数据本身数值大小的影响。两个数列的标准差相同,但是两数列的差异程度却不同。为了更准确地反映差异程度,要计算离散系数。13、离散系数:是将一组数据的标准差除以其均值,用来测度数8据离散程度的相对数。14、标准分数:是变量值与其平均数的离差除以标准差后的值,用以测定某一个数据在该组数据中的相对位置。第三章参数估计1、总体分布:是总体中所有观测值所形成的分布。2、总体参数:是对总体特征的某个概括性的度量。3、总体参数指标有:(1)总体平均数()(2)总体方差(2)(3)总体比例()等。●统计量是样本的函数。构成统计量的函数中不能包含未知因素。4、样本统计量指标有:(1)样本均值(x)(2)样本方差(2s)(3)样本比例(p)●统计量的概率分布构成了推断总体参数的理论基础。5、关于样本均值的抽样分布:(1)设总体共有N个元素,从中随机抽取一个容量为n的样本,在重置抽样时,共有nN种抽法;在不重复抽样时,共有)!(!!nNnNCnN个样本。9(2)样本均值的抽样分布就是指所有可能抽出来的样本x的分布。(3)样本均值的均值就是总体均值,即)(xE。(4)重置抽样时,样本均值的标准差为总体标准差的n1,即nx;不重置抽样时,样本均值的方差为122NnNnx。(5)当总体服从正态分布时,样本均值一定服从正态分布,即有:X~),(2N时,x~),(2nN。(6)若总体为未知的非正态分布时,只要样本容量n足够大(通常要求n≥30),样本均值x仍会接近正态分布,其分布的期望值为总体均值,样本方差为总体方差的n1。(7)如果总体不是正态分布,当n为小样本时(通常n30),样本均值的分布则不服从正态分布。6、关于样本比例的抽样分布:(1)当样本容量比较大时,样本比率p近似服从正态分布,且有p的数学期望就是总体比率,即)(pE。(2)在重置抽样时,p的方差为np)1(2。(3)在不重置抽样时,p的方差为1)1(2NnNnp。(4)在重置抽样时,p的分布为p~))1(,(nN10(5)在不重置抽样时,p的分布为p~)1)1(,(NnNnN7、关于统计量的标准误差:(1)统计量的标准误差用于衡量样本统计量的离散程度。在参数估计中,用于衡量样本统计量与总体参数之间差距。(2)样本均值的标准误计算公式为:nx(3)当总体标准差未知时,可用样本标准差s代替计算,这时计算的标准误差称为估计标准误差。(4)样本比例的标准误计算公式为:np)1((5)当总体比例的方差)1(未知时,可用样本比例的方差)1(pp代替。8、参数估计:就是用样本统计量去估计未知的总体参数。9、用样本统计量估计总体参数的两种方法:(1)点估计(2)区间估计10、常用的点估计有:(1)用样本均值x估计总体均值(2)用样本比例p估计总体比例(3)用样本方差2s估计总体方差211、区间估计:是包括样本统计量在内的一个区间,该区间通常是由样本统计量加减估计标准误差得到的。12、关于区间估计:(1)标准正态分布N(0,1)的均值为0,标准差为1。11(2)标准化的公式为:Z(观测值-均值)÷标准差(3)以68.27%的置信水平推断总体参数的置信区间为)1(z:),(nxnx(4)以95.45%的置信水平推断总体参数的置信区间为)2(z:)2,2(nxnx(5)以99.73%的置信水平推断总体参数的置信区间为)3(z:)3,3(nxnx13、评价估计量的标准有:(1)无偏性(2)有效性(3)一致性●无偏性是指估计量抽样分布的期望值等于被估计的总体参数。x、p、2s分别是总体均值、总体比例、总体方差2的无偏估计量。●有效性是指估计量的方差尽可能小。对同一个总体参数的两个无偏估计量,有更小方差的估计量更有效。●一致性是指一个大样本给出的估计量要比一个小样本给出的估计量更接近总体的参数。样本均值是总体均值的一个一致估计量。14、关于总体均值的区间估计:(1)在对总体均值进行区间估计时,需要考虑总体是否为正态分布、总体方差是否已知、用于估计的样本是大样本(30n)12还是小样本(30n)等情况。(2)大样本情况下,总体服从正态分布,总体方差已知,总体均值在置信水平-1下的置信区间为nzxnzx22,(3)大样本情况下,总体服从正态分布,总体方差未知,总体均值在置信水平-1下的置信区间为nszxnszx22,(4)小样本情况下,总体服从正态分布,总体方差已知,总体均值在置信水平-1下的置信区间为nzxnzx22,(5)小样本情况下,总体服从正态分布,总体方差未知,总体均值在置信水平-1下的置信区间为nstxnstx22,●关于总体比例的区间估计,在大样本条件下,若5np,5)1pn-(,则二项分布可用正态分布近

1 / 20
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功