第一章1、统计:是人们认识客观世界总体数量变动关系和变动规律的活动的总称,是人们认识客观世界的一种有力工具。特点:1、数量性:统计数据总是客观事物量的反映2、总体性:统计的数量研究,得出反映现象总体的数量特征3、变异性:总体各单位的特征表现存在差异性,且不是事先可以预知的差异2、统计研究的基本环节:1、统计设计2、收集数据3、整理与分析4、资料积累开发应用3、统计总体:是根据一定目的确定的所要研究的事物的全体。它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。同质性:是确定统计总体的基本标准,它是根据统计的研究目的而定的。大量性:统计总体应该由足够数量的同质性单位构成。4、样本样本由一定数目的单位构成的;样本所包含的总体单位数称为样本容量。5、总体单位(单位)是组成总体的各个个体。6、标志:指总体各单位普遍具有的属性或特征。分为:品质标志、数量标志。【品质标志表明单位属性方面的特征,其表现只能用文字语言描述,如:性别】【数量标志表明单位数量方面的特征,可以用数值表现,如:工龄、工资】7、统计指标:是反映统计总体数量特征的概念和数值。【由两项基本要素构成:指标的概念、指标的取值】8、指标与标志之间存在密切关系。标志反映总体单位的属性和特征;指标反映总体的数量特征。标志和指标的关系是个别和整体的关系。9、统计数据是总体单位标志或统计指标的具体数量表现。根据对研究计量的不同精确度,人们将计量尺度有低到高、由粗略到精确分为4个层次:1、定类尺度(是按照客观现象的某种属性对其进行分类)2、定序尺度(是对客观现象各类之间的等级差或顺序差的一种测度)3、定距尺度(是对现象类别或次序之间间距的测度)4、定比尺度(用于反映现象的结构、比重、速度、密度等数量关系)10、数据类型:根据对客观现象观察的角度不同,统计数据可分为:1、横截面数据(静态数据)2、时间序列数据(动态数据)3、面板数据(同时在时间和截面空间上取得的二维数据)11、统计数据的表现形式1、绝对数(分为时期数据和时点数据)2、相对数(由2个互相联系的数值对比求得)3、平均数(反映现象总体的一般水平或集中趋势)第二章1、统计数据的收集【处于基础阶段】是根据统计研究预定的目的和任务,运用响应的科学的调查方法与手段,采集反映客观现象数据的过程。【收集方法:1、统计调查2、试验】2、统计数据按来源的不同可分为:1、原始资料【直接向调查对象收集的反映被调查单位情况的统计资料】2、二手资料【借助他人的调查或已公布的资料加工整理后得到的资料】3、统计调查的方案设计:1、确定调查目的(why)------解决为什么2、确定调查对象和调查单位(who)------调查谁3、确定调查项目和调查表(what)-----调查项目指要调查的具体内容,构成调查表4、确定调查时间(when)----包括调查时间(资料所属时间)和调查的工作期限5、确定调查的组织实施计划(how)-----确定调查机构、组织、培训人员4、统计调查的组织具体形式1、按调查范围:全面调查-----对调查对象的所有单位一一进行调查【如:普查】非全面调查----对调查对象的部分单位进行调查2、按时间标志:连续性调查----指随研究现象的变化不断进行调查登记不连续性调查----指间隔一段较长的时间对事物的变化进行一次性调查3、按组织形式:定期报表----是按国家统一规定的表式和内容,定期向各级领导机构报送统计资料的一种形式专门调查----是为了某一专题研究而组织的专项调查----------------------------------------------------------------------------------------------------------------------------------------------------------------5、抽样调查【所研究的是随机变量】按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据所获得的样本数据,对调查对象总体特征做出具有一定可靠程度的推算。适用范围:1、不可能或不必要进行全面调查的社会现象2、对普查资料进行必要的修正6、重点调查【节省人力、物理、效果好】指在调查对象中,只选择一部分重点单位进行的非全面调查。【所研究现象的标志总量中占很大比重】适用范围:只要求掌握基本情况,而部分单位又能较集中地反映研究项目的情况。7、典型调查是一种专门组织的非全面调查。是根据调查的目的,在对研究的对象进行初步分析的基础上,有意识地选取若干具有代表性的单位进行深入调查和研究。适用范围:对所研究事物进行具体、细致的调查研究,详细观察事物的发展过程,具体了解现象发生的原因,并掌握现象各个方面的联系。----------------------------------------------------------------------------------------------------------------------------------------------------------------------------为了适应社会主义市场经济的要求,我国建立以必要的周期性的普查为基础,以经常性的抽样调查为主体,同时辅以重点调查、科学推算和部分全面报表综合运用的统计调查方法体系。-----------------------------------------------------------------------------------------------------------------------------------------------------------8、数据整理是指根据统计研究的目的,将调查所得的原始资料进行分组、汇总,使其条理化、系统化的工作过程。内容:【1、统计资料的审核】【2、资料的分组和汇总】【3、编制统计表或绘制统计图【4、统计资料的积累、保管和公布】9、统计分组【对象是总体】根据统计研究的目的和库管现象的内在他点,按某个或几个标志把研究的总体划分为若干个不同性质的组。遵循的两个原则:1、穷尽原则:是总体中的每一个单位都应有可归,或者说各分组的空间足以容纳总体所有单位2、互斥原则:在特定的分组标志下,总体中任何一单位只能归属于某一组而不能同时或可能归属几个组。分组的种类:按分组的标志的性质不同:1、品质分组(按品质标志进行分组)2、数量分组(按数量标志进行分组)10、统计分组的方法1、单项式分组:按数量标志分组;用一个变量值作为一组,形成单项式变量数列。【一般适用于离散型变量且变量范围不大】2、组距式分组:将变量划分为几段区间,把一段区间内的所有变量值归为一组,形成组距式变量数列区间的距离就是组距。【一般适用连续型变量或变动范围较大的离散型变量】11、组距---------------------------------------------------------------------------------------------------------------12、频数(次数):分布在各组的单位个数。13、频率f:各组的频数与频数之和的比值。反映了各组频数党费大小对总体所起的作用的相对强度(1)频数密度=频数/组距,即单位组距的频数。(2)频率密度=频率/组距,即单位组距的频率第三章偏差是用于衡量分布的不对称程度或偏斜程度的指标。偏度指标a:333322第六章相关系数的种类1、按相关关系的程度划分可分为完全相关,不完全相关和不相关。2、按相关形式划分可以分为线性相关和非线性相关3、按相关的方向可划分为正相关和负相关。(1)正相关:两个相关现象间,当一个变量的数值增加(或减少)时,另一个变量的数值也随之增加(或减少),即同方向变化。例如收入与消费的关系。(2)负相关:当一个变量的数值增加(或减少)时,而另一个变量的数值相反地呈减少(或增加)趋势变化,即反方向变化。例如物价与消费的关系。两个变量之间的相关,称为是单相关单相关分析是对两个变量之间的现行相关程度进行分析。4、相关分析【广义的】指用一个指标来表明现象间相互依存关系的密切程度。5、回归分析【狭义的】指对具有相关关系的现象,根据其相关关系的具体形态,选择一个合适分得数学模型。只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。联系:相关分析是回归分析的基础和前提回归分析是相关分析的深入和继续定性分析:研究者理论知识和时间经验,对客观现象之间是否存在相关关系,以及何种关系作出判断定量分析在定性分析的基础上,通过编制相关表、绘制相关图(散点图)、计算相关系数等方法来判断现象之间相关的方向、邢台及密切程度。相关系数指在线性条件下说明两个变量之间相关关系么且程度的统计分析指标。(根据总体全部数据计算)总体相关系数:(,)=()()CovXYVarXVarYCov(X,Y)是变量X和Y的协方差;Var(X)和Var(Y)分别为变量X和Y的方差。总体相关系数是反映两变量之间线性相关程度的一种特征值。(常数)(根据样本数据计算)样本相关系数:22()()()()ttttXXYYrXXYY样本相关系数是总体相关系数的一一致估计量当r=0,X与Y样本观测值之间没有联系3.如果|r|=1,则表明X与Y完全线性相关,当r=1时,称为完全正相关,当r=-1时,称为完全负相关。4.r是对变量之间线性相关关系的度量。一元线性回归模型指只有一个因变量和一个自变量的线性回归模型。(一)总体回归函数Yt=β1+β2Xt+utut是随机误差项(二)样本回归函数:01ˆˆttYXe(t=1,2,...n)et称为残差残差的总量越小越好。线性部分反映了由于x的变化而引起的y的变化。---------------------------------------------------------------------最小二乘法指通过使残差平方和为最小来估计回归系数的一种方法。☆解方程组得:1112221111122ˆˆˆˆnnniiiixyiiinnxxiiiinniiiinxyxyLLnxxyxyxnn总体方差的估计:2221ˆ22niitiyyeSnn自由度是2S越小表示拟合得越好,回归线的代表性就越强。12ˆ211()()niixSSnxx2ˆ21()niiSSxx回归模型的检验包括理论意义检验、以及检验、二级检验。理论意义检验主要涉及参数估计值得符号和取值区间,如果他们与实质科学的理论依据i人们的实践经验不相符,就说明模型不能很好地解释现实的现象。一级检验是利用统计学中的抽样理论来检验样本回归方程的可靠性,具有又可分为拟合程度评价和显著性检验,二级检验是对标准线性回归模型的家丁条件能否得到满足进行检验。拟合程度:是指样本观测值聚集在样本回归线周围的紧密程度。数量尺度是样本决定系数222112211ˆˆ=1-1ˆnniiiinniiiiyyyySSRSSErSSTSSTyyyy1、反映回归直线的拟合程度2、取值范围在[0,1]之间【非负性】3、r21,说明回归方程拟合的越好;r20,说明回归方程拟合的越差4、决定系数等于单相关系数的平方,即r2=(r)2第七章1、时间序列是把各个不同时间的社会经济统计指标数值,按时间先后顺序排列。时间数列的构成要素:1、现象所属的时间2、不同时间的具体指标数值2、时间序列按照指标的性质可分为;1、总量指标:指把一系列总量指标值按时间的先后顺序排列起来所形成的时间序列。【时期序列、时点序列】2、相对指标:指由绝对数指标派生出来的,是由两个有联系的指标对比的比率。3、平均指标联系与区别:3、时期指标时间序列具有以下特点:1)可加性,不同时期的总量指标可以相加;2)指标