第十二章因子分析因子分析是一种在许多变量中提取出隐藏的具有代表性的共性因子、构造因子模型的统计技术。因子分析模型设m个可能存在相关关系的观测变量z1,z2,……,zm(经过标准化后)含有p个独立的公共因子F1,F2,……,Fp(m≥p),观测变量zi含有独特因子Ui(i=1…m),诸Ui间互不相关,且与Fj(j=1…p)也互不相关,每个zi可由p个公共因子和自身对应的独特因子Ui线性表出:mmpmpmmmppppUcFaFaFaZUcFaFaFaZUcFaFaFaZ221122222212121112121111(模型1)mmppmijmUcUcUcFFFaZZZ22112121.)(简记为)1()1()()1(mppmmCUFAZ(模型2)A称为因子负荷矩阵(即模型1中各方程的系数aij的矩阵),aij表示第i个变量zi在第j个公共因子Fj上的负荷,简称因子负荷。因子负荷反映了某一变量与某个因子的相关关系。每一个因子也可以表示各观测变量的线性组合:Fj=Wj1Z1+Wj2Z2+Wj3Z3+….+WjmZmWj1:权重或因子得分系数,用于计算因子得分。因子分析步骤:一、形成问题二、基于原始数据构造相关矩阵CorrelationMatrix1.000-.053.873-.086-.858.004-.0531.000-.155.572.020.640.873-.1551.000-.248-.778-.018-.086.572-.2481.000-.007.640-.858.020-.778-.0071.000-.136.004.640-.018.640-.1361.000V1V2V3V4V5V6CorrelationV1V2V3V4V5V6KMOandBartlett'sTest.660111.31415.000Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.Approx.Chi-SquaredfSig.Bartlett'sTestofSphericity三、确定因子分析方法主成分分析法(Principalcomponentsanalysis简称PCA)和主因子分析法(Principalfactoranalysis简称PFA,也称commonfactoranalysis)。主成分解释了变量的总方差,主因子解释了协方差。当主要目的是要减少变量时,采用主成分分析;当为了寻找对协方差有贡献的潜在因子时,采用主因子分析。常用主成分分析法。四、提取因子提取因子原则:按照能够解释方差的大小逐序提取因子。所有公因子(与其他变量所共有)能够解释某个变量方差的比例称为公因子方差(communality),记作h2。公因子方差反映了各个因子对该变量的解释程度。某变量的h2越大,说明这些因子对该变量的解释程度越强,用这些因子来描述该变量就越有效。Communalities1.000.9261.000.7231.000.8941.000.7391.000.8781.000.790V1V2V3V4V5V6InitialExtractionExtractionMethod:PrincipalComponentAnalysis.因子的特征值揭示了各个因子能够解释总方差的多少,反映了因子的重要程度,可作为提取因子的依据。五、确定因子的数量方法一:依据经验知识确定。方法二:选择特征值大于1的因子。方法三:scree检验,即将各因子的特征值用折线图表示出来,寻找平滑递减的特征值在图的右边停止不前的位置。ScreePlotComponentNumber654321Eigenvalue3.02.52.01.51.0.50.0六、旋转因子若确定两个因子,得出因子/成分矩阵图如下,展示了两个因子与6个变量之间的相关关系,即因子负荷,体现了因子对变量的解释作用。但是,由于公因子是从多个变量中提取出来的,很有可能出现很多变量甚至所有变量在一个因子上的负荷都较大的情形,从而难以将变量归类和解释因子。故此,将因子矩阵进行正交旋转,采用方差最大正交旋转法,使得每个因子只和少数变量之间显著相关,或者每个变量都只和个别因子(最好是一个)强相关。旋转不会影响公因子方差,但每一个因子能够解释的方差会发生变化,从而使得因子负荷发生变化。ComponentMatrixa.928.253-.301.795.936.131-.342.789-.869-.351-.177.871V1V2V3V4V5V612ComponentExtractionMethod:PrincipalComponentAnalysis.2componentsextracted.a.RotatedComponentMatrixa.962-2.66E-02-5.72E-02.848.934-.146-9.83E-02.854-.933-8.40E-028.337E-02.885V1V2V3V4V5V612ComponentExtractionMethod:PrincipalComponentAnalysis.RotationMethod:VarimaxwithKaiserNormalization.Rotationconvergedin3iterations.a.六、解释因子基于旋转后的因子矩阵进行解释。变量1、3、5和因子1相关,变量2、4、6和因子2相关。七、计算因子得分可根据研究需要计算因子得分:即每一个样本在每一个因子上的得分。计算方法:对于每个样本,用其各个标准化变量值乘以相应的因子得分系数Wij,再加总。ComponentScoreCoefficientMatrix.358.011-.001.375.345-.043-.017.377-.350-.059.052.395V1V2V3V4V5V612ComponentExtractionMethod:PrincipalComponentAnalysis.RotationMethod:VarimaxwithKaiserNormalization.ComponentScores.八、模型评估即评估模型的拟合程度。因子分析的原假设:变量之间的相关关系可以由一个共同的因子来描述,即变量间的相关程度可以转化为变量与因子间的相关程度/可由变量与因子间的相关关系来反映变量间关系。把通过变量与因子的关系反映出的变量间关系称为再生相关系数,初始的变量间相关系数与再生相关系数之间的差异反映了模型的拟合效果。ReproducedCorrelations.926b-7.76E-02.902-.117-.8955.662E-02-7.76E-02.723b-.177.730-1.79E-02.746.902-.177.894b-.217-.859-5.13E-02-.117.730-.217.739b1.999E-02.748-.895-1.79E-02-.8591.999E-02.878b-.1525.662E-02.746-5.13E-02.748-.152.790b2.440E-02-2.92E-023.115E-023.770E-02-5.25E-022.440E-022.224E-02-.1583.763E-02-.105-2.92E-022.224E-02-3.13E-028.138E-023.327E-023.115E-02-.158-3.13E-02-2.66E-02-.1073.770E-023.763E-028.138E-02-2.66E-021.574E-02-5.25E-02-.1053.327E-02-.1071.574E-02V1V2V3V4V5V6V1V2V3V4V5V6ReproducedCorrelationResidualaV1V2V3V4V5V6ExtractionMethod:PrincipalComponentAnalysis.Residualsarecomputedbetweenobservedandreproducedcorrelations.Thereare5(33.0%)nonredundantresidualswithabsolutevaluesgreaterthan0.05.a.Reproducedcommunalitiesb.第十三章时间序列分析时间序列分析是对于按时间顺序观测的系列数据进行分析的方法。例1:表1为中国海关出口商品总额的有关数据(亿美元),计算环比、定基、平均发展速度和增长速度。年份出口总额逐期增长量环比发展速度环比增长速度定基发展速度定基增长速度1990620.91———100.00—1991718.4397.52115.7115.71115.7115.711992849.40130.97118.2318.23136.8036.801993917.4468.04108.018.01147.7647.7619941210.06292.62131.9031.90194.8894.8819951487.80277.74122.9522.95239.62139.6219961510.6622.86101.541.54243.30143.3019971827.92317.26121.0021.00294.39194.3919981837.099.17100.500.50295.87195.8719991949.31112.22106.116.11313.94213.9420002492.03542.72127.8427.84401.35301.3520012661.55169.52106.806.80428.65328.6520023255.96594.41122.3322.33524.39424.39例2:某地区国内生产总值1999-2001年间平均每年递增12%,2002-2005年间平均每年递增10%,2006-2008年平均每年递增8%。请计算:(1)该地区国内生产总值在这10年间(1999-2008)的总发展速度;(2)该地区国内生产总值在这10年间(1999-2008)的平均增长速度;(3)若该地区2008年的国内生产总值为500亿元,以后平均每年增长6%,则到2010年可达到多少?