2019/12/171组员:谢冬林、郑涛、朱宁洪志扬、赵子艺2019/12/1721.基本原理:通过考察变量的相关性,从原始变量中导出少数几个主分量,使它们尽可能多地保留原始变量的信息,且彼此间互不相关,数量远远少于原始变量的个数,对数据进行压缩,达到降维的目的,并解释数据。2.数学模型:ppppppppppxaxaxayxaxaxayxaxaxay221122221212121211112019/12/1733.主成分的选择:首先,选择方差最大的主成分,若不足以代替原始变量,在考虑第二个主成分,以此类推,一般要求所选主成分的方差总和占全部方差的80%以上。4.主成分解释:主成分的因子载荷矩阵的每一列与原始变量的线性组合5.主成分分析步骤:第1步:对原始变量进行标准化,消除变量水平和量纲的影响。第2步:根据标准化后的数据计算相关系数矩阵第3步:求出相关系数矩阵的特征根及特征向量。第4步:确定主成分,并对主成分的含义作出适当的解释2019/12/1743.主成分的选择:首先选择方差最大主成分,若不足以代表原来变量,再选择第二个主成分,以此类推,一般要求所选主成分方差总和占全部方差的80%以上。4.解释主成分:因子载荷矩阵的各列与标准化后的原始变量的线性组合。5.主成分分析步骤:第1步:对原始变量进行标准化,消除变量水平和量纲影响。第2步:根据标准化后的数据计算相关系数矩阵。第3步:求相关系数矩阵特征根及特征向量。第4步:确定主成分,对主成分的含义作出适当解释。6.SPSS操作:①选择分析【Analyze】——降维【DataReduction-Factor】,进入主对话框,如下图所示:②在主对话框中将所有原始变量点击选入变量【Variables】③点击描述【Descriptives】,在相关矩阵【CorrelationMatrix】下选择系数【Coefficients】,点击继续【Continue】回到主对话框。④点击抽取【Extraction】,在输出【Display】下选择碎石图【ScreePlot】,点击继续【Continue】回到主对话框。⑤点击旋转【Rotation】,在输出【Display】下选择载荷图【LoadingPlot】,点击继续【Continue】回到主对话框。点击【OK】7.课后习题:2019/12/175课本P27112.1对2007年30家能源类上市公司有关经营数据进行主成分分析:spss基本操作:①选择分析【Analyze】——降维【DataReduction-Factor】,进入主对话框,如下图所示:2019/12/176②在主对话框中将所有原始变量点击选入变量【Variables】③点击描述【Descriptives】,在相关矩阵【CorrelationMatrix】下选择系数【Coefficients】,点击继续【Continue】回到主对话框。2019/12/177④点击抽取【Extraction】,在输出【Display】下选择碎石图【ScreePlot】,点击继续【Continue】回到主对话框。⑤点击旋转【Rotation】,在输出【Display】下选择载荷图【LoadingPlot】,点击继续【Continue】回到主对话框。点击【OK】2019/12/178(1)各变量之间的相关系数矩阵:变量之间存在较强相关关系,适合做主成分分析。2019/12/179(2)各主成分所解释的原始变量方差:前3个主成分的累计方差贡献率为70.667%,虽然不到80%,但第4个主成分的特根小于1,因此选择前3个比较合适2019/12/1710(3)碎石图:碎石土可以看出6个主轴长度的变化趋势,显然第4个开始变化平缓,因此,选择主轴变化趋势出现拐点的前3个主成分作为原始变量的代表。2019/12/1711(4)主成分因子载荷矩阵:876543211147.0329.0434.0573.0363.0824.0804.0490.0xxxxxxxxy876543212524.0248.0672.0643.0603.0049.0066.0698.0xxxxxxxxy876543213219.0610.0332.0219.0498.0464.0442.0113.0xxxxxxxxy主成分2019/12/1712(5)载荷图:第一主成分主要解释了x2(净资产收益率)和x3(每股收益);第二个主成分主要解释了x1(主营业务利润)、x4(总资产周转率)和x5(资产负债率)、x6(流动比率)、x8(资本积累率);第3个主成分主要解释了x7(主营业务收入增长率)。2019/12/171312.3对50名学生的成绩进行主成分分析,选择几个综合变量表示6门课成绩:SPSS操作过程同上,这里只对结果分析(1)各变量之间的相关系数矩阵:变量之间存在较强相关关系,适合做主成分分析。课本P2722019/12/1714(2)各主成分所解释的原始变量方差:前2个主成分的累计方差贡献率为82.242%,选择前两个主成分代表原始变量6门课的成绩2019/12/1715(3)碎石图:碎石土可以看出6个主轴长度的变化趋势,显然第3个开始变化平缓,因此,选择主轴变化趋势出现拐点的前2个主成分作为原始变量的代表。2019/12/1716(4)主成分因子载荷矩阵:6543211781.0800.0886.0803.0584.0794.0xxxxxy6543212420.0388.0325.0252.0695.0401.0xxxxxxy主成分:2019/12/1717(5)载荷图:第一个主成分既解释了数学、物理和化学3门课程成绩,又解释了语文、历史和英语3门课程成绩。前3个主成分的载荷为负值,后3个为正值,可能为文理科课程性质所导致。第二主成分与6门课课程成绩均变现为正值。2019/12/171812.5运用主成分分析对我国31个省市自治区的工业企业经济效益进行综合评价:(1)各变量之间的相关系数矩阵:变量之间存在较强相关关系,适合做主成分分析。课本P2722019/12/1719(2)各主成分所解释的原始变量方差:前三个主成分合计可以解释89.573%的原始变量信息,选择前三个主成分。2019/12/1720(3)碎石图:碎石土可以看出18个主轴长度的变化趋势,显然第4个开始变化平缓,因此,选择主轴变化趋势出现拐点的前3个主成分作为原始变量的代表。2019/12/1721(4)主成分因子载荷矩阵:主成分Y=AX(A为载荷矩阵,X为原始变量)2019/12/1722(5)载荷图:(5)综合评价:从主成分Y1、Y2、Y3的函数关系式可以看出,在第一个主成分线性组合中,除去14、15、16、17、18变量系数小于0.2,其余变量均在0.27左右,说明除去这五个变量的其他变量在第一主成分中所起到的做用相当。而第15、17变量取值为负,其中,X17系数绝对值为0.0903,说明X17的取值越大主成分Y1的取值越小。从而知道它们对第一主成分表达式起明显的减值作用。即说明工业成本费用利润率的取值越大Y1的值越小,X17是工业成本费用利润率,是反映降低成本的经济效益的指标,(利润总额/成本费用总额),该项指标增大时,反映了企业投入新技术降低成本费用的同时使得总利润增大,因此,Y1在综合反映了其他变量反映的信息的基础上,突出反映了工业企业投入新的生产技术使得成本费用减少的能力。2019/12/1723综合评价:在第二主成分中,系数绝对值最大的是X15的系数,-0.672,X15表示的是资产的负债率,X15的取值越大,Y2的取值越小,即资产负债率越大,Y1的值越小,所以X15对Y1是减值作用;系数绝对值排在第二位的是X18的系数,0.588,X18表示产品销售率,X18取值越大,Y2值越大,所以X18对Y2是增值作用。因为在实际中,各个变量的取值都很大,所以系数相差0.1往往都能带来很大的实际差异。从Y2的函数表达式中我们可以看出,Y2的大小主要是由X15、X18的取值与各自系数的乘积之间的和所决定。资产负债率(总负债/总资产)是衡量企业利用债权人资金进行经营活动能力的指标。产品销售率(产品销售数/产品生产数)是反映企业产品已实现销售的程度,是分析企业产销衔接情况的指标。所以Y2突出反映的是企业负债筹集资本作为产销成本的利用能力。2019/12/1724综合评价:在第三主成分中,系数最大的分别是X17、X14、X16,系数分别为0.856、0.6825、0.611;X17、X14、X16分别表示工业成本费用利润率、总资产贡献率和流动资产周转次数。工业成本费用利润率是反映降低成本的经济效益的指标;总资产贡献率是反映全部资产的获利能力,是评价企业营业能力的核心指标;流动资产周转次数(产品销售收入/流动资产平均余额)是反映企业筹、产、销综合能力的指标。因为Y3的大小主要有着三个变量的取值大小所决定,所以Y3突出反映的是企业的综合盈利能力。2019/12/17251.因子分析意义:2.数学模型:通过对变量之间关系的研究,找出能综合原始变量的少数几个因子,使得少数因子能够反映原始变量的绝大部分信息,然后根据相关性的大小将原始变量分组,使得组内的变量之间相关性较高,而不同组的变量之间相关性较低属于多元统计中处理降维的一种统计方法,其目的就是要减少变量的个数,用少数因子代表多个原始变量pkpkpppkkkkfafafaxfafafaxfafafax22112222212121121211112019/12/17263.共同度量与方差贡献率:4.因子分析步骤:(1)数据检验(2)因子提取(3)因子命名和解释(4)计算因子得分)21(122piahkjiji,,,)21(122kjagpiijj,,,2019/12/17275.SPSS操作:第1步选择【Analyze】【DataReduction-Factor】主对话框。将所有原始变量选入【Variables】第2步点击【Descriptives】【correlationMatrix】【KMOandBartlett’stestofsphericity】(其他选项根据需要)【Continue】第3步点击【Extraction】,在【Method】框中选择因子的提取方法(本例使用隐含的Principalcomponents);在【Extract】中输入选择因子的最小特征根(隐含的是特征根大于1);在【Display】下选择【ScreePlot】【Continue】第4步点击【Rotation】,在【Method】框中选择因子旋转方法(隐含的不旋转,本例选择【Varimax】);在【Display】下选择【LoadingPlot】【Continue】第5步点击【Scores】,并选中【DisplayfactorScorecoefficientmatrix】(SPSS隐含的估计因子得分系数的方法是Regression)【Continue】【OK】6.课后习题:2019/12/1728①选择分析【Analyze】——降维【DataReduction-Factor】,进入主对话框,如下图所示:12.2(1)检验12.1数据是否适合因子分析(2)对12.1进行因子分子课本P2722019/12/1729②在主对话框中将所有原始变量点击选入变量【Variables】③点击描述【Descriptives】,在相关矩阵【CorrelationMatrix】下选择系数【Coefficients】,KMO和Bartlett球度检验【KMOabdBartlett’stestofsphericity】,点击继续【Continue】回到主对话框。2019/12/1730④点击抽取【Extraction】,方法【Method】中选择因