Copyright©2009AllRightsReserved,信息管理学院1决策方法与仿真华长生江西财经大学数学与管理工程系Email:huachsh@jxufe.edu.cn课程网站:©2009AllRightsReserved,信息管理学院2第5章多目标决策分析5.1多目标决策的目标准则体系5.2多维效用并合方法5.3层次分析方法(AHP)5.4数据包络分析(DEA)5.5主成分分析法(PCA)5.6目标规划方法Copyright©2009AllRightsReserved,信息管理学院3中国大学排行榜5.5.1案例中国大学排行榜——网大排行榜武书连排行榜(广东管理科学学院)中国校友会排行榜5.5主成分分析Copyright©2009AllRightsReserved,信息管理学院41.学术资源(1)博士点总数及学科分布;(2)硕士点总数及学科分布;(3)国家重点学科数及学科分布;(4)国家重点实验室、国家工程研究中心、国家人文社科重点研究基地数及学科分布;(5)国家级科技奖励。2.师资资源(1)具有博士的教师比例或教师在其领域获得最高学位的比例;(2)专任教师与学生比;(3)长江学者特聘教授人数或两院院士人数;(4)教师平均工资。教育投入:学术资源、师资资源、物质资源财力资源、学生情况5.5主成分分析案例:中国大学排行榜Copyright©2009AllRightsReserved,信息管理学院54.财力资源(1)生均行政经费的开支;(2)奖学金和助学金占行政经费的比例;(3)享受奖学金与助学金人数占全体学生比例;(4)专任教师与科研人员人均科研经费;(5)教师年平均收入(学校发放的部分);5.学生情况(1)学生填报志愿的录取率;(2)高考录取平均分;(3)各省市重点高中文理科前30名考生录取比率,各省市文理科前100名考生的录取比例;(4)研究生总数及其在全校学生中比率;(5)研究生报考与录取比率。3.物资资源(1)图书总量及生均藏书量;(2)图书馆用于购买新书的经费占图书馆开支的比例;(3)图书馆总面积及生均面积;(4)教师人均办公用房的面积;(5)体育馆总面积及生均面积5.5主成分分析案例:中国大学排行榜Copyright©2009AllRightsReserved,信息管理学院6教育产出:研究成果、成果转化、人才培养校友捐赠、声望声誉1.研究成果(1)课题批准总数及级别;(2)索引情况:SCI/EI/ISTP/CSTP/SSCI/A&HCI/CSSCI人均数;(3)获国家和国际奖励。2.科技成果转化(1)成果转化率;(2)成果转化效益。3.人才培养(1)7月~9月前毕业生一次就业率(毕业率);(2)7月前毕业生考取其他院校研究生人数及比率;(3)毕业生国外院校奖学金获得者与录取人数及比率;(4)留学生比例(在同专业学生中的比例;来自五大洲的比例);(5)国家级大赛学生获奖情况(电子设计、数模、桃战杯,英语演讲、机器人大赛等)。4.校友捐赠校友平均捐赠率。5.声望或声誉知名学者专家、校长、官员、企业家问卷调查。5.5主成分分析案例:中国大学排行榜Copyright©2009AllRightsReserved,信息管理学院7如此多的指标(40多个),都与学校的排名和声誉有关但又可能互相重叠交叉,如何处理这些指标才够客观合理。企业生产率评价品牌知名度评价等等5.5主成分分析案例:中国大学排行榜其他类似问题各地区居民消费评价Copyright©2009AllRightsReserved,信息管理学院8主成分分析法(PCA)Copyright©2009AllRightsReserved,信息管理学院9KarlParson在1901年引进的,针对非随机向量Hotelling1933年将这个方法推广到随机向量.中国大学排行榜问题学术资源x1、师资资源x2、物质资源x3、财力资源x4、学生情况x5、科研成果x6、成果转化x7、人才培养x8、校友捐赠x9、……..n所大学p个指标清华、北大、复旦、南开…...江西财大等5.5主成分分析基本思想Copyright©2009AllRightsReserved,信息管理学院10多数情况下,不同指标之间是有一定相关性.财力资源、物质资源科研成果、成果转化人才培养、校友捐赠相互关联5.5.2基本思想主成分分析就是设法将原来众多具有一定相关性的指标(比如p个指标),重新组合成一组相互无关的综合指标来代替原来指标。通常数学上的处理就是将原来p个指标作线性组合,作为新的综合指标。5.5主成分分析基本思想Copyright©2009AllRightsReserved,信息管理学院11ppxaxaxaF12121111第一综合指标paaa11211、、、如何取最大的方差)var(11FF第二综合指标ppxaxaxaF22221212?)var(22最大吗的方差FF即正交不相关,即和还要要求,0),cov(2121FFFF以此类推,可以创建第三、第四、以至第p个综合指标,同时后面的主成分也要前面所有的主成分正交在实际工作中,一般取信息量包含85%以上的前几个综合指标,虽然这样做会损失一部分信息,但是我们已经获取了主要信息,并从原始数据中进一步提取了某些新的信息。5.5主成分分析基本思想Copyright©2009AllRightsReserved,信息管理学院12以此类推的的线型函数中方差最大是)(或正交;不相关)(且满足条件综合指标为:,,,,2,,1),,2,1(12112222122112222121212121111pjiipiippppppppppxxxFFFpiaaaxaxaxaFxaxaxaFxaxaxaF此时所选取的综合指标,相当于在原指标的基础上,进行了坐标旋转,使得第一个指标的方差最大(含有最多的信息)。5.5主成分分析基本思想Copyright©2009AllRightsReserved,信息管理学院13阵为:个指标,相应的指标矩个项目,设有pn5.5.3主成分的推导,npnnpppxxxxxxxxxXXXX21222211121121............),,,(,XxaxaxaFpp2211综合指标为)',,,(21paaa其中组合系数为1'),(12piia且要求5.5主成分分析Copyright©2009AllRightsReserved,信息管理学院14最大,使)var(FWXXF')var(')var()var(,的特征根为若021pW,为:对应的正交特征向量组puuu,,,21,)',,,(21paaa其中组合系数为jpjjuk1令协方差矩阵)var(XWpjjjpjjjukWukF11)var(pjjjk1pjjjjpjjjukuk11112pjjk且jjjuWu且5.5主成分分析主成分的推导Copyright©2009AllRightsReserved,信息管理学院15主成分为第,为第二主成分,为第一主成分,此时,称nFFFn...211111)var(,FXuF因此,)var(,1最大时Fu1)var(axFm且同理,ppXuFXuFXuF,,,3322有pjFjj,,2,1,)var(个主成分的贡献率为第称jfpijj1i/个主成分的累积贡献率为前kfkjj1时个主成分的累积贡献率前通常85.0,1kjjfk我们就取前k个主成分5.5主成分分析主成分的推导Copyright©2009AllRightsReserved,信息管理学院165.5.4主成分分析法的步骤1)样本数据处理pjniajipnij,,2,1,,2,1)(;,项指标为个项目的第项指标,第有,每项项目公司、产品、项目等个项目有待评估的npnnppaaaaaaaaa212222111211项目指标指标间的差异),,,(21paaa5.5主成分分析Copyright©2009AllRightsReserved,信息管理学院17)var(jjijijaaax,其中niijjana11nijijjaana12)(11)var(标准化标准化数据矩阵),,,(21pxxxnpnnppxxxxxxxxxX212222111211njjjjxxxx215.5主成分分析主成分分析法的步骤Copyright©2009AllRightsReserved,信息管理学院182)计算相关系数矩阵pppppprrrrrrrrrR212222111211的相关系数,和为向量jiijxxr)var()var(),cov(jijiijxxxxrnkjkjikijixxxxnxx1))((11),cov(nkkiixnx11相关系数矩阵5.5主成分分析主成分分析法的步骤Copyright©2009AllRightsReserved,信息管理学院193)求相关系数矩阵R的特征值和特征向量矩阵特征向量矩阵0)det(ER021ppuuu,,,21)(21puuuU,,,5.5主成分分析主成分分析法的步骤矩阵R的特征值和特征向量4)求主成分的贡献率,确定因子piiiif1/特征值的累积贡献率kiikf1如果超过0.85,则说明前k个主成分基本包含了全部指标具有的信息,因此可以只选前k个主成分来进行分析kCopyright©2009AllRightsReserved,信息管理学院20)()(2121kkzzzXuXuXuz,,,,,,5)计算主成分值前k个主成分值6)计算样本评价值kiiizfY1nyyy21根据样本评价值对待评估项目进行排序5.5主成分分析主成分分析法的步骤