主成分分析(论文)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

高校人文社科科研综合实力评价研究摘要一、问题重述高校人文社科科研综合实力评价研究根据所给数据,并搜集更多相关数据,回答下面的问题1.研究数据之间的内在关系;2.设计几种方案对各省市科研实力进行综合评价并进行分类,论证方法的合理性,给出合适的建议二、条件假设(1)假设高校人文社科科研指标在一定程度上会反映高校的人文社科科研综合实力(2)假设资料所提供数据准确有效三、符号约定x—同一葡萄酒样品的平均值_四、问题分析3.主成分分析法建立模型:基于主成分分析法研究高校人文社科科研综合实力影响高校人文社科科研综合实力的成分有很多,例如投入的人年数,投入科研事业经费,课题总数等等。常用于研究各变量对结果影响因素的方法有多元回归分析、主成分分析、因子分析、回归分类树等。每种算法各有各的特点,本文尝试选取主成分分析法。主成分分析:PCA是将多指标重新组合成一组新的无相关的几个综合指标,是根据实际需要从中选取尽可能少的综合指标,以达到尽可能多地反应原指标信息的分析方法。由于这种方法的第一主成分在所有的原始变量中方差最大,因而综合评价函数的方差总不会超过第一主成分的方差,所以该方法有一定的缺陷。(1)题中共给影响高校人文社科科研综合能力的7种因素,分别是投入人年数、投入高级职称的人年数、投入科研事业费、课题总数等。设各影响因素为p2,1,...,xxx,它们的综合指标——主成分设为:p,,...,,21mzzzm其中,则pp2211p12121111.........xlxlxlzlxlxlzmmmmmzzz,...,,21分别为原变量指标p21,...,,xxx的第一,第二,…,第m个主成分。(2)对原始数据进行标准化处理由于原始数据的量纲不同,为了使不同量纲的数据能够进行运算,故对数据进行标准化处理。设有随机变量x1,x2,…,xp,其样本均数记为1x,2x,…,px,样本标准差记为S1,S2,…,Sp。首先作标准化变换(3)计算相关系数矩阵,对应的特征值p,...,,21(按从小到大排列)及其对应的特征向量SXXxpppppprrrrrrrrrR......................212222111211,其中nkjkjnkikijkjnkikiijxxxxxxxxr2211()()()()(4)计算主成分贡献率及累计贡献率主成分iz的贡献率为:),...,2,1(1pipkki累计贡献率为:),...,2,1(11pipkkikk一般取累计贡献率达85%左右的特征值m,...,,21,对应第一、二,…,)(pmm个主成分。(5)根据第一主成分的得分对高校人文社科科研综合实力进行评价模型求解:一般认为,在主成分分析法中,主成分的累计特征值占特征值总和的85%左右时,即可视为第一、二……主成分。根据题中所给数据,在SPSS中进行主成分分析,得到如下结果。解释的总方差成份初始特征值提取平方和载入合计方差的%累积%合计方差的%累积%15.99485.63185.6315.99485.63185.6312.6489.25894.8893.1672.39297.2814.1171.66998.9505.047.67399.6236.022.31799.9407.004.060100.000提取方法:主成份分析。根据表格结果可知,第一项的累计贡献率就达85.631%,故投入人年数即为影响高校人文社科科研综合实力的第一主成分。该省投入人年数越高,则其省内所有高校人文社科科研综合实力越强。仅按第一项因素排序,可得排名前三位的省份分别是:北京(6795.0)、江苏(5480.0)、湖北(4427.0),排名较落后的三位分别是:海南(163.0)、青海(159.0)、西藏(75.0)。

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功