第8章统计实验(因子分析)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1实验四R型因子分析1.实验目的:本实验讨论利用R型因子分析从具有错综复杂关系的变量中,找出数量较少的几个公因子来描述原始的变量,并且尽量减少信息的损失。通过该实验,能够起到如下的效果:(1)理解因子分析的作用、思想、数学基础、方法和步骤;(2)熟悉如何利用因子分析,提出问题、分析问题、解决问题、得出结论;(3)会调用SAS软件实现因子分析的各个步骤,根据计算的结果进行分析,得出正确的结论,解决实际的问题。2.知识准备:R型因子分析是从具有错综复杂关系的变量中,找出数量较少的几个公因子来描述原始的变量,并且尽量减少信息的损失。其思想是:找出少量的不相关的若干个随机变量(公因子),))尽最大信息的描述原始众多的关系复杂的变量。其数学模型有很多,如正交因子模型【1】,因子分析模型L【4】等,它们的数学模型和方法均有不相同。我们下面采用因子分析模型L来进行分析。R型因子分析的步骤大体分为:首先正向化指标;然后计算样本相关阵的特征值、单位特征向量和方差贡献率,根据方差贡献率选取适当数量的初始因子,并得到初始因子载荷阵;再对初始因子进行旋转,选用行及列的元素的绝对值向0、1分化严重的旋转因子载荷阵对应的旋转因子作为最终的公因子;最后利用因子载荷阵求出因子得分函数。3.实验内容:表1的数据是全国30个省市自治区经济发展基本情况,其中X1-GDP,X2-居民消费水平,X3-固定资产投资,X4-职工平均工资,X5-货物周转量,X6-居民消费价格指数,X7-商品零售价格指数,X8-工业总产值,数据来源:1996年《中国统计年鉴》;见【1】表1全国30个省市自治区经济发展基本情况序号省市X1X2X3X4X5X6X7X81北京1394.892505519.018144373.9117.3112.6843.432天津920.112720345.466501342.8115.2110.6582.513河北2849.521258704.8748392033.3115.2115.81234.854山西1092.481250290.94721717.3116.9115.6697.255内蒙832.881387250.234134781.7117.5116.8419.396辽宁2793.372397387.9949111371.1116.11141840.557吉林1129.21872320.454430497.4115.2114.2762.478黑龙江2014.532334435.734145824.8116.1114.31240.379上海2462.575343996.489279207.4118.71131642.9510江苏5155.2519261434.9559431025.5115.8114.32026.6411浙江3524.7922491006.396619754.4116.6113.5916.5912安徽2003.5812544744609908.3114.8112.7824.1413福建2160.522320553.975857609.3115.2114.4433.6714江西1205.111182282.844211411.7116.9115.9571.8415山东5002.3415271229.5551451196.6117.6114.22207.6916河南3002.741034670.3543441574.4116.5114.91367.9217湖北2391.421527571.684685849120116.61220.7218湖南2195.71408422.6147971011.8119115.5843.8319广东5381.7226991639.838250656.5114111.61396.352续表序号省市X1X2X3X4X5X6X7X820广西1606.151314382.595105556118.4116.4554.9721海南364.171814198.355340232.1113.5111.364.3322四川35341261822.544645902.3118.51171431.8123贵州630.07942150.844475301.1121.4117.2324.7224云南1206.6812613345149310.4121.3118.1716.6525西藏55.98111017.8773824.2117.3114.95.5726陕西1000.031208300.274396500.9119117600.9827甘肃553.351007114.815493507119.8116.5468.7928青海165.31144547.76575361.6118116.3105.829宁夏169.75135561.985079121.8117.1115.3114.430新疆834.571469376.955348339119.7116.7428.76(1)利用因子分析模型L进行分析,找出适当的公共因子及相应的因子得分函数;(2)利用上面的因子得分函数对样品进行聚类分析,并给出适当的结论。4.实验步骤:(1)利用因子分析模型L进行分析,找出适当的公共因子及相应的因子得分函数:1.读入数据,并且正向化指标;SAS程序:Dataeconomy1;inputX1-X8;cards;1394.892505519.018144373.9117.3112.6843.43920.112720345.466501342.8115.2110.6582.512849.521258704.8748392033.3115.2115.81234.851092.481250290.94721717.3116.9115.6697.25832.881387250.234134781.7117.5116.8419.392793.372397387.9949111371.1116.1114.01840.551129.21872320.454430497.4115.2114.2762.472014.532334435.734145824.8116.1114.31240.372462.575343996.489279207.4118.7113.01642.955155.2519261434.9559431025.5115.8114.32026.643524.7922491006.396619754.4116.6113.5916.592003.5812544744609908.3114.8112.7824.142160.522320553.975857609.3115.2114.4433.671205.111182282.844211411.7116.9115.9571.845002.3415271229.5551451196.6117.6114.22207.693002.741034670.3543441574.4116.5114.91367.922391.421527571.684685849120116.61220.722195.71408422.6147971011.8119115.5843.835381.7226991639.838250656.5114111.61396.3531606.151314382.595105556118.4116.4554.97364.171814198.355340232.1113.5111.364.3335341261822.544645902.3118.51171431.81630.07942150.844475301.1121.4117.2324.721206.6812613345149310.4121.3118.1716.6555.98111017.8773824.2117.3114.95.571000.031208300.274396500.9119117600.98553.351007114.815493507119.8116.5468.79165.31144547.76575361.6118116.3105.8169.75135561.985079121.8117.1115.3114.4834.571469376.955348339119.7116.7428.76;run;Dataeconomy2;seteconomy1;X9=100/X6;X10=100/X7;run;语句解释:“Dataeconomy1;”指将原始数据输入到文件“economy1”中;“InputX1-X8;cards;”指将后面的数据对应地赋予变量X1-X8;“Dataeconomy2;seteconomy1;”指调用“economy1”中的数据,经计算后存入“economy2”;“X9=100/X6;X10=100/X7”指将变量“X6、X7”进行正向化的计算,正向化后的数据分别存入变量“X9、X10”;2.调用因子分析程序,计算样本相关阵的特征值、单位特征向量和方差贡献率,并根据方差贡献率选取适当数量的因子作为初始因子;SAS程序:Procfactordata=economy2M=prinpriors=onep=0.8simplecorr;varX1-X5X9X10X8;run;语句解释:“Procfactor”指调用因子分析程序;“data=economy2”指调用“economy2”中的数据;“M=prin”指定因子提取的方法;可供选择的方法有:prin(主成份法)、prinit(主因子法)、mlim(最大似然法)等;“priors=one”指定所有变量的初始共性方差估计值为1;“p=0.8”指定选用的初始因子的累积贡献率和刚好大于0.8;“simple”指显示均值、标准差及观察个数;“corr”指显示相关系数阵或偏相关系数阵;“varX1-X5X9X10X8”指需要分析的变量是“X1-X5X9X10X8”,其它更多的语句参见4书【2】。运行结果及解释:图1相关阵的特征值、累计贡献率图1数据“Eigenvalue”指相关系数阵的特征值;“Difference”指本行特征值与下行特征值之差;“Proportion”指本行特征值对应初始因子的方差贡献率;“Cumulative”指本行及上面各行特征值对应初始因子的累积贡献率;图2因子载荷阵图1中数据结果说明:前3个因子的累计贡献率为0.8957,大于0.8,因此可以只取前3个因子作为初始因子;图2、图3中数据“Factor1-Factor3”是三个初始因子;图2中数据显示:载荷矩阵中元素的绝对值向0、1分化不明显,需要作因子旋转;图3方差贡献率图4中数据是变量“X1-X5X9X10X8”的共同度,数据显示:每个变量的共同度都大于或等于0.8,这说明选用3个公因子就可以反映所有变量的绝大部分信息;图4各变量的共同度3.调用因子分析程序,选取3个初始因子,利用正交方差最大旋转法进行因子旋转;SAS程序:Procfactordata=economy2R=Vn=3scoreout=result;varX1-X5X9X10X8;run;Procprintdata=result;varfactor1-factor3;run;语句解释:“R=V”指定因子旋转的方法;可供选择的方法有:V(正交方差最大旋转法)、Orthomax(最大正交旋转法)、Equamax(正交均方最大旋转法)等;5“n=3”指选取前3个因子为公因子;“score”指显示因子得分系数;“out=result”指将每个样品的因子得分“factor1-factor3”输出到文件“result”中;“procprintdata=result;varfactor1-factor3;”指将文件“result”中的数据“factor1-factor3”输出到屏幕上其它更多的语句参见书【2】。运行结果及解释:图5旋转变换的正交矩阵图6旋转后的因子载荷阵图7旋转后的方差贡献率图8旋转后各变量的共同度图9最终的因子得分系数实验结

1 / 9
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功