首先声明:师姐的论文小师弟小师妹们不要抄哦,会被认出来哦~-0-基于sas软件的我国2013年各省规模以上工业企业资产情况分析摘要本文首先将取得的我国2013年各省规模以上工业企业资产情况数据进行图形显示,初步对指标的相关性进行判断。其次基于因子分析原理在sas中对2013年中国各省(市)工业企业资产相关数据进行分析,得出了中国31个省(市)在2013年的工业企业资产发展状况综合得分。再次基于因子分析中各省得分结果对31个省(市)进行聚类,得出了31个省(市)2013年的工业企业资产发展状况分类情况。最后在sas中,使用了gmap语句尝试对此前分析出的各省发展状况结果进行地图化、三维的立体显示结果。关键词:规模以上工业企业;sas统计地图;因子分析;聚类分析;数据可视化;引言工业发展状况是我国经济发展的一项重要指标,中国国家统计局每年都要对我国不同地区相关工业企业的发展情况进行调查统计,最终将结果出示在中国国家统计局统计年鉴中。如何将这些数据进行分析利用将会很大程度上体现这些统计数据的价值。从取得的我国2013年各省规模以上工业企业资产情况数据来看,我国在2013年的工业统计数据在每个省(市)都有所差异,本文利用因子分析法从宏观上对31个省(市)2013年的工业企业资产表现进行评价排名,将我国2013年各省规模以上工业企业资产情况因子得分结果进行聚类分析,最后就因子得分结果进行了sas三维统计地图的可视化展示,使得2013年31个省(市)的工业企业资产发展状况有了直观的展示方式。这样的展示流程可以用在每一年的年度数据可视化报表中,清晰直观的展示各地区每年工业发展状态。本文的创新之处在于采用了不同的数据展示结果,sas中的gmap语句使得区域数据的可视化变为可能,并且使得结论可以直观展现。首先声明:师姐的论文小师弟小师妹们不要抄哦,会被认出来哦~-1-一.模型方法(一)知识准备(1)规模以上企业国家对不同行业的企业都制订了一个规模要求,达到规模要求的企业就称为规模以上企业,规模以上工业企业在2010年之前是指年主营业务收入在500万元及以上的法人工业企业;2011年是指年主营业务收入在2000万元及以上的法人工业企业。(2)因子分析因子分析法是通过对样本相关阵的内部依赖关系的研究,将一些具有一定关系的变量或样本归结为较少的几个不可观测的综合因子(又称主因子)的多元统计分析方法。首先由相应计算确定主因子的个数,建立因子模型,如果求出主因子解后,各个主因子的解释力度不够,还需要进行因子旋转,以得到一个更有解释意义的因子结构,最后应用因子分析模型去评价每年的中国规模以上企业资产总额在整个模型中的地位,即进行综合评价。(3)聚类分析聚类分析就是用数学方法研究和处理给定对象的分类。作为多元统计方法的一种,聚类分析又称为群分析,它是研究样品或指标的分类问题。聚类分析的研究不仅具有重要的理论意义,也具有重要的工程应用价值和人文价值。随着我们知识水平的不断提高,在实际生活和工作中,面对经常遇见分类问题,要求也越来越严格。例如,核算分析我国31个省市自治区工业企业效益等。(4)sas统计地图在sas软件中,除了系统自带的sasuser以及sashelp数据库中的现有数据之外,还存在一种专用于绘制统计读地图的maps数据库,数据库中存储了来自纾解各地区域图形的统计数据,其中也包含了中国完整轮廓地图,只要利用相关数据进行地图连接便可以绘制出不同种类的地图,有blockmap、prismmap等等,本文中使用的是prismmap。(二)因子分析第一步:将31个省(市)2013年工业企业资产相关数据进行分析。首先对反应工业企业资产情况的企业单位数、资产总计、流动资产总计、负债合计、所有者权益合计、主营业务收入、主营业务成本、主营业务税金及附加、利润总额、本年应交增值税、总资产贡献率、资产负债率、流动资产周转次数、工业成本费首先声明:师姐的论文小师弟小师妹们不要抄哦,会被认出来哦~-2-用利润率一共14种指标进行初步趋势预判,在sas中绘制多线图来观察各个指标的变化趋势;第二步:对14个指标之间的相关系数进行分析,编程运算出各个指标之间的相关系数,将绝大部分相关系数大于0.3的指标留下,将剩余指标排除;第三步:在matlab软件中对剩余指标进行因子分析,利用matlab对应的因子分析语句进行处理,将因子得分情况输出在工作框中。(三)聚类分析第一步:在sas中将因子分析结果作为参照变量(指标),对31个省进行2013年规模以上工业企业资产运营状况的编程聚类分析。第二步:针对聚类分析结果进行解释。(四)数据可视化第一步:将2013年全国31个省规模以上工业企业资产运营能力综合得分数据作为基础数据,并以sas软件中地图数据集为参考进行数据集的构建。第二步:在sas中编程实现数据的prismmap可视化展示。第三步:对展示结果进行结合实际的分析。二.结果分析(一)指标对应说明1符号指标含义place地区num企业单位数sum资产总计flu流动资产总计own负债合计power所有者权益合计prim主营业务收入prima主营业务成本tax主营业务税金及附加income利润总额1由于部分指标长度过长,显示在结果输出界面时使得图表过于臃肿,截图遇到困难,所以这里将指标和地名统一加以符号化首先声明:师姐的论文小师弟小师妹们不要抄哦,会被认出来哦~-3-xtax本年应交增值税rgive总资产贡献率rown资产负债率time流动资产周转次数rmon工业成本费用利润率表1:表示符号对应指标查明表2123456789101112131415北京天津河北山西内蒙古辽宁吉林黑龙江上海江苏浙江安徽福建江西山东表2:数字代表区域意义信息表(聚类分析部分)16171819202122232425262728293031河南湖北湖南广东广西海南重庆四川贵州云南西藏陕西甘肃青海宁夏新疆表3:数字代表区域意义信息表(聚类分析部分)(续表)安徽浙江江西江苏吉林青海福建黑龙江河南河北湖南湖北新疆西藏甘肃广西12345678910111213141516表4:数字代表区域意义信息表(数据可视化部分)贵州辽宁内蒙古宁夏北京上海山西山东陕西天津云南广东海南四川重庆181920212223242526282930313233表5:数字代表区域意义信息表(数据可视化部分)(续表)(二)指标走势图2由于在《2013年中国统计年鉴》中各省市排名的次序与sas软件中自带的maps数据库各省数据顺序不同,所以这里单独列出相关关系以免混淆首先声明:师姐的论文小师弟小师妹们不要抄哦,会被认出来哦~-4-图1:2013年我国31个省(市)规模以上工业企业资产运营指标走势图由图1我们可以发现在2013年我国31个省(市)规模以上工业企业资产运营指标中,绝大部分指标的走势都是一致的,31个省(市)在指标值方面大小差异有大有小,但是基本取向一致,没有异常数据出现。(三)指标相关系数图2:指标相关系数图(显著部分)首先声明:师姐的论文小师弟小师妹们不要抄哦,会被认出来哦~-7-由图中数据可知,通过变量相关性检验并且效果较好的指标为:企业单位数、资产总计、流动资产总计、负债合计、所有者权益合计、主营业务收入、主营业务成本、主营业务税金及附加、利润总额、本年应交增值税。(四)指标因子分析图3:因子分析因子贡献率表由上表可以看出,在提取第一个主因子的同时,该因子对指标的贡献率就已经达到了93.94%,这样的累计贡献率已经超过85%,它对每一个单独的剩余因子的贡献最小为85.52%,大多数集中在97%-98%之间,这样的贡献率效果说明该主成分已经可以用来作为唯一主因子进行因子分析。利用该主因子打出的全国31个省规模以上工业企业资产运营能力综合得分如下:首先声明:师姐的论文小师弟小师妹们不要抄哦,会被认出来哦~-8-图4:各省(市)在2013年规模以上工业企业资产运营综合得分表(五)指标聚类分析对中国2013年31个省规模以上工业企业资产运营能力综合得分的分析我们在可视化之后具体进行,接下来是由因子打分结果得出的对中国2013年31个省规模以上工业企业资产运营能力聚类分析结果:图5:2013年中国31个省(市)规模以上企业运营能力聚类结果图首先声明:师姐的论文小师弟小师妹们不要抄哦,会被认出来哦~-9-将结果进行解读,则可以看到,中国2013年31个省规模以上工业企业资产运营能力大致可以聚为三类,第一类是由江苏、山东、广东构成的规模以上工业企业运营能力较强实力队,第二类是由浙江、河南、辽宁、四川、湖北、上海构成的规模以上工业企业运营能力中实力队,剩余包括新疆、西藏、安徽、陕西在内的规模以上工业企业运营较弱实力队。(六)分析结果可视化图6:中国2013年31个省规模以上工业企业资产运营能力综合得分统计地图首先声明:师姐的论文小师弟小师妹们不要抄哦,会被认出来哦~-10-从上图来看,在2013年,我国各个省市规模以上工业企业资产运营能力差异显著,其中,可以明显看出在沿海东部地区的省份规模以上工业企业资产运营能力相对较好,而在西部地区规模以上工业企业资产运营能力整体较弱。按照具体观察来说,我国在2013年江苏、山东、广东省的规模企业资产运营效果明显好于其它省份,这样的观察结果与聚类分析结果相一致。而在整体实力相对较弱的西部地区,新疆省的表现算是西部地区的首位。结合实际我们可以知道,新疆地区的规模以上工业企业主要以轻工业为主,例如在2012年,新疆的塑料节水器材产业已发展成为中国最重要的产业基地,产量世界第一,类似这样的产业为新疆的规模以上工业企业提供了发展的前景,也很大程度上拉动了新疆地区工业产业的资产运营实力。三.结论通过全文的分析,我们可以较为全面的得到中国2013年各个省(市)在规模以上工业企业资产运营方面具体高低、所属类别的情况,并且可以直观的感受不同省(市)2013年规模以上工业企业资产运营能力高低的区别。在所有的31个省(市)中,一共可以将规模以上工业企业资产运营能力分为三等,其中江苏、广东、山东三个东部沿海城市居于资产运营首位,这与三个省的地理位置关系密不可分,另外,居于西部的省份大多处于资产运营能力的最底层,仍然无法与中东部省份相抗衡,但在西部省份中,新疆省凭借自身开发的轻工业规模以上企业优势超越了西部大部分省份的资产运营能力。从研究过程看,本文的研究方法还存在一些缺陷,比如在数据可视化的阶段,将各个省(市)综合得分处理为正值的时候仅仅运用了集体加100的方式,这样使得数据间相对大小不变但相对比例发生了变化,并不是十分科学的展现省(市)之间的资产运营能力比例情况。但是本文比较好的一点就是尝试了使用sas丰富的数据库资源,并且采用了可视化的方式来展示数据分析结果,使得数据分析结论不再是一堆数据,能够帮助我们更好的直观观察数据分析结果。首先声明:师姐的论文小师弟小师妹们不要抄哦,会被认出来哦~-11-附录1.sas相关代码数据输入部分libnamechinad:\baogao;datachina.map;inputplace$numsumfluownpowerprimprimataxincomextaxrgiverowntimermon;cards;北京370131398.2812772.7616363.6115034.6718624.8215798.25282.411254.78521.777.6652.121.547.09天津538322059.4112159.9614095.777963.6427011.1223208.38317.951992.76859.3316.0963.902.368.02河北1264936040.1714970.4321164.6114875.5645766.2540019.94423.242560.861112.9913.5658.733.206.02山西394628058.2711371.3720011.008047.2718404.6515687.34162.61547.91735