钢铁行业股票的聚类分析摘要随着经济的发展,人们已经越来越关心股票这一高风险高收入的投资项目,对此,本文运用多元统计办法,通过考察钢铁行业的一些相关指标数据,运用聚类分析理论中最成熟的系统巨雷方法,对这些指标数据进行分析,得出结论,帮助投资者选择最佳股票。关键词:总资产,主营业务收入,聚类分析,风险性1.导言股票至今已有将近400年的历史,它最早出现在资本主义国家,是社会化大生产的产物。发展到现在,股份有限公司已经成为资本主义国家最基本的企业组织形式;股票已经成为资本主义国家业筹资的重要渠道和方式,亦是投资者投资的基本选择方式;而股票的发行和市场交易亦已成为资本主义国家证券市场的重要基本经营内容,成为证券市场不可缺少的重要组成部分。同时,股份公司,股票和股票市场不是资本主义所持有的。我国是一个社会主义国家,在发展有计划商品经济的条件下,同样可以利用股份公司的企业组织形式,股票筹资的方式和股票市场的调节机制,为发展社会主义的有计划的商品经济服务。对国家来说,股票具有多方面的积极作用,它可以广泛地动员,积聚和集中社会的闲散资金,可以为改革完善我国的企业组织形式探索一条新道路,可以促进我国经济体制改革的深化发展,还可以扩大我国利用外资的渠道和方式,增强对外的吸纳能力等。同时有利于股份制企业建立和完善自我约束,自我发展的经营管理机制,有利于股份制企业筹集资金,满足生产建设的资金需要。对广大的投资者来说,可以开拓投资渠道,扩大投资的选择范围,适应了投资者多样性的投资动机,交易动机和利益的需求,一般来说能为投资者提供获得较高收益的可能性。但是由于股票价格既受政治,经济,市场因素的影响,亦受技术和投资者行为因素的影响,因此,股票股票价格经常处在频繁的变动之中。股票价格频繁的变动扩大了股票市场的投机性活动,使股票市场的风险性增大。股票投资是一种风险与收益相当的投资行为,所以对于股票的选择必须慎重考虑。本文就钢铁这一行业的股票进行分析。考虑同一行业在国际和国内环境的相似性,以及国家政策的同等性,在文中只对该上市公司及其股票的一些指标进行分析,得出相应的结果。并提出一些建议。2.模型分析的原理及其思想2.1聚类分析的基本思想聚类分析又称集群分析,是研究如何将客观事物合理分类的一种数学方法。它是根据食物本身的特性对被研究对象进行分类,使同一类中的个体有较大的相似性,不同类中的个体有较大的差异。它与判别分析同属类分析问题。聚类分析根据分类对象的不同,可分为样本聚类和变量聚类。样本聚类在统计学中又称为Q型聚类,它是根据被观测的对象的各种特性,对各变量值进行分类。变量聚类在统计学中又称为R型聚类,反映同一事物特点的变量有很多,我们往往选择部分变量对事物的某一方面进行研究。与多元分析的其他方法相比,聚类分析是从事物数量上的特征出发对事物进行分类,是数值分析学和多元统计技术结合的结果,是一种较粗糙的、理论并非完善的分析方法,但是其使用简便,分类效果较好,是常用的探索性分析工具,解决许多实际问题,所以很受人们的重视,同回归分析、判别分析一起被成为多元统计分析的三大方法。2.2聚类分析的分类聚类分析主要包括有:二阶段聚类、K中心聚类、层次聚类(系统聚类)1、二阶段聚类;二阶段聚类模型是一种新型的分层聚类算法,目前一般应用在数据挖掘与多元统计的交叉领域—模式分类中,其算法适用任何尺度的变量。2、K中心聚类:K中心聚类为一种快速聚类方法,适合处理大样本数据。K中心聚类要求聚类变量为数值变量,研究者事先需要制定分类数K,各分类中心的初值可以由研究者指定,也可以由程序自动给出。K中心聚类采用迭代算法,不断调整各分类中心位置,直到收敛。3、层次聚类(也称系统聚类)是实际工作中使用最多的一种方法。层次聚类法的层次含义是:开始时每个样品各看成一类,将距离最近的两类合并;重新计算新类与其他类的距离,再将距离最近的两类合并;再计算新类与其他类的距离,这样一步步地进行下去,每一步减少异类,直至所有的样品都合并成一类为止。整个聚类过程可绘成聚类图。类与一类之间的距离有各种不同的定义方法,定义不同即产生不同的算法,而不同的算法可能聚得不同的结果。选用何种结果合适,可以结合专业知识帮助判断。(1)类间平均法,倾向合并偏差较小的类。(2)类内平均法,倾向合并偏差较小的类(3)最邻近距离法,适用于非常离散的资料(4)最远距离法,为前两种方法的折中(5)中心法,分类效果较差,但稳健,对异常值不敏感(6)离差平方和法,倾向得到各类样品数目接近的分类结果分类效果好但对异常值敏感。2.3分析方法这次设计用的是聚类分析方法中理论比较成熟的系统聚类法。有雨类与类之间有以上几种距离的定义,所以系统聚类法主要有五种,分别为最短距离法、最长距离法、重心法、类平均法以及离差平均和法。本次分析用了五种方法对数据进行分析后选取一种最好的方法进行分析。3.原始数据及其数据分析3.1相关原始数据表一原始数据总资产主营收入净利润增长率每股净资产净资产收益率主营业无收入增长率每股资本公积金大钢不锈452.23178.65759.485.4638.43210.122.2008安阳钢铁159.2749.33721.723.382.9441.780.387鲁银投资15.678.44649.821.472.1336.150.144南钢股份100.0950.776144.036.2463.671.2055武钢股份490.85124.1604.62.996.02649.030.7368菜钢股份159.9669.38549.156.213.8621.541.477柳钢股份102.6446.78456.776.0954.9745.111.4646凌钢股份34.9216.01331.545.273.1512.90.8365华凌股份389.3892.63330.874.712.6431.521.8373济南钢铁160.1176.93325.844.256.1837.91.4288唐钢股份291.0795.69313.614.34.7754.341.4273杭钢股份9132308.825.182.0917.981.1401安泰股份37.537.92250.863.282.7344.130.8879承德钒钛108.630.23221.523.311.7958.591.162韶钢松山128.3632.16213.714.071.769.791.0413本钢板材259.577.03207.045.23231.9289.472.7758八一钢铁92.2426.68185.254.191.671.531.4495宝钢股份1778.4429.75156.384.854.3228.661.8749鹏博士5.931.6153.051.4710.939.570.329总资产(亿元)主营收入(亿元)每股净资产(元)每股资本公积金(元)3.2结果分析1、下面将数据输入到spss的编辑器,进行数据处理。过程如下:首先把数据输入到spss的编辑器,在菜单栏中选Analyze中的classify命令,再classify子菜单里的hierarchicalcluster(即系统聚类法),在stastistics里选中agglomerationschedule和proximitymatrix并且在rangeofsolutions中选3到7类;在plot中选dendrogram,cecle中选allclusters,orientation中选vertical;在method中选wardsmethod,standardize中选zcscores和byvariable。运行spss得到成员聚类表。表2成员聚类表广钢股份44.1412.87145.412.130.9243.530.8744三钢股份56.1721.89128.634.6948.511.3253包钢股份151.6348.31120.522.312.5339.450.6733宁夏恒力12.841.38115.132.4420.33225.381.1763鞍钢股份627.95160.17111.675.487.3632.632.1653邯郸钢铁242.8459.8492.414.122.1915.21.6586马钢股份585.4899.4379.533.1211.3130.320.8448ST长钢20.087.0875.710.814-1.4810.340.103大冶特钢29.7212.7466.283.1155.579.811.0807西宁特钢69.5910.6252.872.94812.03782.421.0905新华股份7.392.2643.881.8626.990.2721首钢股份170.2362.6741.852.6741.827.051.1422酒钢股份77.7440.6421.834.761.7453.611.1548抚顺特钢47.0410.7820.942.98603973.111.4118新型铸管93.9531.2720.884.04093.3914.181.4594福星科技49.364.7412.086.851.930.352.7588大连金牛36.67.048.193.780.2212.671.9529法尔胜38.964.87.722.60760.618.321.2287攀钢钢钒212.2146.8610.13.492.1836.961.4499贵绳股份12.132.191.084.531.3211.142.8937重庆钢铁103.1127.6502.922.4300.661根据上表给出的结果我选择聚为六类,因为它最符合实际。表3个案处理摘要图表4成员聚类表表5聚类过程结果2.通过对数据进行聚类分析,可以看到分为六类结果比较令人满意,其具体的分类结果如下:第一类包括:太钢不锈第二类包括:安阳钢铁、鲁银投资第三类包括:南钢股份、武钢股份、菜钢股份、凌钢股份、华菱股份、济南钢铁。唐钢股份。安泰集团、承德钒钛、韶钢松山、八一钢铁、鹏博士、广钢股份、三钢闽光、包钢股份、宁夏恒力、鞍钢股份、邯郸钢铁、ST长钢、大冶特钢、西宁特钢、新华股份、首钢股份、酒钢宏兴、抚顺特钢、新兴铸管、法尔胜、攀钢钢钒、重庆钢铁第四类包括:本港板材、福星科技、大连金牛、贵绳股份第五类包括:包钢股份第六类包括:马钢股份回顾分析指标,我们不难发现,就整体而言,几乎所有的上市其股票行情相当,也就是说,除了少数具有明显优势或者劣势的公司以外,钢铁行业的整体实力都维持在同一层次上。就太钢不锈来说,到07年3月31号为止,太钢不锈向投资者交了一份满意的答案:2006年,公司实现主营业务收入400亿元,同比上期增长了68.78%,实现净利润24亿元,同比增长幅度高达212.04%,净资产收益率达到18.25%,2006年控股股东太原集团向太钢不锈注入优质资产,由此,太钢不锈一跃实现了钢铁主业资产“一体化”。收购效益相当明显。与此同时,新产品的开发也使太钢不锈业绩斐然。由此引起太钢不锈股票前景一片大好。对于宝钢股份,其总资产以及主营业务收入在当前都排名第一,但是净利润排到十九,相对与总体净利润来说,成为负利润。并且,在往前看,06年12月31号,其情形基本相同。宝钢股份从总体上已经形成一定的固定形式,不能灵活的变动,再加上其管理阶层的人员变动不少,使其很难进步,但实力仍然雄厚。尤其是宝钢股份试制成X120管线,被认为是目前世界上最高强度的管线钢。马钢股份可以说是上市比较早的钢铁公司,实力雄厚其总资产和主管业务收入始终保持在前五名,尽管它的净利润仍为负数,但是就最近的几次总体数据来看,它一直是呈现积极的增长阶段,前景也可观。再看本钢板材、福星科技、大连金牛、贵绳股份这四支股票,后三支股票无论在主营业务收入、总资产,还是在净利润上,都不能和其他的一些股票相提并论,而且是长期在这样的状态下,一直很难改变现状,其趋势亦只能维持在这个状态。对于本钢板材,其效益比上面三个好,但是其前景同样不是很乐观。以它的净利润来说,在短短三个月内,由原来的第三名下