因子分析和聚类分析在证券投资中的应用摘要:中国证券市场作为一个新兴的证券市场,从2001年以来,市场环境发生了重大的变化。而市场环境的变化又导致盈利模式、投资策略和操作理念等诸多方面发生了深刻的变化。投资者开始对价格操纵型的市场盈利模式进行反思。本文通过因子分析和聚类分析方法分析了在中国证券市场如何进行投资决策的问题。通过对证券市场的背景的分析,阐述上市公司投资取向研究的重要性。通过因子分析为具体研究做好理论铺垫,并为优化各类投资者投资取向的选择提供可资借鉴的经验。将聚类分析方法引入证券投资分析中,建立较为全面的综合评价指标体系,衡量样本股票的相似程度。然后通过聚类分析模型来确定投资范围和投资价值。该方法能帮助投资者准确地了解和把握股票的总体特性,预测股票的发展潜力,并通过类的总体价格水平来预测股票价格的变动趋势,选择有利的投资时机。关键词:证券投资因子分析聚类分析AbstractChinesesecuritiesmarketasanemergingstockmarket,since2001,greatchangeshavetakenplaceinthemarketenvironment.Andthechangeofmarketenvironmentandleadtoprofitmode,investmentstrategyandoperationidea,profoundchangeshavetakenplaceinmanyaspects,suchas.Investorsbegantoreflectthemarketprofitmodelofthepricecontroltype.ThisarticlethroughthefactoranalysisandclusteranalysismethodstoanalyzehowtomakeinvestmentdecisionsinChinasecuritiesmarket.Throughtheanalysisofthebackgroundofthesecuritiesmarket,thepaperexpoundstheimportanceofinvestmentorientationoflistedcompaniestostudy.Throughfactoranalysistheoryforeshadowingfortheconcreteresearch,thechoiceofallinvestorsandtooptimizetheinvestmentorientationprovidestheexperienceforreference.Theclusteringanalysismethodisintroducedintothesecuritiesinvestmentanalysis,setupthecomprehensiveevaluationindexsystem,comprehensivemeasuresamplestocksimilarity.Andthenthroughtheclusteranalysismodeltodeterminethescopeoftheinvestmentandinvestmentvalue.Thismethodcanhelpinvestorstoaccuratelyunderstandandgrasptheoverallcharacteristicsofstock,predictthestockdevelopmentpotential,andthroughtheclass'soverallpricelevelcanbeusedtopredictthechangetrendofthestockprice,choosegoodinvestmentopportunity.引言:中国证券业自二十世纪九十年代至今正在迅速发展壮大,随着我国市场经济建设的不断发展,人们的金融投资意识也在日益加强,越来越多的投资者把目光放到了证券市场。但是由于我国起步较晚,证券业在发展中也存在不少问题。投资者往往只注重短期投资而忽略了长期投资。没有一个理性的投资态度很难在投资中获得收益。所以想在证券投资中获得回报就得认真的分析上市公司的过去的业绩并推测出未来的发展,找出具有投资价值的股票,进行长期投资。上市公司的财务指标能反映出公司的财务信息,但是如果投资者只是盲目的去翻看这些信息并不能从中得到对投资有利的信息。随着我国经济的稳定增长,上市银行也得到了快速发展,银行股的投资价值也越来越大。所以本文选取了10家上市银行的基本资料进行了综合分析。运用因子分析和聚类分析结合的方法研究股票的内在价值,全面反映上市银行的成长性和盈利能力,帮助投资者缩小投资范围,降低投资风险。行业分析及指标选择对行业水平建立相应的评价指标,目的在于使行业的定性分析转化为定量分析。总资产收益率直接反映了公司整体获利能力,净资产收益率反映公司股东的投资报酬的大小,主营业务是公司重点发展方向和利润的来源,主营业务收入增长率越大,表明公司扩大市场规模的能力越强,即公司的成长能力越强。本文选取了10家上市银行的6项财务指标,运用SPSS软件综合分析公司的盈利能力和成长能力能更好的体现公司的价值,为投资者提供更准确地投资信息。所有财务数据来源于各银行2011年年报的财务报表,数据整理如下:银行名称总资产收益率净资产收益率主营业务利润率主营业务收入增长率营业利润增长率净利润增长率工商银行1.4423.4457.0324.9526.3525.55建设银行1.4722.5154.8222.7525.3125.48农业银行1.1120.4641.4930.0631.2428.50中国银行1.1718.2751.3618.5518.5518.81交通银行1.1920.4951.1221.8030.5829.95招商银行1.3924.1748.4834.7241.4140.20民生银行1.4023.9545.2750.3962.0360.80光大银行1.1220.4452.4129.6641.4941.36兴业银行1.2024.6756.2337.7740.2438.21中信银行1.2721.0753.8437.9948.1141.62因子分析方法因子分析的思想起源于1904年斯皮尔曼发表的文章《对智力测验得分进行统计分析》,也是一种降维简化数据的技术。因子分析的基本思想是根据原始变量相关性大小进行分组,使得同组内的变量之间相关性较高,而不同组的变量间的相关性较低。每组变量代表一个基本结构。并用一个不可观测的综合变量表示,这个基本结构称为公共因子。对于所研究的某一个具体问题,原始变量就可以分解成两部分之和的形式,一个是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。因子分析的另一个重要应用是对变量或样本进行分类。当处理得到因子的表达式之后,将原始数据代入表达式就可以计算得到因子得分,在各因子所组成的空间中描绘出因子得分所在的点,这样就能形象的对变量或样本进行分类。首先通过‘KMO和BARTLETT的球形度检验’检验上述数据得出下表KMO和Bartlett的检验取样足够度的Kaiser-Meyer-Olkin度量。.558Bartlett的球形度检验近似卡方49.931Df15Sig..000由表看出,该数据适合用因子分析方法。对上述数据进行因子分析得到原始数据的标准化矩阵的均值,方差和相关系数矩阵求出该矩阵的6个特征根的大小,贡献率和累计贡献率,选定三个主成分成为新的公因子,简称因子,得出结果如下表解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的%累积%合计方差的%累积%合计方差的%累积%13.43057.16357.1633.43057.16357.1633.06651.09651.09621.62827.14084.3031.62827.14084.3031.58226.37377.4703.61010.16094.463.61010.16094.4631.02016.99394.4634.2734.54899.0105.053.88799.8976.006.103100.000提取方法:主成份分析。因此,将原来的十个变量综合为这三个因子,计算原变量对因子的载荷,并且正交旋转后得到旋转矩阵如下旋转成份矩阵a成份123营业利润增长率.978.095-.116净利润增长率.966.128-.130主营业务收入增长率.948.201-.158总资产收益率.015.956.089净资产收益率.487.757.180主营业务利润率-.202.173.961提取方法:主成分分析法。旋转法:具有Kaiser标准化的正交旋转法。a.旋转在5次迭代后收敛。从表中可以看出,第一个主成分与营业利润增长率和净利润增长率有关,称之为,效益因子。第二主成分与总资产收益率和净资产收益率有关,反映了企业的投资效益,称之为投资效益因子。第三主成分与主营业务利润率有关,主营业务反映了公司的成长能力,因此称之为成长能力因子。聚类分析方法聚类分析就是研究如何对样本或变量进行量化分类的多元数据分析方法。聚类分析的基本思想是认为所研究的样本或指标之间存在程度不同的相似性。根据一批样本的多个观测指标,具体找出一些能够度量样本或指标之间相似程度的统计量,以这些统计量为划分类型的依据,把一些相似程度较大的样本或指标聚合为一类,把另一些彼此之间相似程度较大的样本聚合为另一类,直到把所有的样本或指标都聚合完毕。聚类分析是依据分析数据本身具有的定量特征来对大量的数据进行分组归类,以了解数据的内在结构,使分类更具客观性,并能反映事物的内在必然联系。对上述数据进行聚类分析分成4类得到如下结果RescaledDistanceClusterCombineCASE0510152025LabelNum+---------+---------+---------+---------+---------+建设银行1-+工商银行2-+---+交通银行5-++-+中国银行4-----++-------+农业银行3-------++---------------------------------+招商银行6-+||光大银行8-+-------------+|兴业银行9-+|中信银行10-+|民生银行7-------------------------------------------------+分析结果将因子分析和聚类分析结果综合分析名称聚类分类因子一因子二因子三工商银行1-0.816451.215220.84736建设银行1-1.068081.293370.26348农业银行2-0.44565-0.75061-1.93788中国银行1-1.33496-0.99005-0.14319群集成员案例4群集1:建设银行12:工商银行13:农业银行24:中国银行15:交通银行16:招商银行37:民生银行48:光大银行39:兴业银行310:中信银行3交通银行1-0.52447-0.64060.01417招商银行30.211711.09438-0.67285民生银行41.810070.78214-1.08107光大银行30.54295-1.338010.60646兴业银行30.79332-0.141231.39445中信银行30.83157-0.518140.70906从效益因子上看,民生银行居第一位,总分为1.81007。客户进行投资最注重的就是收益率,民生银行在十家银行中,收益率最高,将成为市场中的绩优股。民生银行是我国首家主要由非公有制企业入股的全国性股份制商业银行。1996年2月7日登记成立。经2000年11月27日向社会公开发行人民币普通股35000万股后,公司总股本已达173024.8万股。截止至2011年11月,其中小企业金融事业部贷款余额超过1000亿元,表外业务余额超过600亿元,服务的资产客户数超过一万户。民生银行致力于