2019/12/19中国人民大学六西格玛质量管理研究中心1第九章多变量的图表示法目录上页下页返回结束•§9.1散点图矩阵•§9.2脸谱图•§9.3雷达图与星图•§9.4星座图2019/12/19中国人民大学六西格玛质量管理研究中心2第九章多变量的图表示法目录上页下页返回结束图形是对资料进行探索性研究的重要工具,当人们在运用其它统计方法对所得资料进行分析之前,往往习惯于把各资料在一张图上画出来,以直观地反映资料的分布情况及各变量之间的相关关系。当变量较少时,可以采用直方图、条形图、饼图、散点图或是经验分布的密度图等方法,对于变量个数少于3的情况,这样做是简单而有效的。而当变量个数为3时,虽然仍可以做三维的散点图,但这样做已经不是很方便,当变量个数大于3时,就不能用通常的方法作图了。自20世纪七十年代以来,统计学家研究发明了很多多维变量的图表示方法,以借助图形来描述多元资料的统计特性,使图形直观、简洁的优点延伸到多变量的研究中去。本章主要介绍散点图矩阵、脸谱图、雷达图等多变量的图表示法的基本思想及作图方法。2019/12/19中国人民大学六西格玛质量管理研究中心3第九章多变量的图表示法目录上页下页返回结束因为对资料的图表示法只是以一种直观的方式再现资料,不同的研究者习惯的资料显示方式可能会有很大不同,因此,不同于其它统计方法,大部分图表示法都没有非常严格的画图方法,研究者可以根据自己的习惯设定某些规则以更方便地揭示资料之间的联系。故此,本章对各种图表示方法原则上只给出作图的思想及思路,而不对严格的数学公式作过多说明。2019/12/19中国人民大学六西格玛质量管理研究中心4§9.1散点图矩阵目录上页下页返回结束散点图矩阵是借助两变量散点图的作图方法,它可以看作是一个大的图形方阵,其每一个非主对角元素的位置上是对应行的变量与对应列的变量的散点图。而主对角元素位置上是各变量名,这样,借助散点图矩阵可以清晰地看到所研究多个变量两两之间的相关关系。由此也可以看出,散点图矩阵方法还不是真正意义上的多变量作图方法,它研究的仍是两两变量之间的相关关系,而不能直接反映多个变量之间的关系,借助它来对资料分类也是比较困难的;然而,因其直观,简单,容易理解,散点图矩阵还是越来越受到了广大实际工作者的喜爱,很多统计软件也加入了作散点图矩阵的功能。下面我们举例说明如何用SPSS软件作散点图矩阵对资料进行分析。2019/12/19中国人民大学六西格玛质量管理研究中心5§9.1散点图矩阵目录上页下页返回结束例9.1以SPSS软件自带的world95.sav资料为例,该资料共有26个变量109条观测,是1995年世界109个国家和地区的基本发展情况的资料。选择该数据如下几个变量作图:density(每平方公里人口数)、lifeexpf(女性预期寿命)、lifeexpm(男性预期寿命)、babymort(婴儿死亡率)、gdp_cap(GDP是总资产的倍数)、calories(每日摄入热量)打开资料集world95.sav,依次点选Graphs→Scatter…进入Scatterplot对话框;选中Matrix(矩阵)左侧的图标,点击Define按钮,进入ScatterplotMatrix对话框,依次选择上面五个变量,点击OK键运行,则生成如下图形:2019/12/19中国人民大学六西格玛质量管理研究中心6§9.1散点图矩阵目录上页下页返回结束输出结果9.1:2019/12/19中国人民大学六西格玛质量管理研究中心7§9.1散点图矩阵目录上页下页返回结束由散点图矩阵可以看到,每平方公里人口数与其它各变量的相关性均不明显,男性的预期寿命,女性的预期寿命及婴儿死亡率三个变量之间有明显的线性相关系,而GDP是总资产的倍数与上面三个变量存在着某种曲线相关关系。由此可以看出其它变量之间的相关关系,在此不再赘述。另外,SPSS软件还有一些选项可以帮助我们由散点图矩阵得到更多信息,资料集world95.sav中变量religion的含义是主要的宗教信仰,在ScatterplotMatrix对话框中将religion变量选作标记变量(选入setmarkersby)框中,则在输出的散点图矩阵中,不同宗教信仰的国家以不同的颜色画出,借此可以作更详细的分析,此处不再详述。2019/12/19中国人民大学六西格玛质量管理研究中心8§9.1散点图矩阵目录上页下页返回结束另外,有些统计软件(如Statistica软件)提供的画散点图矩阵的模块同时在主对角线上可以画出相应变量的直方图,这样就在散点图矩阵上提供了更多的信息,即同时能通过该图了解各变量的分布情况。对于Statistica软件的用法这里不做过多说明,对于上面的资料,用Statistica软件作散点图矩阵得到结果如下:2019/12/19中国人民大学六西格玛质量管理研究中心9§9.1散点图矩阵目录上页下页返回结束输出结果9.2:2019/12/19中国人民大学六西格玛质量管理研究中心10§9.2脸谱图目录上页下页返回结束2019/12/19中国人民大学六西格玛质量管理研究中心11§9.2脸谱图目录上页下页返回结束脸谱图分析法的基本思想是由15—18个指针决定脸部特征,若实际资料变量更多将被忽略(有新的画图方法取消了脸的对称性并引入更多脸部特征从而最多可以用36个变量来画脸谱),若实际资料变量较少则脸部有些特征将被自动固定。统计学曾给出了几种不同的脸谱图的画法,而对于同一种脸谱图的画法,将变量次序重新排列,得到的脸谱的形状也会有很大不同。此处我们不对脸谱的各个部位与原始变量的数学关系作过多探讨,而只说明其作图的思想及软件实现方法。2019/12/19中国人民大学六西格玛质量管理研究中心12§9.2脸谱图目录上页下页返回结束按照H.Chernoff于1973年提出的画法,采用15个指标,各指标代表的面部特征为:1表示脸的范围,2表示脸的形状,3表示鼻子的长度,4表示嘴的位置,5表示笑容曲线,6表示嘴的宽度,7~11分别表示眼睛的位置,分开程度,角度,形状和宽度,12表示瞳孔的位置,13~15分别表示眼眉的位置,角度及宽度。这样,按照各变量的取值,根据一定的数学函数关系,就可以确定脸的轮廓、形状及五官的部位、形状,每一个样本点都用一张脸谱来表示。而脸谱容易给人们留下较为深刻的印象,通过对脸谱的分析,就可以直观地对原始资料进行归类或比较研究。2019/12/19中国人民大学六西格玛质量管理研究中心13§9.2脸谱图目录上页下页返回结束例9.2以我国35个上市公司的八大评价指标为例说明(数据略)见参考文献[20]。S—Plus软件收入了脸谱图的作图方法,下面我们举例说明如何用S—Plus软件画脸谱图。S—Plus画脸谱图的方法非常简单,只要调用faces函数就可以实现了。将前面的资料的数字部分输入S—Plus,并令文件名为gongsi.sdd,在命令窗口调用下面的函数:faces(data.matrix(gongsi),fill=T,which=1:8,head=Facesof35ompanies,ncol=5,scale=T,byrow=T)回连运行就可以生成35个公司的脸谱图,每一个公司用一张脸谱表示出来,但是,此时生成的脸谱图不好与公司名对应,可将35个公司名放入一个向量a中,然后在上面的命令中加入选项labels=a,即可生成如下脸谱图:2019/12/19中国人民大学六西格玛质量管理研究中心14§9.2脸谱图目录上页下页返回结束输出结果9.3:2019/12/19中国人民大学六西格玛质量管理研究中心15§9.2脸谱图目录上页下页返回结束对faces函数的子选项作简要说明,因为完整的脸谱图共需15个变量,而此处只有八个变量,Fill=T是指将由后七个变量决定的脸的部位画在相应的中央位置,which=1:8是指用资料集gongsi的前八列画脸谱图,head指定图的标题,ncol确定输出时每列输出脸谱图的个数,scale=T指在画脸谱图时将各变量都变换到(0,1)之间,byrow=T是指输出时脸谱图列行排列,这有助于我们将脸谱图与相应的公司名对应起来。2019/12/19中国人民大学六西格玛质量管理研究中心16§9.2脸谱图目录上页下页返回结束脸谱图给人的感觉形象直观,容易留下较深刻的印象,可以根据脸谱图来对各公司的运营能力进行比较,比如根据脸的范围(净资产收益率)来看,方正科技,清华同方,粤电力,深南电,金丰投资等公司处于较高水平,而象渝开发,粤宏远,寰岛实业等公司明显处于较低水平,类似可以对其他指标进行分析。利用脸谱图,还可以直观地对各个公司进行归类。由上图看来,方正科技、深南电、深能源、中兴通讯、粤电力、清华同方、金丰等公司大致可以归为一类,穗恒运、长城计算机、永鼎光缆、宏图高科大致可以归为一类,富龙热力、韶能股分、惠天热电、大连热电、华银电力、长春经开、新黄浦、辽房天、三木集团、青鸟华光、海星科技、龙电股分等公司可以归为一类,剩余的公司大体可以归为一类。此处不再详述。2019/12/19中国人民大学六西格玛质量管理研究中心17§9.2脸谱图目录上页下页返回结束在利用脸谱图工具对观测进行比较分析时,值得注意的一点是脸谱的形状受各变量次序的影响很大,在本例中如果把八个指标的次序换一下,得到的脸谱图就会有很大不同。而且,根据脸谱图对各公司的归类有很大的主观性,因为不同的人所关注的脸的部位有很大不同,如有些人对脸的胖瘦比较在意,而有的人对五官的印象特别深,因此对同样的脸谱图,不同的人可能得到不同的结论,在实际分析中,该方法必须与聚类,相关等定量分析相结合才能得到比较合理可信的结论。2019/12/19中国人民大学六西格玛质量管理研究中心18§9.2脸谱图目录上页下页返回结束例9.3表9-1是五大钢铁公司反映经营状况的八大指标,为了比较国内钢铁公司与韩国蒲项钢铁公司的差距,下面做出韩国蒲项钢铁公司、宝钢、鞍钢、武钢、首钢五家钢铁公司的脸谱图。2019/12/19中国人民大学六西格玛质量管理研究中心19§9.2脸谱图目录上页下页返回结束表9-1:项目宝钢鞍钢武钢首钢浦项负债保障率2.892.952.341.853.12长期负债倍数5.169.156.072.636.96流动比率1.311.831.162.222.1资产利润率21.7117.3424.7711.8925.34收入利润率23.1711.3319.557.622.28成本费用利润率30.2312.7624.818.0528.52净利润现金比率1.790.91.71.091.3三年资产平均增长率1.487.2863.311.7613.18三年销售平均增长率20.0729.1952.8818.7724.16三年平均资本增长率11.0410.548.957.6317.512019/12/19中国人民大学六西格玛质量管理研究中心20§9.2脸谱图目录上页下页返回结束2019/12/19中国人民大学六西格玛质量管理研究中心21§9.3雷达图与星图目录上页下页返回结束一、雷达图2019/12/19中国人民大学六西格玛质量管理研究中心22§9.3雷达图与星图目录上页下页返回结束EXCEL软件提供了画雷达图的功能,它适合于观测数较少的情形,这时可以方便地把各观测画到一张图里面,便于对各指标进行对比,但是,当观测数比较多时,画到一张雷达图里面就不太容易看出各观测之间的接近程度,用EXCEL当然也可以对每一个观测画一张雷达图,但此时转差率已经很低了。S-Plus软件也收入了雷达图的画法,下面我们举例说明雷达图的画法。2019/12/19中国人民大学六西格玛质量管理研究中心23§9.3雷达图与星图目录上页下页返回结束例9.4资料仍取我国35个上市公司的资料。常见的EXCEL就可画出很漂亮的雷达图。用EXCEL画雷达图的方法,比如仅对深能源和深南电两公司画雷达图,方法如下:在EXCEL窗口中,输入资料格式如下:公司简称净资产收益率%总资产报酬率%资产负债率%总资产周转率流动资产周转率已获利息