K-Means聚类分析一、实验方法K-Means聚类分析二、实验目的根据2001年全国31省市自治区各类小康和现代化指数的数据,用Spass对地区进行K-Means聚类分析。三、实验数据综合指数社会结构经济与技术发展人口素质生活质量法制与治安北京93.210094.7108.497.455.5上海92.395.192.711295.457.5天津87.993.488.7989062.7浙江80.989.485.178.586.658广东79.290.486.965.986.559.4江苏77.882.174.881.275.974.6辽宁76.385.865.793.168.169.6福建72.483.471.767.77660.4山东71.770.86775.770.277.2黑龙江70.178.155.782.167.671吉林67.981.151.885.856.868.1湖北65.973.548.779.95679陕西65.971.548.281.951.785.8河北6560.152.475.666.476.6山西64.173.2417357.387.8海南64.171.646.261.854.5100重庆6469.741.976.263.277.9内蒙古63.273.542.278.250.281.4湖南60.960.540.373.956.484.4青海59.973.843.763.94780.1四川59.360.743.571.950.678.5宁夏58.273.545.967.146.761.6新疆64.771.257.275.157.364.6安徽56.761.341.263.552.572.6云南56.759.449.859.848.172.3甘肃56.66636.666.245.879.4四、分析方法与结果表一31个省市自治区小康和现代化指数的K-Means聚类分析结果(一)初始聚类中心聚类123综合指数79.2092.3051.10社会结构90.4095.1061.90经济与技术发展86.9092.7031.50人口素质65.90112.0056.00生活质量86.5095.4041.00法制与治安59.4057.5075.60迭代历史记录a迭代聚类中心中的变动123124.3876.30723.5792.000.000.000a.由于聚类中心中不存在变动或者仅有小幅变动,因此实现了收敛。任何中心的最大绝对坐标变动为.000。当前迭代为2。初始中心之间的最小距离为49.349。ANOVA聚类误差F显著性均方自由度均方自由度综合指数1633.823222.5182872.556.000社会结构1539.872247.3122832.547.000经济与技术发展4381.296256.7602877.190.000人口素质1817.856274.3632824.446.000生活质量3315.174259.2762855.928.000法制与治安530.188276.284286.950.004由于已选择聚类以使不同聚类中个案之间的差异最大化,因此F检验只应该用于描述目的。实测显著性水平并未因此进行修正,所以无法解释为针对“聚类平均值相等”这一假设的检验。每个聚类中的个案数目聚类17.00023.000321.000有效31.000缺失.000