spss-统计分析基础知识

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

技能训练主要内容统计分析基础知识(初步)相关分析方法预测方法综合评价方法决策分析方法分类方法技能训练目标与要求了解各种方法的基本原理;熟悉各种方法的适用范围和适用对象;掌握各种方法在excel和SPSS等软件中的操作及结果判读分析。坚持过程考核,纳入土地利用规划课程考核体系,约占30%。每次坚持考勤,每人固定电脑位置。第一部分统计分析基础知识基本概念数据类型数据采集统计整理几种常用的统计指标与参数应用实例:中国大陆省份人均GDP的变异系数一、基本概念数据(data):对客观事物进行度量的结果。样本(case):统计分析对象所涉及的个体。指标(index):统计分析对象所涉及的具体因素。变量(variable):随统计分析样本或时间变化而有变化的指标。常量(constant):固定不变的因素。GDP工业产值土地面积总人口耕地面积建成区面积南京123467苏州无锡徐州淮安指标样本数据二、数据类型定性数据:文字表述形式1、分类数据:男、女2、顺序数据:优、良、中等、一般、差定量数据:具体数值表示1、绝对数:总人口、总产出、土地面积2、相对数:产业比重、耕地比重、增长率、人均产值、粮食单产、地均投资等3、平均数:样本平均水平或同一样本一定时期平均水平。三、数据采集数据的渠道来源①来自于观测、测量部门的有关专业数据。②来自于统计年鉴、统计公报中的有关自然资源及社会经济发展数据。③来自于有关单位或个人的不定期的典型调查数据、抽样调查数据。④来自于政府公报、政府文件中的有关数据。⑤来自于档案、图书等文献资料中的有关数据。⑥来自于互联网(internet)的有关共享数据。⑦来自地图图件。主要包括各种比例尺的地形图、影像地图、专题地图等。⑧来自遥感数据。主要包括各种航空遥感数据和卫星遥感数据。⑨其他来源的有关数据。采集数据过程中需要注意的问题①数据的完备性和可靠性。②在数据采集过程中,最大限度地减小数据的误差(注意数据单位)。③在数据采集完毕后,进行检验,辨别真伪,通过数据筛选,去粗取精、去伪存真(剔除异常值)。四、统计整理统计整理的基本步骤:①统计分组,就是根据研究目的,按照一定的分组标志将数据分成若干组。②计算各组数据的频数、频率,编制统计分组表。③作分布图。频数:各组数据中的数据个数;频率:各组数据频数与总体数据个数的百分比分组步骤(案例:1999年全国各省人口分组)1、求组全距R=xmax-xmin2、确定组数n=1+3.32lgN3、确定组距h=R/n4、确定组限自小到大:第一组下限h1下=xmin-h/2H1上=h1下+h组中值:位居数据组中最上限与最下限的中间的数值五、几种常用的统计指标与参数描述数据一般水平的指标描述数据分布的离散程度的指标描述数据分布特征的参数(一)描述数据一般水平的指标平均值(Mean)反映了数据一般水平。计算方法:①未分组的地理数据②分组的地理数据niixnx11miimiiifxfx11(2.4.1)(2.4.2)中位数(Median)①对于未分组的数据,样本数n为奇数时,中位数是位置排在第(n+1)/2位的数据;样本数n为偶数时,中位数是排在中间位置的两个数据的平均值。②分组的地理数据,中位数的计算方法:确定中位数所在的组位置,按下述公式计算中位数mmniiefSfdLM1121或mmniiefSfdUM1121(2.4.3)(2.4.4)在式(2.4.3)和(2.4.4)中:Me代表中位数;L为中位数所在组的下限值;U为中位数所在组的上限值;fm为中位数所在组的频数;Sm-1为中位数所在组以下的累计频数;Sm+1为中位数所在组以上的累计频数;d为中位数所在组的组距。众数(Mode)众数就是出现频数最多的那个数,计算方法分为以下两种情况:①未分组的地理数据,可以根据每一个数据出现的频数大小直接确定众数。②对于已经分组的地理数据,众数的计算步骤如下:确定频数最多的组为众数所在组。按以下公式计算众数2110dLM2120dUM或(2.4.5)(2.4.6)在式(2.4.5)和(2.4.6)中:M0代表众数;L为众数所在组的下限值;U为众数所在组的上限值;∆1为众数组频数与下一组频数之差;∆2为众数组频数与上一组频数之差;d为众数所在组的组距。例1:表2.4.2给出了某农场各农田地块的面积,试计算其平均值、中位数和众数。地块编号123456789101112平均值中位数众数面积/hm212835035555072408529657554.2552.550应按照未分组数据计算其平均值、中位数和众数,计算结果见上表最后三列。表2.4.2某农场各农田地块的面积例2:表2.4.3给出了中国西部地区某城市2000年家庭月收入的抽样调查结果,试计算其平均值、中位数和众数。家庭月收入/元户数向上累计频数向下累计频数2000~300030030021303000~40001300160018304000~500020018005305000~600015019503306000~700010020501807000~8000502100808000~900030213030合计2130——表2.4.3中国西部地区某城市2000年家庭月收入的抽样调查结果解题步骤:(1)用公式(2.4.2)计算平均数(2)计算中位数。先确定中位数所在组的位置,再按照公式(2.4.3)或者(2.4.4)计算中位数Me=3588.46(元)x=3899.06(元)(3)计算众数,先确定众数所在组,再按照公式(2.4.5)或(2.4.6)计算众数。显然,众数所在组应该在第二组。众数M0=3476.19(元)。(二)描述数据分布离散程度的指标极差(Range)指所有数据中最大值与最小值之差,计算公式为离差指每一个数据与平均值的差,计算公式为离差平方和它从总体上衡量一组数据与平均值的离散程度,其计算公式为}{min}{maxiiiixxRxxdiiniixxd12)((2.4.9)(2.4.8)(2.4.7)方差(Variance)与标准差(Std.deviation)方差是从平均概况衡量一组数据与平均值的离散程度。方差计算公式为标准差为方差的平方根,计算公式为nixixn12)(12(2.4.10)niixxn12)(1(2.4.11)如果以样本方差对标准差进行无偏估计,则计算公式为1)(12nxxSnii(2.4.12)变异系数变异系数表示数据的相对变化(波动)程度,其计算公式%1001)(1%10012nxxxxSCniiv(2.4.13)例如:对于表2.4.2中的数据,分别计算极差、离差、离差平方和、方差、标准差、标准差的无偏估计,以及变异系数。地块编号123456789101112平均值中位数众数面积/hm212835035555072408529657554.2552.550表2.4.2某农场各农田地块的面积步骤:(1)按照公式(2.4.7)计算极差(2)按照公式(2.4.8)计算离差,结果见表2.4.4。序号123456789101112面积128350355550724085296575离差-42.2528.75-4.25-19.250.75-4.2517.75-14.2530.75-25.2510.7520.75731285R表2.4.4数据的离差(3)按照公式(2.4.9)计算离差平方和(4)按照公式(2.4.10)计算方差(5)按照公式(2.4.11)计算标准差(6)按照公式(2.4.12)计算标准差的无偏估计(7)按照公式(2.4.13)计算变异系数1212iidd19.47212122d73.2119.4722σ1122dS%100xSCv5666.2521.72990.4184(三)描述数据分布特征的参数偏度系数(Skewness)测度数据分布的不对称性情况,刻画以平均值为中心的偏向情况,计算公式为g10,表示负偏,即均值在峰值的左边;g10,表示正偏,即均值在峰值的右边;g1=0,表示对称分布(如下图)。3111niixxng(2.4.14)图2.4.3偏度系数的三种情形峰度系数(Kurtosis)它测度了数据在均值附近的集中程度,其计算公式为标准正态分布的峰度系数g2=0;g20,表示数据分布的集中程度高于正态分布;g20,表示数据分布的集中程度低于正态分布(图2.4.4)。niixxng14231图2.4.4标准峰度系数的三种情形(2.4.15)六、应用实例:中国大陆省份人均GDP的变异系数我们知道变异系数测度的是地理数据分布的相对差异。为了分析中国大陆经济发展的省际差异及其演化过程,我们首先把1978-2002年各省(直辖市、自治区)的GDP数,按照可比价格进行折算,再除以人口数,计算出按照可比价衡量的人均GDP数据,然后再用公式(2.4.13)计算变异系数,结果如图2.4.5。图2.4.51978—2002年中国大陆省份人均GDP的变异系数从图2.4.5中可以看出,在1978—2002年期间,人均GDP的变异系数,以1990年为转折点,呈现出一个U形曲线。即:人均GDP的变异系数,在1978—1990年期间基本上呈现下降趋势,而在1990—2002年期间则基本上呈现上升趋势。这说明,在1978—1990年期间,中国大陆经济发展的省际差异,基本上呈缩小趋势,而1990—2002年期间则基本上呈扩大趋势。这一变化与国家宏观经济政策变动的时间、趋势大体一致。

1 / 34
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功