二SPSS基本统计分析报告

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析1第二章:SPSS基本统计分析SPSS软件的基本统计计算和绘图功能主要通过Analyze菜单中的DescriptiveStatistics以及Reports来完成的。另外,基本统计分析的报表是利用Analyze菜单中Tables制作的。为更清楚地讨论SPSS基本统计分析,可引入实际的案例加以介绍。以《世界500强公司》的数据为例:我们想统计世界500强中,主营业务为电信的公司出现的频率怎么做?我们想计算500强公司营业收入的均值、差异程度,怎么做?本章学习内容:1.1数据的基本统计描述量1.2频数分析(Frequencies)1.3描述统计(Descriptives)1.4探索分析(Explore)1.5报告输出具体内容:1.1数据的基本统计描述量表示集中趋势的统计量总和(Sum)所有数据的算术和均值(Mean)算术平均值众数(Mode)n个数据中出现次数最多的数中位数(Median)排在中间位置的数百分位数(Percentile)数据从小到大排序,处在k%位置的数称为第k百分位数表示离散程度的统计量方差(Variance)标准差(Std.Deviation)极差(Range)最大值与最小值之差四分位极差(Interquartile)第75百分位数与第25百分位数之差表示分布形状特征的统计量偏度(Skewness)接近0,对称分布;0,右偏态;0,左偏态。峰度(Kurtosis)接近0,为正态分布;0,陡峭;0,平缓。1.2频数分析(Frequencies)1.2.1主要作用可对数据按组进行归类整理,形成对某一变量不同水平的频数分布表和图形,以便于对数据的分布趋势作出初步判断。1.2.2实例分析打开文件《世界500强公司》,对世界500强公司数据进行频数分析:(1)对世界500强公司主营业务进行频数分析;(2)对世界500强公司的营业收入进行频数分析并画出直方图;《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析2(3)对我国进入500强的公司进行频数分析。具体操作如下:题1.对世界500强公司主营业务进行频数分析:AnalyzeDescriptiveStatisticsFrequencies,打开Frequencies对话框,如下图。2134《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析3《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析4题2.对世界500强公司的营业收入进行频数分析并画出直方图题目分析:由于营业收入属于数值型变量,其中每一数值都不相同,所以直接做频数分析没有意义。应将其按数值大小分成不同区间,然后作频数分析;而这一步应首先基于对数值进行描述统计,找出最小值和最大值。具体步骤分为描述统计、分组(通过“重新编码”(Recode))、频数分析等三步。描述统计:AnalyzeDescriptiveStatisticsDescriptives,打开如下对话框。DescriptiveStatistics50010096.2219812.01E+00728019.919500百万美元ValidN(listwise)NMinimumMaximumSumMean根据最小值和最大值,对原数据中营业收入进行重新分组:(0-29999.9),(30000-59999.9),(60000-89999.9),(90000-119999.9),(120000-149999.9),(150000-179999.9),(180000-209999.9),(210000-)分组(通过“重新编码”(Recode)):TransformRecodeIntoDifferentVariables(重新编码为新的变量)2134《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析52134《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析6此时我们会看到数据编辑窗口中变量栏多了一个:收入分组。频数分析:现在可以对新的变量:收入分组进行频数分析了(Charts选项中选择histograms,并勾选正态曲线)。步骤同一。结果如下两图。收入分组36272.472.472.410120.220.292.6204.04.096.671.41.498.051.01.099.03.6.699.61.2.299.81.2.2100.0500100.0100.01.002.003.004.005.006.007.008.00TotalValidFrequencyPercentValidPercentCumulativePercent10.008.006.004.002.000.00收入分组4003002001000Frequency1135720101362Mean=1.42Std.Dev.=0.89061N=500Histogram题3:对我国进入500强的公司进行频数分析。(1)首先挑选出中国的公司,可以通过筛选观测量来完成。具体操作:DataSelectCases,点选If对话框,然后设定“总部所在”为“中国”(总部所在=“中国”)。将未被选中的数据进行删除,将选中的数据以“中国”为名另存到桌面上。见下图。《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析7Ok之后将文件另存到桌面。(2)对中国进入500强公司进行频数分析。打开中国.sav文件,AnalyzeDescriptiveStatisticsFrequencies,打开Frequencies对话框,在charts选项中选择“BarCharts”,输出结果如下。Statistics主营业务110ValidMissingN《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析8主营业务19.19.19.1218.218.227.319.19.136.419.19.145.519.19.154.519.19.163.6436.436.4100.011100.0100.0电力电信化学贸易炼油贸易能源银行TotalValidFrequencyPercentValidPercentCumulativePercent银行能源贸易炼油化学贸易电信电力主营业务43210Frequency主营业务1.3描述统计(Descriptives)1.3.1主要作用对变量进行描述性统计分析,计算均值、标准差、全距和均值标准误差等。1.3.2实例分析刚才已经使用过。可对500强进行描述统计,操作后输出结果如下:DescriptiveStatistics500209715.810096.2219812.028019.9191152.301625766.257E+0083.527.10916.472.218500百万美元ValidN(listwise)StatisticStatisticStatisticStatisticStatisticStd.ErrorStatisticStatisticStatisticStd.ErrorStatisticStd.ErrorNRangeMinimumMaximumMeanStd.DeviationVarianceSkewnessKurtosis对结果的解释可参照教科书。习题:对“frequencies-舒张压.sav”文件中的数据进行频数分析(以10分组);练习2《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析91.4探索分析(Explore)1.4.1主要功能:此过程可检查数据是否有错误、考察样本分布特征及对样本分布规律作初步考察。剔除奇异值和错误数据。探测数据的错误来源人为的数据差错仪器测量的误差输入数据时的手误,如:小写的“l”与“1”、“o”与“0”数据探测的重要性由于数据的采集和输入可能出现的差错,在分析之前要检查数据的真实性。1.4.2实例分析(1)对日本进入500强的企业进行探索分析,并用茎叶图和箱线图显示。首先筛选出日本公司,步骤同上。Analyze--DescriptiveStatistics--Explore顺序单击,打开Explore主对话框。如图:点击ok后,会出现输出窗口,如下:《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析10CaseProcessingSummary87100.0%0.0%87100.0%总部所在=日本(FILTER)Selected百万美元NPercentNPercentNPercentValidMissingTotalCasesDescriptives27871.1022598.804122704.85133037.35424610.88817826.1006E+00824240.0310096.2120814.4110718.217289.52.058.2583.879.511MeanLowerBoundUpperBound95%ConfidenceIntervalforMean5%TrimmedMeanMedianVarianceStd.DeviationMinimumMaximumRangeInterquartileRangeSkewnessKurtosis总部所在=日本(FILTER)Selected百万美元StatisticStd.ErrorPercentiles10397.78010627.52012939.10017826.10030228.60063848.00092525.52013070.85017826.10029705.900总部所在=日本(FILTER)SelectedSelected百万美元百万美元WeightedAverage(Definition1)Tukey'sHinges5102550759095Percentiles《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析11125000.0100000.075000.050000.025000.0百万美元403020100Frequency1021111415381940Mean=27871.102Std.Dev.=24240.0314N=87forfilter_$=SelectedHistogram百万美元Stem-and-LeafPlotforfilter_$=SelectedFrequencyStem&Leaf33.001.00000000000001111222223333333344415.001.55666666677899911.002.000011223336.002.5556692.003.03.003.7.004.00113331.004.912.00Extremes(=54997)Stemwidth:10000.0Eachleaf:1case(s)茎叶图从左到右分为三部分:频数、茎和叶、茎是整数部分,叶是小数部分,Stemwidth表示茎宽。每行的茎和叶组成的数字再乘以茎宽,即得到实际数据的近似值,实际数据中与该近似值靠近的值的个数即为频数表示的个数。例如:从茎叶图中可以看出,25000cases30000的数据一共6个,分别大致为25000、25000、25000、26000、26000、29000(根据所在位数的数字,而非四舍五入)。《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析12(2)按主营业务绘制日本500强公司的箱线图首先用SelectCases选出500强中的所有银行业(If=”银行”)。然后用GraphsBoxplot,打开箱线图对话框,如图:《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析13邮政邮递饮料银行烟草铁路运输汽车零件汽车、摩汽车贸易轮胎橡胶零售炼油金属制品金属胶卷计算机、计算机化学航空公司广告工业农业工程建筑工程建设电子、娱电子、机电子电信电力出版印刷玻璃保险办公设备主营业务125000.0100000.075000.050000.025

1 / 17
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功