专业资料word完美格式关于某地区361个人旅游情况统计分析报告一、数据介绍:本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好4代表积极性非常好);额外收入,一类变量。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、。。。以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。二、数据分析1、频数分析。基本的统计分析往往从频数分析开始。通过频数分地区359个人旅游基本状况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性况的基本分布。统计量积极性性别N有效359359缺失00首先,对该地区的男女性别分布进行频数分析,结果如下性别频率百分比有效百分比累积百分比有效女19855.255.255.2男16144.844.8100.0合计359100.0100.0表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为44.8%和55.2%,该公司职工男女数量差距不大,女性略多于男性。其次对原有数据中的旅游的积极性进行频数分析,结果如下表:积极性频率百分比有效百分比累积百分比专业资料word完美格式有效差17147.647.647.6一般7922.022.069.6比较好7922.022.091.6好246.76.798.3非常好61.71.7100.0合计359100.0100.0其次对原有数据中的积极性进行频数分析,结果如下表:其次对原有数据中的是否进通道进行频数分析,结果如下表:Statistics通道NValid359Missing0专业资料word完美格式通道FrequencyPercentValidPercentCumulativePercentValid没走通道29381.681.681.6通道6618.418.4100.0Total359100.0100.0表说明,在该地区被调查的359个人中,有没走通道的占81.6%,占绝大多数。上表及其直方图说明,被调查的359个人中,对与旅游积极性差的组频数最高的,为171人数的47.6%,其次为积极性一般和比较好的,占比例都为22.0%,积性为好的和非常好的比例比较低,分别为24人和6人,占总体的比例为6.7%和1.7%。2、探索性数据分析(1)交叉分析。通过频数分析能够掌握单个变量的数据分布情况,但是在实际分析中,不仅要了解单个变量的分布特征,还要分析多个变量不同取值下的分布,掌握多个变量的联合分布特征,进而分析变量之间的相互影响和关系。就本数据而言,需要了解现工资与性别、年龄、受教育水平、起始工资、本单位工作经历、以前工作经历、职务等级的交叉分析。现以现工资与职务等级的列联表分析为例,读取数据(下面数据分析表为截取的一部分):Count性别*积极性交叉制表计数积极性合计差一般比较好好非常好性别女964741122198男753238124161合计1717979246359专业资料word完美格式上联表及BarChart涉及两个变量,即性别与积极性的二维交叉,反映了在不同的性别对于旅游积极性分布情况。上表中,性别成为行向量,积极性列向量。(2)性别与收入的探索性分析性别CaseProcessingSummary性别CasesValidMissingTotalNPercentNPercentNPercent收入女198100.0%0.0%198100.0%男161100.0%0.0%161100.0%Descriptives性别StatisticStd.Error收入女Mean1005.2856249.51479695%ConfidenceIntervalforMeanLowerBound907.63853UpperBound1102.93272专业资料word完美格式5%TrimmedMean957.92011Median937.50000Variance485439.577Std.Deviation696.734940Minimum7.426Maximum3125.000Range3117.574InterquartileRange937.563Skewness.896.173Kurtosis.310.344男Mean1066.9279165.99321995%ConfidenceIntervalforMeanLowerBound936.59779UpperBound1197.258025%TrimmedMean986.95497Median937.50000Variance701171.907Std.Deviation837.360082Minimum58.630Maximum6250.000Range6191.370InterquartileRange718.750Skewness2.370.191Kurtosis10.166.380(3)p-p图分析专业资料word完美格式Age专业资料word完美格式结果分析年龄在正态p-p图的散点近似成一条直线,无趋势正态p-p图的散点均匀分布在直线y=0的上下,故可认为本资料服从正态分布3、相关分析。相关分析是分析客观事物之间关系的数量分析法,明确客观事之间有怎样的关系对理解和运用相关分析是极其重要的。函数关系是指两事物之间的一种一一对应的关系,即当一个变量X取一定值时,另一个变量函数Y可以根据确定的函数取一定的值。另一种普遍存在的关系是统计关系。统计关系是指两事物之间的一种非一一对应的关系,即当一个变量X取一定值时,另一个变量Y无法根据确定的函数取一定的值。统计关系可分为线性关系和非线性关系。事物之间的函数关系比较容易分析和测度,而事物之间的统计关系却不像函数关系那样直接,但确实普遍存在,并且有的关系强有的关系弱,程度各有差异。如何测度事物之间的统计关系的强弱是人们关注的问题。相关分析正是一种简单易行的测度事物之间统计关系的有效工具。Correlations收入旅游花费额外收入收入PearsonCorrelation1.140**.853**Sig.(2-tailed).008.000N359359359专业资料word完美格式旅游花费PearsonCorrelation.140**1.183**Sig.(2-tailed).008.000N359359359额外收入PearsonCorrelation.853**.183**1Sig.(2-tailed).000.000N359359359**.Correlationissignificantatthe0.01level(2-tailed).上表是对本次分析数据中,旅游花费、收入、、额外收入的相关分析,表中相关系数旁边有两个星号(**)的,表示显著性水平为0.01时,仍拒绝原假设。一个星号(*)表示显著性水平为0.05是仍拒绝原假设。先以现旅游花费这一变量与其他变量的相关性为例分析,由上表可知,旅游花费与额外收入的相关性最大,5.回归分析有相关性分析可得收入,旅游花费呈线性相关,因此作回归分析VariablesEntered/RemovedbModelVariablesEnteredVariablesRemovedMethod1收入a.Entera.Allrequestedvariablesentered.b.DependentVariable:旅游花费ModelSummarybModelRRSquareAdjustedRSquareStd.ErroroftheEstimate1.140a.020.017129.604a.Predictors:(Constant),收入b.DependentVariable:旅游花费ANOVAbModelSumofSquaresdfMeanSquareFSig.1Regression120443.8091120443.8097.170.008aResidual5996596.23935716797.188专业资料word完美格式Total6117040.048358a.Predictors:(Constant),收入b.DependentVariable:旅游花费CoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)91.56311.5287.943.000收入.024.009.1402.678.008a.DependentVariable:旅游花费ResidualsStatisticsaMinimumMaximumMeanStd.DeviationNPredictedValue91.74241.90116.4118.342359Std.PredictedValue-1.3456.842.0001.000359StandardErrorofPredictedValue6.84047.3629.0483.426359AdjustedPredictedValue92.09271.79116.5319.018359Residual-193.904891.785.000129.423359Std.Residual-1.4966.881.000.999359Stud.Residual-1.6076.891.0001.002359DeletedResidual-223.789894.316-.117130.229359Stud.DeletedResidual-1.6117.390.0041.025359Mahal.Distance.00046.811.9972.955359Cook'sDistance.000.199.003.015359CenteredLeverageValue.000.131.003.008359a.DependentVariable:旅游花费Charts专业资料word完美格式由上图可知回归方程:y=91.563+0.024(x1),(P(Sig=0.000)0.01)即旅游花费=91.563+0.024*收入(p0.01)6单样本T检验首先对现工资的分布做正态性检验,结果如下:专业资料word完美格式由上图可知,现工资的分布可近似看作符合正态分布,现推断现工资变量的平均值是否为$3,000,0,因此可采取单样本t检验来进行分析。分析如下:One-SampleStatistics单个样本统计量N均值标准差均值的标准误收入3591032.93021762.52394240.244474单个样本检验检验值=0tdfSig.(双侧)均值差值差分的95%置信区间下限上限收入25.666358.0001032.930214953.784931112.07550由One-SampleStatistics可知,359个被调查的人中收入平均值1032.93021,标准差为762.523942,均值标准误差为40.244474。图表One-SampleTest中,第二列是t统计量的观测值为25.666;第三列是自由度为358(n-1);第四列是t统计量观测值的专业资料word完美格式双尾概率值;第五列是样本均值和检验值的差;第六列和第七列是总体均值与原假设值差的95%的置信区间为(953.78493,1112.07550)。该问题的t值等于25.666对应的临界置信水平为0,远远小于设置的0.05,因此拒绝原假设,表明该地区被调查的359名人中收入与1032.93021存在显著差异。7,独立样本t检验T-TestGroupStatistics性别NMeanStd.DeviationStd.ErrorMea