市场分析软件SPSS操作实务10、合并文件(MergeFile)(1)添加记录•将其他文件的记录添加到当前文件中,合并后新数据的记录应该为两文件之和。显示两个数据文件中变量名及变量类型不完全相同的变量,即不能完全匹配的变量。连接后新变量显示框。(2)添加变量(AddVariables)•将其他文件的变量添加到当前文件中。•显示两个文件中变量名或变量类型不完全相同的变量,这些变量将在合并后的新文件中以独立的变量存在。若想在新文件中不包含某个变量,可选中将它移出,送入ExcludedVariables框中。11、拆分文件(SplitFiles)分析所有观测记录,不进行拆分。系统默认。根据分类变量进行分拆。输出时体现所有不同的分类组合。根据分类变量进行分折(最多可选择8个分类变量)。选择此项后,输出的方式按每一种不同的类组合给出一个完整的结果。统计分析时,拆分的结果就会显现出来。商场第一提及6139.939.939.91.7.740.51.7.741.21.7.741.83925.525.567.31.7.768.0117.27.275.232.02.077.132.02.079.11811.811.890.821.31.392.221.31.393.521.31.394.821.31.396.163.93.9100.0153100.0100.08532.732.832.81.4.433.22.8.834.04015.415.449.4114.24.253.7238.88.962.551.91.964.5176.56.671.03814.614.785.772.72.788.42.8.889.2114.24.293.431.21.294.61.4.495.031.21.296.1103.83.9100.025999.6100.01.4260100.0新世纪百盛北城天街大都会重百远东永辉家乐福新世界茂业王府井地下商场沃尔玛赛博电脑城其他TotalValid新世纪百盛北城天街重百远东永辉家乐福新世界茂业太平洋王府井地下商场沃尔玛赛博电脑城女人街其他TotalValidSystemMissingTotal性别男女FrequencyPercentValidPercentCumulativePercent商场第一提及a6139.939.939.91.7.740.51.7.741.21.7.741.83925.525.567.31.7.768.0117.27.275.232.02.077.132.02.079.11811.811.890.821.31.392.221.31.393.521.31.394.821.31.396.163.93.9100.0153100.0100.0新世纪百盛北城天街大都会重百远东永辉家乐福新世界茂业王府井地下商场沃尔玛赛博电脑城其他TotalValidFrequencyPercentValidPercentCumulativePercent性别=男a.商场第一提及a8532.732.832.81.4.433.22.8.834.04015.415.449.4114.24.253.7238.88.962.551.91.964.5176.56.671.03814.614.785.772.72.788.42.8.889.2114.24.293.431.21.294.61.4.495.031.21.296.1103.83.9100.025999.6100.01.4260100.0新世纪百盛北城天街重百远东永辉家乐福新世界茂业太平洋王府井地下商场沃尔玛赛博电脑城女人街其他TotalValidSystemMissingTotalFrequencyPercentValidPercentCumulativePercent性别=女a.12、选择记录(SelectCases)•在数据分析时,有时可能只对某些记录感兴趣。选择全部记录,系统默认。选择满足条件的记录。随机抽取一定比例的观测记录。按记录编号抽取记录。用过滤变量选取记录。未被选取的记录保留在文件中,出于未被选中状态,其编号内标有对角斜线,删除未被选取的记录随机抽取一定比例的观测记录。随机抽取一定比例的观测记录。按记录编号抽取记录。13、数据汇总(Aggregate)分类变量。汇总变量。(八)数据管理之Transform功能计算变量转换--“计算功能的强化专用过程1、计算(Computer)•通过SPSS算术表达式及函数•对现有记录进行计算•计算结果成为新变量(也可以覆盖一个已经存在的变量)现存变量名计算符和常数函数式表达式目标变量名统计函数标准差“计算”功能示例之一•以“员工薪水”数据库为例•“员工薪水”数据库的基本情况•计算员工累计工作时间计算”功能示例之二•计算员工入职以来的平均薪水双击该条目计算”功能示例之三•对不同收入水平的员工征收不同税率的个人所得税•以当前薪水为基准•20000及以下免税,=0•20000以上的,超过20000的部分征收1%Recode功能重新编码--将连续变量转换为等级变量新的等级变量覆盖原连续变量生成新的不同于原连续变量的等级变量Recode功能之IntoDifferentVariables将原等级变量合并转换为新的等级变量:数据库演示•举例:•以“员工薪水”数据库为例•将“入职前的工作经历时间”重新自动转换为“入职前工作经验丰富程度”AutomaticRecode功能--自动重新编码•以“员工薪水”数据库为例•选取变量“入职累计时间”进行演示。VisualBander功能--连续变量的可视化分段•以“员工薪水”数据库为例•选取变量“入职累计时间”进行演示。Count功能--Recode的另一种操作SPSS描述统计操作实务及数据统计结果解读(一)•一、DescriptiveStatistics概述1、Frequencies功能百分位显示离散趋势集中趋势分布指标离散趋势集中趋势标准差方差全距最小值最大值均值标准误均值中位数众数算术和百分位显示分布指标四分位数,显示25%、50%和75%的百分位数。将数据平分为输入的10个等份。用户自定义百分位数,输入值0—100之间。偏度峰度•集中趋势•是指一组数据向某一个典型值或代表值集中的情况。•集中趋势的概念就是代表值、平均值的概念,•集中趋势的种类(统计量)•平均数、中位数、众数。描述统计指标体系•反映分布集中程度的统计量•众数(mode)、中位数(median)、均值(mean)•集中趋势•中位数•中位数是指一组数据按大小顺序排列情况下处于中间位置上的数值。•只有定序、定距和定比数据才有中位数。•若数据的个数是奇数,则在中间位置的数值就是中位数。•如果数据的个数是偶数,则用居于中间位置的两个数值的平均数是中位数。•集中趋势•众数•众数是指在许多数据中出现次数最多、有集中表现的一个数值,从而表明研究总体中各总体单位某一特征的集中趋势。•只有在总体单位数较多,且有明显集中趋势的资料中才能计算众数。•在组距式分组资料情况下求众数,则以出现次数最多的一组作为众数组,然后以这组的组中值为众数。•众数(MO)、中位数(Md)、平均数(X)之间的关系MOMdXMdXMO•反映离散程度的统计量(分布的形状)•离散量数分析•表示一组数据变异程度或分散程度的量数。•离散程度值越大,集中趋势值的代表性越小;离散程度值越小,集中趋势值的代表性越大。•种类:方差、标准差、全距、异众比率、离散系数、偏度系数等。•极差(全距)、四分位数间距、均方差、方差和标准差•离散量数分析•全距(range):最大值与最小值的差,用R表示。•反映数据的离散状况太粗略、不灵敏,只作参考•四分位数差(Inter-QuartileRange,IQR):是两个四分位数之差,即内距IQR=高四分位数-低四分位数•异众比率•非众数的频数与全部个案数的比值,用VR表示。指众数所不能代表的其他数据(非众数数据)在总数据中的比重。•VR值越大,众数的代表性越小,反之VR值越小,则众数的代表性越大。偏度和峰度•偏度(skewness)和峰度(kurtosis)用于描述数据分布与正态分布之间的差异程度。•斜度表示分布与正态曲线相比较的不对称程度和方向。如果分布式对称的,则斜度为0;如果偏向左边,斜度为正;如果偏向右边,斜度为负。•峰度表示与正态曲线相比的冒尖程度或扁平程度。如果分布与正态曲线的形状相当,峰度为0;如果比正态曲线瘦高,峰度为正;如果比正态曲线扁平,峰度为负。集中趋势(员工薪水数据库之教育年限变量)StatisticsEducationalLevel(years)474013.4912.00126395ValidMissingNMeanMedianModeSum离散趋势(员工薪水数据库之教育年限变量)StatisticsEducationalLevel(years)4740.1332.8858.32213821ValidMissingNStd.ErrorofMeanStd.DeviationVarianceRangeMinimumMaximum百分位显示StatisticsEducationalLevel(years)47408.0012.0012.0012.0012.0012.0015.0015.0015.0016.0017.00ValidMissingN1020253040506070758090Percentiles分布指标StatisticsEducationalLevel(years)4740-.114.112-.265.224ValidMissingNSkewnessStd.ErrorofSkewnessKurtosisStd.ErrorofKurtosis显示频数分布表显示频数表员工受教育年限的频数分布表EducationalLevel(years)5311.211.211.219040.140.151.361.31.352.511624.524.577.05912.412.489.5112.32.391.891.91.993.7275.75.799.42.4.499.81.2.2100.0474100.0100.08121415161718192021TotalValidFrequencyPercentValidPercentCumulativePercent图表2、Descriptives功能DescriptiveStatistics47413821639513.492.8858.322474EducationalLevel(years)ValidN(listwise)NRangeMinimumMaximumSumMeanStd.DeviationVariance