实验2数据特征的描述统计分析

gnuwind
4 ℃
2020-01-02

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

实验2数据特征的描述统计分析1.下表是一电脑公司某年连续120天的销售量数据(单位：台)。试对其进行频数分析，计算均值、中位数、众数、四分位数,标准差、最大值、最小值、全距,偏度、峰度系数；画出直方图、茎叶图、箱线图；解释结果并说明其分布特征。操作步骤：1.输入数据并设置变量为V12.选择“分析”→“描述统计”→“频率”命令，弹出如下图的对话框。点击“频率”对话框，选择变量V1，点击中间的右箭头，使变量V1进入右边的列表框。点击“统计量”按钮，弹出如下对话框。选中“四分位数”、“均值”、“中位数”、“众数”、“标准差”、“范围”、“最小值”、“最大值”、“偏度”、“峰度”。3.击“继续”回到“频率：统计量”界面。点击“图标”按钮，选择“直方图”，点击继续。回到《频率：统计量》界面，确定。结果分析1.描述性统计表从表中可以看出：有效样本数为120，没有缺失值。销售平均值为184.57，标准差为21.681，最大值为237，最小值为141。2.频率分布该表给出了电脑公司的销售额的频数分布。该表从左到右分别是有效的样本值、频数、频数占总数的百分比、有效数占总数的百分比、累计百分比。3.直方图从直方图可以看出销售额近似服从正态分布，而且集中趋势在175。4.茎叶图这是数据的茎叶图。从左到右分别是频数、茎、叶三部分。其中茎代表数值的整数部分，叶代表数值的小数部分。由每行的茎叶构成的数字再乘以茎宽，则为实际数据的近似值。5.箱线图这是电脑公司销售额数据的箱线图，其中箱为四分位间距的范围，所谓四分位距就是百分数75代表的值减去百分数25代表的值。中间的粗线表示平均数，上面和下面的细线分别表示最大值和最小值。2.下表是某班同学月生活费资料，试对其进行描述分析，并对结果作出说明。操作步骤：1.输入数据，然后选择“分析”→“描述统计”→“描述”命令在“描述性”对话框的左侧列表选择“人数f”，单击中间的右箭头，使之进入“变量”列表框。2.选择“将标准化得分另存为变量”复选框。单击“描述性”对话框右上角的“选项”，然后选择“均值”，在“离散”选项组中选择“标准差”、“方差”、“范围”、“范围”、“最小值”、“最大值”、“均值的标准误差”复选框。在“分布”选项组选择“偏度”、“峰度”复选框。在“显示顺序”选项组中选择“变量列表”复选框。设置完毕后，单击“继续”，然后“确定”。结果分析：如表，样本个数为8个，极差为7，最小值为2，最大值为9，均值为4.75，均值的标准误差为0.881,标准差为2.493，方差为6.214，偏度系数为0.526，峰度系数为-0.653。3.某项调查要研究城市居民居住年限的长短与对该地区百货公司熟悉程度之间的关系。随机调查266户居民，收集数据如下表：（1）.操作步骤：1.输入数据，对“熟悉程度”变量用“1”表示“不熟悉”，用“2”表示“熟悉”；对“居住时间”变量用“1”表示“小于13年”，用“2”表示“13-30年”，用“3”表示“30年以上”，如图：2.对数据进行预处理，以计数变量对升学变量进行加权。选择“数据”→“加权个案”，在“加权个案”对话框中选中“加权个案”，然后在左侧的列表框中选中“计数”，单击中间右箭头，使之进入“频率变量”列表框。单击确定，完成数据预处理。3.选择“分析”→“描述统计”→“交叉表”命令，选择“熟悉程度”并单击中间右箭头使之进入列表框。最后选中“显示复式条形图”4.选择检验统计量的计算方法。单击“精确”，选中“仅渐进法”，单击继续，返回交叉表。然后选择相关统计检验。单击“交叉表”对话框右侧的“统计量”，选中“卡方”复选框，用于检验“熟悉程度”与“居住时间”之间是否相关。返回然后单击“交叉表”对话框右侧的“格式”，选中“升序”，然后单击确定。结果分析：1.样本总值为266，没有缺失值。2.列联表。如表所示，居住时间小于13年的人中，46.4%的人熟悉程度为不熟悉，53.6%的人熟悉程度为熟悉；居住时间为13-30年的人中，39.1%的人熟悉程度为不熟悉，60.9%的人熟悉程度为熟悉；30年以上的人中，50.4%的人熟悉程度为不熟悉，49.6%的人熟悉程度为熟悉。3.卡方检验结果。可以看出，卡方值为14.201，自由度为2，双侧概率为0.001.由于p值为0.001，小于0.05，可以认为熟悉程度与居住时间有显著关系。