实验一:EXCEL的数据整理与显示一、实验目的及要求:(一)目的1.了解EXCEL的基本命令与操作、熟悉EXCEL数据输入、输出与编辑方法;2.熟悉EXCEL用于预处理的基本菜单操作及命令;3.熟悉EXCEL用于整理与显示的基本菜单操作及命令。(二)内容及要求根据学生实验数据2011-2012,1.用Excel制作一张学生政治面貌的频数分布表,并绘制一张柱状图,反映不同政治面貌的学生人数分布情况。政治面貌汇总共青团员160其他7中共党员13总计1802.对学生的体重进行等距分组,整理成频数分布表,并绘制直方图。分组频率40-442045-493850-544655-592460-642465-691670-74575-79680-841合计1803.编制生源与专业交叉分布的列联表,并画出雷达图,比较两个专业的学生生源的分布是否相似。生源专业会计物流总计北京、天津、上海251439农村131225省会城市141327县城231437小城镇、集镇12517中等城市231235总计11070180二、仪器用具硬件:计算机(安装Windows98、Windows2000或WindowsXP或以上)软件:EXCEL三、实验原理统计中数据整理与显示的相关理论。四、实验方法与步骤1.用Excel制作一张学生政治面貌的频数分布表,并绘制一张柱状图,反映不同政治面貌的学生人数分布情况。1)菜单——数据——数据透视表和数据透视图2)将政治面貌拉到列和数据中计数项:政治面貌 政治面貌汇总共青团员160其他7中共党员13总计1803)插入——图表——柱状图2.对学生的体重进行等距分组,整理成频数分布表,并绘制直方图。1)复制学生体重数据放入新的工作区——数据——排序4449545964697479842)输入接受区域数据3)工具——数据分析——直方图4)输入区域选择体重数据,接受区域为5)修改输出,结果如下分组频率40-442045-493850-544655-592460-642465-691670-74575-79680-841合计1806)选中表格——插入——图标,选择柱状图——修改分类间距3.编制生源与专业交叉分布的列联表,并画出雷达图,比较两个专业的学生生源的分布是否相似。1)数据——数据透视表和数据透视图——新建2)将生源拉入列,专业拉入行,生源拉入数据专业生源会计物流总计北京、天津、上海251439农村131225省会城市141327县城231437小城镇、集镇12517中等城市231235总计110701803)选中表格,插入——图标——雷达图由上图看出,会计和物流的学生生源的分布相似。五、实验结果与数据处理1、频数分布表计数项:政治面貌 政治面貌汇总共青团员160其他7中共党员13总计1802、分组频率40-442045-493850-544655-592460-642465-691670-74575-79680-841合计1803、生源专业会计物流总计北京、天津、上海251439农村131225省会城市141327县城231437小城镇、集镇12517中等城市231235总计11070180六、讨论与结论实验二:EXCEL的数据特征描述、列联分析、多元回归分析一、实验目的及要求:(一)目的熟悉EXCEL用于数据描述统计、列联分析、多元回归的基本菜单操作及命令。(二)内容及要求根据学生实验数据2011-2012,1.对学生的身高进行描述统计,说明学生身高的一些基本特征。2.对不同户口中贫困生的分布情况编制列联表,并分析贫困生的数量的多少是否与户口的不同是有关。3.根据学生的体育成绩(y1)与学生的年龄(x1)、体重(x2)、身高(x3)和性别(x4)建立一个多元回归模型,并判断此模型有无意义。二、仪器用具硬件:计算机(安装Windows98、Windows2000或WindowsXP或以上)软件:EXCEL三、实验原理统计中数据整理与显示的相关理论。四、实验方法与步骤1.对学生的身高进行描述统计,说明学生身高的一些基本特征。1)在“工具”中的“数据分析”选择“描述统计”,其中“输入区域”为“身高”列。身高平均164.7722222标准误差0.595129756中位数163.5众数155标准差7.984503536方差63.75229671峰度-0.696982464偏度0.248125331区域36最小值150最大值186求和29659观测数180最大(1)186最小(1)150置信度(95.0%)1.1743727562.对不同户口中贫困生的分布情况编制列联表,并分析贫困生的数量的多少是否与户口的不同是有关。1)在“数据”的“数据透视表和数据透视图”选择“数据透视表”,然后显示勾选“现有工作表”中的“布局”,其中“布局”为依次将“户口”拖至“列”区域,将“是否贫困生”拖至“行”区域,将“户口”拖至“数据”区域,至此完成,其结果显示如下:计数项:是否贫困生是否贫困生 户口否是总计城市户口12511136农村户口38644总计163171802)将做好的数据透视表“选择性粘贴”,要勾选“数据”和“转置”;3)根据公式计算出期望值,并绘制期望值和观察值表格,结果显示如下:贫困生占总人数的比例:17/180*100%=9.4%非贫困生占总人数的比例:163/180*100%=90.6%观察值期望值1251231113384064选择函数“CHITEST”,“Actual_range”选中观察值数据,“Expected_range”选中期望值数据。3.根据学生的体育成绩(y1)与学生的年龄(x1)、体重(x2)和身高(x3)和性别(x4)建立一个多元回归模型,并判断此模型有无意义。1)新建“sheet4”,将“性别”“年龄”“体重”“身高”“体育成绩”四列复制,粘贴到“sheet4”;2)在“sheet4”中将“性别”列复制,然后粘贴到现有工作表,其中要将“性别”改为“代码”,在“编辑”中的“查找和替换”中用“0”替代“男”,用“1”替代“女”;3)在空白列首行输入“Y”,选择“筛选”中的“自动筛选”,其中“性别”为“男”,在“Y”列的空白格为“男生的体育成绩/1”,同理可得女生的“Y”值为“女生的体育成绩/0.8”;4)在“工具”中的“数据分析”中选择“回归”,然后在“Y值输入区域”选中“Y”列数据;“X值输入区域”选中“代码”“年龄”“体重”“身高”四列数据,选择“选择输出区域’,至此完成。五、实验结果与数据处理(一)描述统计身高平均164.7722222标准误差0.595129756中位数163.5众数155标准差7.984503536方差63.75229671峰度-0.696982464偏度0.248125331区域36最小值150最大值186求和29659观测数180最大(1)186最小(1)150置信度(95.0%)1.174372756学生身高的基本特征:该数据为右偏分布,众数中位数平均数;学生身高平均值约为164.77厘米,中位数为163.5厘米,众数位155厘米。还有学生身高的方差和标准差都比较大,说明学生中身高差距大,分布比较不平衡。(二)经过excel统计得出如下列联表:不同城市户口中贫困生的分布情况列联表计数项:是否贫困生是否贫困生 户口否是总计城市户口12511136农村户口38644总计16317180根据excel计算结果得出,相关性为:0.696,即P=0.696136326α=0.05,不能拒绝原假设,因此是否贫困生与户口是无关的。(三)多元回归模型SUMMARYOUTPUT回归统计Multiple0.796934RSquare0.635103AdjustedRSquare0.626763标准误差25.01996180方差分析dfSSMSFSignificanceF回归分析4190671.347667.8376.146872.7701E-37175109549.7625.9985179300221Coefficients标准误差tStatP-valueLower95%Upper95%下限95.0%Intercept404.1382.632144.8907122.26E-06241.046221567.2139241.0462567.2139Variable-1.667122.046022-0.814810.416287-5.70517872.37093-5.70518Variable0.3069090.3392120.9047720.36683-0.36256330.976381-0.362560.976381Variable-0.919510.427453-2.151140.032836-1.7631378-0.07589-1.76314-0.07589Variable56.930886.2014599.1802391.2E-1644.691600469.1701544.691669.17015回归模型:y=404.13-1.66712X1+0.306909X2-0.91951X3+56.93088X4AdjustedRSquare=0.626763,即解释力度为62.6763%;F检验:将SignificanceF值(即P值)与给定的α=0.05进行比较,因为SignificanceF=2.7701E-37α=0.05,所以学生的年龄、体重、身高和性别与学生的体育成绩之间的线性关系显著;t检验:直接用p值进行比较,可以看出,其中x3和x4对应的p值小于0.05,通过t检验,但x1和x2对应的p值大于0.05,未通过检验。这说明了:在影响体育成绩的4个变量中只有身高和性别的影响是显著的,而其他2个变量均不显著。小结:虽然该模型中的因变量(体育成绩)与各自变量之间总体显著,但因变量与其中两个自变量的线性关系并不显著,因此该模型虽然有一定意义,但说明力度不大。六、讨论与结论在做实验过程中经常忘记如何应用Excel的功能,还有对于书上的一些重要的公式没有掌握好,其中主要是期望的计算和相关性系数的检验的很不熟悉。实验三:时间序列分析一、实验目的及要求:(一)目的掌握EXCEL用于移动平均、线性趋势分析的基本菜单操作及命令。(二)内容及要求综合运用统计学时间序列中的移动平均、季节指数运算、时间序列因素分解、图形展示等知识,并结合经济学等方面的知识,对一家大型百货公司最近几年各季度的销售额数据(见Book13)的构成要素进行分解,并绘制图形进行分析。二、仪器用具硬件:计算机(安装Windows98、Windows2000或WindowsXP或以上)软件:EXCEL三、实验原理时间序列分析中的移动平均分析原理、季节指数原理等。四、实验方法与步骤(一)季节指数和季节变动图1.完善“年/季度”列和“时间标号”列;2.在“粘贴”中“选择性粘贴”(其中要勾选“数值”和“转置”)将“销售额”从“sheet1”复制粘贴到“sheet2”中的“销售额”列;3.分别计算数值。第一,计算移动平均值。在数据分析中选择移动平均,输入区域选择“销售额”列,在输出区域选择“移动平均值”列,其中间隔值为4;第二,计算中心化后的移动平均值。在数据分析中选择移动平均,输入区域选择“移动平均值”列,在输出区域选择“中心化后的移动平均值”列,其中间隔值为2;第三,计算比值。用“C7/E7”求出“比值”列的值;第四,计算季节指数。用“选择性粘贴”(并注意勾选“数值”和“转置”)将“比值”列的值复制粘贴到“各季节指数计算表”;进行合计,得出∑值,通过∑/9得出平均值。通过平均值的合计值/4得出误差1.003823,最后求出季节指数=∑/1.003823;4.画出季节变动图。在常用工具栏的“图标向导”图标中选择“折线图”,其中在系列中删除“季节”并在“标题”中的“分类(X)轴”填“季节”至此得出季节变动图。(二)各项趋势值第一,补充完整“sheet3”里的“年/季度”列和“时间标号”列,用“选择性粘贴”将“季节指数”从“sheet