系部:土木工程专业:年级:13级_课程名称:应用统计学学号:姓名:指导教师:2015年5月3日2《应用统计学》SPSS操作实验1主讲老师:2015年5月4日姓名成绩年级专业学号课程名称应用统计学实验名称数据录入、描述性统计练习教师评语年月日一、实验目的及要求熟练掌握图表描述与统计量描述。二、写出下列概念1.频率2.累积频率3.众数4.中位数5.极值6.极差7.样本均值8.样本方差答:1.频率又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通常用比例或百分数表示。也就是说在某一不确定的事件中,所考察对象出现的次数与实验次数的比叫做频率。2.累积频率把样本值小于某个样本数据的都加起来的值。3.众数样本数据集合中出现频次最高的那个样本值,称为众数。4.中位数对样本数据进行排序,把处于中间位置上的数据称为中位数。5.极值样本数据中最大的和最小的值,称为极值。6.极差极大值和极小值的差7.样本均值把样本数据集合中的所有数据加起来,然后在除以样本数据集合中的样本个数。8.样本方差离差平方和与n-1的比值。3三、实验内容1.某高校海外学生的第一学期的汉语成绩如下:676971707274767575747374747877817373746871747870697372747780757472836873757876747368717275797475747468797576757774747575797775757473737271687071727373727271717082777673706869717778687273787779727272757574747476767473747372727471727372727474687172727574767774747373787876747572727275747677(1)用SPSS制作频数分布表,频率分布表,累积频率分布表。(2)用SPSS做如下计算练习:统计数据的频次、频率、累积频次与累积频率。计算众数、中位数、样本均值等。解:数据的频次、频率、累积频次与累积频率如上图所示。4计算极值、四分点、极差、四分位距、离差、离差平方和、方差等。用SPSS做一张茎叶图。5用SPSS做直方图。四、实验结果1.实验过程:打开spss软件,录入数据,点击分析按钮,然后点击描述统计按钮,点击频率,对数据进行分析。得出图标,并截图粘贴在作业上面。2.实验结论:该校海外学生的语文成绩平均分为74分,大多数人在70分以上。6《应用统计学》SPSS操作实验2主讲老师:2015年5月3日姓名成绩年级专业学号课程名称应用统计学实验名称SPSS的相关分析教师评语年月日一、实验目的及原理1.掌握用spss软件对数据进行相关性分析,熟悉其操作过程,并能分析其结果。2.相关性分析是考察两个变量之间线性关系的一种统计分析方法。更精确地说,当一个变量发生变化时,另一个变量如何变化,此时就需要通过计算相关系数来做深入的定量考察。P值是针对原假设H0:假设两变量无线性相关而言的。一般假设检验的显著性水平为0.05,你只需要拿p值和0.05进行比较:如果p值小于0.05,就拒绝原假设H0,说明两变量有线性相关的关系,他们无线性相关的可能性小于0.05;如果大于0.05,则一般认为无线性相关关系,至于相关的程度则要看相关系数R值,R越大,说明越相关。越小,则相关程度越低。而偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程,其检验过程与相关分析相似。二、实验准备试在图书馆论文数据中下载一篇关于相关分析的论文,并用SPSS软件验证其结果。三、实验内容1.合成纤维的强度与其拉伸倍数有关,测得试验数据如下表所示,序号拉伸倍数强度(kg/mm2)12.01.622.52.432.72.543.52.754.03.564.54.275.25.086.36.497.16.5108.07.3119.08.01210.08.1要求:绘制上述数据的散点图,并计算相关系数,说明合成纤维的强度与其拉伸倍数之间是否存7在显著的线性相关关系。2.某农场通过试验取得某农作物产量与春季降雨量和平均温度的数据,如下表。现求降雨量和产量的偏相关系数,并进行检验。产量降雨量温度1502562303383004510450105134801111450011516550120175801201860012518600130203.试在图书馆论文数据中下载一篇关于相关分析的论文,并用SPSS软件验证其结果。四、实验结果1.实验过程:第一题:1.打开SPSS软件,建立合成纤维强度与其拉伸倍数的实验数据,如图2.选择菜单:【图形】→【散点/点状】,选择简单类型的散点图,按“定义”对散点图做定义83.选择菜单:【分析】→【相关】→【双变量】,将“拉伸倍数”和“强度”选入“变量”框中。点击【确定】。第二题:1.打开SPSS软件,建立产量、降雨量、温度的实验数据,如图2.选择菜单:【分析】→【相关】→【偏相关】,将“产量”和“降雨量”选入“变量”框中,“温度”选入“控制”框中。点击【确定】。9第一题结果10结论:从表中可以看出,强度与拉伸倍数之间的相关系数为0.000,小于0.005,表明两个变量之间显著相关。第二题结果:结论:从表中可以看出,降雨量与温度之间的相关系数为0.957,t检验的显著性概率为0.0000.01,拒绝零假设,表明两个变量之间显著相关。降雨量与粮食产量之间的相关系数为0.981,t检验的显著性概率为0.0000.01,拒绝零假设,表明两个变量之间也显著相关。产量与降雨量的偏相关系数为0.780,显著性概率p=0.0130.01,说明在剔除了温度的影响后,产量与降雨量没有显著性关系。通过相关关系与偏相关关系的比较可以得知:在温度的影响下,产量与降雨量没有显著性关系。五.论文掌握使用spss软件对数据进行相关性分析,从变量之间的相关关系,寻求与居民消费水平密切相关的因素。(1)检验我国居民手机拥有量与全国总人口数、我国居民人均可支配收入、全国手机产量之间的相关关系。a.打开spss软件,输入数据。11b.在spss的菜单栏中选择点击分析相关双变量,弹出一个对话窗口。C.在对话窗口中点击确定,系统输出结果,如下表。从表中可以看出,我国居民手机拥有量与总人口数之间的相关系数为0.830,t检验的显著性概率为0.0000.01,拒绝零假设,表明两个变量之间显著相关。我国居民手机拥有量与我国居民人均可支配收入之间的相关系数为0.967,t检验的显著性概率为0.0000.01,拒绝零假设,表明两个变量之间也显著相关。我国居民手机拥有量与我国手机产量之间的相关系数为0.978,t检验的显著性概率为0.0000.01,拒绝零假设,表明两个变量之间也显著相关(2)控制我国居民人均可分配收入,全国手机产量与全国总人口数、我国居民手机拥有量、全国手机产量之间的相关关系研究之间的偏相关关系。读入数据后:A.点击分析相关偏向量,系统弹出一个对话窗口。B.点击确定,系统输出结果,如下表。12从表中可以看出,我国居民手机拥有量与全国手机产量的偏相关系数为0.741,显著性概率p=0.0000.01,说明在剔除了我国居民人均可支配收入的影响后,居民消费水平与国民总收入依然有显著性关系,并且0.7410.978,说明它们之间的显著性关系稍有减弱。我国居民手机拥有量与总人口数的偏相关系数为-0.761,显著性概率p=0.0110.01,说明在剔除了我国居民人均可支配收入的影响后,居民消费水平与国民总收入没有显著性关系,并且-0.7610.830,说明它们之间的显著性关系十分减弱。从表中可以看出,我国居民手机拥有量与我国居民人均可支配收入的偏相关系数为0.926,显著性概率p=0.0000.01,说明在剔除了总人口数的影响后,我国居民手机拥有量与我国居民人均可支配收入依然有显著性关系,并且0.9260.927,说明它们之间的显著性关系稍有减弱。我国居民手机拥有量与全国手机产量的偏相关系数为0.947,显著性概p=0.0000.01,说明在剔除了总人口数的影响后,居民消费水平与国民总收入有显著性关系,并且0.9470.978,说明它们之间的显著性关系有点减弱。从表中可以看出,我国居民手机拥有量与我国手机产量的偏相关系数为0.741,显著性概率p=0.0000.01,说明在剔除了总人口数的影响后,我国居民手机拥有量与我国居民人均可支配收入依然有显著性关系,并且0.7410.978,说明它们之间的显著性关系稍有减弱。我国居民手机拥有量与全国总人口数的偏相关系数为-0.570,显著性p=0.0110.01,说明在剔除了我国居民人均可支配收入的影响后,我国居民手机拥有量与全国手机产量没有显著性关系,并且-0.5700.947,说明它们之间的显著性关系十分减弱。结论:通过相关关系与偏相关关系的比较可以得知,在我国居民人均可支配收入13的影响下,全国手机产量、总人口数对我国居民手机拥有量的影响减弱。