数据统计与分析课后答案

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

附录2:《数据统计与分析——SPSS应用教程》习题答案本“习题答案”也适用于《统计分析应用教程—SPSS,LISREL&SAS实例精选》书中的习题。习题1答案1.(1)答:有错误,犯了水平互相嵌套的错误;如“每周去2次或2次以上”把第1组的编码嵌套进去了。又比如:“每周去3次或3次以上”又把第2组的编码嵌套进去了。(2)答:正确的编码方案如下:1=每周去1次2=每周去2次3=每周去3次4=每周去4次或4次以上2.答:该编码问题严重。(1)80岁不能是缺失值,缺失值可用00岁。(2)职业不编码不行,而必须编码为:1=工人2=农民等等。(3)职业变量用全称(Occupation)超出8个字符。(4)而且栏目位置占1列即可。(5)颜色的第1个字母作为变量值会引起重复,应该用单词的前3-4个字符。(6)Color变量的栏目位置10被嵌套在“4-14”之内,这是严重的错误。更正后的编码方案见图1-19:VariableCode栏目位置Age00岁是MissingValue1-2Occupation①职业应编码为:1=工人2=农民3=教师4=干部5=医生6=其它②职业变量要缩写,如Occu,然后用变量标签注解Occu为“职业”3Color颜色用前三个字母作为变量值,比如:blu=蓝色(blue)bla=黑色(black)4图1-19纠错后的编码方案3.(1)答:错。错在变量名超过8个字符。(2)答:错。错在变量名的首字符是数字领头。(3)答:错。错在变量名中间冒出一个空格。(4)答:对,#号可以作为变量名。但不提倡。习题2答案1.答:合并后的大目标数据文件“BIGab.sav”中仍然有30个Cases、但每个Cases各有(50+30)=80个变量,即v1、v2、v3、v4……v50、x1、x2、x3、x4……x30。2.答:合并后的大目标数据文件“BIGab2.sav”中仍然是50个变量,即v1、v2、v3、v4……v50。但是Cases数目增加为(20+30)=50个Cases。3.答:请读者照着书中的方法去使用对话框。排序的命令如下:SORTCASESBYxh(D)sex.LISTxhsexscore。4.答:对话框的解法请按照书中介绍的去举一反三。命令解法如下:GETFile=’9293.sav’.SELECTIF(location=2ANDsex=2).SORTCasesBYxh(D)sex.LISTxhsexscore.5.答:对话框的解法请按照书中介绍的去举一反三。命令解法如下:SAMPLE0.20.LISTxh.6.答:对话框的解法请按照书中介绍的去举一反三。命令解法如下:N50.LISTxh.7.答:对话框的解法请按照书中介绍的去举一反三。命令解法如下:WEIGHTBYlocation.8.答案略。9.答案略。习题3答案1.(1)答:DATALIST命令本身应有终止符“.”。(2)答:在DATALIST命令中,File所调用的数据文件名必须用一对左撇号括住。正确的写法是:DATALISTFile='Myf1.Dat'/v11-2v23.(3)答:栏目位置不够变量数目整除。正确的写法是:DATALIST/v1Tov1210-33.(4)答:数值标签要用一对左撇号括住,而且要加上命令的终止符“.”。正确的写法是:VALUELABELVf1'工人'2'农民'3'教师'4'医生'.(5)答:命令后面应有终止符“.”。正确的写法是:VALUELABELVf1'工人'2'农民'3'教师'4'医生'5'干部'.(6)答:定义缺失值时只能根据变量的栏目位置赋予一个唯一的值。正确的写法是:MISSINGVALUEv1Tov100(-1).或是:MISSINGVALUEv1Tov100(0).(7)答:变量标签是唯一的;一个变量应该对应唯一的一个标签。正确的写法是:VARIABLELABELScore1'第一次考试的成绩'/Score2'第二次考试的成绩'/Score3'第三次考试的成绩2.(1)答:此文件的前5个cases见表1-4。表1-4文件的前5个casesCASESIdageHeight101231.65202221.70306211.75408211.76512211.68(2)答:学号为01的学生有最多的Score1(高考得分)。(3)答:学号为12的学生家住农村。(4)答:在Vm变量中,有4个Cases的数据有效。3.答:至少有8处错误。(1)A应改为(A)(2)Haircolor超过8个字符,应改为Haircolr(3)Weigh应改为WEIGHT(4)VALUELABEL中的Eyecolr应改为Eyecolor(5)VALUELABEL中的Haircolor应改为8个字符以内,如Haircolr(6)MISSINGVALUE中的age(-1)应去掉,因为DataList中尚未定义age。(7)正确的MISSINGVALUE语句应改为:MISSINGVALUEHeightWeight(000).(8)ListVariable语句应改为:ListVariable=HeightToEyecolor.4.答:“05FLl”中的Ll为字母(型),犯了类型不匹配的错误。正确的写法是:05F005.答:总体(population)是样本测量值的集合。对于感兴趣的整个组中,每个成员都对应一个这样的值。具体说来是某省的人口(总体)或工业产值(总体)中的某个指标测量值的集合,而不是那些人或物的集合。样本(sample)虽然也是一些值的集合,但不代表整个感兴趣的组。比如,一个样本可以是某省中某县的人口的集合或某县工业产值的集合。6.答:由于总体与样本的不同,由此派生出参数与统计量的差别。(1)参数:参数(parameters)是总体的测量值,用希腊字母表示。(2)统计量:统计量(statistics)则是样本的测量值,用一般的英文字母表示(见本章内容)。7.答:(1)均值:用以描述数据(值)分布的中心位置。定距以上的数据计算均值才有意义。比如,对于一个总体(某省)的人口,其平均值被称为总体均值(populationgmean),记为μ。对于某样本(某县)的人口,其平均人口则被称为样本均值(sampleaverage)。总体均值和样本均值的计算公式是相同的。但是其他测量值不一定相同。此外,还有方差、标准偏差等概念。(2)标准偏差:也被称为标准差。表示某人的身高或收入等测量值偏离均值多少。比如甲班语文成绩的标准偏差为20,乙班语文成绩的标准偏差为30,那么,乙班语文成绩比甲班的语文成绩变化(波动)大。(3)方差:标准偏差的平方则是方差。方差表示数据内部的变异性。8.答:统计学上,一般都是假设被统计的样本是来自正态分布(Normaldistribution)的总体。正态分布是关于总体的一种理论分布,是有严格的数学定义的。从正态分布的总体中抽取的样本一般是服从正态分布的。正态分布的重要特征如下:(1)均值:均值是观察值的平均值(Meanvalue)。区间(Interval)型以上变量值的均值才有意义。(2)众数:众数是最经常发生的频次。众数是对定类变量(Nominal)而言的。比如某班有男生25名、女生15名,那么,该班男生的人数是众数。(3)中位数:中位数是对次序(Ordinal)变量值而言的。中位数是比取值的一半大、同时又比取值的一半小的值。或者说,中位数的一半落在均值之上,同时,另一半则落在均值之下。中位数的取值方法有两种:单数情况下的观察值的中位数;双数情况下的观察值的中位数。(4)正态分布的均值、众数、中位数重叠:将正态分布的图形沿着中心位置对半折叠时,均值、众数、中位数三者重叠在一起。9.有哪些经验规则?答:如果数据来自服从正态分布的总体,可用下面的经验规则很快地概括出我们的数据。经验规则如下:·68%的观察值是落在离均值一个标准偏差(1σ)的范围内。·95%的观察值是落在离均值两个标准偏差(2σ)的范围内。·99%的观察值是落在离均值三个标准偏差(3σ)的范围内。习题4答案下面是RECODE习题。1.答:命令格式如下:RECODEv1,v2(原值1=新值1)(原值2=新值2)......(原值m=新值m)例如:RECODEage(0thru30=1)(30thru60=2)(60thru90=3)(90thruhi=4).2.答:命令中允许使用的关键词如下:LO(或LOWEST)、HI(或HIGHEST)、THRU、MISSING、ELSE、SYSMIS3.(1)答:语法正确,但结果不太理想。因为结果只剩下0和2两组。(2)答:语法正确,但结果不太理想。原因同上。4.答:用“/”分隔。例如:RECODEGage(1,2=1)(3,4=2)/sex(1=1)(2=0).5.答:对。因为将变量A由原来的4组合并为两组。6.(1)答:对。这是端点连接法。(2)答:对。符合语法规则,但是会漏掉各组的端点值。(3)答:对。符合语法规则。但结果只剩下100卡以内的一组数据。7.RECODEage(MISSING=00).MISSINGVALUEage(-1).(进一步将系统缺失值“-1”改为用户缺失值)8.答:RECODEINCOME(LOTHRU5000=1)(5000THRUHI=2).9.答:RECODEsex(’F’=’B’)(’M’=’A’).10.答:有以下4个变换命令。RECODEsex(1=1)(2=0).COMPUTEGage=age.COUNTFM=F(1)M(2).IF(sex=2ANDlocation=2)GROUP=2.下面是Compute习题11.答:COMPUTEscore=S1/S2*100.COMPUTEX=ABS(-7.8).12.答:见第4章。13.(1)答:Y1=7.8(2)答:Y2=-16(3)答:Y3=25(4)答:Y4=-1(5)答:A=10(6)答:B=0.79(7)答:C=2.2(8)答:D=2(9)答:E=2.72(10)答:F=0下面是COUNT习题14.(1)答:真(2)答:真(3)答:假15.(1)答:真(2)答:真习题5答案下面是FREQUENCIES习题答案。1.(1)答:众数(2)答:众数(3)答:均值(4)答:均值(5)答:众数(6)答:均值(7)答:均值2.(1)答:真(2)答:真(3)答:假(4)答:假(5)答:真3.答:已填补的频次见图5-24中打#标记的数据。择偶标准11538.538.538.55#12.8#12.8#51.3717.917.969.2#512.812.882.137.77.789.712.62.692.337.7#7.7100.039100.0100.0相貌文化水准气质风度志同道合人品本人收入其他TotalValidFrequencyPercentValidPercentCumulativePercent图5-24择偶标准的频率表4.(1)答:画出的book变量的频率表见图5-25。BOOK315.015.015.0420.020.035.0420.020.055.0315.015.070.0315.015.085.0210.010.095.015.05.0100.020100.0100.02.003.004.005.006.009.0010.00TotalValidFrequencyPercentValidPercentCumulativePercent图5-25book变量的频率表(2)答:用直方图为宜。因为直方图可画出空缺的位置,便于一目了然地看出缺的是何种数据。(3)答:直方图与条形图的主要区别见表5-1。表5-1直方图与条形图的主要区别直方图条形图①适用于区间(定距)以上的数据,如:收入、年龄、工资、体重等。适用于标称(定类)型以上的数据。如:性别、肤色、种族、国别等。②以图形的面积为频次以图形的条形为频次③变量的某种水平空缺时仍留空位置变量的某种水平空缺时,不留空位下面是Descriptive习题答案。5.(1)答:Compu

1 / 21
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功