营销数据分析总复习题第一部分章节复习题第一、二章一、单项选择题1.问卷设计中封闭式间题与开放式问题的区别是A.列出两个对立的答案,由被调查者选择一个B.列出多个备选答案,由被调查者选择一个C.列出多个备选答案,被调查者选择多个D.前者设立备选答案,后者不设备选答案2.在给变量命名时,下面的提法正确的是:A.SPSS的变量名中不能有汉字B.SPSS的变量名中可以有汉字,最多可以有8个汉字C.SPSS的变量名中可以有汉字,最多可以有4个汉字D.SPSS的变量名中可以有汉字,汉字个数没有限制3.SPSS数据文件的扩展名是:A..xlsB..sasC..docD..sav4.对于用SPSS读取Excel的数据文件,下面的提法正确的是:A.SPSS不能读取Excel的数据文件B.如果Excel的数据文件首行有变量名,那么SPSS只能读取数据而无法读取首行的变量名C.如果Excel的数据文件首行有变量名,那么SPSS不仅可以读取数据,而且可以读取首行的变量名D.以上说法都不对5.横向合并数据选择怎样的菜单A.MergerFileB.AddCasesC.MergeVariableD.AddVariable二、多选题1.下列名称哪些可以在SPSS中充当变量名。A.性别B.XINGZHENGSHIYEDC.行政事业单位D.NIANNINE.A!358F.J5678G.N_35678H.ALL2.SPSS有哪些数据类型。A.数值型B.定序型C.定类型D.字符型E.定量型F.日期型G.标准型H.圆点型三、简答题1.按数据的计量尺度可将数据分为哪三类,这三类数据类型在SPSS中如何定义其尺度。并分别举例说明。2、下面是每周去图书馆学习的次数的编码方案:1=每天去1次2=每周去2次或2次以上3=每周去3次或3次以上4=每周去4次或4次以上1)如此编码,有无错误?为什么?2)试写出正确的编码方案。3、下图是对年龄、职业、喜欢的颜色三个变量的编码方案及其栏目位置。VariableCode栏目位置Age80岁是MissingValue1~2Occupation1)职业不编码2)职业变量用全称10~14Color颜色用第1个字母作为变量值10该编码有什么问题?请加以更正。4.1)在下窗口左框UnpairedVariables中*代表什么?+代表什么?2)Indicatecasesourceasvariable项代表什么?3)上窗口能对数据文件进行怎样的处理?5、变量的横向合并中,如目标数据文件“F1.sav”有30个Cases,每个Cases各有50个变量,即v1,v2,v3,…v50。目标数据文件“F2.sav”有30个Cases,每个Cases各有30个变量,即x1,x2,x3,…x30。则合并后的大目标数据文件“F12.sav”中有多少个Cases,每个Cases各有多少个变量?6、Cases的纵向合并中,如目标文件“F3.sav”有20个Cases,每个Cases有50个变量,即v1,v2,v3,…v50。目标数据文件“F4.sav”有30个Cases,每个Cases各有50个变量,即v1,v2,v3,…v50。则合并后的大目标文件“F34.sav”中有多少个Cases,每个Cases各有多少个变量?第三章SPSS数据的预处理一、单项选择1.数值5.6789E-02等于:A.5.6789B.0.056789C.0.0056789D.567.892.将数学式子:yxab2写成SPSS的算术表达式,正确的是:A.2*a*b/x+yB.2*a*b/(x+y)C.2ab/x+yD.2ab/(x+y)3.在SPSS中,用逻辑表达式来表示“年龄在40以上(含40)而且在50以下(不含50)”,正确的是:A.40=年龄50B.年龄=40&年龄50C.年龄=40且年龄50D.年龄=40|年龄50二、简答题1、实发工资等于基本工资加上补贴减去住房公积金,然后再依据职称将以上计算结果进行调整,以中级为基本单位,初级下调10%,副高上调10%,正高上调20%,请写出各职称的工资发放表达式。2、下窗口中,includeallcases和includeifcasesatisfiescondition分别代表什么。如果文化程度编码为1初中2高中3大专4本科,现只需对本科学历的人群进行分析,如何填写箭头旁的方框。3、数据的选取方法有几种?下列情况应采用怎样的数据选取方式?1)希望选取全部样本的前5个cases。2)希望对全部样本的30%的数据进行分析3)假定职业有三种,工人、教师、医生。希望选取工人样本。4)希望选取全部样本中50~100个cases进行分析。5)希望选取在所有变量上都没有缺省值的cases。4、在对基本工资的分析中,可以通过分类汇总分析不同性别人群的基本工资。如果我们还想了解不同性别不同职称人群的基本工资呢?应如何进行分类汇总?请直接计算和排序。序号性别(男1,女2)职称(高级1,副高2,中级3,初级4)基本工资0011.01.01014.00021.02.0984.00031.01.01044.00041.03.0866.00051.03.0848.00062.04.0824.00072.04.0824.00082.04.0824.00092.02.0859.00101.03.0827.05、有100个数据,请按照sturges提出的经验公式来确定组数。又该100个数据是年龄,最大值为40岁,最小值为20岁,应该确定多少组数,且组距如何?6、下表是某广告公司的不同广告类型投放价格和关注率,请计算广告的平均价格。广告类型单价(千元/人)关注率电视5030广播1.22网络325报纸610户外1.56请说明在SPSS中应如何操作,并直接计算结果。第四章SPSS基本统计分析一、单项选择右面的表是使用SPSS,对20个人的英语成绩进行的基本统计分析的结果,回答下面的问题:1.均值等于:A.81.80B.82.50C.79D.68.9052.标准差等于:A.1.856B.8.301C.68.905D.79.003.标准误等于:A.1.856B.8.301C.68.905D.79.004.四分位数间距等于:A.79.00B.82.50C.88.00D.9.005、比较下面7个变量,指出哪个变量适合计算均值、众数或中位数?1)location(地区)2)like1(爱好)3)height(身高)4)score(成绩)5)vf(父亲职业)6)income(年收入)7)child(子女数)6、对于频率表而言,以下的说法哪个为真?哪个为假?1)有效的百分数和累计的百分数,均为不包括缺省值。2)累计百分数的总和为100%。3)频次一栏根本不显示。4)有效的百分数的总和为100%。7※、下图为一张择偶标准的频率表,试对空缺的频次和百分比填补完整。frequencypercentValidpercentCumulativepercentValid相貌1538.538.538.5文化水准气质风度志同道合人品本人收入其他Total753133917.912.87.72.6100.017.912.87.72.67.7100.051.382.189.792.3100.08、下列数据是20名学生已读过的杂志数(单位:本)2,2,2,3,3,3,3,4,4,4,4,5,5,5,6,6,6,9,9,101)描述这些数据时,用条形图还是直方图?2)直方图与条形图的区别是什么?9、某样本有儿童10人(编码为1),有少年15人(编码为2),有青年20人(编码为3)。计算这三种人的各个统计量有无意义?若有,请计算。1)均值2)众数3)中位数10、某样本有355个个案,并且是有序的,即第1个个案是最大值,第二个个案是次大值,第355个个案是最小值,第几个个案为中位数?11、在某公司,为数极少的老板工资年收入达5位数,但绝大多数员工工资收入只有3位数,如果你是公司的经理,你将用怎样的统计量来描述高支付水平,为什么?如果你是该公司员工,你将用什么样的统计量来描述低支付水平?为什么?12※、下面是10个家庭分别拥有的车辆数,0,1,1,1,2,2,2,2,2,4,根据这些数据,填补下表中的空缺值。meanvarianceStddev1.06maximumminimummodemedianrange13、在一次考试中,学生的成绩均值为Mean=80,标准差为S=10。请计算下表中的标准值Z。student成绩Standardscore(z)17528538014、某教师计算某次考试成绩的统计量如下:Mean=60range=60N=99minimum=30maximum=90后来,他发现还有一张卷子漏了统计,其分数为60分。试把这份卷子补上,重新计算这个统计量。15、某研究人员探讨他所设计的实验教学是否能提升学生的数学成绩。他将研究对象前后测验成绩转成百分等级后,比较低、中、高三组学生成绩百分等级进步的情形,分析结果发现中等程度的学生进步最多,低能力和高能力组的学生进步不多。请你参考下表说明该研究分析与解释的问题。数学成绩测验的原始分数、百分等级、和百分带能力高低原始分数百分等级1EX1EX之百分带高619457~6584~99中483844~5227~50低351431~398~22注:E将近416、已知某变量服从正态分布,其均值为0.09,标准差为0.12。从这些数据中,您能否算出以下统计量,为什么?1)中位数2)众数3)方差4)峰态系数17、某研究人员,对原始数据标准化后,获得标准值的均值为1.15。该值是否意味着要对均值重新检查?为什么?18、某样本,男编码为0,女编码为1,若平均性别为0.8。这个平均值有意义吗?含义是什么?19、试判断下述的真假。1)Range,不像方差分析那样受端点的影响特别大。2)如果有个样本,其均值、中位数和众数三者近似于相同,那么此分布也趋于有近似的方差。20.下列属于数据描述的指标或方法有A.非参数检验B.标准差C.主成分分析D.峰度E.平均数21.填补下表空缺。V2*v3crosstabulationcountV3total12V212total5090608014022、crosstabs表格中,可以用什么检验来判断行列变量之间的关系,该检验原假设和统计量是如何表达的?23、下图是性别(sex)和地区(location)的交叉汇总表。(学生家庭住址)*(学生性别)crosstabulation(学生性别)TOTAL男生女生(学生家庭住址)城市count%within(学生家庭住址)%within(学生性别)%ofTotal1250.0%80.041.1%1250.0%85.7%41.4%24100.0%82.8%82.8%农村count%within(学生家庭住址)%within(学生性别)%ofTotal360.0%20.0%10.3%240.0%14.3%6.9%5100.0%17.2%17.2%TOTALcount%within(学生家庭住址)%within(学生性别)%ofTotal1551.7%100%51.7%1448.3%100.0%48.3%29100.0%100.0%100.0%1)如果性别与地区是互为独立的2个变量,每个单元的期望频次是多少?2)这个交叉表的自由度为多少?3)独立性卡方检验的卡方值为多少?24、如果希望出现图1应在图2的SPSS选项中如何选择?图1图225、请将下图翻译成中文,并说明结果。26※、下图是一种什么样的输出表?它与frequencies过程产生的表格有什么区别?Group$LIKE业余爱好CategorylabelCodeCountPctofResponsesPctofCases听戏看电影18723.648.1看小说读报215140.983.4唱歌跳舞34111.122.7交朋友44311.723.8下棋打牌54712.726.0TotalResponses369100.0203.98m