2015年春社会统计学形成性考核作业形成性考核作业一(第1章至第3章)表1是某大学二年级135个同学的《社会统计学》课程的期末考试成绩,请将数据输入SPSS软件,并(1)对考试成绩进行排序和分组(40分),(2)制作频数分布表(30分)并绘制频数分析统计图(30分)。请注意分组时按照下列标准:等级AA-B+BB-C+CC-D+DF分数90-10086-8983-8580-8276-7973-7570-7266-6963-6560-620-59表1某专业二年级同学社会统计学期末考试成绩(百分制)学生成绩学生成绩学生成绩学生成绩学生成绩186283455888270109712602965569383881108036530305785848811187428317858838568112665853286599386871138468733846095878811483770348761718891115858643585629089761167895136936386908711781105837966489918111881119038826589926111971125039786683937212086138740806784948612191148241746844952912266156542726968963712358166843737089978212468178644867184988212580188045857286998212677198146907379100851275520704769747810178128542180488675871028012962224949867688103901305423805084778210482131652470518178831057213274255952907992106861337026805334808610780134722752548481861088213573答案如下:1、按成绩低至高排序如下表:学生成绩学生成绩学生成绩学生成绩学生成绩学生成绩学生成绩4288644272408078836386658995293659372102801148372867089303015651057210780338480861190283429651347211080508481864690533413165437312580548494865290963711266135731981678410686629068441226641745181718412086103902249166813274918111384687889112506968897611781585138712191951856812677118813585348779922752124683178148245857587369312854476939783882578586875693130547707478778210085908759931275520701017897821158511187609510582470116789882186558837961235882707379998217867688255913370188010482328683882606171218010882448684889261109712380588348868788129621197126806683498664892、成绩分组表如下:等级AA-B+BB-C+CC-D+DF分数90-1086-883-880-876-773-770-766-663-660-60-5人数132816228412753173、制作频数分布表如下:等级AA-B+BB-C+CC-D+DF分90-1086-883-880-876-773-770-766-663-660-60-5数人数13281622841275317百分比9.63%20.74%11.85%16.3%5.93%2.96%8.89%5.19%3.7%2.2%%12.59%4、频数分析统计图如下:051015202530分数90-1086-883-880-876-773-770-766-663-660-60-5等级AA-B+BB-C+CC-D+DF百分比系列2系列3形成性考核作业二(第4章至第6章)表1为某大学对100个学生进行了一周的上网时间调查,请用SPSS软件:(1)计算学生上网时间的中心趋势测量各指标(20分)和离散趋势测量各指标(30分)。(2)计算学生上网时间的标准分(Z值)及其均值和标准差。(20分)(3)假设学生上网时间服从正态分布,请计算一周上网时间超过20小时的学生所占比例。(30分)表1某专业一年级同学一周上网时间(小时)学生上网时间学生上网时间学生上网时间学生上网时间学生上网时间1132118411461881102922224276219821038232243963248320412241044864138421582513451065218516626261046186621861071327124726671087108528224814681388219329194986920891910183010501070219010113312251137112913212103230522872159271320338531273269328141934205410742094191515351755975179515168361456107619961017837857127799720181538125824782198819203915592679179914202240136020801610018答案如下:形成性考核作业三(第1章至第12章)一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确答案的序号,填写在题中的括号内。每小题2分,共20分)1.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。这项研究的总体是(C)A.22000名学生B.2200名学生C.22000名学生的每月生活费用D.2200名学生的每月生活费用2.从变量分类看,下列变量属于定序变量的是(C)A.专业B.性别C.产品等级D.收入3.在频数分布表中,比率是指(D)A.各组频数与上一组频数之比B.各组频数与下一组频数之比C.各组频数与总频数之比D.不同小组的频数之比4.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据(D)A.茎叶图B.环形图C.饼图D.线图5.根据一个样本均值求出的90%的置信区间表明(C)A.总体均值一定落入该区间内B.总体均值有90%的概率不会落入该区间内C.总体均值有90%的概率会落入该区间内D.总体均值有10%的概率会落入该区间内6.判断下列哪一个不可能是相关系数(C)A.-0.89B.0.34C.1.32D.07.期中考试中,某班级学生统计学平均成绩为80分,标准差为4分。如果学生的成绩是正太分布,可以判断成绩在72分-88分之间的学生大约占总体的(A)A.95%B.68%C.89%D.90%8.正态分布中,σ值越小,则(A)A.离散趋势越小B.离散趋势越大C.曲线越低平D.变量值越分散9.下面哪一项不是方差分析中的假定(D)A.每个总体都服从正态分布B.观察值是相互独立的C.各总体的方差相等D.各总体的方差等于010.对消费的回归分析中,学历、年龄、户口、性别、收入都是因变量,其中收入的回归系数为0.8,这表明(A)A.收入每增加1元,消费增加0.8元B.消费每增加1元,收入增加0.8元C.收入与消费的相关系数为0.8D.收入对消费影响的显著性为0.8二、名词解释(每题4分,共20分)1.抽样单位与抽样框答:抽样单位就是一次直接的抽样所使用的基本单位。抽样单位有时与构成总体的个体是相同的,有时是不同的。例如对育龄妇女的调查,当直接抽取育龄妇女时,两者是相同的;当我们从总体中一次直接抽取户时,以抽中的户中的育龄妇女作为样本时,抽样单位(户)与个体(育龄妇女)就不相同了。抽样框是指一次直接抽样时样本中所有抽样单位的名单。例如,从某校中抽取200名学生进行就业观的调查,那么这所学校的所有学生的名单就是这次抽样的抽样框。但是,当我们先抽取班级,以抽中班级中的所有学生作为样本时,这所学校所有班级的名单就是这次抽样的抽样框。2.均值答:均值是集中趋势最主要的测量值,它是将全部数据进行加总然后除以数据总6个数,也称为算数平均数。均值包含一组数据中所有数值,它是先将所有数值进行加总,然后进行平均,在均值中所有数值都有所体现。因而,我们说均值是集中趋势最主要的测量值。3.散点图答:散点图是在坐标系中,用X轴表示自变量x,用Y轴表示因变量y,而变量组(x,y)则用坐标系中的点表示,不同的变量组在坐标系中形成不同的散点,用坐标系及其坐标系中的散点形成的二维图就是散点图。散点图是描述变量关系的一种直观方法,从散点图中直观的看出两个变量之间是否存在相关关系、是正线性相关还是负线性相关,也可以大致看出变量之间关系强度如何,但是对于具体关系强度则需要相关系数来判断。4.抽样分布答:抽样分布是指样本统计量的概率分布,它是在重复选取容量为n的样本时,由每个样本计算出来的统计量数值的相对频数分布。例如样本均值的分布、样本比例分布等。5.虚无假设与替换假设答:将需要通过样本信息来推断其正确与否的命题称为虚无假设,也成为原假设或者零假设,通常用0H表示。如果虚无假设不成立,我们就拒绝虚无假设,需要在另个一假设中进行选择,这就是替换假设,替换假设通常用1H表示。上面例子中,虚无假设为:0H:μ=1800替换假设为:1H:μ≠1800a。三、简答题(每题10分,共30分)1.等距分组和不等距分组有什么区别?请举例说明。答:在分组时,如果分组组距相等,就是等距分组,如:学生平均每天上网时间:组距设3,分成3-6,6-9,9-12,12-15共4个小组。如果分组组距不相等,就是不等距分组。如:人口分析,分婴幼儿组(0-6),少儿组(7-17),中青年组(18-59),老人组(60-130),组距不相等。2.简述定类变量、定序变量和数值型变量集中趋势测量的方法。答:运用以下表格说明定类变量、定序变量和数值型变量集中趋势测量的方法数据类型定类数据定序数据数值型数据适用的测量值众数中位数均值分位数中位数众数分位数众数3.如何对配对样本进行t检验。答:可运用以下2种方法对配对样本进行t检验(1)配对样本T检验方法:配对样本检验主要是判断不同的处理或试验结果是否有差异。配对样本T检验(Paired—SampleTtest)用于检验两个相关的样本(配对样本)是否来自具有相同均值的总体,因此针对配对样本我们可以首先计算出两个样本每个对应变量间的差值,然后再检验其差值的均值是否为零,若均值接近于零(即在给定的置信区间内),说明两个样本均值在给定的置信水平上没有差异;若均值在给定置信区间以外,说明两个样本均值在给定的置信水平上有差异。(2)利用SPSS进行配对样本T检验;在SPSS主菜单选中Analyze—CompareMeans—Paired—SampleTTest,出现图11—4所示窗口。“PairedVariables”框中的变量作为分析变量,总是成对出现,指定要检验的两个变量到“PairedVariables”输入栏里的“Variable1”和“Variable2”中,在“CurrentSelections”栏中就会显示被选中的成对变量,在“Options”选项中可以进行置信水平和缺失值的设置,同单样本T检验。四、计算题(每题15分,共30分)1.某大学针对某项政策的态度调查,随机抽取300名被调查者,了解对政策的观点,调查结果见表1所示。(15分)表1对某项政策态度的