社会统计学作业一、单项选择题1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是(A)A.样本B.总体C.统计量D.变量2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为(C)A.频率B.累积频数C.累积频率D.比率3.离散系数的主要目的是(D)A.反映一组数据的平均水平B.比较多组数据的平均水平C.反映一组数据的离散程度D.比较多组数据的离散程度4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有(B)A.50%的数据B.68%的数据C.95%的数据D.99%的数据5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为(A)A.39.19B.28.90C.19.54D.27.956.用样本统计量的值直接作为总体参数的估计值,这种方法称为(A)A.点估计B.区间估计C.有效估计D.无偏估计7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例()偏高。如果要检验该说法是否正确,则假设形式应该为(B)A.0H:≥0.1;1H:0.1B.0H:≤0.1;1H:0.1C.0H:=0.1;1H:≠0.1D.0H:0.1;1H:≤0.18.下面哪一项不是方差分析中的假定(D)A.每个总体都服从正态分布B.观察值是相互独立的C.各总体的方差相等D.各总体的方差等于09.判断下列哪一个不可能是相关系数(D)A.-0.9B.0C.0.5D.1.210.用于说明回归方程中拟合优度的统计量主要是(D)A.相关系数B.离散系数C.回归系数D.判定系数11.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。这项研究的总体是(A)A.332.1万户家庭B.3000户家庭C.332.1户家庭的年均收入D.3000户家庭的年均收入12.下列变量属于数值型变量的是(A)A.工资收入B.产品等级C.学生对考试改革的态度D.企业的类型13.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形(A)A.环形图B.饼图C.直方图D.条形图14.在频数分布表中,频率是指(C)A.各组频数与上一组频数之比B.各组频数与下一组频数之比C.各组频数与总频数之比D.各组频数与最大一组频数之比15.两个定类变量之间的相关分析可以使用(A)A.系数B.系数C.r系数D.Gamma系数16.根据一个样本均值求出的90%的置信区间表明(C)A.总体均值一定落入该区间内B.总体均值有90%的概率不会落入该区间内C.总体均值有90%的概率会落入该区间内D.总体均值有10%的概率会落入该区间内17.已知某单位职工平均每月工资为3000元,标准差为500元。如果职工的月收入是正态分布,可以判断月收入在2500元—3500元之间的职工人数大约占总体的(B)A.95%B.68%C.89%D.90%18.方差分析的目的是(D)A.比较不同总体的方差是否相等B.判断总体是否存在方差C.分析各样本数据之间是否存在显著差异D.研究各分类自变量对数值型因变量的影响是否显著19.对于线性回归,在因变量的总离差平方和中,如果回归平方和所占比例越大,那么两个变量之间(A)A.相关程度越大B.相关程度越小C.完全相关D.完全不相关20.正态分布中,值越小,则(B)A.离散趋势越小B.离散趋势越大C.曲线越低平D.变量值越分散21.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为(A)A.简单随机抽样B.系统抽样C.整群抽样D.分层抽样22.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据(D)A.茎叶图B.环形图C.饼图D.线图23.如果一组数据中某一个数值的标准分值为-1.5,这表明该数值(D)A.是平均数的-1.5倍B.比平均数少1.5C.等于-1.5倍标准差D.比平均数低1.5个标准差24.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是(A)A.89B.72C.88D.9525.某班级学生期末英语考试平均成绩为75分,标准差为10分。如果已知这个班学生的考试分数服从正态分布,可以判断成绩在65-85之间的学生大约占全班学生的(A)A.68%B.89%C.90%D.95%26.已知某单位平均月收入为3500元,离散系数为0.2,那么他们月收入的标准差为(A)A.700B.0.2C.3500D.17500027.在假设检验中,不拒绝虚无假设意味着(D)A.虚无假设是肯定正确的B.虚无假设肯定是错误的C.没有证据证明虚无假设是正确的D.没有证据证明虚无假设是错误的28.在因变量的总离差平方和中,如果回归平方和所占的比例越大,则两变量之间(A)A.相关程度越高B.相关程度越低C.完全相关D.没有任何关系29.从两个总体中各选取了6个观察值,得到组间平方和为234,组内平方和为484,则组间方差和组内方差分别为(?)A.234,121B.117,121C.234,48.4D.117,8130.在回归方程中,若回归系数等于0,这表明(B)A.因变量y对自变量x的影响是不显著的B.自变量x对因变量y的影响是不显著的C.因变量y对自变量x的影响是显著的D.自变量x对因变量y的影响是显著的31.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。这种调查方法属于(C)A.简单随机抽样B.整群抽样C.分层抽样D.系统抽样32.某企业职工的月收入水平分为以下五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值近似为(D)A.3000元B.3500元C.2500元D.3250元33.对于右偏分布,平均数、中位数和众数之间的关系是(A)A.平均数中位数众数B.中位数平均数众数C.众数中位数平均数D.众数平均数中位数34.两组数据的平均数不相等,但是标准差相等。那么(C)A.平均数小的,离散程度小B.平均数大的,离散程度大C.平均数大的,离散程度小D.两组数据离散程度相同35.在假设检验中,如果所计算出的P值越小,那么检验的结果(A)A.越显著B.越不显著C.越真实D.越不真实36.如果物价与销售量之间的线性相关系数为-0.87,而且二者之间具有统计显著性,那么二者之间存在着(A)A.高度相关B.中度相关C.低度相关D.极弱相关37.回归平方和(SSR)反映了y的总变差中(A)A.由于x与y之间的线性关系引起的y的变化部分B.除了x对y的现有影响之外的其他因素对y变差的影响C.由于x与y之间的非线性关系引起的y的变化部分D.由于x与y之间的函数关系引起的y的变化部分38.根据一个具体的样本求出的总体均值90%的置信区间(A)A.以90%的概率包含总体均值B.绝对包含总体均值C.10%的可能性包含总体均值D.绝对不包含总体均值39.在假设检验中,虚无假设和备择假设(C)A.都有可能成立B.都不可能成立C.有且只有一个成立D.备择假设一定成立,虚无假设不一定成立40.在方差分析中,某一水平下样本数据之间的误差称为(A)A.组内误差B.组间误差C.组内平方D.组间平方二、名词解释1.抽样单位与抽样框2.普查与抽样调查3.参数与统计量4.方差与标准差5.独立样本与配对样本6.总体与样本7.抽样分布8.二维表9.相关系数10.组内均方11.普查12.误差减少比例13.散点图14.正态分布15.最小二乘法16.概率抽样17.中位数18.相关系数19.区间估计20.中心极限定理21.假设检验三、简答题1.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。(1)网络供应商的姓名(2)每月的网络服务费(3)每月上网时间(4)上网的主要目的(5)上周收到的电子邮件数量(6)每月用于网上购物的金额(7)上月网上购物的次数(8)使用的电脑的品牌(9)上网是否玩游戏(10)电脑是否带有光盘刻录机2.调查方法主要包括哪几种?简要说明各种方法的优缺点。3.什么是简单一元线性回归分析?其作用是什么?4.简要说明社会研究过程。5.按测度水平,变量可分为哪几类?并举例说明。6.简要举例说明在分析双变量的关系时,T检验和卡方检验的主要区别。7.等距分组和不等距分组有什么区别?请举例说明。8.举例说明什么是自变量和因变量,二者之间是什么关系?9.简要说明卡方的拟合优度检验和独立性检验的含义。10.条形图和直方图有什么区别?11.简述众数、中位数和平均数作为测量中心趋势的指标所适用的数据类型。13.简要举例说明在分析双变量的关系时,T检验和卡方检验的主要区别。14.举例说明什么是离散变量和连续变量。15.SPSS主要有哪些功能?16.在SPSS中如何定义变量属性?17.统计表主要由哪几部分构成?18.简述相关系数的取值与意义。四、计算题(每题15分,共30分)1.某校社会学专业同学统计课成绩如下表所示。社会学专业同学统计课成绩表学号成绩学号成绩学号成绩101023761010377510105270101024911010387010105388101025871010397610105493101026781010409010105562101027851010417610105695101028961010428610105795101029871010439710105866101030861010449310105982101031901010459210106079101032911010468210106176101033801010478010106276101034811010489010106368101035801010498810106494101036831010507710106583要求:(1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。2.为研究某种商品的价格(x)对其销售量(y)的影响,收集了12个地区的有关数据。通过分析得到以下结果:方差分析表变差来源SSdfMSFSig.回归ABCD0.000残差205158.07EF——总计1642866.6711———要求:(1)计算上面方差分析表中A、B、C、D、E、F处的值。(2)商品销售量的变差中有多少是由价格的差异引起的?(3)销售量与价格之间的相关系数是多少?3.某公司招聘职员时,要求对职员进行两项基本能力测试。已知,A项测试中平均分数为90分,标准差是12分;B考试中平均分数为200分,标准差为25分。一位应试者在A项测试中得了102分,在B项测试中得了215分。若两项测试的成绩均服从正太分布,该位应试者哪一项测试更理想?4.某公司欲了解广告费用x对销售量y的影响,收集了20个地区的数据,并对x、y进行线性回归分析,得到:方程的截距为364,回归系数为1.42,回归平方和SSR=1602708.6,残差平方和SSE=40158.07。要求:(1)写出广告费用y与销售量程x之间的线性回归方程。(2)假如广告费用投入50000元,根据回归方程估计商品销售量。(3)计算判定系数2R,并解释它的意义。5.为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机