江南大学现代远程教育第三阶段测试卷考试科目:《统计学》第10章至第12章(总分100分)时间:90分钟______________学习中心(教学点)批次:层次:专业:学号:身份证号:姓名:得分:一、简答题(每题5分,共40分)1、重复抽样与不重复抽样有什么不同?2、在实际中,抽样调查多采用不重复抽样方法抽取样本,但在计算抽样平均误差时也可以采用重复抽样条件下的公式,原因何在?3、什么是假设检验中的显著性水平?4、什么是相关关系?相关关系有什么特点?5、简述相关关系的种类。6、什么是估计标准误差?其作用如何?7、最小二乘法在回归分析中起什么作用?8、简述相关关系与与函数关系的区别二、计算题(每题15分,共60分)1、根据不良贷款(y)与贷款余额(1x)、累计应收贷款(2x)、贷款项目个数(3x)和固定资产投资额(4x)的样本数据,得Excel输出的回归分析结果如下:回归统计MultipleR0.89309RSquare0.79760AdjustedRSquare0.75712标准误差1.77875观测值25方差分析dfSSMSFSignificanceF回归4249.37162.34319.7041.04E-06残差2063.2793.164总计24312.650Coefficients标准误差tStatP-valueIntercept-1.0220.782-1.3060.206XVariable10.0400.0103.8370.001XVariable20.1480.0791.8790.075XVariable30.0150.0830.1750.863XVariable4-0.0290.015-1.9370.067(1)试写出样本回归方程,利用上表给出F值的计算公式;(2)试说明各回归系数是否显著.(05.0)2、1986年—1995年个人收入与支出资料:(亿元)年份个人收入X个人消费Y年份个人收入X个人消费Y19861987198819891990647077829256606670781991199219931994199510712514316518988102118136155要求:①计算相关系数,并进行显著性检验;(=0.632)②建立回归方程,并说明方程中系数的经济含义;③计算估计标准误差。④若个人收入为213亿元,估计个人消费支出额。(所有计算结果精确到0.0001)3、将24家生产产品大致相同的企业,按资金分为三类,每个公司的每100元销售收入的生产成本(单位:元)如下表。这些数据能否说明三类公司的市场生产成本有差异?(α=0.05)20-3030-5050以上6975777276807072757670867280747268866680807274834、某厂生产一种新型家用产品,厂家声称某市已有20%以上的家庭在使用这种产品。市场调查人员在该市抽选了一个由300个家庭组成的随机样本,发现有70个家庭使用了这种产品。这些数据是否为证实厂家的说法提供了充分证据?设α=0.05.附:参考答案:一、简答题(每题5分,共40分)1、答:两者的不同表现在四个方面:(1)随机性稍有不同。重复抽样时,从抽取第一个单位直至第n个单位,每次总体中始终保持N个单位可供抽选,每个单位被选中的机会也始终相等,都是1/N,不重复抽样时,抽取第一个单位时,总体中有N个单位可供抽选,每个单位被抽中的机会是1/N;抽取第二个单位时,总体中剩下N-1个单位,每个单位被选中的概率变为1/(N-1)……以此类推。(2)可能组成的样本总数不同。从单位数为N的总体中抽取n个单位作样本,重复抽样有Nn种可能样本配合,不重复抽样有CNn种可能样本。(3)样本的代表性不同。重复抽样的样本单位有可能被重复抽取,其样本单位在总体中的普及程度比不重复抽样低,因而样本的代表性也较不重复抽样样本的代表性差一些。(4)抽样误差不同。同等条件下,重复抽样的误差总是大于不重复抽样的误差。2、答:从抽样平均误差的计算公式看,不重复抽样比重复抽样多乘一个系数(1—n/N)。但在实际中,全及总体的单位数N通常很大,而抽样单位数n相对较小,n/N的值越近于0,(1—n/N)的值就越近于1。这样,利用两个公式计算出来的抽样平均误差相差甚小,一般不会影响到调查结果的判断分析。为了简化,对不重复抽样的情况也可以采用重复抽样的公式来计算抽样平均误差。3、答:假设检验是围绕对原假设内容的审定而展开的。如果原假设正确我们接受了(同时也就拒绝了替换假设),或原假设错误我们拒绝了(同时也就接受了替换假设),这表明我们作出了正确的决定。但是,由于假设检验是根据样本提供的信息进行推断的,也就有犯错误的可能。有这样一种情况,原假设正确,而我们却把它当成错误的加以拒绝。犯这种错误的概率用α表示,统计上把α称为假设检验中的显著性水平,也就是决策中所面临的风险。所以,显著性水平是指当原假设为正确时人们却把它拒绝了的概率或风险。这个概率是由人们确定的,通常取α=0.05或α=0.01,这表明,当作出接受原假设的决定时,其正确的可能性(概率)为95%或99%。4、答:相关关系是指现象之间客观存在的,在数量变化上受随机因素的影响,不确定的相互依存关系。相关关系有如下特点:第一,相关关系表现为数量上的相互依存关系,即一个现象在数量上发生变化,另一个现象也会相应地发生数量上的变化。第二,相关关系在数量上表现为不确定的相互依存关系,即存在相关关系的两个变量,对应于一个变量的取值,另一个变量可能有多个数值与之对应。5、答:相关关系可以从不同角度进行分类:相关关系按变量多少可分为单相关和复相关,单相关是指两个变量间的相关关系,复相关是指多个自变量与因变量的相关关系。相关关系从表现形态上划分为直线相关和曲线相关,直线相关是指两个变量的对应取值在坐标图中大致呈一条直线,曲线相关是指两个变量的对应取值在坐标图中大致呈一条曲线。相关关系从变化方向上划分为正相关和负相关,变量x与y变化方向相同为正相关,x与y变化方向相反为负相关。6、答:估计标准误差就是用来说明回归直线方程代表性大小的统计分析指标。估计标准误差主要有两方面的作用:第一,估计标准误差是衡量回归直线方程代表性大小的重要尺度。估计标准误差小,回归直线方程代表性强;反之,则回归直线方程代表性弱。第二,估计标准误差,从另一个侧面反映变量之间相关关系的密切程度。估计标准误差大,相关关系不密切;反之,现象之间相关关系较密切。7、答:最小二乘法的原理是实际观测值与回归值的偏差即残差平方和最小,这样可以使所确定的回归直线与所有样本观测数据点都比较靠近,使回归直线更具代表性。8、答:当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,称这种关系为确定性的函数关系。当一个或几个变量取一定的值时,另一个变量的值虽然不确定,但它仍按某种规律在一定的范围内变化,称这种关系为相关关系。在一定的条件下这二者是可以相互转换的。二、计算题(每题15分,共60分)1、解:(1)样本回归方程704.1920279.634371.249029.0015.0148.0040.0022.1ˆ4321Fxxxxy(2)对于0:,0:1110HH由于05.0001.01p,即拒绝0:10H。而对于4,3,2;0:,0:10jHHjj由于067.0,863.0,075.0432ppp,都大于0.05,从而接受jHj(0:0)4,3,2。2、解:1405822x1114xn=10966692y929y116557xy4.111X9.92Y⑴线性相关系数2222yynxxnyxnxyn=0.9997因为所以Y与X显著相关。⑵1ˆ=(nΣxy-ΣxΣy)/[nΣx2-(Σx)2]=0.79270ˆ=Σy/n-1ˆΣx/n=4.5878所以yˆ=0ˆ+1ˆx=4.5878+0.79271ˆ=0.7927说明个人收入每增加1元,人均消费水平平均增加0.7927元.③9476.02ˆˆΣy2102nxyynssesy④若个人收入为213亿元,估计个人消费支出额=173.443、解:方差分析差异源SSdfMSFP-valueFcrit组间332.33332166.166710.214420.0007973.466795组内341.6252116.26786总计673.958323因为FFα,则拒绝原假设,接受备择假设。即通过检验知,μj不全相等,说明三类公司的市场生产成本有差异.4、解:n=300p0=20%样本成数=23.33%①H0:p≤20%H1:p>20%②Z=(23.33%-20%)/0.0231=1.4416③取α=0.05查表得:Zα=Z0.05=1.645④因为ZZα所以接受H0,即这些数据不能为证实厂家的说法提供充分证据.