1、简述时间序列的预侧程序。第一步:确定时间序列所包含的成分,也就是确定时间序列的类型。第二步:找出适合此类时间序列的预侧方法。第三步:对可能的预侧方法进行评估,以确定最佳预侧方案。第四步:利用最佳预侧方案进行预侧。2、频率与概率有什么关系?在相同条件下随机试验n次,某事件A出现.次,则比值n/n称为事件A发生的频率。随着n的增大,该频率围绕某一常数P披动,且披动幅度逐渐减小,趋于稳定,这个频率的v定值即为该事件的概率。3、饼图和环形图的不同:饼图只能显示一个样本或怠休各部分所占比例,环形图可以同时绘制多个样本或怠休的数据系列,其图形中间有个“空洞弋每个样本或怠休的数据系类为一个环。4、怎么减少无回答对于随机误差,要提高样本容量,对于系统误差,只有做好准备工作并做好补救措施。①访问员必须要有相当的责任心,对其进行沟通技巧和责任心地培养;②加强与被访者的沟通;③事先通知,消除消费者的疑虑,然后再进行正式的访问,将会极大地降低拒访率。④物质奖励,奖励要适度,过高,使数据的真实性产生偏差;过低,则起不到应有作用,不能降低因无回答而产生的误差。⑤多次访问,指第一次访问被拒绝后,进行第二次乃至于第三次的访问,直到被访者愿意接受采访为止。多次访问在邮寄和电话采访中采用较多。⑥替换,替换就是在某个抽样单位拒绝接受采访以后,放弃该单位,寻找与其背景相同的人作为替换进入抽样总体。5、为什么要计算离散系数?方差和标准差是反映数据分散程度的绝对值,一方面其数值大小受原变量值本身水平高低的影响,也就是与变量的平均数大小有关;另一方面,它们与原变量的计量单位相同,采用不同计量单位的变量值,其离散程度的侧度值也就不同。因此,为消除变量值水平高低和计量单位不同对离散程度侧度值的影响,需要计算离散系数。6、直方图与茎叶图的区别直方图虽然能很好地显示数据分布,但不能保留原始的数值,茎叶图类似于横置的直方图,与直方图相比,茎叶图技能给出数据的分布状况,又能给出每个原始数据,即保留了原始数据信息。在应用方面,直方图通常适用于大数据,茎叶图适用于小批量数据。7、回归分析主要解决什么问题从一组样本数据出发,确定出变量之间的数学关系式;对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量中找出哪些变量是显著的,哪些是不显著的;利用所求关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这种估计或预测的可靠程度。8、一元线性回归模型中有哪些基本的假定?(1)因变量y与自变量x之间具有线性关系。(2)在重复抽样中,自变量x的取值是固定的,即假定x是非随机的。(3)误差项是一个期望值为0的随机变量,即E()=0。(4)对于所有的x值,的方差都相同。(5)误差项ε是一个服从正态分布的随机变量,且独立,即ε~N(0,)。9、解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。总平方和:n次观察值的总变差可由这些离差的平方和来表示,称为总平方和,记为SST,即公式为:(yi-y)2回归平方和:可以有回归直线来解释的yi的变差部分,记为SSR残差平方和:它是除了x对y的线性影响之外的其他因素对y变差的作用,是不能由回归直线来解释的yi变差部分,称为残差平方和或误差平方和,记为SSE.三个平方和的关系为:总平方和(SST)=总回归平方和(SSR)+残差平方和(SSE)1、什么是二手资料?使用二手资料应注意什么间题与研究内容有关,由别人调查和试验而来已经存在,并会被我们利用的资料为“二手资料;使用时要进行评估,要考虑到资料的原始收集人,收集目的,收集途径,收集时间使用时要注明数据来源.9、为什么要计算离散系数?方差和标准差是反映数据分散程度的绝对值,一方面其数值大小受原变量值本身水平高低的影响,也就是与变量的平均数大小有关;另一方面,它们与原变量的计量单位相同,采用不同计量单位的变量值,其离散程度的测度值也就不同。因此,为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。