目录统计分析对金融投资分析的意义一元线性回归多元线性回归1231952年马克维茨发表了资产组合理论,开启了金融问题定量研究的先河。他利用概率论和数理统计的相关理论,构造了分析证券价格的模型框架。马克维茨资产组合理论的产生和发展显示了统计分析在金融投资领域应用的强大生命力。不完全统计,诺贝尔经济学奖总计几十位获奖者中,超过半数的获奖经济学家来自于统计计量领域。借用统计理论,将经济理论数学公式化,将经济行为定量化,已成为当今世界经济的热门课题。对期货投资分析来讲,随着市场日趋复杂,数字已成为传递信息的最直接载体,大量的数学与统计工具在期货分析研究中发挥不可或缺的重要影响。1、统计分析对金融投资分析的重要性一、统计分析对金融投资分析的意义期货价格预测方法主要有以下几种:2、统计分析在期货价格分析中的应用德尔菲法回归分析法时间序列法期货价格分析中最为常用的方法。包括一元线性回归和多元线性、非线性回归模型。思路是围绕价格的影响因素建立计量模型。介于定性与定量之间的分析方法,也即将专家个人调查法和专家会议调查法结合的一种新型专家预测方法,由于此法属于直观预测法,在及时性和准确性方面存在缺陷,实际中较少运用。根据历史数据去找出事物随时间发展的轨迹,并预测未来发展状况的定量分析方法。时间序列研究方法主要集中于研究趋势变动和周期变动。一、统计分析对金融投资分析的意义相关关系是指变量之间的不确定的依存关系。在经济领域,社会和经济变量受随机因素的影响很大,它们之间的关系主要表现为相关关系。相关分析就是对变量之间的相关关系的分析,主要就是对变量之间是否存在必然的联系,联系的形式,变动的方向作出符合实际的判断,并测定他们联系的密切程度,检验其有效性。二、一元线性回归1、如何理解相关关系?完全正线性相关完全负线性相关正线性相关负线性相关零相关y=7.4403x+2951.1R²=0.973720,00030,00040,00050,00060,00070,00080,00090,00002,0004,0006,0008,00010,00012,000沪铜连续合约价格元/吨LME三月期铜价格美元/吨y=-0.0016x+89.744R²=0.4019707274767880828486889002,0004,0006,0008,00010,00012,000LME三月期铜价格美元/吨美元指数沪铜与LME三月期铜价格散点图LME三月期铜价格与美元指数散点图二、一元线性回归—散点图(示例1)相关系数是在直线相关的条件下,说明两个变量之间的相关关系密切程度的统计分析指标。相关系数也称为相关量,是用来描述变量之间变化方向和密切程度的数字特征量,样本间相关一般用r表示,总体间相关一般用ρ表示。2、相关系数的计算22)()())((yyxxyyxxr2222yynxxnyxxynr也可简化为二、一元线性回归相关系数仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系。同时,r虽然是两个变量之间线性关系的一个度量,但并不意味着x与y一定有因果关系。-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加相关系数与相关程度表一览表二、一元线性回归相关性应用—不同品种相关性矩阵(示例2)二、一元线性回归只有一个因变量和一个自变量的线性回归模型,叫一元线性回归模型。一元线性回归模型可表示为y=0+1x+y是x的线性函数(部分)加上误差项–线性部分反映了由于x的变化而引起的y的变化–误差项是随机变量•反映了除x和y之间的线性关系之外的随机因素对y的影响•是不能由x和y之间的线性关系所解释的变异性–0和1称为模型的参数3、如何理解一元线性回归分析?二、一元线性回归一元线性回归分析是建立在一系列假设基础上的,这些假设为:回归模型因变量y与自变量x之间是具有线性关系在重复抽样中自变量x值是固定的。即假定x是非随机的误差项ε是一个服从正态分布的随机变量,且相互独立。即ε~N(0,σ2)回归分析方法的最基本假设是因变量和自变量的关系为线性。在仅有一个解释变量的情况下,一元线性回归方程是一条直线,可以用下式表示:y=0+1x其中0和1为常数,也成为回归系数。4、一元线性回归的基本假设?由于单点到直线的偏差可正可负,我们选择一条直线,使得观测点偏差的平方总和最小,则此直线可以定义为最优拟合直线,这一方法在统计中称为最小二乘法。xy二、一元线性回归5、用最小二乘法进行最优拟合二、一元线性回归从理论上讲,最小二乘法可获得最佳估值计算绝对偏差要比计算平方偏差和难度要大5、用最小二乘法进行最优拟合01100111ˆˆ2(1)0ˆˆˆ2()0ˆniiiniiiiQyxQyxxxˆyˆxxnyxyxnxxyxˆ10n1i2n1ii2in1iin1iin1iiiiiii1根据最小二乘法的要求,可得求解6、一元线性回归方程的显著性检验回归系数的检验步骤1.提出假设–H0:1=0(没有线性关系)–H1:10(有线性关系)2.计算检验的统计量3.确定显著性水平,并进行决策tt,拒绝H0;tt,不拒绝H02ˆ1)xx(SS)2n(t~sˆt11,二、一元线性回归6、一元线性回归方程的显著性检验xyyxy10ˆˆˆyy{}}yyˆyyˆ),(iiyx二、一元线性回归6、一元线性回归方程的显著性检验SST=SSR+SSEn1i2in1i2n1i2iyˆyyyˆyy总平方和(SST){回归平方和(SSR)残差平方和(SSE){{二、一元线性回归6、一元线性回归方程的显著性检验回归平方和占总离差平方和的比例反映回归直线的拟合程度取值范围在[0,1]之间R21,说明回归方程拟合的越好;R20,说明回归方程拟合的越差判定系数等于相关系数的平方,即R2=r2n1i2in1i2in1i2in1i22yyyˆy1yyyyˆSSTSSRR二、一元线性回归二、一元线性回归—示例3Date长江铜现货价格xi沪铜连续合约yi2009-1-225,35023,2702009-1-929,50027,0102009-1-1628,70027,2002009-1-2329,18025,5402009-2-628,25028,2002009-2-1329,10028,5002009-2-2028,55026,8402009-2-2729,15027,8602009-3-630,60029,6502009-3-1330,39529,0102009-3-2033,10031,9602009-3-2735,25033,650………………SUMMARYOUTPUT回归统计MultipleR0.997317133RSquare0.994641464AdjustedRSquare0.994592303标准误差936.2431876观测值111方差分析dfSSMSFSignificanceF回归分析1177347156971773471569720232.37611.3074E-125残差10995544092.38876551.3063总计11017830259789Coefficients标准误差tStatP-valueLower95%Upper95%下限95.0%上限95.0%Intercept-3970.435408403.9310586-9.8294877911.0465E-16-4771.01361-3169.857207-4771.01361-3169.857207XVariable11.0762402650.007566339142.24055711.3074E-1251.0612440271.0912365021.0612440271.091236502y=1.0762x-3970.4R²=0.994620,00030,00040,00050,00060,00070,00080,00020,00030,00040,00050,00060,00070,00080,000散点法Excel回归计算y=1.076x-3970二、一元线性回归—示例3Date长江铜现货价格xi沪铜连续合约yi2009-1-225,35023,2702009-1-929,50027,0102009-1-1628,70027,2002009-1-2329,18025,5402009-2-628,25028,2002009-2-1329,10028,5002009-2-2028,55026,8402009-2-2729,15027,8602009-3-630,60029,6502009-3-1330,39529,0102009-3-2033,10031,9602009-3-2735,25033,650………………SUMMARYOUTPUT回归统计MultipleR0.997317133RSquare0.994641464AdjustedRSquare0.994592303标准误差936.2431876观测值111方差分析dfSSMSFSignificanceF回归分析1177347156971773471569720232.37611.3074E-125残差10995544092.38876551.3063总计11017830259789Coefficients标准误差tStatP-valueLower95%Upper95%下限95.0%上限95.0%Intercept-3970.435408403.9310586-9.8294877911.0465E-16-4771.01361-3169.857207-4771.01361-3169.857207XVariable11.0762402650.007566339142.24055711.3074E-1251.0612440271.0912365021.0612440271.091236502y=1.0762x-3970.4R²=0.994620,00030,00040,00050,00060,00070,00080,00020,00030,00040,00050,00060,00070,00080,000散点法Excel回归计算y=1.076x-3970三、多元线性回归相在对期货价格进行分析过程中,期货价格的变动受多种因素的影响,因而单一的一元线性回归分析很难得到比较好的效果,简单的一元线性回归不能达到预期的效果,通常是通过多元回归分析进行研究。多元线性回归模型:b0,b1,b2,,bk是参数是被称为误差项的随机变量y是x1,,x2,,xk的线性函数加上误差项包含在y里面但不能被k个自变量的线性关系所解释的变异性kkxxxy221101、多元线性回归模型三、多元线性回归多元回归方程总的参数是未知的,需要用样本数据去估计。的估计值用样本统计量估计回归方程中的参数时得到的方程kˆ,,ˆ,ˆ,ˆ210k210,,,,kkxxxyˆˆˆˆˆ22110k210ˆ,,ˆ,ˆ,ˆ是k210,,,,•回归方程的估计值仍然是由最小二乘法估计出来的,由于手工计算有些繁琐,需要借助统计分析软件计算。我们主要解释和分析程序得出的结论。2、多元线性回归方程的估计3、多元线性回归方程的拟合优度多元样本可决系数R2修正的R2回归方程标准误差SSTSSE1SSTSSRyyy