1二元回归分析2二元回归分析(bivariateregressionanalysis)•回归分析的主要功能:在解释一个经验现像中所观察到的变化•二元回归:回归模型中仅有一个依变数以及一个自变数3–y是依变数,x是自变数–a是截距或常数(intercept或constant)–b是回归系数或称为斜率(regressioncoefficient)bxay一、二元回归模型4•教育水平是不是会影响个人的工资?–y是个人月工资(“元”)–x是教育水平(“年”)–200是截距–100是回归系数xy1002005•回归系数的解释:–当自变数增加一个单位时,依变数会增加b个单位–每多受一年的教育,个人的工资就会增加100元–回归系数b代表自变数对依变数的影响力6y=200+100x2007二、非一对一的对应关系•一对一的对应关系:每一个自变数的值都仅有一个依变数的值相对应•非一对一的对应关系:每一个自变数的值都可能有数个依变数的值相对应8CostPer12FluidOunces1.41.21.0.8.6.4.2PricePer6-pack876543219changeinrealexports1.41.21.0.8.6.4.20.0-.2annualgrowthrateinnationalourput,1975-851086420-2-4-610yyeˆ•非一对一的对应关系:–e误差(errors),预测值–回归系数b:平均而言(onaverage),当自变数增加一个单位时,依变数会增加b个单位ebxayˆy11三、最小平方法(MethodofLeastSquares)•因为非一对一的对应关系,回归线的认定不是那么直接了当•问题是我们该选那一条回归线?选择的标准又是什么?12•选项1-最小误差和:找一条直线,使观察值(y)与预测值()的误差和为最小,也就是,为最小yˆiiyyˆ13•选项2-最小平方法:找一条使观察值(y)与预测值()间误差平方和(thesumofsquaresoftheerrors)为最小的直线,也就是,为最小yˆSSEyyii()214四、回归模型的解释力•散布图(scatterplot)•R2(CoefficientofDetermination)15222)ˆ()ˆ()(yyESSyyRSSyyTSSii16TSSRSSRESSRSSTSS217•R2指的是“依变数中被自变数解释的变异量之比例”。R2的值最大为1,最小为0–如R2=0.26,这表示自变数可解释依变数里26%的变异量18五、回归分析的假设检定•样本回归模型•母体回归模型ebxayXY19•回归分析的逻辑–假设在母体中自变数对依变数有影响–然后将两变数纳入回归模型中,以样本资料计算出回归系数b–假定这个回归系数b不是0,表示在样本中自变数对依变数确有影响20–但是这是否也显示母体模型中的回归系数不等於0?–如果就表示在母体中自变数对依变数没有影响–所以须要检证在样本回归系数b不等於0的情形下,母体回归系数是不是也不等於0021•假设检定的程序:–1)设立假设–2)决定显著程度(α)–3)设立决定规则–4)计算检定数据–5)结论22•研究问题:外资的流入是否会影响开发中国家的经济成长率?–y是经济成长率–x是外资的流入ebxay231)设立假设(双尾检定):•虚无假设:母体回归系数等於0,外资的流入对这些国家经济成长率没有影响•对立假设:母体回归系数不等於0,表示外资的流入对这些国家经济成长率有影响0:0H0:1H242)决定显著程度(α)3)决定规则为:–如果0在以样本回归系数建立的信赖区间内,无法拒绝虚无假设(统计不显著)–如果0不在以样本回归系数建立的信赖区间内,拒绝虚无假设(统计显著)254)计算检定数据如,自由度为或0.054–0.268107.0161.0054.099.1161.0))((975;.2bnstb05.099.1975;.68975;.270975;.2tttn68270265)结论–因为0不在信赖区间内,显示在95%信赖区间内母体回归系数为0的机率不超过5%。因此我们可以拒绝虚无假设–结论是外资的流入对这些国家经济成长率有影响。27–回归分析的假设检定也可以t分数检定,或–p值检定28•t分数检定法(双尾检定,设)–统计上显著–统计上不显著.9752;-ntt.9752;-ntt05.29•p值检定法(双尾检定)–如p,拒绝H0–如p,无法拒绝H030•简易双尾检定法–如–回归系数与其标准误比率的绝对值大於2,则表示在双尾检定的逻辑下,样本回归系数b在统计上是显著的2bsb31•单尾检定:p值检定法–决定规则如α,拒绝H0如α,无法拒绝H02p2p