泊松回归泊松回归案例介绍案例介绍案例介绍案例介绍描述分析描述分析描述分析描述分析数据读入数据读入模型的建立模型的建立模型的建立模型的建立关于泊松分布关于泊松分布y对于参数为n和p的二项分布,有:y对于参数为n和p的二项分布,有:{}()1nkknPXkppk−⎛⎞==−⎜⎟⎝⎠y当n很大而p很小时,根据泊松定理,有:k⎝⎠()lim1,!knkknneppnpkkλλλ−−→∞⎛⎞−==⎜⎟⎝⎠y即二项分布在n趋近正无穷是服从泊松分布:!kk⎝⎠{},0,1,2!kePXkkkλλ−===!k关于泊松分布关于泊松分布y泊松分布体现了对01分布变量进行多重观察的结y泊松分布体现了对0-1分布变量进行多重观察的结果,即变量值为1的次数的分布。y泊松分布具有较好的数学性质即y泊松分布具有较好的数学性质,即()()EXDXnpλ===()()p线性模型线性模型?y方程左边是离散型数据,右边是连续型数据,因此无法使用线性模型从简单出发从简单出发…非负的非负的泊松回归泊松回归正负都有(){}0123logfreq1+freq2+freq3xλββββ=+×××{}456+exp1+exp2+exp3+βββε×××极大似然法极大似然法()iknxλ()()(){}01,exp!niiiixLxkλββλ==−∏()()00,0ˆˆ,argmax,Lββββββ=单个自变量的显著性检验单个自变量的显著性检验ˆˆββββ()()()0,10,,ˆˆvarjjjjjjNjpββββσββ−−=⎯⎯→=ˆjβ()ˆˆjjjTβσβ=似然比检验似然比检验⎛⎞(){}()(){}0000,2maxlog,0maxlog,LLβββλββββ⎛⎞=−×=−⎜⎟⎝⎠(){}()()(){}0000,2maxlog,02maxlog,LLβββββββ⎛⎞=−×=−−×⎜⎟⎝⎠()()00⎝⎠似然比检验的实现似然比检验的实现模型选择模型选择2AICDeviancedf=+×()logBICDeviancendf=+×检验数据检验数据带入模型计算可得带入模型计算可得1.13820200.179185410.073319440.091454180.006887326.10.00512455.30.003202113.6−+×+×+××+×+×0.006887326.10.00512455.30.003202113.60.3163×+×+×=误差的度量误差的度量()21=mtrueprediikk−∑绝对预测精度()1iiikkm=∑绝对预测精度