人脸对齐问题可以看作是学习一个回归函数F,以图象I作为输入,输出θ为特征点的位置(人脸形状):θ=F(I)。简单的说,级联回归模型可以统一为以下框架:学习多个回归函数{f1,…,fn-1,fn}来逼近函数F:θ=F(I)=fn(fn-1(…f1(θ0,I),I),I)θi=fi(θi-1,I),i=1,…,n所谓的级联,即当前函数fi的输入依赖于上一级函数fi-1的输出θi-1,而每一个fi的学习目标都是逼近特征点的真实位置θ,θ0为初始形状。通常情况,fi不是直接回归真实位置θ,而回归当前形状θi-1与真实位置θ之间的差:Δθi=θ-θi-1。在加州理工学院从事博士后研究的PiotrDollár于2010年首次提出级联形状回归模型CascadedPoseRegression(CPR),来预测物体的形状,该工作发表在国际计算机视觉与模式识别会议CVPR上。如下图所示,如下图所示,给定初始形状θ0,通常为平均形状,根据初始形状θ0提取特征(两个像素点的差值)作为函数f1的输入。每个函数fi建模成RandomFern回归器,来预测当前形状θi-1与目标形状θ的差Δθi,并根据Δθi预测结果更新当前形状得θi=θi-1+Δθi,作为下一级函数fi+1的输入。该方法在人脸、老鼠和鱼三个数据集上取得不错的实验结果,通用的算法框架亦可用于其他形状估计任务,比如人体姿态估计等。该方法的不足之处在于对初始化形状θ0比较敏感,使用不同的初始化做多次测试并融合多次预测结果可以一定程度上缓解初始化对于算法的影响,但并不能完全解决该问题,且多次测试会带来额外的运算开销。当目标物体被遮挡时,性能也会变差。与上一个工作来自同一课题组的XavierP.Burgos-Artizzu,针对CPR方法的不足,进一步提出RobustCascadedPoseRegression(RCPR)方法,并发表在2013年国际计算视觉会议ICCV上。为了解决遮挡问题,PiotrDollár提出同时预测人脸形状和特征点是否被遮挡的状态,即fi的输出包含Δθi和每个特征点是否被遮挡的状态pi:{Δθi,pi}=fi(θi-1,I),i=1,…,n当某些特征点被遮挡时,则不选取该特征点所在区域的特征作为输入,从而避免遮挡对定位的干扰。此外,作者提出智能重启技术来解决形状初始化敏感的问题:随机初始化一组形状,运行{f1,…,fn-1,fn}的前10%的函数,统计形状预测的方差,如果方差小于一定阈值,说明这组初始化不错,则跑完剩下的90%的级联函数,得到最终的预测结果;如果方差大于一定阈值,则说明初始化不理想,选择重新初始化一组形状。该策略想法直接,但效果很不错。级联形状回归模型成功的关键在于:1.使用了形状相关特征,即函数fi的输入和当前的人脸形状θi-1紧密相关;2.函数fi的目标也与当前的人脸形状θi-1相关,即fi的优化目标为当前形状θi-1与真实位置θ之间的差Δθi。此类方法在可控和非可控的场景下均取得良好的定位效果,且具有很好的实时性。