突破阻爱·为自己突破阻爱·为自己@InfoQinfoqchina突破阻爱·为自己婚恋交友中的用户推荐系统吴金龙佳缘技术研发中心2014年04月25日突破阻爱·为自己关于我•吴金龙–新浪微博:@breezedeus–世纪佳缘技术研发中心2005201020112014北京大学计算数学专业博士研究方向:协同过滤推荐算法世纪佳缘研发中心:数据相关阿里云计算PC&Mobile输入法开发突破阻爱·为自己大纲佳缘、研发中心背景介绍三大系统:运营、个性化、组合推荐系统五大特点、二项计划总结突破阻爱·为自己背景简介佳缘、研发中心突破阻爱·为自己佳缘的信件模式:灵活的按效果付费7•国外婚恋交友网站:先付费•世纪佳缘:后付费突破阻爱·为自己佳缘的信件模式:灵活的按效果付费8突破阻爱·为自己为什么佳缘不免费?9为什么不免费垂直型网站,用户目的明确用户的生命周期短用户获取成本高付费,让交友环境更加纯净目前没有其他更好模式突破阻爱·为自己2万+2.4%1万-2万3.4%5千-1万8.8%女30%超一亿注册会员性别年龄教育背景月收入男70%18-2341.7%45+1.7%36-457.6%31-358.8%高中及以下32.4%硕士及以上3.2%200013.6%2千-5千67.9%24-3039.2%大学64.5%地区分布会员多会员少会员属性突破阻爱·为自己研发中心的工作范畴:数据相关&新技术探索11数据接口非个性化推荐个性化推荐魅力会员人脸检索数据产品用户推荐网警系统人脸搜索数据运营与监控新产品调研统计产品效果统计产品改进支持分布式存储与计算系统Hadoop/HiveMysql/MongoDBMemcached/RedisStorm突破阻爱·为自己三大用户推荐系统运营、个性化、组合突破阻爱·为自己婚恋交友中的交互流程13为男用户展示女性男用户点击查看异性资料男用户发信回信付费查看此信件具体内容女收信用户上线后查看邮箱突破阻爱·为自己用户推荐系统的一般流程14候选产生模块排序模块所有用户候选用户最终结果排序后用户过滤模块突破阻爱·为自己系统一:运营推荐系统15按照择偶条件匹配、资源分配等原则抽取候选集按照收益最大化等原则排序候选集所有用户候选用户最终结果排序后用户过滤已联系过的、黑名单等候选•目标:最大化公司的(短期和长期)收益–提高人均付费金额–提升付费人数突破阻爱·为自己运营推荐系统:候选产生模块按照择偶条件匹配、资源分配等原则抽取候选集带约束的动态资源分配问题资源需求方资源提供方突破阻爱·为自己运营推荐系统:排序模块按照收益最大化等原则排序候选集最大化用户的看信/收益效率看信效率:单位时间内的看信量让愿意看信的用户收到更多信看的信越多,收信就越多缩短发信到看信的时间周期登录越频繁,收信就越多突破阻爱·为自己系统二:个性化推荐系统18抽取用户可能感兴趣的异性作为候选集依据用户的历史数据对候选集重排序所有用户候选用户最终结果排序后用户•提升用户满意度过滤不满足择偶条件、已联系过、黑名单等候选突破阻爱·为自己个性化推荐系统的架构19线下系统Log监控系统数据模型系统前端展示数据流动方向算法支持线上系统突破阻爱·为自己个性化推荐系统:候选产生和排序模块使用规则控制各类运营用户的收信情况引入信件收益尝试最大化整体收益抽取用户可能感兴趣的异性作为候选集Offline/Onlineitem-basedkNN依据用户的历史数据对候选集重排序LogisticRegression/LatentFactor问题无法融合运营需求突破阻爱·为自己个性化推荐系统的评价指标演进发/收信看信正向回信收益突破阻爱·为自己系统三:组合推荐系统22以满足运营需求为准则抽取候选集依据用户的历史数据对候选集重排序所有用户候选用户最终结果排序后用户•在满足运营需求的情况下,提升用户体验过滤不满足择偶条件、已联系过、黑名单等候选突破阻爱·为自己组合推荐中分解成多个转化率预测问题23为男用户展示女性男用户点击查看异性资料男用户发信回信付费查看此信件具体内容女收信用户上线后查看邮箱𝐂𝐯𝐑1𝐂𝐯𝐑4𝐂𝐯𝐑2𝐂𝐯𝐑3突破阻爱·为自己组合推荐系统发信随意发信认真无回信新用户用户群组看信-回信发信-看信点击-发信展示-点击•针对不同的用户群,使用不同的组合策略突破阻爱·为自己总结五大特点、二项计划突破阻爱·为自己特点一:地域性强•只找本地人:小地区内候选集合很小–如何扩展择偶条件地区分布会员多会员少突破阻爱·为自己特点二:可逆性•两边都是人:需要考虑到双方感受突破阻爱·为自己特点三:资源不可复制•一夫一妻制:资源不可重复使用突破阻爱·为自己特点四:转化链很长•信只有被看了,才有价值为男用户展示女性男用户点击查看异性资料男用户发信回信付费查看此信件具体内容女收信用户上线后查看邮箱突破阻爱·为自己特点五:多指标博弈•公司利益vs.用户利益•短期利益vs.长期利益突破阻爱·为自己未来计划一:各产品之间交叉使用数据产品用户推荐魅力会员网警查杀产品推荐知识库魅力会员网警查杀产品推荐图片检索31•多数据源融合突破阻爱·为自己未来计划二:探索新的推荐元素•推荐理由–为什么推荐她:因为你离异,她也离异?•人脸检索技术突破阻爱·为自己突破阻爱·为自己特别感谢合作伙伴突破阻爱·为自己特别感谢媒体伙伴(部分)