建立用户画像的标签体系王建军前一篇粗略的介绍了建立用户画像的过程,连载二更进一步,以时尚杂志全媒体为业务原型,把抽象的文字描述实例化,从战略目的分析、如何建立用户画像体系、怎么对标签进行分类分层级三个不同角度来说说用户画像建立的过程。梳理标签体系是实现用户画像过程中最基础、也是最核心的工作,后续的建模、数据仓库搭建都会依赖于标签体系。可以获取到的数据分两类,一类是业务系统数据,一类是用户访问网站、APP产生的行为数据。不同的企业做用户画像有不同的战略目的,广告公司做用户画像是为精准广告服务,电商做用户画像是为用户购买更多商品,内容平台做用户画像是推荐用户更感兴趣的内容提升流量再变现。战略理清楚后,首先要画出描述用户画像的框架,建立用户画像体系框架的目的是进一步明确用户画像的用途、把标签限定在合理的范围内。具体要结合战略目标、数据情况、应用场景来规划标签系统,选取和战略目标一致的标签维度,把标签按照应用场景进行分门别类。同时注意聚焦和收敛,不要把没用标签装进来,以降低系统的复杂性,避免无用信息干扰分析过程。用户画像体系和标签分类从两个不同角度来梳理标签,用户画像体系偏战略和应用,标签分类偏管理和技术实现侧。把标签分成不同的层级和类别,一是方便管理数千个标签,让散乱的标签体系化;二是维度并不孤立,标签之间互有关联;三可以为标签建模提供标签子集,例如计算美妆总体偏好度,主要使用美妆分类的标签集合。梳理某类别的子分类时,尽可能的遵循MECE原则(相互独立、完全穷尽),尤其是一些有关用户分类的,要能覆盖所有用户,但又不交叉。比如:用户活跃度的划分为核心用户、活跃用户、新用户、老用户、流失用户,用户消费能力分为超强、强、中、弱,这样按照给定的规则每个用户都有分到不同的组里。标签还可以按照处理过程、标签获取的方式进行划分,分为事实标签、模型标签、预测标签。不同类别的处理方式不一样。事实标签:直接从原始数据中提取,例如性别、年龄、住址、上网时段等等模型标签:需要建立模型进行计算,例如美妆总体偏好度预测标签:通过预测算法挖掘,例如试用了某产品后是否想买正品但是有些事实标签,如果用户没有填写的话,就需要建立模型来预测。例如数据库中的年龄字段为空,建立依据用户行为来建立特征工程,然后做预测。参考文档《如何构建用户画像》《你确定你真的懂用户画像?》