下载此文档

1号店架构师王富平:一号店用户画像系统实践.doc


文档分类:IT计算机 | 页数:约15页 举报非法文档有奖
1/15
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/15 下载此文档
文档列表 文档介绍
该【1号店架构师王富平:一号店用户画像系统实践 】是由【朱老师】上传分享,文档一共【15】页,该文档可以免费在线阅读,需要了解更多关于【1号店架构师王富平:一号店用户画像系统实践 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。ofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilities我先引用梵高的一句话:“我想强调的是,同一个人有多样的自画像。与其追求照相般的相似性,不如深入地开掘相似处〞。以下图是是当时梵高比较得意时的画像,戴了礼帽,穿了西服,但那时耳朵已经割掉了。我觉得作为一个好的架构师,要有艺术家的精神。时至今日架构发生了很多变化,新语言在不断出现,我觉得没必要把思维停留在某一个方面。ofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilities用户画像的定义用户画像定义使用标签来量化用户特性属性,到达描述用户的目的。用户画像的难点就是数据源,因为你拿要拿到足够多足够全的数据很不容易,所以要与业务结合,比方说这个人在30天内购置了你的商品,这就是一个标签,但是如果你不参与开发这个系统,你不会想到有这个标签。然后是动态更新,一个人是不断变化的,就像梵高一样,他不同时期的自画像也是不一样的。假设现有用户画像有姓名、地域两个属性,你将如何使用?最简单的分析不同性别的群体特征,做特定营销。分析广州、北京、客户的群体特征,分析90后、80后的群体特征。其实这里面有共同点,就是说分类和聚类。京东也好、淘宝也好、一号店也好,我不可能真的每一个用户生成一套推荐方案,我们都是把人分成了一万个类,或者一千个类,我们把你划分到某一个类别里面,在那个类别里面做一个推荐。而且群体特征往往更能反映你的个人喜好,就是说其实人与人之间是有共同点的,也是有异同点的。分类—聚类迈出个性化的第一步,用户画像的应用开始1号店建立用户画像的初中是来自于?千人千面?工程,简而言之:分析不同群体特征,针对群体进行推荐调整,典型的群体有小区、学校公司等。以下图是2024年9月份转化率的数据。我们覆盖面也比较大,目前差不多355家公司,591个行业,。ofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilities1号店从零开始打造了自己的用户画像系统,包含了用户标签画像、用户偏好画像。经历了全量版画像、Storm版实时画像、电商用户标签画像等演进和完善的过程。在两年的时间里,遇到了性能瓶颈、数据质量评估、用户标签的膨胀、画像在精准化营销等应用场景的摸索,一步步成长,在推荐系统发挥了巨大作用。用户标签画像我们的用户标签包含根本特征、社会身份、顾客用户生命周期、类目偏好等等。比方说你怎么判断一个人是不是对女装感兴趣,假设我们有一个类目就是女装,那很好办,如果你购置都是女装,那会认为你这个人对女装比较感兴趣。如以下图所示。ofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilities挑战我们期间遇到了两方面的挑战:亿级画像系统实践和应用记录和存储亿级用户的画像,支持和扩展不断增加的维度和偏好,毫秒级的更新,支撑个公司性化推荐、广告投放和精细化营销等产品怎么做到的ofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilities用户画像算法模型不断优化引入Storm等实时技术主题推荐标签、用户命名实体等新增标签补充进画像HBase的离线和在线别离、Hbase的KV读和Solr的批量读别离、region热点监控和切分数据流不断优化数据存储改进第一版画像现状ofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilities偏好系统包括类目偏好和导购属性偏好两个局部,第一版的偏好系统接口调用数每天达千万次,主要效劳于推荐栏位和EMD,但改变的偏好系统存在性能低下,偏好得分分布不合理等问题:运行一次全量的数据更新太慢用户的偏好得分数据分布不合理,得分呈多波峰分布,、,兴趣偏好分值将不会发生变化〔未按时间进行衰减〕新版画像系统流程ofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilities这个很简单,就是大家都能想到的离线和在线,离线要基于用户的行为,产品的信息进行打分,要得到一个个人的偏好,前端提供一个接,根本上是这样子。画像模型优化1关于算法模型做了一些优化,第一个优化就是得分,通过操作得分使它的偏好更有区分性,历史行为应有衰减。你这个得分假设永远是叠加的,这也是有问题的,因为你一个月之前或者一年之前所有的行为,如果现在还影响着你的得分,会有不准确性,所以会有一个历史的衰减得分。偏好得分分布应与用户对类目的权重分布一致,关键是对数据的处理,还有怎么样去调整你的模型。偏好画像的得分应满足三个条件:用户在此类目或导购属性上的操作越多,得分越高用户对类目或导购属性的喜好程度不同,可以通过偏好得分区间表达用户的历史行为应有衰减对于类目偏好,需先将用户对类目偏好离散化提高某些场景性能,最简单的行为可划分为两档【喜爱|一般】。ofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilities参数调整原那么:衰减系数的设置满足两个月衰减一半〔结合用户在不同类目下的购置周期,见下页〕各类行为权重之间的比例设置等同于用户各种行为数目的比例偏好得分分布应与用户对类目的权重分布一致画像模型优化2然后有一个购置周期的问题,就是说不同的东西会有一个购置周期的,比方说牙膏多久前买的,牛奶多久前买的,这些东西的周期性是比较强的。后面会有一个实时推荐,根据用户的行为进行算分,根据各个类目的偏好进行一个实时推荐。主题标签,比方说吃货,比方说爱吃零食的女性,算是吃货范围。还有数码极客,就是通过主题划分人。具体的方法我就不多讲,就是通过你购置的东西进行分类。以下图是用户不同类目的购置周期。主题推荐标签ofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilities主题和标签的映射关系如下:使用标签表中的关键词列表,结合商品的评论、标题数据给商品打标签。商品打标签公式为:用户打标签公式为:HBase的离线和在线别离讲一下HBase,我们拿了很多开源的东西。我想问一下CAP大家都了解吧,一个数据库你只能获取两个特性。这边我们采用了离线和在线的方式,把可用性提上去。如以下图所示。ofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesofruraldrinkingwatersources,pletewithwarningsigns,workprotectionfacilitiesSolr解决批处理选人我们还有一个选人机制,就是用户画像的另一个场景,既然你有用户的各种信息了,那么对于其他业务,比方说广告业务,比方说促销业务他们提供了一个需求,就是选人,是基于Solr做的一个选人中心。如以下图所示。

1号店架构师王富平:一号店用户画像系统实践 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数15
  • 收藏数0 收藏
  • 顶次数0
  • 上传人朱老师
  • 文件大小2.12 MB
  • 时间2024-05-15