《2020年终大会-推荐算法:3-5.pdf》由会员分享,可在线阅读,更多相关《2020年终大会-推荐算法:3-5.pdf(22页珍藏版)》请在三个皮匠报告上搜索。
1、多目标排序在快手短视频推荐 中的实践 郑东 快手社区科学部 快手短视频推荐场景介绍 多目标精排:从手工融合到Learn To Rank 复杂多目标:Ensemble Sort和在线自动调参 重排序:Listwise、强化学习和端上重排序 总结和展望 分享大纲 快手短视频推荐场景介绍 关于快手 双列发现页单列精选页关注页同城页 中国领先的短视频和直 播社区,日活3亿+ 价值观:真实、多元、 美好、有用 发现页:看见更大的世 界 双列:选择权 单列:沉浸式 关注页:半熟人半陌生 人社区,私域流量 同城页:身边触手可及 的生活 推荐算法在快手的流量分发和 用户体验中起核心主导作用 排序目标 隐式正反
2、馈 播放时长 有效播放 播放完成率 完播 显式正反馈 收藏 下载 进入个人页 关注 点赞 正向评论 观看评论 原声点击 标签点击 分享 显式负反馈 不感兴趣 负向评论 举报 隐式负反馈 短播放 终止Session 时间 实验 组DAU 涨幅 留存的累积效应 提升使用时长/正向反馈,减少负向 反馈,最终提高用户留存 多目标精排 从手工融合到Learn To Rank 缺点 过于依赖规则设计 过于依赖人工调参,维护成本高 固定权重,缺少个性化、场景化 手工融合和简单模型融合 多任务学习获得的个性化预估值 多目标排序 快手推荐追求时长、点赞、关注、分享等多种目标 通过合适的排序目标和机制设计,获得多
3、目标的协同提升 Stage1:手动公式融合 Stage2: 树模型规则Ensemble融合 a * pEvtr + b * pLtr + + g * f(pWatchTime) 使用GBDT模型,引入pXtr、画像和统计类特征,拟合组合 label: w = a * effective_view + b * like + + h * f(watch_time) 采用加权LogLoss, = ! #log(#) + log(1 #) 上下滑无负样本,通过拷贝正样本实现对目标无偏估计 等价于将叶子结点转换为打分规则,得到打分的Ensemble,也叫 RuleFit 缺点:表达能力有限,无法online learning 上线效果:同城页短视频时长提升4.5% 超参Learn To Rank user_iddevice_idstatus_1minstatus_2h . photo_top (di