《9-5 严选跨域多目标算法演进.pdf》由会员分享,可在线阅读,更多相关《9-5 严选跨域多目标算法演进.pdf(21页珍藏版)》请在三个皮匠报告上搜索。
1、跨域多目标算法演进网易严选推荐算法工程师强小辉陈自强|目录业务介绍01多目标建模02多目标优化演进03长期价值探索04|业务介绍严选站内推荐业务的算法服务 入口页 为你精选/猜你喜欢 活动页 goods组排序 商详页类目页 其他业务场景|多目标建模精排的挑战&难点多业务指标的优化转化数据稀疏长期价值探索|多目标建模样本与特征正负样本正:用户点击/转化负:skip-above 曝光未点击样本构造头部热门打压 Top流量商品降采样短时间多次曝光 时间窗口+选取1次曝光虚假曝光 定制规则去噪假正样本 误点/快速回退行为数值特征归一化/RankGauss分桶embed类别特征hash低频过滤embed
2、序列特征embedattentionpoolingembedding初始化normalize|多目标建模MMOE应用广泛的多目标网络Expert+门控网络PLEShared expert+Specific expert考虑了不同Expert之间的交互PLEMMOE|多目标优化演进位置偏差用户倾向于和靠前的物品交互反馈循环,部分商品过曝Debias构建shallow tower建模biasBias feature+dropout|CTR+1.7%人均点击数+4.95%多目标优化演进转化目标稀疏增加业务目标 加购 评论商品 查看促销信息 分享 收藏Seesaw PhenomenonorGradno
3、rm不同任务Loss梯度量级接近不同任务学习速度接近CTR+6.92%CTCVR+5.87%|多目标优化演进跨域多目标算法引入场景差异性场景共性+迁移学习|长期价值探索|商品卡片类型用户留存率商品卡片+内容卡片 多业务混排Bandit算法 根据用户偏好个性化曝光权重增加优化目标:用户交互session长度全站加购率+0.5%曝光点击率+2.02%3日留存率+1.2%非常感谢您的观看|多场景建模在网易严选通用推荐中的实践陈自强 网易严选推荐算法工程师|您公司的logo|不同用户群体、APP 不同模块、不同客户端等,数据分布上有明显差异通用推荐场景数据分布呈现显著差异入口页二跳页活动页通用推荐场景
4、核心场景l入口页首猜、购物车、个人页等模块l流量大、数据丰富l承担核心业务指标l承接中、小、新流量场景l单模块流量较小、数据稀疏l场景丰富什么是多场景建模?什么是多场景建模?您公司的logo|多场景建模:研究如何捕获场景之间的共性,同时保留各个场景的数据特性的建模方案为什么使用多场景建模?您公司的logo|不同场景数据分布不同,易忽略场景间差异性模型训练过程出现负迁移,容易被大场景数据带偏推荐效果有好有坏,出现跷跷板现象小场景与新场景数据稀疏,难以充分训练好模型众多场景单独建模,人力及系统资源浪费场景多,无法统一快速迭代如何进行多场景建模?您公司的logo|构建场景相关特征输入进行建模效果一般
5、,场景信息难以体现将场景视为 bias,构建辅助子网络在输出层与主网络结果相加或相乘主网络学习共性,子网络拟合差异性如何进行多场景建模?您公司的logo|套用 MMoE 多任务框架进行多场景建模MMoE 专家网络结构,每个塔对应一个场景各场景特征数量、语义保持一致特征空间多个专家网络隐式学习场景间差异与共性顶层塔只能被对应场景数据更新,小场景学不好输出层增加共享塔,缓解小场景学不好问题各场景最终结果是所有场景加权结果权重生成子网络用于生成场景权重场景数量限制,未尝试 PLE如何进行多场景建模?您公司的logo|STAR 结构中,场景输出由中心共享参数和场景私有参数相乘得到共享参数由所有场景数据更新,场景参数只能由特定场景更新存在中心共享网络,易于接入新场景共享底层特征空间,场景信息可能无法传递您公司的logo|如何进行多场景建模?底层采用 MMoE 专家网络结构,自动选择场景间共享信息顶层专家网络与场景特征并行输入,强化场景间差异左侧场景MLP参数私有,右侧共享通用推荐中落地结果您公司的logo|各场景训练数据占比及平均 CTR各场景离线 AUC 结果Mix 和Single 分别混合场景数据和单场景训练模型中小场景离线 AUC:Mix Single Multi线上 AB 实验 CTR 约 5+%10+%的相对提升非常感谢您的观看您公司的logo|