《2020年终大会-推荐算法:3-3.pdf》由会员分享,可在线阅读,更多相关《2020年终大会-推荐算法:3-3.pdf(26页珍藏版)》请在三个皮匠报告上搜索。
1、EdgeRec: 边缘计算在推荐系统中的应用 龚禹 阿里巴巴 淘系推荐技术团队 2020.12.19 Road Map 背景 端上重排系统 端上混排系统 端上训练与千人千模 背景 边缘计算 v.s. 云计算 Overload on Cloud 互联网应用及用户规模爆炸式增长 5G普及、带宽增加存储压力 大规模神经网络模型计算压力 巨大的通信开销交互和体验瓶颈 运维成本和故障风险 Advantages on Edge 终端设备的存储计算能力快速发展 数据本地化:解决云存储及隐私问题 计算本地化:解决云计算过载问题 低通信成本:解决交互和体验问题 去中心化计算:故障规避与极致个性化 Edge Co
2、mputing: Bring Code to Data 临近 性 高带 宽 低延 时 隐私 性 重新思考工业界信息流推荐? Q1:区别于学术界基于MovieLens等的评分(或点击 率)预测任务 信息流推荐是一个人机交互的系统并 有无法忽略的上下文环境 Q2:信息流推荐的目标(如:浏览量 PV、点击量 IPV、 成交量 GMV)和传统搜索引擎的目标(如:相关性) 的不同 信息流推荐系统强调整体收益最大化 推荐系统新架构 召回粗排精排重/混排 个性化检索效率预估展现决策 云端 端-云协同的推荐系统架构传统推荐系统架构 端上重排系统 业务问题 推荐系统输入/反馈时效 分页请求机制导致策略调整不及时
3、 实时行为特征延迟 用户行为特征粒度粗 用户偏好的变化 与 推荐系统对用户感知 和 对内容的调整时机 并不能匹配,会出现推荐的内容并非用户当前时刻想要的,用户 浏览和点击意愿都会下降。 基于Client-and-Server的推荐架构 上海品茶猜你喜欢分坑位点击率统计 端上实时用户感知 背景 解决用户行为延迟和粒度粗的问题 思考 用户行为数据对于“个性化”的意义,参考DIN等工作 之前的工作一般只考虑用户和商品的“正反馈”交互(如点击、成交),很少考虑到“负反馈”交互(如曝光) 实时的“负反馈”交互也很重要,比如:商品类目多次曝光后,点击率会明显下降 需要考虑用户和商品的“交互动作”,比如:点击后在详情页的行为反应对商品真正的偏好,可能存在“伪”点击 用户在信息流推荐场景的“实时行为”相对于用户的“长期行为”同样重要 难点 如何对端上的用户异构行为进行序列建模? 如何优化端上序列模型推理的性能