同城找导游(快速找到同城导游的方法)

上海品茶

2020年终大会-推荐算法：3-2.pdf

上传人：li

编号：29849

2020-12-01

25页 3.95MB

《2020年终大会-推荐算法：3-2.pdf》由会员分享，可在线阅读，更多相关《2020年终大会-推荐算法：3-2.pdf（25页珍藏版）》请在三个皮匠报告上搜索。

1、粗排技术体系与最新进展王哲阿里定向广告算法团队大纲粗排发展历史粗排最新进展总结与展望粗排发展历史背景介绍大型工业排序系统一般采用多阶段级联架构，包含：召回：1000W+ 粗排：1W+ 精排：上百重排：上百粗排目标：在满足算力rt约束的情况下，选出满足后链路需求的集合。粗排与精排的比较：算力rt约束：粗排打分量远高于精排，同时有较严格的延迟约束：10-20ms 解空间问题：粗排线上打分的候选集更大，面临更严重的选择偏差问题。 Matching Pre-Ranking Ranking tens of millions tens of thousands hund

2、reds Re-Ranking 粗排的两大技术路线集合选择技术精准值预估技术以集合为建模目标，选出满足后链路需求的集合依赖对后链路的学习，可控性较弱算力消耗一般较小代表技术：多通道 Listwise，如LambdaMART 序列生成算法集合评估器集合生成器以值为建模目标，直接对最终系统目标进行精确值预估可控性更强算力消耗一般较大代表技术： Pointwise 粗排的前深度学习时代（2016年以前） y = ?(Tx) Generation 3 Vector-Product based DNN Generation 4 COLD Generation 2 Logist

3、ic Regression Generation 1 Ad-wise statistical score user featuresad features ConcatConcat 0 1 x y = f(xa) y = # clicks(ad) # impressions(ad) ?(x) x = concat(xu,xa,xua) 质量分基于广告的历史平均CTR，只使用了广告侧的信息表达能力有限实时性强 LR为代表的传统机器学习模型结构简单，有一定的个性化表达能力可以在线更新，在线服务粗排的深度时代-向量内积模型（2016）双塔结构，两侧分别输入user特征和ad特征，经过DNN变幻后分别产出user向量和ad向量 user侧网络可以引入transformer等复杂结构对用户行为序列进行建模优点：内积计算简单，节省线上打分算力 user向量和ad向量离线计算产出，