《DataFun网易云音乐用户行为归因体系建设_宋志毅.pdf》由会员分享,可在线阅读,更多相关《DataFun网易云音乐用户行为归因体系建设_宋志毅.pdf(21页珍藏版)》请在三个皮匠报告上搜索。
1、DataFunSummitDataFunSummit#20232023网易云音乐用户行为归因数据体系建设演讲人-宋志毅-网易云音乐-资深数据开发工程师面临的问题 归因的业务背景 上一阶段的做法 上一阶段的问题解决的方案 埋点体系升级 归因模型升级 埋点管理平台未来的规划 埋点 模型 平台目录 CONTENTDataFunSummitDataFunSummit#2023202301面临的问题核心资产归因的业务背景-数据资产大图数据接入客户端日志 曝光、点击、滑动、播放服务端日志 交互请求算法 标签公共流量dwd事件流量dwd播放、收藏、评论、分享、关注场景流量dwd上海品茶、搜索、音乐人、个人页、活
2、动业务事件dwd下单、做任务dim主题域dws 用户、内容、创作者、会员、产品功能多元关系:人-内容-分发场景二元关系:人-内容,人-人关系型业务库新资产dwdoneID、oneIP、4BC、时空数据人的标签:自然属性,社会属性,兴趣,行为等内容标签:类型,品类,场景等标签型服务场景决策分析 圈歌圈人 内容推广 价值评估 营销活动 关系挖掘 市场洞察 用户行为归因数据资产基石归因的业务背景-为什么需要归因P1C1P2C2P3C3P4C4R页面点击转化产品功能A算法策略B运营策略C描述是什么因素促使用户完成转化(播放、互动、下单)分析流量引导和转化效果做出调整和优化用户行为归因归因的业务背景-音
3、乐的典型场景内容如何被分发,并非用户当前的行为路径归因的业务背景-归因策略的选择 待归因事件中,最早发生的事件被认为是导致业务结果的唯一因素首次触点归因 待归因事件中,每一个事件对业务结果产生的影响力平均分摊线性归因 待归因事件中,最早和最近的事件影响力占一部分比例,中间事件平摊影响力位置归因 待归因事件中,越近发生的待归因事件对业务结果的影响力越大时间衰减归因标准一致,逻辑简单直接业务认可,能反映业务事实 待归因事件中,最近发生的事件被认为是导致业务结果的唯一因素末次触点归因上一阶段的做法目标事件归因事件段(通常1天)归因策略(末次触点)待归因事件时间序列排序关联相关事件归因播放间接归因播放
4、直接归因 以播放作为待归因事件,做时间序列排序关联 以直接来源之前的点击作为待归因事件,做时间序列排序关联 埋点日志携带内容分发直接来源code常规ETL模式内容分发归因上一阶段的问题321数据量大,耗时、耗资源实时或准实时场景不可用稳定性无法支持更多层级链路归因代码需要频繁更新扩展性日志信息没有统一规范,定义模糊归因时间段的局限性时间序列不一定反映内容分发来源的真实情况准确性DataFunSummitDataFunSummit#2023202302解决的方案问题分析稳定性01准确性02扩展性03归因数据归因过程避免大量数据排序关联归因结果包含足够的信息且符合业务分析诉求埋点体系升级标准化记录
5、用户行为链路归因模型升级基于埋点的行为链路产出业务归因数据管理埋点需求与埋点使用埋点管理平台埋点体系升级大前端埋点框架sdk实现数据仓库埋点内容设计标准化对象管理位置信息两大要素对象ID(oid)排序位置(pos)内容信息三大要素内容类型(ctype)内容ID(cid)内容分发策略(ctrp)SPMSCM标准化归因参数三大要素对象类型标识(otype)SPMSCM三种类型psrefermultireferaddrefer标准化归因形态伴随态归因(内容分发)播放:持久化记录refer其它:将持久化的播放refer随事件提交非伴随态归因提交操作事件当前的refer技术共建归因模型升级-目标埋点日志
6、已经记录了归因链路信息,归因模型还需要解决归因链路的哪些问题?组件复用,SPM一致但业务含义不同末次触点不一定反映真实的业务诉求归因模型升级-目标内容以集合形式分发歌单、专辑、播单主题域建设符合业务诉求的末次触点触点所属的模块、页面不同元素归属同一个业务场景同一业务场景,不同客户端或不同版本的SPM定义不同,或者本身就会出现在不同的位置推荐类型(如搜索场景既有主动行为又包含推荐流量)付费类型来源的页面位置来源的媒介内容来源的业务场景来源的流量分类如何组织数据支持多维归因分析?归因模型升级-埋点标准延申歌曲cell(歌曲ID)歌单page(歌单ID)播放btn(无ID)待归因事件的触点对象中最近
7、一个与目标事件关联的内容类型不同的内容定义媒介内容忽略非业务归因目标的触点后的末次触点歌单、专辑、播单等媒介内容详情页收银台等公共页面虚拟歌曲列表等过渡页面定义有效末次触点服务动态分发模块内容时携带组件标识,取特殊的scm作为spm_cid(可能会有多层级)与spm作为业务位置的联合唯一建定义业务唯一SPM配置规则归因模型升级-多维模型设计字段说明生成方式多个常规字段播放、收藏、订单各自的业务字段add_refer反序列化保留原始日志种的refer字段,包含业务唯一SPM的联合唯一键spm_cid,用于个性化的归因分析场景及数据查验通过UDF按统一规则或配置规则解析埋点日志的原始refermu
8、lti_refer1-5biz_refer有效末次触点,内容为以上refer字段的其中之一,描述来源的页面位置carrier_type描述来源的媒介内容carrier_idrefer_scene描述来源的业务场景通过统一规则或配置规则根据解析后的上述字段生成多个流量分类字段描述不同业务场景下的来源的流量分类归因目标事件DWD(播放、收藏、订单)埋点管理平台埋点登记、稽查、索引一体化埋点信息维度表当前方案总结321无需进行日志关联,高效率低成本目前已在离线、准实时、实时场景同时上线稳定性能支持层级更多、更复杂的业务场景播放归因代码层面因归因逻辑适配调整的需求,新方案上线1年多仅1次扩展性没有严格的校验标准播放无意义的归因结果播放量占比歌曲和播客分别从10%和20%下降至1%准确性DataFunSummitDataFunSummit#2023202303未来的规划未来的规划埋点提高不同客户端类型的覆盖率提高归因场景覆盖率模型提高归因场景覆盖率不同业务线数据分支较多,实现上有差异,归因体系需要落地统一标准平台埋点管理平台统一管理归因ETL过程中的配置规则业务唯一spm有效末次触点业务场景归属流量分类归属感谢观看