《如何从0到1构建用户画像系统.pdf》由会员分享,可在线阅读,更多相关《如何从0到1构建用户画像系统.pdf(73页珍藏版)》请在三个皮匠报告上搜索。
1、如何从0到1构建用户画像系统 驱动营收增长 打通用户在不同 客户端行为 数据开发及部署 画像应用服务层 画像数据分析 SECURE, CLOUD- BASED NETWORK 画像系统架构 数据架构 从用户画像的数据架构谈需要掌握的大数据模块和开发语言 开发流程 第一阶段:目标解读 在建立用户画像前,首先需要明确用户画像服务于企业的对象,根据业务方需求,未来产品建设目标和用户画像分析之后预期效果; 第二阶段:任务分解与需求调研 经过第一阶段的需求调研和目标解读,我们已经明确了用户画像的服务对象与应用场景,接下来需要针对服务对象的需求侧重点,结合产品现有 业务体系和“数据字典”规约实体和标签之间
2、的关联关系,明确分析纬度; 第三阶段:需求场景讨论与明确 在本阶段,数据运营人员需要根据前面与需求方的沟通结果,输出产品用户画像规划文档,在该文档中明确画像应用场景、最终开发出的标 签内容与应用方式 ,并就该份文档与需求方反复沟通确认无误。 第四阶段:应用场景与数据口径确认 经过第三个阶段明确了需求场景与最终实现的标签纬度、标签类型后,数据运营人员需要结合业务与数据仓库中已有的相关表,明确与各业务场 景相关的数据口径。在该阶段中,数据运营方需要输出产品用户画像实施文档,该文档需要明确应用场景、标签开发的模型、涉及到的数据库 与表,应用实施流程; 第五阶段:特征选取与模型数据落表 本阶段中数据分
3、析挖掘人员需要根据前面明确的需求场景进行业务建模,写好HQL逻辑,将相应的模型逻辑写入临时表中,抽取数据校验是否符 合业务场景需求。 第六阶段:线下模型数据验收与测试 数据仓库团队的人员将相关数据落表后,设置定时调度任务,进行定期增量更新数据。数据运营人员需要验收数仓加工的HQL逻辑是否符合需求, 根据业务需求抽取查看表中数据范围是否在合理范围内,如果发现问题及时反馈给数据仓库人员调整代码逻辑和行为权重的数值。 第七阶段:线上模型发布与效果追踪 经过第六阶段,数据通过验收之后,就可以将数据接口给到搜索、或技术团队部署上线了。上线后通过对用户点击转化行为的持续追踪,调整优 化模型及相关权重配置。 各阶段关键产出物 需要掌握的相关模块 Kafka 流式计算 Spark Streaming Hbase 数据存储和查询 Hive MySQL Spark 数据开发 作业调度(ETL) crontab