《DataFun-上午-1st-腾讯百亿级内容处理架构解析-stevenyshi(施驭) .pdf》由会员分享,可在线阅读,更多相关《DataFun-上午-1st-腾讯百亿级内容处理架构解析-stevenyshi(施驭) .pdf(25页珍藏版)》请在三个皮匠报告上搜索。
1、腾讯百亿级内容处理架构解析施驭 腾讯 高级后端研发工程师|听众收益|1、揭秘腾讯PCG百亿级内容处理管线的核心架构2、数百个微服务乐高式编排的技术选型3、如何保证每日数十亿次的任务可靠调度4、如何实现端到端的可观测性和服务稳定性01背景介绍03系统详解02系统效果04未来展望目录CONTENT|01背景介绍背景介绍|背景介绍|消息系统调度系统运行系统存储系统业务内容工程质量算子原子化插件标准化服务编排化内容多态性内容预处理内容识别码内容接入管线编排内容处理可观测|02系统效果系统效果-技术效果|接入效率:强大的接入能力,累计处理百亿级内容数据,支持自定义和模板化的近10种异构内容接入,管线创建
2、实现自举,接入周期从1周降低至2个小时。研发效率:端到端的效率优化算法能力,引入时间从天级别降低至1小时。平台已引入百余个算法插件算子;整体链路迭代的交付周期从月级别降低到天级别。运行效率:每天数十亿的消息信号。具备高效的延迟队列补偿保障,水平扩展优先级队列处理机制;插件共享,每天缓存命中数亿次,为业务节省万余核CPU、千余张GPU。维护效率:全链路秒级业务内容视角和平台工程视角健康性和追踪性可观测能力。目前故障自动处理率75%+,自愈率75%+,平均故障恢复时间2.4分钟。|03系统详解系统详解-技术架构图|系统详解-接入系统|鉴权限流标准化自动化内容接入层(千万级/天)材料仓库业务隔离分布
3、式ID生成内容筛选器管线A管线B配置化筛选内容形式图文视频短内容合辑带货系统详解-插件系统|插件市场(插件规模4000+)分类标签算法特征质量特征低俗惊悚策略逻辑排重旧闻人工环节质量标准调用方式同步异步协议定义标准自定义业务管线(管线规模1000+)腾讯视频管线腾讯新闻管线QQ浏览器管线15亿/day系统详解-编排系统-Pipeline|PipelinePipeline模式:模式:链式编排,适合比较简单的业务场景系统详解-编排系统-DAG|DAGDAG模式模式:基于BPMN(Business Process Model and Notation)2.0标准构建,用于支持比较复杂的业务模型。元素
4、描述符号事件(Event)用来表明流程的生命周期中发生了什么,包括开始事件,结束事件等活动(Activity)活动是业务流程定义的核心元素。一个活动可以是流程的基本处理单元(如人工任务、服务任务),也可以是一个组合单元(如外部子流程、嵌套子流程)网关(Gateway)用来控制流程的流向,包括排他网关、并行网关、相容网关等顺序流(Sequence Flow)顺序流用于显示在流程中执行和编排的顺序活动系统详解-编排系统-DAG|系统详解-消息系统|多源消息统一接入(3千万+/天)消息中间件解耦削峰 消息支持重试与广播系统详解-调度系统|统一调度框架(数十亿/天)支持优先级调度 执行器心跳监控 动态
5、流控与反压机制 多租户逻辑隔离系统详解-执行系统-Pipeline|Pipeline模式执行引擎基于FSM(finite-state machine)有限状态机实现,每个stage对应一个状态系统详解-执行系统-DAG|DAG引擎的设计理念是一个纯抽象、可复用、与业务逻辑无关的引擎,驱动流程在DAG图上的流转。系统详解-存储系统|内容属性宽表schema需要灵活扩展灵活扩展,同时需要对字段进行规范管理;需要提供单个内容的详细处理流水供业务查询追溯;需要支持PBPB级级的数据存储,以及对内容万级万级qpsqps的在线读写能力,同时要求较高的可用性;需要支持不同业务个性化的关键字段的检索需求;需要有离线离线+实时数仓实时数仓提供给业务进行各种查询分析;在降本的背景下还需要平衡好资源成本资源成本。系统详解-存储系统|实时加工存储:Hbase(数百T数据量级)离线分析存储:ES+Clickhouse(根据业务需要部署)系统详解-监控系统|04未来展望未来展望|插件开发效率任务运行效率TCO智能链路效率智能编排路由寻优弹性伸缩非常感谢您的观看|