上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

师锐-实时计算在字节跳动的发展与展望.pdf

编号:101889 PDF 25页 33.57MB 下载积分:VIP专享
下载报告请您先登录!

师锐-实时计算在字节跳动的发展与展望.pdf

1、师锐字节计算基础架构负责人实时计算在字节跳动的发展与展望#1#1#2#2#3#3发展概览#4#4历程回顾重点工作展望总结#1#1发 展 概 览国 内 业 务海 外 业 务字 节 跳 动 旗 下 产 品实 时 信 息 流 推 荐规 模 与 挑 战实时推荐请求海量存储空间全球 MAU国家与地区运营1919亿亿150150个个EBsEBs百万百万 QPSQPS实时计算在字节跳动的主要应用场景#1#1#2#2#3#3#4#4#5#5实时特征计算e.g.窗口计数实时模型训练实时数仓安全&风控实时大屏e.g.春晚,双十一主要计算引擎资源对比2021-01-012021-01-142021-01-27202

2、1-02-092021-02-232021-03-132021-03-262021-04-092021-04-232021-05-072021-05-212021-06-042021-06-242021-07-112021-07-242021-08-072021-08-212021-09-032021-09-172021-09-302021-10-142021-11-15SPARKApache FlinkPRIMUSMAPREDUCE#2#2历 史 回 顾2017 2018:Flink 初露锋芒调研并明确 Flink 为字节流式计算引擎的发展方向#1#1完成 Jstorm on Flink 适

3、配工作,推动 Jstorm 向Flink 引擎迁移#2#2构建一站式流式计算作业管理平台#3#3SmartResources 上线,支持自动调整 Container CPU 和内存使用量#4#4单点故障重启上线,支持超大规模抖音流式训练作业#5#5完成 100%Jstorm作业迁移#1#1Flink 1.5-1.9 版本升级,在公司范围内推广 Flink SQL#2#2Flink Batch 在公司内场景落地#3#3统一实时元信息#4#4State&Checkpoint大规模推广#5#52019 2021:Flink 高速发展数据来源:字节跳动 Flink 团队内部统计字节跳动 Flink 全

4、景全球 Flink 作业数量SQL 作业占 30%全球 Flink作业使用 CPU 核数全球开启 checkpoint 作业的数量高峰流量吞吐 600GB/s全球消息处理峰值 QPS4 4万万400400万万9090亿亿1.81.8万万#3#3重 点 工 作YARN 编排调度一次性资源分配加速启动考虑负载均衡反调度机制批流作业混部利用率提升单机环境资源隔离GangGangScheduleSchedule负载均衡负载均衡调度调度容器化容器化混合部署混合部署DistributedStorageCoordinatorControllerBrokerBrokerBrokerProxyProxyProx

5、yKV StorageConsumerProducerBMQBMQ批流一体Native 实现兼容 Kafka 协议存储计算分离Flink 开发迭代Runtime&Services单点故障恢复SmartResources推测执行故障节点自动隔离性能测试框架混沌工程多机房容灾SQL1.9-1.11 升级Flink SQL 开发平台丰富 Connector 生态Temporal Table Function维表延迟 Join自定义窗口新增聚合指标兼容 CheckpointState&Checkpoint小文件聚合Regional CheckpointState backend Cache自定义 Ch

6、eckpoint 触发策略Queryable StateDorado 流式计算平台作业托管一键容灾SQL 开发调试智能诊断特征计算平台KafkaKafkaHiveHiveKV KV 存储存储RPC RPC 服务服务数据源抽取抽取扩展扩展过滤过滤字段抽取/扩展/过滤unionunioninterval joininterval joinwindow joinwindow joinlookup joinlookup join数据 JOIN/UNIONSchema Table字段名类型user_idbigintnamevarcharapp_idintcountintactionint状态层存储层抽取

7、层明细数据更新获取明细数据注册触发器聚合计算#4#4展望&总结批流消费无缝切换HybridHybridSourceSource引擎统一引擎统一StreamingStreamingBatch SQLBatch SQL底层存储底层存储统一统一SQL 语义,UDF,Runtime 统一实时计算统计小时&天级校准BMQ 使用一套分布式存储系统批 流 一 体Cloud Shuffle ServiceCloud Shuffle ServiceIO 聚合In Mem 副本高速写入成本&性能q3q6q8q10 q11 q15 q18 q19 q30 q32 q34 q35 q37 q38 q45 q46 q5

8、1 q54 q59 q68 q69 q71原生 ShuffleCSS007080TPC-DS 1TB 提升30%以上QueryMPP CBO调度性能优化跨数据源联合查询流批一体HTAP行列混合存储Godel:在离线融合调度资源管理合并资源池统一管理,快速切换调度融合一套调度器,多类场景运维交付一套系统调度语义融合Gang 性交付、Batch 调度作业、任务排队极致性能资源同构、网络拓扑感知、NUMA 感知在离线隔离管控层租户隔离、数据面资源隔离2021 FFA Talks from ByteDance【实时数据湖】Building The Real-time Datalake at ByteDance【行业实践】Flink 在字节跳动数据流的实践【流批一体】流批一体在字节特征平台的实践【平台建设】State Migration and Query on Flink SQL【核心技术】Powering HTAP at ByteDance with Apache Flink【核心技术】Improvements of Job Scheduler and Query Execution on Flink OLAP【核心技术】StateBackend Performance Improvements with CacheTHANKS

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(师锐-实时计算在字节跳动的发展与展望.pdf)为本站 (云闲) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部